No. 374/622 Index Prev Next
Path: titcca!sragwa!wsgw!headgw!sonygw!sonyve!sanewo
From: sanewo@isrc.sony.junet (SANETO Takanori)
Newsgroups: fj.kanji
Subject: Re: Help!! Teach me about " Real" kanji IN/OUT code (In Japanese/Kanji)
Message-ID: < SANEWO.89Feb6203109@isrcnw.isrc.sony.junet>
Date: 6 Feb 89 11:30:55 GMT
References: < 379@cpgcgw.cpgc.sony.JUNET>
Sender: news@sonyve.isrc.sony.junet
Distribution: fj
Organization: Corporate Research Laboratories Atsugi, SONY, Japan
Lines: 61
In-reply-to: kimi@cpgcgw.cpgc.sony.JUNET's message of 6 Feb 89 09:18:43 GMT
えっと、さねを@ソニーです。内輪でのフォローですが…
In article < 379@cpgcgw.cpgc.sony.JUNET>
「きみちゃん」さん kimi@cpgcgw.cpgc.sony.JUNET (Kimitaka Kawaguchi) writes:
> 本当のところはどういう漢字IN/OUTコードを使ったらいいのか知りませんか??
JUNETの手引の通りで良いと思います。つまり:
漢字IN(というよりは、漢字選択): " ESC $ @" or " ESC $ B"
漢字OUT(というよりは、ローマ字選択): " ESC ( B" or " ESC ( J"
で、一番重要なのは、ローマ字選択のシーケンスとして、" ESC ( H" は決
して使ってはならない! ということです。
少し細かく説明すると、
1. 漢字選択のシーケンス(" ESC $ X" )
Xであらわされる2バイト文字セットを使用する(細かい言葉づかいは不正
確です。正しくは、JIS規格を参照して下さい)ことを表します。X=@が78
年版のJIS漢字で、X=Bが83年版のJIS漢字を表します。ちなみに、X=Aは、
中国語の漢字セットだったと思います。
2. ローマ字選択のシーケンス(" ESC ( X" )
Xで表される1バイト文字セットを使用することを表します。X=BはASCII文
字セットで、X=JがJISのローマ字セットです。両者の違いは、バックスラッ
シュと¥記号、上線とチルダーの2箇所です(と思う)。
ちなみに、X=Hは、スェーデンのアルファベットだったかな…とにかく、
ローマ字とは何の関係もないものですから、決して使わないようにするべ
きです。
NEWS の `stty jiskanji'で、" ESC ( H" になるとのことですが、ローマ字
選択の最後のキャラクタは、`stty jesc X'で変更できますので、ちゃん
と、「正しい」設定をしてあげましょう。
以上は、漢字コードを送り出す側に関する要求でしたが、受け取る側(例
えば、端末エミュレータ)では、次のようになると思います。
まず、理想としては、シーケンスの終端文字による文字セットの違いにき
ちんと対応する。つまり、" ESC ( B" のあとの 0x5c はバックスラッシュ
として、また、" ESC ( J" のあとでは¥記号として表示する。2バイトコー
ドについても、78年版と83年版では、違うところは違うように表示する、
ということになります。
ただ、実用的には、両者の違いを無視して、どちらか一方にしてしまって
もいいかもしれません(78年版と83年版で字体の違うような文字を名前に
持つ方々は、また違った意見をお持ちと思いますが :> )。
" ESC ( H" については、正式に扱えば、スウェーデンのアルファベットを
表示すべきかも知れませんが、大抵の場合は、「間違った」ローマ字選択
シーケンスでしょうから、そのように扱うのが親切でしょう。
とにかく、記憶に頼って書きました。本質的なところは間違って
ないと思いますが、もし何か問題があれば、指摘して下さい。
--
實藤 隆則 (SANETO Takanori) // [趣味] 本業をすること //
・・・・・・・・・・・・・・・・・・// Bonjour Chapeau //
さねを@総合研究所.ソニー // [本業] 趣味に走ること //
Next
Continue