No. 577/622 Index Prev Next
Path: titcca!ccut!wnoc-tyo-news!scslwide!wsgw!wsserva!sakamoto
From: sakamoto@sm.sony.co.jp (Tomohiko Sakamoto)
Newsgroups: fj.kanji
Subject: Re: Kanji code of OSF/1
Message-ID: < 42998@wsserva.sm.sony.co.jp>
Date: 9 Jun 90 06:47:22 GMT
References: < PROJ.90Jun7224744@hokkori.nff.ncl.omron.co.jp> < 3871@ntt-twins.ntt.jp>
Sender: news@sm.sony.co.jp
Distribution: fj
Lines: 65
オムロンの栗林さん:
> > EUC は、少なくとも、デファクトスタンダードですし、(まあ、これは、主観の
> > 問題かも知れませんが)、ISO2022 にも一応準拠していると思います。
> > 一応と、言ったのは、コードセット2 で、SS2 を、GL ではなく、GR に
> > invoke している点です。
In article < 3871@ntt-twins.ntt.jp> ,
nakayama@ntt-twins.ntt.JP (Nakayama Ryu~ji) says:
> これはほんとまぬけですね。しっかり規格に書いてあるのに。
ソニーの坂本です。
中山さんは、EUC のことをまぬけだと言っておられるのでしょうか。
私は、すべてのロッキングシフトおよびシングルシフトを用意しなかった
ISO 2022 のほうがまぬけだと思っています。
LS0 00/15 (7ビット環境での SI, 0x0f)
LS1 00/14 (7ビット環境での SO, 0x0e)
LS2 ESC 06/14
LS3 ESC 06/15
LS0R なし
LS1R ESC 07/14
LS2R ESC 07/13
LS3R ESC 07/12
SS0 なし
SS1 なし
SS2 08/14 (EUC の 0x8e)
SS3 08/15 (EUC の 0x8f)
SS0R なし
SS1R なし
SS2R なし
SS3R なし
歴史的理由で G0 を8ビットコードの右側に invoke できないのは、まあいいと
して、SS1、SS1R、SS2R、SS3R がないのは、規格の一貫性を損なっていると思い
ます。SS2R、SS3R があれば、ISO 2022 完全準拠の EUC が出来たのに。
> > つまり、日本語などの複数文字(複数文字だけじゃないですが)を扱う場合
> > UN*X コマンド などの、アメリカ製のアプリケーションの改造が少なくて済む。
> > でしょう。
>
> こんなので妥協したのがそもそもの間違いということでしょうか。
妥協しなかったら、シフトJIS 以上に扱いにくいコードになっていたでしょう。
例えば、EUC のコードセット2の SS2 0xa2 が SS2 0x22 となるわけで、このコ
ードは ASCII の「" 」とぶつかってしまいます。他の文字も同様で、すべての
ASCII と衝突することになります。
つまり、シフトJIS は、0x40、0x5b〜0x60、0x7b〜0x7e が、特に 0x5c の「\」
が UNIX & C と相性の悪い要因になっているのに、それに輪を掛けて混乱を招く
コードになってしまいます。
本来なら、処理コードを使わなくても済んだアプリケーションも大改造が必要と
なってしまうことが予想されます。
EUC は、あくまでも UNIX 用のコードなのす。
そして、シフト JIS コード は、MS漢字コードと呼ばれるように、Microsoft 社
が、自社の BASIC、FORTRAN、そして MS-DOS に用いる「日本語コード」として
デザインされたものだということです。
だから、EUC とシフト JIS を同じ土俵で戦わせることはどだい無理な話なのか
も知れません。
Next
Continue