No. 410/622 Index Prev Next
Path: titcca!ccut!tomo!wada
From: wada@tomo.wadalab.u-tokyo.JUNET (wada)
Newsgroups: fj.kanji
Subject: Re: JIS X 0202
Message-ID: < 19@tomo.wadalab.u-tokyo.JUNET> 
Date: 12 Apr 89 09:14:28 GMT
Reply-To: wada@tomo.wadalab.u-tokyo.JUNET ()
Distribution: fj
Organization: Wadalab/Dept of Math Eng/Univ of Tokyo
Lines: 62


和田です(東大 計数工学科/教育用計算機センター)
;wada@ccut.cc.utyo.junet,koper@tecc.ecc.utyo.junet
;(03)812-2111 ex 7410

In article < 20969@wsgw.ws.sony.junet> , sakamoto@ws.sony.junet 
(Tomohiko Sakamoto) writes:
...
> ソニーの坂本です。
> 
> kermit とは関係のない話になって恐縮ですが、JIS X 0202 (ISO 2022) が話題
> になっているので、その記述について私も「ブチブチ」言わせてもらいます。
> 
> ことの発端は、UNIX ワークステーションでよく用いられる漢字コードの EUC で
> す。 EUC では、
> 
> 	G0 に ASCII、
> 	G1 に JIS X 0208 の漢字、
> 	G2 に JIS X 0201 のカタカナ
> 
> を指示し、G0 を列02〜07(GL)に、G1 を列10〜15(GR)に呼び出しています。
> そして、G2 は SS2(Single-shift two) で一時的に GR に呼び出しています。
> 
ISO 2022 にも JIS X 0202 にも「一時的に GR に呼び出す」という用語はありま
せん. 
よっつの規格から引用すると:
JIS X 0202-1984: SS2は, 最後に指示したG2集合から1文字を呼び出す.
JIS X 0211-1986: SS2は, 引き続く1文字分のビット組み合せを, 指示してある
G2集合に従って解釈させる. そのビット組み合せは, 列2-7のものとする.
ISO 2022-1986: SS2 shall invoke one character from the last designated
G2 set. ... The bit combination permitted to follow SS2 or SS3 is one
of those from 2/1 to 7/14 for a 94-character G2 or G3 set and 2/0 to
7/15 for 1 96-character G2 or G3 set.
ISO 6429-1988: SS2 causes the bit combination following it in the data
stream to be interpreted according to the currently designated G2 set.
In the case where the characters of the G2 set are represented by more
than one bit combinations, SS2 changes the interpretation of the
relevant number of following bit combinations. The bit combinations 
following SS2 shall be one from 02/00 to 07/15.

一方EUCを定めたときのことは
小野芳彦: UNIXの日本語化の実現方法 (情報処理, pp1393-1400, vol27, no12)
にあるようにバイト単位で解釈可能なように, ascii以外はb8ビットを1にする
という方針のため, SS2に続く外字のb8ビットを1にしたようです. 当時もこれが
ISO 2022 と矛盾すると大騒ぎだったのですが, 7ビット8ビット変換をした痕蹟
と考えればよいという知恵者がいて, SS2,1xxxxxxx を採用したのです.

G2, G3には94(*94*..), または96(*96*..)文字の集合しか指示できないので, 
呼び出すのには原理的に7ビットあれば十分なため, b8ビットは0でも1でもよく, 
どちらでもよいようにしろという意見は例えば中国(China)あたりからもでます
が, JIS X 0202の
3. 用語の意味
(4) 符号化文字集合
の定義にあるように, 「集合内の文字とビット組み合わせを1対1に関係づける
あいまいでない規則の集合」としてはb8ビットは0でも1でもよいというわけに
はいかないのです. 勿論7ビットの範囲内であいまいでなければよいという書き
かたもありえますが, 今のISO 2022等ではそう考えないということで了解して
ほしいと思います.

JIS X 0202 の改訂は ISO 2022-1986に合わせていく方向ですので「SS2R」は
考えられないでしょう.
	
Next
Continue < 21097@wsgw.ws.sony.junet>