No. 608/622 Index Prev Next
Path: titcca!nttlab!nttyrl!morisaki
From: morisaki@nttyrl.ntt.jp (Masato Morisaki)
Newsgroups: fj.kanji
Subject: Re: JIS X.... (Re: RE:Shift-JIS vs EUC)
Message-ID: < 15074@nttyrl.ntt.jp>
Date: 14 Jun 90 01:50:19 GMT
References: < 43020@wsserva.sm.sony.co.jp>
Distribution: fj
Organization: Advanced Information Systems lab., NTT, Yokosuka, Japan
Lines: 151
でしゃばり過ぎている森崎@NTTです。:-)
坂本さん、ISO と JIS の関係には時間差というか年差があるという
ことをごぞんじですか?
拡張方式については、ISO --> JIS というプロセスを経るわけです。
何故なら、拡張方式については全世界の合意が必要なわけですよね。
ISO で IS になって、その結論をもとに JIS へフィードバックという
プロセスになります。
逆に、character set のほうは、ISO への registration ですから、
各国の national standard がきまってその結果を ISO へと反映させる
という process になります。
まあ、この関係を理解のうえ以降をよんでください。
In article < 43020@wsserva.sm.sony.co.jp> ,
sakamoto@sm.sony.co.jp (Tomohiko Sakamoto) says:
> JIS ハンドブックをみると、X0208 に「ESC 02/4 04/2 で2バイト符号系の指示
> 及び呼び出し」ってあるんだけれど、「ESC 02/8 04/10」いわゆる「ESC(J」に
> よる1バイト符号系の指示 って書いてないじゃない。多分、原規格(JIS 規格票)
> の付属書かなんかにはあるんだろうけど。
> これって大事なことだと思うんだけどなあ。ハンドブックにも載せてよ。
なにか disignation について誤解があるようですね。 disignation はいったん
2バイト符号系にすると、それっきりですよ。同じ disignation をつづけて
だしてもかまわないのです。1バイト符号系にもどす(もどす
という考えかたがそもそもあやまっている。正確には1バイト系にすると
いうべきでしょうね。)のは、X0201 のほうです。
この1バイト系への disignation について、X0208 でふれるというのは、
規格として危険な部分があります。もし、付属書等でふれると、JIS が
が発行されている途中で、2つの規格書でことなる記述を含むことになります。
X0201 が改訂されたとき、あたらしい disignation がきまればその時点から
この disignation が1バイト系の標準となります。規格書を書くという意味では
他の規格書の内容(とくに、disignation の部分)を引用するということは
最大の注意が必要なわけです。1つの規格書に他の規格書の使い方について
ふれるということは、1冊の規格書だけで理解できるという点ではすぐれて
いますが、コンセステンシーを保つということでは禁止的な方法です。
規格書はバイブルであって、教義の解釈書ではないのですからね。
逆に、上のようなことがあることを知っていることは、複数の規格書をもとに
あるエンコーディング等を採用してプログラムなどを作成する(デサインする)
人の教養ですね。私の社内でよくあることとして、1つの規格書を読んで、
すべてをわかったふうにいう愚かな技術者がいることです。
わたしは、社内では「あんたプロでしょう。それで社内としての規格書のたぐい
(ほとんどが個別の規格を織りなして1つの体系を作成することですが、)が
よく設計できるね。本質的にデザイナーとしての素養がないのね。」と
嫌みをいうことにしています。(このフレーズ余談)
> は、「ローマ文字」って言っていることです。普通、「ローマ文字」なんて言い
> ませんよね。
あれ、ローマ文字という使い方を普通にしません?もともと国語として
ローマ文字であって、これがなまってローマ字という言い方になってきたのと
ちがいます? たしか、戦前の日本語をローマ文字だけにしようという運動の
時代の書物をよむと、ローマ文字という言い方が標準的な使われ方であった
と記憶していますが。
> それで、JIS X0208 を見ると、3区の文字のことを「ローマ字」と
> 呼んでいるんです。でも、6区や7区は「ギリシア文字」、「ロシア文字」。
まさに、日本での国語の搖れが規格書にも反映されているというだけの
ことでしょう。
> まあ、SP のことを「空白」でなく「間隔」って言っているくらいですから、正
> 式な規格と世間一般での慣用的な呼び方とは違うもんなんでしょうね。
SP は機能コードで「間隔」を設定するものですから、文字としての「空白」
ではないのです。世間の計算機屋の使い方がまちがっている。というのが
わたしの印象ですがね。
> DEL だって、「抹消」ですか。
> 「削除」の方が Delete の訳としてふさわしいような気もしますが。
1字を消す(無効にする)ことは正しい日本語では抹消ですよ。契約書等で
捨印というのがありますね。このとき、何字訂正、何字抹消という
言い方をしませんか?
(と、かきながら、われながら日頃、いい加減な日本語をつかっているなと
反省しています。:-))
> それはともかく、
> ...
> もし、「8ビット環境で2バイト符号系を G1 に指示すること」が 1978年の時
> 点に決まっていれば、シフト JIS なんか生まれずに済んだことでしょう。
いっとう最初にのべたことがそもそものはじまりです。
JIS C6226-1978 が ISO に登録されたのは、DEc.30, 1979 ですから
このときまで、G1 の割当がなかったのだと思います。
マルチバイトをあらわす、 2/4 というのが最初にでてくるのが
JIS C6226-1978 ですからね。
たしか、GO として ESC 2/4 4/0 を ISO で正式にきまるまえ(検討段階)に
JIS は先取りしたはずです。
ちなみに、Registration Number 42 によると
GO : ESC 2/4 4/0
G1 : ESC 2/4 2/9 4/0
G2 : ESC 2/4 2/10 4/0
G3 : ESC 2/4 2/11 4/0
となっています。
GO だけおかしいと思いません?じつにこのマルチバイトというのを世界的に
認めさせたのは日本であること、そして JIS で先取りしたことを ISO に
反映させたこと、が現われていません?
2/4 というのを最初に導入させるという調整は、いまほどマルチバイトの
重要性が世界的にわかってもらえない時期であることをかんがえると
すごいことだとおもいませんか?
> 「ローマ文字・片仮名」環境から、「ローマ文字・漢字」環境への移行が世の中
> で進み、パソコンの世界でも、最初から EUC に似た環境が出現したはずです。
> X0208 の漢字符号系は片仮名を含んでいますから、このような移行はとても自然
> だったと思います。
こういうことは今だからこそいえるのです。
逆に、G1, G2, G3 が使えるようになっているいまだからこそ、そのように
世の中のベンダーが移行していけばいいのではありませんか?
> 7ビット環境でも漢字を G1 に指示することはいいことです。
> SI/SO で、「ローマ文字」と「漢字」を切り替えられるじゃないですか。
> ESC$B と ESC(J という3バイトのエスケープシーケンスで切り替えるよりもス
> マートでプログラムの作成も容易だったに違いありません。
ぐどいようですが、世界的な拡張方式の議論の中で、マルチバイトの G1 への
designation をどうするかという議論の最中で上のようになったのだと思います。
> それでも、JIS の規格が、あくまでも「ローマ文字」と「漢字」を G0 に指示し
> たいというのなら、「片仮名」も ESC(I で G0 に指示するようにして、3つの
> 文字セットの扱いを対等な関係にして欲しかった。
> SS2R と SS3R を作らなかった ISO 2022 のマヌケ。
> 漢字を G1 に指示しなかった JIS X0208 のアホウ。
> ついでに、「片仮名」を 63文字しか定義しなかった JIS X0201 のバカ。
規格書のたぐいはどうしても過去との互換性にも最大の注意が
必要です。JIS のコードに関する規格はこの互換を保証しながら、
あたらしいかつ効率的なエンコーディングも可能とすることを
導入していると規格書から読み取れます。逆に規格書を用いる人は、
過去の互換をとる必要がある場合は、「やもうえず(やもうえずですよ。)」
保証された範囲でこの互換をつかい、新しい部分へと移行できるように
考えるべきでしょう。過去を批判するまえに、規格書をどう使うかという
使う側の英知がもとめられているのではありませんかね。
> ソニー(株)スーパーマイクロ事業本部ワークステーション事業部
> 坂本智彦 sakamoto@sm.sony.co.jp
森崎
P.S.わたしは、JISの規格委員の回し者ではありません。:-)
JISの規格にいちども携わったことはない人物ですので
誤解のないように。ただ、JIS C 6226 ができるとき、
SC2の委員をやっていた上司の配下にいて、かつどうしても
日本語をあつかった研究をやる立場から、環境を整える上で、
コードに最大の関心をもたざるを得なかったので。
Next
Continue < 43026@wsserva.sm.sony.co.jp>