No. 607/622 Index Prev Next
Path: titcca!nttlab!nttyrl!morisaki
From: morisaki@nttyrl.ntt.jp (Masato Morisaki)
Newsgroups: fj.kanji
Subject: Re: RE:Shift-JIS vs EUC (Re: Kanji code of OSF/1)
Message-ID: < 15061@nttyrl.ntt.jp> 
Date: 13 Jun 90 17:07:32 GMT
References: < 43013@wsserva.sm.sony.co.jp> 
Distribution: fj
Organization: Advanced Information Systems lab., NTT, Yokosuka, Japan
Lines: 101

In article < 43013@wsserva.sm.sony.co.jp> ,
	michael@sm.sony.co.jp (Michael Knight) says:
>  	COMPOUND_TEXT そのものについてはどういう意見をお持ちですか?

現時点における一番まともな解だと思っています。
最低、CTではすべてのベンダーが了解しているわけですし、コードその
ものも、しっかりベースのあるものです。CSそのものは、表そのものが
議論されているのですから、いまは危険ですね。考え方の方向は賛成ですけど、
先取りは危険です。いま、CSに手をだすのは、おっちょこちょいか、無責任な
人でしょう。

CTに、+α をいれるのはかってですが (CS等)、これをうたい文句に
するベンダーはきらいです。
ほんとは、現状のCTだけに限定してほしいのですが、まあそれは他社との
差別化ですがら、かってでしょう。

が、わたしが社のコードに関する ultimate の権限があれば、
CTだけをつかわせるという通達をだすでしょうね。

>  	台湾人は X 上で漢字を使えないですよね。
>  	ISO2022 は確かに大事な規格ですが ISO に加盟していない人々を
>  	犠牲にすることになります。

これは、純然たる政治の問題です。中国を代表しているのが大陸ですからね。
某???のベラ・チャン副所長さんも CT については問題にしていません
ですよ。
はなしは、それますが、入江さんも、ballot のとき Replay-Resent-To:
のヘッダをつけた mail を出すだけでなく、ご意見をのべられてはいかがです?

> >  下での投票の時、JIS 関係で 8bit 目の議論で両方を投票したのは!
> >  ベンダーのエゴですな。。)
>  	これってもしかして XLFD を提案したくせに
>  	-*-screen-medium-r-normal--10-100-75-75-m-100-jisx0208-kanji11
>  	なんて言う font を載せて堂々と売ってる会社の人のことですか?

そうです。

>  	そもそも JIS は何故 (J なんかを定義しているのでしょうね。

歴史ですよ。1970年代後半に designation の登録作業があって、いままでの
JIS code set を登録しただけだとおもいます。もう少しいえば、ASCII と
JIS の違いの部分は、その前の時代に各国対応に定義可能というのが ISO で
きまっていたからです。$ は通貨記号ですから、当然 yen になるわけです。
自国文化をきちんと反映したためですね。わたしは悪いとはおもいませんが。

こっからは余談:

なにも、US がベストだと信奉する必要はないですし、日本の SC2 委員のかた
がたは、どっかの独善家や翻訳作業屋さんたちと異なって、きちんとした
ポリシーをもってここ20年、コードの問題に取り組んでこられていると
思います。13年まえを考えてごらんなさい。あのときに、学術的な目的
で国語研の方が調査された漢字の頻度をもとに作成された某コード表のように、
いまでは通用しないコード表を選ばず、きちんとしたポリシーをもって作成さ
れた漢字表ができたことを。
いまでも国語審議会の方針が変更されても、ちょっとした手直しで通用できて
いるわけですよ。

まだ、文節カナ漢字変換の技術すらなかって、いかに漢字をいれるかを
議論されているときに、そのベースとなる漢字表が10年以上もつかえる
という(たんにエンコーディングの議論だけですむという)。こういうの
が定義されたのは、驚異ではありませんか?
わたしは、当時、2度ほど、まったくことなる漢字表の変換表を手作業で作成
しましたが、これは大変な作業ですよ。1字ごとコードブックをめくって
探すわけですからね。しまいには、コードだけをダンプすると何が書いて
いるかよめるようになりますよ。
これが漢字プリンター、ディスプレイが普及するまえに標準ができたため、
この変換という苦労が、ベンダーのマシンがかわるたびにやらなくてすむ。
このことは、ユーザにとってどれほどいいことか。。
もし、あの時代にJISの漢字ができていなかったら、ほれプリンター
にだすときはあのコードで、などなど、きっと、かな漢字変換の技術など
もう10年以上遅れていたことでしょうね。

エンコーディングの議論もまったく同じだと思います。いろんな思い付きを
採用するのでなく、栗林さんがいわれるように1990代以降を考えて
気にいる/いらない、あるいはサポートする能力がある/ないは別として、
1つ方式を全ベンダーが採用していかないと危険ですね。また、横やりを
いれたり、自己の利害を他の陰にかくれて押し込むというのは、すきでは
ありませんね。自己の利害追求だと堂々と論陣をはればいいのですがね。

どこの社でもそうだと思いますが、きちんとコードについて知識を持ち合わせ、
理解されている上層部の方はすくないとおもいますが、いかがでしょう。
わたしの知るかぎりコードについて、しっかりしたポリシーを早い時期に
社内で統一化した JEF は偉いですね。やはり日本の日の丸コンンピュータを
進めるという上の意気込みがあったからでしょう。
state less にするために、8 bit 目に 1 と 0 を立てるという方式は
JEF がオリジナルなのですよ。(いまでもそうかな?)
DEC code は 10 とすると JEF になってしまうから 11 ということを考えだし
た(おろかな。。。)のです。
カナの導入のために、single shift Right を用いるというのは DEC ですがね。
(なお、()で「おろかな。。。。」とかきましたが、
 この当時の xxx の人はしっかりした考えをもっておられましたよ。
 ある意味では、dumb terminal 相手の encoding としてはよくできた方だと
 おもってました。VMS のようなミニコンの上で自然言語処理の研究ができた
 のですから。keypad editor というスクリーン・エディダつかえたのですから。)
 
− 以上は、DEC 漢字が作成される過程を外野から関係していた老人
   のたわごとですがね。 −

>   Hideo Irie (Michael Knight)	michael@sm.sony.co.jp

森崎
Next
Continue < 15095@nttyrl.ntt.jp>
< ymiwa.900614213918@cancer.jepro.co.jp>
< 43026@wsserva.sm.sony.co.jp>
< 15265@nttyrl.ntt.jp>