No. 602/622 Index Prev Next
Path: titcca!ccut!kyu-cs!ccku-gw!kudpc!kuis!kurims!wd
From: wd@kurims.kyoto-u.ac.jp (Kamo Hiroyasu)
Newsgroups: fj.kanji,fj.comp.text
Subject: character code for text processing (Re: Shift-JIS vs EUC)
Message-ID: < WD.90Jun12151553@kurims.kurims.kyoto-u.ac.jp> 
Date: 12 Jun 90 06:15:53 GMT
References: < PROJ.90Jun11212750@hokkori.nff.ncl.omron.co.jp> 
Sender: bnews@kurims.kurims.kyoto-u.ac.jp (News Administrator)
Distribution: fj
Organization: Research Institute for Mathematical Sciences, Kyoto, Japan.
Lines: 40
Xref: titcca fj.kanji:723 fj.comp.text:204
In-reply-to: proj@nff.ncl.omron.co.jp's message of 11 Jun 90 12:27:50 GMT


  鴨ともうします。

In article < PROJ.90Jun11212750@hokkori.nff.ncl.omron.co.jp>  proj@nff.ncl.omron.co.jp (Hiroshi Kuribayashi) writes:
 >In article < 43006@wsserva.sm.sony.co.jp>  sakamoto@sm.sony.co.jp (Tomohiko Sakamoto) writes:
 > 
 >    > > >  私は、個人的には、ファイルコード、ネットワークコードとしては、ISO2022,
 >    > > >  処理コードとしては、ISO10646 だと思っています。
 >    > > 
 >    > > 栗林さんのこの発言は EUC を否定しているともとれますよ。
 > 
 > 今までは、EUC で良かったけど、これからは、EUC じゃだめだよと、
 > いっているのです。
 > だって、EUC だと、1か国語しか表せないんですもの、

  ファイルフォーマットは、そのファイルを使うアプリケーションが勝手に決
めればよい。ただし、似た目的で使うアプリケーションに共通ファイルフォー
マットがあると便利。で、文字コードというのは、テキスト処理用の共通ファ
イルフォーマットの構成要素である。これはいいですか?
  そう考えると、栗林さんの意見に納得できます。
  昔は貧しかったので、テキスト処理はプログラムと英文だけを対象にしてい
ればよかった。だから、ASCIIだけで十分だった。でも、いつまでも貧しいま
までいてはいけない。少なくとも、複数の言語が混在した文章が処理できる程
度のことは必要だ。となると、EUCでも不十分なのは当然ですよね。
  ではどうしようかということを考えます。複数の言語が混在した文章のため
の共通ファイルフォーマットおよびそのための文字コードは、現在、世の中に
存在していません。(TRON文字コードがある? あれは論外。)そうすると、一番
良いのは、自分でいいのを設計して使うこと(できれば、それを世間に広める
活動もしてもらうとうれしい。)ですが、それはたいへんです。だから、それ
ができない人は、ISO2022を流用するのがよいでしょう。

 > # といいながら、nemacs は、EUC モードで使っています。
 > # 今までは、これ(EUC)で、良かったんです。
 > # 私は、今のことをいってるんでは、なくて、明日からのコードは、どうするべきか
 > # を、みんなでそろそろ考えてもいいころだといいたいのです。

# そうですよ。今きちんと研究しておかないと、10年後は悲惨なことになって
# いますよ。(ならばおまえやれといわれるとつらい。)

					鴨 浩靖@数理解析研究所.京都大学
Next
Continue