No. 603/622 Index Prev Next
Path: titcca!nttlab!nttyrl!morisaki
From: morisaki@nttyrl.ntt.jp (Masato Morisaki)
Newsgroups: fj.kanji
Subject: Re: File code (Re: Shift-JIS vs EUC)
Message-ID: < 15055@nttyrl.ntt.jp> 
Date: 12 Jun 90 04:16:00 GMT
References: < 43011@wsserva.sm.sony.co.jp> 
Distribution: fj
Organization: Advanced Information Systems lab., NTT, Yokosuka, Japan
Lines: 57

まず、余談:
どっかでの論議を junet でやっているような気分ですな。

さて、
In article < 43011@wsserva.sm.sony.co.jp> ,
	sakamoto@sm.sony.co.jp (Tomohiko Sakamoto) says:
>  grep、sed、awk などは、UNIX というシステムにとってアプリケーションでもあ
>  ります。だから、stateless なファイルコードを、コンベンションとして定めた
>  ほうが有益です。
>  invoke(locking shift) と designate を伴う statefull なファイルコードを
>  使った時、tail コマンドはどうインプリメントすればいいんでしょうか?

この辺は、栗林さんとおなじで、内部処理の問題でしょうといいたい。
だれでもおもいつことは、tail では、頭からみていって、出力するところの
state を判断すればすむことでしょう。処理時間はおおきなファイルのとき
は時間がかかって非効率でしょうけど、できないことはない。
tail の処理は、後ろからという固定概念でとらえるほうが間違っている。
(まあ、これはへこ理屈でいわんとすることはわかってますがね。)

>  それから、もうひとつ大事なことを忘れていませんか?
>  テキストファイルは、何もお手紙だけのファイルではありません。

ええわかっていますよ。

>  Cのソースプログラム、shell script、awk script、sed script などでもあり
>  ます。そこには、ファイル名、すなわちパス名が出てきます。
>  さて、パス名は、何コードでしょう?

ほい、portable C code (でしたっけ? ANSI C できまっている
例のコード) で記述すべきでしょう。つまり、ASCII だけでしったけ。
わたしは、ファイル名にいろんなコードをつかうほうがまちがているという
主義者です。だいたい、setlocale で切り分ける世界を ANSI C が考えておき
ながら、またそれを標準だといってサポートしながら、faile name 等に
他の言語を許すほうがまちがっている。tar,cpio 等でちがう環境にもって
いったとき(つまり、ある locale がサポートされていなとき)どうするの?
どうせよめないわけですし。これ sony さんでは変換するの?そんな賢い
ことをやってくれるわけ?
interchage を基本におくと、こういうのはけしからんことだとおもいますが。
一部だけ便利さをよそおうのはサギと同じだとおもいますがね。

この話をベンダーがおおい meeting でやると、あんたほんとに user と
いわれて小数派(たいがいが約1名 :-))になっちゃうんですがね。:-)

>  森崎さん、SS2 と SS3 は JIS X0202-1984 にもありますよ。
>  EUC が ISO 2022 に準拠していない部分は、
>  SS2、SS3 を SS2R、SS3R の意味で使っていることです。
>  SS2R、SS3R は、ISO 2022-1986 にもありません。

そうでした。SS2R, SS3R ですね。
(まだ、資料がみつからない。うるおぼえでいってすみません。)
でも、たしか、SS2R, SS3R はあたらしい、ISO 2022 の draft で入っている
のではなかったでしたっけ? (幸市氏助け船をだして。)

>    ソニー(株)スーパーマイクロ事業本部ワークステーション事業部
>  	坂本智彦	sakamoto@sm.sony.co.jp

森崎
Next
Continue < 15113@nttyrl.ntt.jp>