No. 603/622 Index Prev Next
Path: titcca!nttlab!nttyrl!morisaki
From: morisaki@nttyrl.ntt.jp (Masato Morisaki)
Newsgroups: fj.kanji
Subject: Re: File code (Re: Shift-JIS vs EUC)
Message-ID: < 15055@nttyrl.ntt.jp>
Date: 12 Jun 90 04:16:00 GMT
References: < 43011@wsserva.sm.sony.co.jp>
Distribution: fj
Organization: Advanced Information Systems lab., NTT, Yokosuka, Japan
Lines: 57
まず、余談:
どっかでの論議を junet でやっているような気分ですな。
さて、
In article < 43011@wsserva.sm.sony.co.jp> ,
sakamoto@sm.sony.co.jp (Tomohiko Sakamoto) says:
> grep、sed、awk などは、UNIX というシステムにとってアプリケーションでもあ
> ります。だから、stateless なファイルコードを、コンベンションとして定めた
> ほうが有益です。
> invoke(locking shift) と designate を伴う statefull なファイルコードを
> 使った時、tail コマンドはどうインプリメントすればいいんでしょうか?
この辺は、栗林さんとおなじで、内部処理の問題でしょうといいたい。
だれでもおもいつことは、tail では、頭からみていって、出力するところの
state を判断すればすむことでしょう。処理時間はおおきなファイルのとき
は時間がかかって非効率でしょうけど、できないことはない。
tail の処理は、後ろからという固定概念でとらえるほうが間違っている。
(まあ、これはへこ理屈でいわんとすることはわかってますがね。)
> それから、もうひとつ大事なことを忘れていませんか?
> テキストファイルは、何もお手紙だけのファイルではありません。
ええわかっていますよ。
> Cのソースプログラム、shell script、awk script、sed script などでもあり
> ます。そこには、ファイル名、すなわちパス名が出てきます。
> さて、パス名は、何コードでしょう?
ほい、portable C code (でしたっけ? ANSI C できまっている
例のコード) で記述すべきでしょう。つまり、ASCII だけでしったけ。
わたしは、ファイル名にいろんなコードをつかうほうがまちがているという
主義者です。だいたい、setlocale で切り分ける世界を ANSI C が考えておき
ながら、またそれを標準だといってサポートしながら、faile name 等に
他の言語を許すほうがまちがっている。tar,cpio 等でちがう環境にもって
いったとき(つまり、ある locale がサポートされていなとき)どうするの?
どうせよめないわけですし。これ sony さんでは変換するの?そんな賢い
ことをやってくれるわけ?
interchage を基本におくと、こういうのはけしからんことだとおもいますが。
一部だけ便利さをよそおうのはサギと同じだとおもいますがね。
この話をベンダーがおおい meeting でやると、あんたほんとに user と
いわれて小数派(たいがいが約1名 :-))になっちゃうんですがね。:-)
> 森崎さん、SS2 と SS3 は JIS X0202-1984 にもありますよ。
> EUC が ISO 2022 に準拠していない部分は、
> SS2、SS3 を SS2R、SS3R の意味で使っていることです。
> SS2R、SS3R は、ISO 2022-1986 にもありません。
そうでした。SS2R, SS3R ですね。
(まだ、資料がみつからない。うるおぼえでいってすみません。)
でも、たしか、SS2R, SS3R はあたらしい、ISO 2022 の draft で入っている
のではなかったでしたっけ? (幸市氏助け船をだして。)
> ソニー(株)スーパーマイクロ事業本部ワークステーション事業部
> 坂本智彦 sakamoto@sm.sony.co.jp
森崎
Next
Continue < 15113@nttyrl.ntt.jp>