No. 286/622 Index Prev Next
Path: titcca!anprda!qmfl!ichikawa
From: ichikawa@qmfl.qmflp.JUNET (ICHIKAWA Shuichi)
Newsgroups: fj.kanji
Subject: Re: New NKF again
Message-ID: < 154@qmfl.qmflp.JUNET> 
Date: 13 Jul 88 01:26:10 GMT
References: < 3832@flab.flab.fujitsu.JUNET> 
Reply-To: ichikawa@qmfl.qmflp.JUNET (ICHIKAWA Shuichi)
Distribution: fj
Organization: Quantum Magneto Flux Logic Project, Tsukiji, Tokyo
Lines: 35

市川至さん@富士通研:
>  入力のコード系が確定した後、それ以降の入力に確定コード系に反するものが
> あった場合:
> 	1)そのまま通過させる
> 	2)無視する and/or stderrで警告する
> 	3)なんとかまともになるように加工する
> のいずれかがよろしいでしょうか。
> これは、EUCやシフトJISの中にJISが出現した場合にどうするかという場合も含
> んでいます。

 JISコードに変換したいとき、入力がJISコードだった(!)場合にも、
問題はあります。
 現在のnkfでは、「nkf -J」を使うと、ESC-$-B / ESC-(-B まで
ESC-$-@ / ESC-(-J になってしまいますが、こういうときは、やっぱり、
元のコードを保存してくれた方がいいです(-BB,-BJ,...でも同様)。
似ているとはいえ、JIS漢字78と83は違うし、ASCIIとJIS-ROMAも違うので。
 JISをJISにするというのも馬鹿げていますが、shell scriptなどで
機械的に処理していると、こういうこともよくあるのです……
(要は、こちらが手を抜いているせいですが)。

 基本的に、nkfは1)にしておいた方が良いのではないでしょうか。
途中で変なコードが出てきたら、変換を止めて「初めから全く素通し」
したいくらいです。
#	ただ、こうすると入力を一旦ぜんぶバッファしなければ
#	ならないので、フィルターという感じではなくなりますね。
 しかし、出力が途中で壊れていて人手でも解読できなくなるよりは、
何もしないでいてくれた方が良いこともあります(と思います)。
3)のように、いろいろ仮定して変換を試みるのは、違うコマンド名に
するか、オプションで指定するのがいいのではないでしょうか。

 勝手なことばかり言って、すみません。
	市川 周一 (ICHIKAWA Shuichi) ichikawa@qmfl.qmflp.junet

	新技術開発事業団 後藤磁束量子情報プロジェクト 構成法研究グループ
Next
Continue < MATSUI.88Jul13225000@maia.aoba.tohoku.junt>
< 2282@tansei.cc.u-tokyo.JUNET>