No. 286/622 Index Prev Next
Path: titcca!anprda!qmfl!ichikawa
From: ichikawa@qmfl.qmflp.JUNET (ICHIKAWA Shuichi)
Newsgroups: fj.kanji
Subject: Re: New NKF again
Message-ID: < 154@qmfl.qmflp.JUNET>
Date: 13 Jul 88 01:26:10 GMT
References: < 3832@flab.flab.fujitsu.JUNET>
Reply-To: ichikawa@qmfl.qmflp.JUNET (ICHIKAWA Shuichi)
Distribution: fj
Organization: Quantum Magneto Flux Logic Project, Tsukiji, Tokyo
Lines: 35
市川至さん@富士通研:
> 入力のコード系が確定した後、それ以降の入力に確定コード系に反するものが
> あった場合:
> 1)そのまま通過させる
> 2)無視する and/or stderrで警告する
> 3)なんとかまともになるように加工する
> のいずれかがよろしいでしょうか。
> これは、EUCやシフトJISの中にJISが出現した場合にどうするかという場合も含
> んでいます。
JISコードに変換したいとき、入力がJISコードだった(!)場合にも、
問題はあります。
現在のnkfでは、「nkf -J」を使うと、ESC-$-B / ESC-(-B まで
ESC-$-@ / ESC-(-J になってしまいますが、こういうときは、やっぱり、
元のコードを保存してくれた方がいいです(-BB,-BJ,...でも同様)。
似ているとはいえ、JIS漢字78と83は違うし、ASCIIとJIS-ROMAも違うので。
JISをJISにするというのも馬鹿げていますが、shell scriptなどで
機械的に処理していると、こういうこともよくあるのです……
(要は、こちらが手を抜いているせいですが)。
基本的に、nkfは1)にしておいた方が良いのではないでしょうか。
途中で変なコードが出てきたら、変換を止めて「初めから全く素通し」
したいくらいです。
# ただ、こうすると入力を一旦ぜんぶバッファしなければ
# ならないので、フィルターという感じではなくなりますね。
しかし、出力が途中で壊れていて人手でも解読できなくなるよりは、
何もしないでいてくれた方が良いこともあります(と思います)。
3)のように、いろいろ仮定して変換を試みるのは、違うコマンド名に
するか、オプションで指定するのがいいのではないでしょうか。
勝手なことばかり言って、すみません。
市川 周一 (ICHIKAWA Shuichi) ichikawa@qmfl.qmflp.junet
新技術開発事業団 後藤磁束量子情報プロジェクト 構成法研究グループ
Next
Continue < MATSUI.88Jul13225000@maia.aoba.tohoku.junt>
< 2282@tansei.cc.u-tokyo.JUNET>