No. 269/622 Index Prev Next
Path: titcca!nttlab!ouicsu!icssm!icsts1!saitoh
From: saitoh@icsts1.osaka-u.junet (SAITOH Akinori)
Newsgroups: fj.kanji
Subject: Re: Hankaku kana
Message-ID: < 1741@icsts1.osaka-u.junet>
Date: 8 Apr 88 11:12:22 GMT
References: < 882@kaba.JUNET> < 1532@srava.sra.JUNET>
Distribution: fj
Organization: tokura-lab., Osaka Univ., Japan
Lines: 137
In article < 1532@srava.sra.JUNET> , kameyama@srava.sra.JUNET (Toyohisa Kameyama) writes:
> 亀山です.
> In article < 3223@flab.flab.fujitsu.JUNET> ichikawa@flab.flab.fujitsu.JUNET (I.Ichikawa) writes:
> > 2)ただしこの協約は、特定個人間で使用するコードを制限するものではない
> これって本当に保証できるのでしょうか?
保証は一切ありません。保証っていったいだれがするのですか?
全国の全ノードのポストマスターに念書を書けとでもおっしゃる
のですか!!??
と、いうふうにかくと喧嘩を売ってしまうので、冷静に書いていきますね。
つい熱くなってしまった。反省、反省。
--------------------------------------------
これはあくまでも僕の理解です。
その範囲で、JUNET漢字コードの約束の意図と意義、それから
現状を書いてみます。
こういう誤解やトラブルが多発するようなら、手引きにはもっと明
確に書いておくべきであったかもしれません。
大体”制限しない”とは書いてありますが、だれもどこでも
”伝達を保証する”とは言ってないし、書いていませんよ。
今、手もとで手引きを参照していますから、手引きに関しては間違
いありません。
西村さんも書いておられましたが、JUNETの漢字コード規約は、
努力目標に近いものです。
まず、各ホストでの努力目標:メールの場合
1. コントロールコード以外のASCIIコードと、JUNET漢字
コード規約にある漢字コードはは伝達を保証する。
これは、”メールアドレスに@を使えるようにする”のと
同じくらい強い拘束力を持つ努力目標です。
普通にしていればこれは保証できます。
2. JUNET漢字コード規約を満たした漢字テキストならば、
読めるように、フィルタ、ページャを整備する。
この結果、
JUNET漢字コードを守っている限り、見ず知らずの人でも、
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
(漢字ターミナルetc さえ持っていれば)メールを正しく読んで
^^^^^^^^^^^^
もらえる。
^^^^^^^^
ということが実現できるわけです。
逆にいうと、
勝手なコードを使いたければ自由に使ってかまわない。
でも、正しく届くかもしれないし、とどかないかもしれない。
届いても読んでもらえないかもしれない。
それを覚悟の上、使うこと。
ということになります。
> ESC (I を使用する以外の方法では, 中継サイトで変換しないという保証は
> あるのでしょうか?
a) ナマの8ビット。
4.3のSMTPを通過した時点で、0x7Fでマスクがかけられます。
b) ^N/^O, ESC-(-I
普通は通ります。256バイトごとに改行があれば、あとは 7bit
スルーのはずですから。
ただし、ローカル漢字コードと、JUNET漢字コードの
相互変換を、/bin/rmail, /usr/bin/uux を改造して行なっている
ホストを通過したときにはどうなるかわかりません。
(だからこういうことはして欲しくないのだけれど、よそのサイ
トの運営に口出しはできないし、だいたいどこがやっているかも
わからないのでどうしようもない)
次にニュースの場合。
これは”見ず知らずの人へのメール”と同等だと思います。
ローカルなニュースグループ以外で、勝手なコードを使うと、
ひんしゅくを買うことになるでしょう。
普通にインストールすると、
1. ,,,,,,,'!','"', , ,'|','}',
'~' は伝達を保証する。これは文字コードではなく、バイト列と
して見たときに、どれを通すかということです。どちらかといえば、
\010,\011,\012,\014,\015,\033,\040〜\176 は通すといったほうが
いいかな。
2. コード変換はポストするとき(エディタの漢字コード-> JUNE
T漢字)と、ニュースリーダで読む時(JUNET漢字-> 端末の
漢字コード)にのみ起きる。
ということで、8bitナマと、SI/SOはダメ。
ESC-(-Iは通るということになります。
ところが、自分のところの利用者の便利を第一に考えるホストでは、
記事をスプールに入れるときに、コード変換をかけてローカル漢字
コードにしてしまします。こいうホストを通過した記事は、ESC-$-@
とESC-$-B 、 ESC-(-JとESC-(-Bの区別は保存されないことになり
ます。これはまだ罪がないというか大きな害はありませんが、
ESC-(-Iはどうなるかわかりません。つかわれているフィルタ次第で
す。
> PS. 1
> 繰り返しお尋ねしますが, DEC 漢字コードでは 1 byte カタカナは扱えるのでしょうか?
> 扱えないとすると tabnsei と ulisvax では 1 byte カタカナの news/mail は
> 読めない可能性がありますが...
というか、これらマシンのコンソールとDECコード端末では でしょうか。
> PS. 2
> ``1 byte カタカナ・コード'' と ``半角カタカナ'' は別のものであるという
> 考え方のあることも忘れないで下さい.
これは”問題のすりかえ”かあるいは”別の問題の提起”でしょ
う!!
この議論の発端はあくまでも”半角カナ”だったはずです。
``1 byte カタカナ・コード'' と ``半角カタカナ'' は完全に
独立に議論すべきです。1 byte カタカナ・コードを半角カナ
の免罪符に使われてはたまりません。
*僕の意見。
半角カナを使えるようにするのには手間がかかる。
純粋に技術的な困難は、問題は半角カナを伝達することではありま
せん。
たとえばニュースなら、1行、変更すればSI/SOが通るようになりま
す。問題は、less,jnews,vn,rn,,,,といった漢字をあつかうユティ
リティソフトです。たとえば、icsts1のコンソールでだけ動けばい
いのなら1日hackすれば出来る自信はあります。
汎用の半角カナ処理機能をつけるとなるとやってられません。
もうひとつの問題は、どうやって各ホストの管理者に作業してもら
うかです。結局これが一番大きい。
漢字を通すための作業なら、やってくれるでしょう。自発的にがやっ
てくれなくても、利用者からの要求で、作業するでしょう。半角カ
ナのための作業はどうでしょうか。
1バイトカナコードの問題はまた別に(必要ならば)考えましょう。
僕はそれよりは1バイトかなコードの方がデータ圧縮の手法として
魅力的に感じます。
斉藤 明紀 齊藤@都倉研.情報.基礎工.阪大
saitoh@icsts1.handai.junet
わたし、ペンを4本折りました。
Next
Continue < 582@tsuda.tsuda.JUNET>
< 1537@srava.sra.JUNET>
< 1594@titcce.cc.titech.JUNET>
< 1538@srava.sra.JUNET>
< 1602@titcce.cc.titech.JUNET>
< 1542@srava.sra.JUNET>
< 1608@titcce.cc.titech.JUNET>
< 1774@icsts1.osaka-u.junet>
< 4889@kyu-cs.csce.kyushu-u.junet>