No. 576/622 Index Prev Next
Path: titcca!etlcom!ulisvax!ulisnrt!saka
From: saka@ulisnrt.ulis.ac.jp (Tetsuo Sakaguchi)
Newsgroups: fj.kanji
Subject: NS code (Re: Kanji code of OSF/1)
Message-ID: < 4351@ulisvax.ulis.JUNET> 
Date: 9 Jun 90 01:08:11 GMT
References: < 2624@wm120_no0.rinfo.sumiden.co.jp>  < 15735@rena.dit.co.jp>  < 42981@wsserva.sm.sony.co.jp>  < 3859@ntt-twins.ntt.jp> 
Sender: news@ulisvax.ulis.JUNET
Reply-To: saka@ulis.ac.jp (Tetsuo Sakaguchi)
Distribution: fj
Organization: Univ. of Lib. &  Info. Sci., Tsukuba, Japan
Lines: 41

どうも、阪口@図情大です。
OSF/1 や EUC からちょいと離れるのですが、参考のために。

In article < 3859@ntt-twins.ntt.jp>  nakayama@ntt-twins.ntt.JP (Nakayama Ryu~ji) writes:
> 内部コードは 16 ビットフルに使ったやつがいいと思う。
> 	0b000000000xxxxxxx	ASCII/JIS ローマ字
> 	0b0xxxxxxx1xxxxxxx	JIS 漢字
> 	0b100000000xxxxxxx	JIS カタカナ
> 	0b1xxxxxxx1xxxxxxx	外字(は本当はイヤ)
> てな感じのやつ。

外字はともかく、こういうふうにすべての文字を2バイトで表すというシステムは現存
しています。
XEROX の Interlisp-D (KOTO) などが用いている NS コード (Network Systems
キャラクターコードセット)という XEROX が標準使用しているものです。
正確に言うと NS コードの2バイト表現というのがそれで、
Interlisp-D (KOTO) ではこれと run-encoding の2種類の方法でファイルの
コードを扱うことが出来ます。
(参考文献:	Interlisp-D リリースガイド
		Interlisp-D リファレンスマニュアル)

なお、現在の最新バージョンである XeroxLisp (Medley) がどうなっているかは
私は知りません。(XeroxLisp に変えるお金がない:-)

NS コードは基本的に第1バイトが文字セットを表し、第2バイトがその
文字セット中の文字コードを指示するものですが、ほとんど JIS と同じものです。

ちなみに run-encoding の方は文字セットを指定する制御コード (0xff +
文字セットのコード)を付けて、同じ文字セット内の場合は1バイトで
文字を表現するというものです。

例:	「あいAB」という4文字を表した場合、
2バイト表現:	0x24 0x22 0x24 0x24 0x00 0x41 0x00 0x42
run encoding:	0xff 0x24 0x22 0x24 0xff 0x00 0x41 0x42
                ^^^^^^^^^           ^^^^^^^^^
    (^^^ で示した部分が文字セットの選択)

では。
--
阪口哲男@図書館情報大学
Tetsuo Sakaguchi. University of Library and Information Science, JAPAN.
Next
Continue