No. 730/2188 Index Prev Next
Path: ie.u-ryukyu.ac.jp!hakata!sakura.kudpc!kuis-news!wnoc-kyo-news!tdi-bb!news1-tokyonet!tokyonet.ad.jp!wnoc-tyo-news!csdnews.sm.sony!sakamoto
From: sakamoto@sm.sony.co.jp (Tomohiko Sakamoto)
Newsgroups: fj.kanji,fj.beginners
Subject: Re: Character Codes
Date: 15 Nov 1996 11:52:06 GMT
Organization: ITC, Sony Corporation
Lines: 84
Message-ID: < 56hlh6$ich@csdnews.sm.sony.co.jp> 
References: < 56he4m$stu@yase.yajima.kuis.kyoto-u.ac.jp> 
Reply-To: sakamoto@sm.sony.co.jp
NNTP-Posting-Host: sak3.sm.sony.co.jp
Xref: ie.u-ryukyu.ac.jp fj.kanji:2758 fj.beginners:2589

In article < 56he4m$stu@yase.yajima.kuis.kyoto-u.ac.jp> ,
	yasuoka@kudpc.kyoto-u.ac.jp writes:
>   「\」と「\」はいいとしても、やっぱり「〜」と「~」は違う文字だと
>  思うんですが。まあ、他に表現の方法がないなら仕方ないんですけどね。

確かに、違う文字です。
JIS X 0208 漢字の 1区33点の「〜」は「波ダッシュ」。
ASCII の 7E は TILDE ですが、ISO-2022-JP では、JIS X 0212 補助漢字の
2区23点の「チルド(tilde)」は表現できません。ほらね :-)

>   「^[$(D"7^[$B」はちょっと苦しいかな?


fj.kanji に投稿された三好さんの用語集が なかなか「簡潔で適切で」あるも
のにならないので、私なりの解説を書いてみました。簡潔に書いたつもりなの
で言葉足らずのところもあるかと思います。 fj.beginners にもクロスポスト
したのは、初心者の皆さんの反応をみたいと思ったからです。	

======================================================================
文字コード:
  文字集合を定め、かつその集合内の文字とビット組合せを 1対1に関係づけ
  る、あいまいでない規則の集合。(JIS X 0202 5.1.4 より)
  符号化文字集合(coded character set)、文字符号(character code)のこと。

文字コードの実例:
  (1) ASCIIコード: 7ビットコード (ISO 646 IRV または ANSI X3.4-1986)
  (2) ラテンアルファベット No.1: 8ビットコード (ISO 8859-1)
  (3) ISO-2022-JP: ASCII と、ローマ文字、1983年版漢字、1978年版漢字の
        7ビットコード (RFC 1468: ISO 646 + JIS X 0201 + JIS X 0208
                        + JIS X 0202(ISO 2022) + 独自規則)
  (4) 日本語EUC: ASCII(またはローマ文字)と、漢字、片仮名、補助漢字の
        8ビットコード (ISO 646 + JIS X 0208 + JIS X 0201 + JIS X 0212
                        + JIS X 0202(ISO 2022))
  (5) シフトJISコード: ローマ文字と、片仮名、漢字、拡張文字の 8ビット
        コード (JIS X 0201 + JIS X 0208 + 独自規則)
  --
  ・(1)はアメリカで、(2)はヨーロッパで、(3)は日本(Internet)で、(4)は
    日本(Unix)で、(5)は日本(PC)で、主に使用されている。
  ・(3)は、エスケープシーケンスで文字集合を切り換える。
  ・(4)は、SS2/SS3 で 片仮名/補助漢字を呼び出す。

文字集合の実例:
  (1) ASCII の図形文字 (94文字)          (5C が「\」、7E が「〜」)
  (2) ISO 8859-1 の右側 (96文字)         (ISO 8859-1 の左側は ASCII)
  (3) JIS X 0201 のローマ文字 (94文字)   (5C が「¥」、7E が「‾」)
  (4) JIS X 0201 の片仮名 (94文字、ただし 31文字は未定義)
  (5) JIS X 0208 漢字     (94x94 = 8,836文字、ただし 未定義あり)
  (6) JIS X 0212 補助漢字 (94x94 = 8,836文字、ただし 2,769文字は未定義)
  --
  ・(5)は、1978年版(6,802文字)、1983年版(6,877文字)、1990年版(6,879文字)
    がある。


半角片仮名:
  JIS X 0201 の片仮名の俗称。JIS X 0201 と JIS X 0208 の文字集合を使用
  するシステムで、前者を後者の半分の幅で表示するものが多数存在し、かつ
  JIS X 0208 漢字の中にも片仮名があることから、JIS X 0201 の片仮名は半
  角片仮名と呼ばれて区別される。 JIS X 0208 全体を全角文字と呼ぶことも
  ある。JIS X 0201 や JIS X 0208 には文字の表示幅の規定はない。

機種依存文字:
  文字集合の未定義部分に各社が割り当てた文字。機種固有文字。

文字化け:
  使用している文字コードの違いにより文字が正しく伝送/表示されないこと。

JISコード:
  ISO-2022-JP のことを指す場合が多い。
  本当に JIS で規定されている(されようとしている)コードは次のとおり。
  ・ローマ文字だけの 7ビットコード    (JIS X 0201 3.2.5)
  ・片仮名だけの 7ビットコード        (JIS X 0201 3.2.6)
  ・ローマ文字と片仮名の 7ビットコード(JIS X 0201 3.2.7)
  ・ローマ文字と片仮名の 8ビットコード(JIS X 0201 3.3.2)
  ・漢字だけの 7ビットコード          (JIS X 0208 + JIS X 0202 6.1.5(c))
  ・漢字だけの 8ビットコード          (JIS X 0208-1997?)
  ・ASCII と漢字の 7ビットコード      (ISO 646 IRV + JIS X 0208-1997?)
  ・ASCII と漢字の 8ビットコード      (ISO 646 IRV + JIS X 0208-1997?)
  ・ローマ文字と漢字の 7ビットコード  (JIS X 0201  + JIS X 0208-1997?)
  ・ローマ文字と漢字の 8ビットコード  (JIS X 0201  + JIS X 0208-1997?)
  --
  2つの文字集合を使用する 7ビットコードは、SI/SO でそれらを切り換える。

--
坂本智彦	sakamoto@sm.sony.co.jp
Next
Continue < 56rrdo$9a9@sunglow.eds.ecip.nagoya-u.ac.jp>