No. 703/2188 Index Prev Next
Path: ie.u-ryukyu.ac.jp!hakata!newssinet!chiba-ns!news.chiba-u.ac.jp!eclnews!sinetnews!news.join.ad.jp!wnoc-tyo-news!csdnews.sm.sony!sakamoto
From: sakamoto@sm.sony.co.jp (Tomohiko Sakamoto)
Newsgroups: fj.kanji,fj.beginners
Subject: Character Codes
Date: 15 Nov 1996 06:15:19 GMT
Organization: ITC, Sony Corporation
Lines: 68
Message-ID: < 56h1pn$ao3@csdnews.sm.sony.co.jp> 
Reply-To: sakamoto@sm.sony.co.jp
NNTP-Posting-Host: sak3.sm.sony.co.jp
Xref: ie.u-ryukyu.ac.jp fj.kanji:2755 fj.beginners:2561

文字コードとは?
  文字集合を定め、かつその集合内の文字とビット組合せを 1対1に関係づけ
  る、あいまいでない規則の集合。(JIS X 0202 5.1.4 より)
  符号化文字集合(coded character set)、文字符号(character code)のこと。

文字コードにはどんなものがあるか?
 (1) ASCIIコード: 7ビットコード (ISO 646 IRV または ANSI X3.4-1986)
 (2) ラテンアルファベット No.1: 8ビットコード (ISO 8859-1)
 (3) ローマ文字だけの 7ビットコード (JIS X 0201 3.2.5)
 (4) 片仮名だけの 7ビットコード     (JIS X 0201 3.2.6)
 (5) ローマ文字と片仮名の 7ビットコード (JIS X 0201 3.2.7)
 (6) ローマ文字と片仮名の 8ビットコード (JIS X 0201 3.3.2)
 (7) 漢字だけの 7ビットコード      (JIS X 0208 + JIS X 0202 6.1.5(c))
 (8) 漢字だけの 8ビットコード      (JIS X 0208-1997?)
 (9) ASCII と漢字の 7ビットコード  (ISO 646 + JIS X 0208-1997?)
(10) ASCII と漢字の 8ビットコード  (ISO 646 + JIS X 0208-1997?)
(11) ラテン文字と漢字の 7ビットコード (JIS X 0201 + JIS X 0208-1997?)
(12) ラテン文字と漢字の 8ビットコード (JIS X 0201 + JIS X 0208-1997?)
(13) ISO-2022-JP: ASCII と、ローマ文字、漢字(1978年版、1983年版) の
       7ビットコード (RFC 1468: ISO 646 + JIS X 0201 + JIS X 0208
                      + JIS X 0202(ISO 2022) + 独自規則)
(14) 日本語EUC: ASCII(またはローマ文字)と、漢字、片仮名、補助漢字の
       8ビットコード (ISO 646 + JIS X 0208 + JIS X 0201 + JIS X 0212
                      + JIS X 0202(ISO 2022))
(15) シフトJIS: ローマ文字と、片仮名、漢字、拡張文字の 8ビットコード
                     (JIS X 0201 + JIS X 0208 + 独自規則)
(16) その他
--
・(1)はアメリカ、(2)はヨーロッパ、(13)は日本(Internet)、(14)は
  日本(Unix)、(15)は日本(PC)で主に使用されている。残りは規格と
  して存在するだけで一般的ではない(と、とりあえず言っておこう)。
・(5)、(9)、(11)は、それぞれ SI/SO で文字集合を切り換える。
・(13)は、エスケープシーケンスで文字集合を切り換える。
・(14) は、SS2/SS3 で 片仮名/補助漢字を呼び出す。
・漢字が使えるのは、(7)〜(15)。

文字集合にはどんなものがあるか?
[1] ASCII の図形文字 (94文字)          5C が「\」、7E が「〜」。
[2] ISO 8859-1 の右側 (96文字)
[3] JIS X 0201 のローマ文字 (94文字)   5C が「¥」、7E が「‾」。
[4] JIS X 0201 の片仮名 (94文字、ただし 31文字は未定義)
[5] JIS X 0208 漢字     (94x94 = 8,836文字、ただし 未定義あり)
[6] JIS X 0212 補助漢字 (94x94 = 8,836文字、ただし 2,769文字は未定義)
[7] その他
--
・[5]は、1978年版(6,802文字)、1983年版(6,877文字)、1990年版(6,879文字)
  がある。


JISコード:
  ISO-2022-JP のことを指す場合が多い。
  本当に JIS で規定されているコードは (3)〜(12)。

半角片仮名:
  JIS X 0201 の片仮名の俗称。JIS X 0201 と JIS X 0208 の文字集合を使用
  するシステムで、前者を後者の半分の幅で表示するものが多数存在し、かつ
  JIS X 0208 漢字の中にも片仮名があることから、JIS X 0201 の片仮名は半
  角片仮名と呼ばれて区別される。 JIS X 0208 全体を全角文字と呼ぶことも
  ある。JIS 規格には文字の表示幅の規定はない。

機種固有文字:
  上記の文字集合の未定義部分に各社が割り当てた文字

文字化け:
  使用している文字コードの違いにより文字が正しく伝送/表示されないこと。

--
坂本智彦	sakamoto@sm.sony.co.jp
Next
Continue < 56h3cs$b9u@csdnews.sm.sony.co.jp>