No. 709/2188 Index Prev Next
Path: ie.u-ryukyu.ac.jp!hakata!sakura!kuis-news!wnoc-kyo-news!tdi-bb!news1-tokyonet!tokyonet.ad.jp!wnoc-tyo-news!csdnews.sm.sony!sakamoto
From: sakamoto@sm.sony.co.jp (Tomohiko Sakamoto)
Newsgroups: fj.kanji,fj.beginners
Subject: Re: Character Codes
Date: 15 Nov 1996 06:42:36 GMT
Organization: ITC, Sony Corporation
Lines: 74
Message-ID: < 56h3cs$b9u@csdnews.sm.sony.co.jp> 
References: < 56h1pn$ao3@csdnews.sm.sony.co.jp> 
Reply-To: sakamoto@sm.sony.co.jp
NNTP-Posting-Host: sak3.sm.sony.co.jp
Xref: ie.u-ryukyu.ac.jp fj.kanji:2756 fj.beginners:2567

In article < 56h1pn$ao3@csdnews.sm.sony.co.jp> ,
	sakamoto@sm.sony.co.jp (Tomohiko Sakamoto) writes:
>  文字コードとは?

改定版です。

======================================================================
文字コード:
  文字集合を定め、かつその集合内の文字とビット組合せを 1対1に関係づけ
  る、あいまいでない規則の集合。(JIS X 0202 5.1.4 より)
  符号化文字集合(coded character set)、文字符号(character code)のこと。

文字コードの実例:
  (1) ASCIIコード: 7ビットコード (ISO 646 IRV または ANSI X3.4-1986)
  (2) ラテンアルファベット No.1: 8ビットコード (ISO 8859-1)
  (3) ISO-2022-JP: ASCII と、ローマ文字、漢字(1978年版、1983年版) の
         7ビットコード (RFC 1468: ISO 646 + JIS X 0201 + JIS X 0208
                        + JIS X 0202(ISO 2022) + 独自規則)
  (4) 日本語EUC: ASCII(またはローマ文字)と、漢字、片仮名、補助漢字の
         8ビットコード (ISO 646 + JIS X 0208 + JIS X 0201 + JIS X 0212
                        + JIS X 0202(ISO 2022))
  (5) シフトJIS: ローマ文字と、片仮名、漢字、拡張文字の 8ビットコード
                       (JIS X 0201 + JIS X 0208 + 独自規則)
  (6) その他
  --
  ・(1)はアメリカ、(2)はヨーロッパ、(3)は日本(Internet)、(4)は
    日本(Unix)、(5)は日本(PC)で主に使用されている。
  ・(3)は、エスケープシーケンスで文字集合を切り換える。
  ・(4)は、SS2/SS3 で 片仮名/補助漢字を呼び出す。

文字集合の実例:
  [1] ASCII の図形文字 (94文字)          5C が「\」、7E が「〜」。
  [2] ISO 8859-1 の右側 (96文字)
  [3] JIS X 0201 のローマ文字 (94文字)   5C が「¥」、7E が「‾」。
  [4] JIS X 0201 の片仮名 (94文字、ただし 31文字は未定義)
  [5] JIS X 0208 漢字     (94x94 = 8,836文字、ただし 未定義あり)
  [6] JIS X 0212 補助漢字 (94x94 = 8,836文字、ただし 2,769文字は未定義)
  [7] その他
  --
  ・[5]は、1978年版(6,802文字)、1983年版(6,877文字)、1990年版(6,879文字)
    がある。


半角片仮名:
  JIS X 0201 の片仮名の俗称。JIS X 0201 と JIS X 0208 の文字集合を使用
  するシステムで、前者を後者の半分の幅で表示するものが多数存在し、かつ
  JIS X 0208 漢字の中にも片仮名があることから、JIS X 0201 の片仮名は半
  角片仮名と呼ばれて区別される。 JIS X 0208 全体を全角文字と呼ぶことも
  ある。JIS 規格には文字の表示幅の規定はない。

機種固有文字:
  上記の文字集合の未定義部分に各社が割り当てた文字。

文字化け:
  使用している文字コードの違いにより文字が正しく伝送/表示されないこと。

JISコード:
  ISO-2022-JP のことを指す場合が多い。
  本当に JIS で規定されているコードは次のとおり。
  ・ローマ文字だけの 7ビットコード (JIS X 0201 3.2.5)
  ・片仮名だけの 7ビットコード     (JIS X 0201 3.2.6)
  ・ローマ文字と片仮名の 7ビットコード (JIS X 0201 3.2.7)
  ・ローマ文字と片仮名の 8ビットコード (JIS X 0201 3.3.2)
  ・漢字だけの 7ビットコード      (JIS X 0208 + JIS X 0202 6.1.5(c))
  ・漢字だけの 8ビットコード      (JIS X 0208-1997?)
  ・ASCII と漢字の 7ビットコード  (ISO 646 + JIS X 0208-1997?)
  ・ASCII と漢字の 8ビットコード  (ISO 646 + JIS X 0208-1997?)
  ・ローマ文字と漢字の 7ビットコード (JIS X 0201 + JIS X 0208-1997?)
  ・ローマ文字と漢字の 8ビットコード (JIS X 0201 + JIS X 0208-1997?)
  --
  2つの文字集合を使用する 7ビットコードは、SI/SO でそれらを切り換える。

--
坂本智彦	sakamoto@sm.sony.co.jp
Next
Continue < 56he4m$stu@yase.yajima.kuis.kyoto-u.ac.jp>