No. 709/2188 Index Prev Next
Path: ie.u-ryukyu.ac.jp!hakata!sakura!kuis-news!wnoc-kyo-news!tdi-bb!news1-tokyonet!tokyonet.ad.jp!wnoc-tyo-news!csdnews.sm.sony!sakamoto
From: sakamoto@sm.sony.co.jp (Tomohiko Sakamoto)
Newsgroups: fj.kanji,fj.beginners
Subject: Re: Character Codes
Date: 15 Nov 1996 06:42:36 GMT
Organization: ITC, Sony Corporation
Lines: 74
Message-ID: < 56h3cs$b9u@csdnews.sm.sony.co.jp>
References: < 56h1pn$ao3@csdnews.sm.sony.co.jp>
Reply-To: sakamoto@sm.sony.co.jp
NNTP-Posting-Host: sak3.sm.sony.co.jp
Xref: ie.u-ryukyu.ac.jp fj.kanji:2756 fj.beginners:2567
In article < 56h1pn$ao3@csdnews.sm.sony.co.jp> ,
sakamoto@sm.sony.co.jp (Tomohiko Sakamoto) writes:
> 文字コードとは?
改定版です。
======================================================================
文字コード:
文字集合を定め、かつその集合内の文字とビット組合せを 1対1に関係づけ
る、あいまいでない規則の集合。(JIS X 0202 5.1.4 より)
符号化文字集合(coded character set)、文字符号(character code)のこと。
文字コードの実例:
(1) ASCIIコード: 7ビットコード (ISO 646 IRV または ANSI X3.4-1986)
(2) ラテンアルファベット No.1: 8ビットコード (ISO 8859-1)
(3) ISO-2022-JP: ASCII と、ローマ文字、漢字(1978年版、1983年版) の
7ビットコード (RFC 1468: ISO 646 + JIS X 0201 + JIS X 0208
+ JIS X 0202(ISO 2022) + 独自規則)
(4) 日本語EUC: ASCII(またはローマ文字)と、漢字、片仮名、補助漢字の
8ビットコード (ISO 646 + JIS X 0208 + JIS X 0201 + JIS X 0212
+ JIS X 0202(ISO 2022))
(5) シフトJIS: ローマ文字と、片仮名、漢字、拡張文字の 8ビットコード
(JIS X 0201 + JIS X 0208 + 独自規則)
(6) その他
--
・(1)はアメリカ、(2)はヨーロッパ、(3)は日本(Internet)、(4)は
日本(Unix)、(5)は日本(PC)で主に使用されている。
・(3)は、エスケープシーケンスで文字集合を切り換える。
・(4)は、SS2/SS3 で 片仮名/補助漢字を呼び出す。
文字集合の実例:
[1] ASCII の図形文字 (94文字) 5C が「\」、7E が「〜」。
[2] ISO 8859-1 の右側 (96文字)
[3] JIS X 0201 のローマ文字 (94文字) 5C が「¥」、7E が「‾」。
[4] JIS X 0201 の片仮名 (94文字、ただし 31文字は未定義)
[5] JIS X 0208 漢字 (94x94 = 8,836文字、ただし 未定義あり)
[6] JIS X 0212 補助漢字 (94x94 = 8,836文字、ただし 2,769文字は未定義)
[7] その他
--
・[5]は、1978年版(6,802文字)、1983年版(6,877文字)、1990年版(6,879文字)
がある。
半角片仮名:
JIS X 0201 の片仮名の俗称。JIS X 0201 と JIS X 0208 の文字集合を使用
するシステムで、前者を後者の半分の幅で表示するものが多数存在し、かつ
JIS X 0208 漢字の中にも片仮名があることから、JIS X 0201 の片仮名は半
角片仮名と呼ばれて区別される。 JIS X 0208 全体を全角文字と呼ぶことも
ある。JIS 規格には文字の表示幅の規定はない。
機種固有文字:
上記の文字集合の未定義部分に各社が割り当てた文字。
文字化け:
使用している文字コードの違いにより文字が正しく伝送/表示されないこと。
JISコード:
ISO-2022-JP のことを指す場合が多い。
本当に JIS で規定されているコードは次のとおり。
・ローマ文字だけの 7ビットコード (JIS X 0201 3.2.5)
・片仮名だけの 7ビットコード (JIS X 0201 3.2.6)
・ローマ文字と片仮名の 7ビットコード (JIS X 0201 3.2.7)
・ローマ文字と片仮名の 8ビットコード (JIS X 0201 3.3.2)
・漢字だけの 7ビットコード (JIS X 0208 + JIS X 0202 6.1.5(c))
・漢字だけの 8ビットコード (JIS X 0208-1997?)
・ASCII と漢字の 7ビットコード (ISO 646 + JIS X 0208-1997?)
・ASCII と漢字の 8ビットコード (ISO 646 + JIS X 0208-1997?)
・ローマ文字と漢字の 7ビットコード (JIS X 0201 + JIS X 0208-1997?)
・ローマ文字と漢字の 8ビットコード (JIS X 0201 + JIS X 0208-1997?)
--
2つの文字集合を使用する 7ビットコードは、SI/SO でそれらを切り換える。
--
坂本智彦 sakamoto@sm.sony.co.jp
Next
Continue < 56he4m$stu@yase.yajima.kuis.kyoto-u.ac.jp>