11. 符号化文字集合 CCS / Coded Character Set 文字集合を構成する「文字」、一つ一つに番号を振ったもの 一般にはこの番号を「コードポイント」 Unicode の場合 「Unicode Scalar Value」 「あ」->U+3042 (Unicode) JIS X 0208 「ビット組合せ」や「区点コード」 「あ」->04区02点 (JIS X 0208)
12. 符号化文字集合の例 ASCII 英数記号 ISO/IEC 8859-1 アクセント付き文字 JIS X 0201 いわゆる半角カナ JIS X 0208 第一・第二水準漢字など JIS X 0212 補助漢字など JIS X 0213 第三・第四水準漢字など Unicode いろいろ
13. JIS X 0208 http://www.kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kanjibukuro/japan.html
17. 用語の整理 charset Character setが由来と思われるため、「文字集合」の意味に感じられるが、用法としてはencodingと同じ 文字コード 文字集合 encoding ある文字のコードポイント
18. Unicode用語集 UCS-2は文字集合ではなくencoding ISO/IEC 10646の定義13.1 Two-octet BMP form (UCS-2) This coded representation form permits the use of characters from the Basic Multilingual Plane with each character represented by two octets. Unicodeの定義 “UCS-2. ISO/IEC 10646 encoding form: Universal Character Set coded in 2 octets, limited to the Basic Multilingual Plane.” http://www.unicode.org/glossary/#UCS_2
19. History of I18N Internationalization, 国際化 I .{18} N I18N S12N (Scherpenhuizenさんが元祖) http://blog.miraclelinux.com/yume/2007/01/i18n_8bc0.html
36. ISO/IEC 2022の構造 20 | 7F A0 | FF A ESC ( BA 漢 ESC $ B 4A 8E (SS2) JIS X 0208 US-ASCII EUC-JP G1 EUC-JP G2 JIS X 0212 EUC-JP G3 JIS X 0201 ローマ字 JIS X 0201 片仮名 JIS X 0213
60. シフトJIS関連の名前 「シフトJIS」 マイクロソフトウェア・アソシエイツが名付けた。総称として用いられる 「Shift-JIS」「Shift JIS」 「シフトJIS」の英語表記 「MS漢字コード」 開発者の山下による命名 「SJIS」 Unix方面での名前 「Shift_JIS」 IANA Charsetでの名前 「シフト符号化表現」 JIS X 0208:1997 附属書1 「Shift_JISX0213符号化表現」 JIS X 0213:2000 付属書1 「Shift_JIS-2004符号化表現」 JIS X 0213:2004付属書1 「CP932 (Windows Codepage 932)」 Microsoft実装 「Windows-31J」 CP932のIANA Charsetでの名前 「IBM CP932」 MS CP932とは別物 「IBM943」 MS CP932とおおむね同じ、JIS X 0201 「IBM943C」 MS CP932と同じ、ASCII
61. 日本語EUC関連の名前 「日本語EUC (圧縮形式)」 情報交換用のEUC、普通はこれ 「日本語EUC (固定長形式)」 System V での内部表現 「eucJP」 UI-OSF日本語環境実装規約で定義 「EUC-JP」 IANA Charsetでの名前 「UJIS」 ΣOSでの名前 「CP51932」 Internet Explorerでの日本語EUC実装 「eucJP-ms」 TOG/JVC CDE/Motif 技術検討 WGが定義 「EUC-JISX0213」 JIS X 0213:2000 付属書3 「EUC-JP-2004」 JIS X 0213:2004 付属書3