>サイトトップへ >このカテゴリの一覧へ

 

X 0221:2014 (ISO/IEC 10646:2012) 

(1) 

目 次 

ページ 

序文  1 

1 適用範囲 1 

2 適合性 2 

2.1 概要  2 

2.2 情報交換の適合性  2 

2.3 装置の適合性  2 

3 引用規格 3 

4 用語及び定義  3 

5 国際符号化文字集号の全体構造  10 

6 基本構造及び名称  10 

6.1 構造  10 

6.2 文字の符号化  11 

6.3 符号位置の種類  12 

6.4 文字の名前  13 

6.5 符号位置の短い識別子(UID)  13 

6.6 UCS列識別子  14 

6.7 オクテット列識別子  14 

7 UCSの維持・改正  14 

8 部分集合 14 

8.1 制限部分集合  15 

8.2 選択部分集合  15 

9 UCSの符号化形式  15 

9.1 UTF-8  15 

9.2 UTF-16  16 

9.3 UTF-32(UCS-4)  16 

10 UCSの符号化方式  17 

10.1 UTF-8  17 

10.2 UTF-16BE  17 

10.3 UTF-16LE  17 

10.4 UTF-16  17 

10.5 UTF-32BE  17 

10.6 UTF-32LE  17 

10.7 UTF-32  18 

11 UCSでの制御機能の使用  18 

12 機能識別の宣言  20 


 

X 0221:2014 (ISO/IEC 10646:2012) 目次 

(2) 

ページ 

12.1 識別の目的及び構文  20 

12.2 UCSの符号化形式の識別  20 

12.3 図形文字部分集合の識別  20 

12.4 制御機能集合の識別  21 

12.5 JIS X 0202の符号化方式の識別  21 

13 符号表及び一覧表の構造  21 

14 ブロック及び組の名前  22 

14.1 ブロックの名前  22 

14.2 組の名前  22 

15 双方向文脈での鏡像文字  22 

15.1 鏡像文字  22 

15.2 双方向テキストの方向性  23 

16 特殊文字  23 

16.1 空白の文字  23 

16.2 通貨記号  24 

16.3 書式文字  24 

16.4 漢字構成記述文字  25 

16.5 字形選択子及び字形指示列  25 

17 文字の表示形  28 

18 互換用文字  28 

19 文字の順序  29 

20 結合文字  29 

20.1 結合文字の順序  29 

20.2 結合クラス及び基準順序  29 

20.3 符号表上での形  29 

20.4 符号化表現のばらつき  30 

20.5 結合文字の重複  30 

20.6 結合文字を含む組  31 

20.7 図形素結合子(合成可能)  31 

21 正規形  31 

22 個々の用字及び記号の特性  32 

22.1 ハングル音節の合成方法  32 

22.2 インド及び他の南アジアで使う用字の特性  32 

22.3 ビザンチン音楽記号  33 

22.4 絵文字記号の原典情報  33 

23 漢字の原典参照  33 

23.1 原典参照一覧  33 

23.2 CJK統合漢字の原典参照  35 

23.3 CJK統合漢字の原典参照の表示  37 


 

X 0221:2014 (ISO/IEC 10646:2012) 目次 

(3) 

ページ 

23.4 CJK互換漢字の原典参照  39 

23.5 CJK互換漢字の原典参照の表示  39 

24 文字の名前及び注記  40 

24.1 名前  40 

24.2 名前の形式  40 

24.3 名前の単一性  41 

24.4 名前の不変性  41 

24.5 名前の一意性  41 

24.6 漢字の名前  42 

24.7 ハングル音節文字の名前  42 

25 名前付きUCS列識別子  44 

26 基本多言語面の構造  45 

27 用字及び記号群に用いる追加多言語面の構造  47 

28 追加漢字面の構造  49 

29 第三漢字面の構造  50 

30 追加特殊用途面の構造  50 

31 符号表及び文字の名前一覧表  51 

31.1 符号表  51 

31.2 文字の名前の一覧表  51 

31.3 符号表及び文字の名前一覧の添付ファイル  52 

附属書A(規定)部分集合用図形文字の組  54 

附属書B(規定)結合文字一覧  95 

附属書C(規定)面01〜面10のUCS変換形式(UTF-16)  96 

附属書D(規定)UCS変換形式8(UTF-8)  97 

附属書E(規定)双方向文脈での鏡像文字 98 

附属書F(参考)書式文字  99 

附属書G(参考)文字の名前のアルファベット順一覧  106 

附属書H(参考)UCSを識別するための“印”(しるし)の使用  107 

附属書I(参考)漢字構成記述文字  108 

附属書J(参考)内部記憶機能をもつ送受信兼用装置に対する推奨  111 

附属書K(参考)オクテット値表現の記法  112 

附属書L(参考)文字の名前付け指針 113 

附属書M(参考)文字の出所  116 

附属書N(参考)文字レパートリに対する外部参照  133 

附属書P(参考)CJK統合漢字に関する追加情報  135 

附属書Q(参考)ハングル音節文字の符号対応表  136 

附属書R(参考)ハングル音節文字の名前  137 

附属書S(参考)漢字の統合及び配列の手順  138 

附属書T(参考)タグ文字による言語のタグ付け  148 


 

X 0221:2014 (ISO/IEC 10646:2012) 目次 

(4) 

ページ 

附属書U(参考)識別子用の文字  149 

附属書JA(参考)日本文字部分レパートリ  150 

 

 


 

X 0221:2014 (ISO/IEC 10646:2012) 目次 

(5) 

まえがき 

この規格は,工業標準化法に基づき,日本工業標準調査会の審議を経て,経済産業大臣が改正した日本

工業規格である。 

これによって,JIS X 0221:2007は改正され,この規格に置き換えられた。 

この規格は,著作権法で保護対象となっている著作物である。 

この規格の一部が,特許権,出願公開後の特許出願又は実用新案権に抵触する可能性があることに注意

を喚起する。経済産業大臣及び日本工業標準調査会は,このような特許権,出願公開後の特許出願及び実

用新案権に関わる確認について,責任はもたない。 

 

この規格には,次の添付ファイル(CD-ROM:別添)がある(それぞれのファイルを参照する箇所を括

弧内に示す。)。 

− EmojiSrc.txt(22.4) 

− CJKU̲SR.txt(23.2) 

− CJKC̲SR.txt(23.4) 

− NUSI.txt(箇条25) 

− ISO10646-2012-1-0000-4DFF.pdf(31.3) 

− ISO10646-2012-2-4E00-9FFF.pdf(31.3) 

− ISO10646-2012-3-A000-1FFFF.pdf(31.3) 

− ISO10646-2012-4-20000-25333.pdf(31.3) 

− ISO10646-2012-5-25334-2A6FF.pdf(31.3) 

− ISO10646-2012-6-2A700-10FFFF.pdf(31.3) 

− IICORE.txt(附属書A) 

− Allnames.txt(附属書G) 

− HangulSy.txt(附属書R) 

− BasicJ.txt(附属書JA) 

− JIExt.txt(附属書JA) 

− JISup.txt(附属書JA) 

− JNIExt.txt(附属書JA) 

− CommonJ.txt(附属書JA) 

− JNIExt2.txt(附属書JA) 

 

X 0221:2014 (ISO/IEC 10646:2012) 


 

 

  

日本工業規格          JIS 

 

X 0221:2014 

 

(ISO/IEC 10646:2012) 

国際符号化文字集合(UCS) 

Information technology-Universal Coded Character Set (UCS) 

 

序文 

この規格は,2012年に第3版として発行されたISO/IEC 10646を基に,技術的内容及び構成を変更する

ことなく作成した日本工業規格である。 

なお,この規格で点線の下線を施してある参考事項及び附属書JA(参考)は,対応国際規格にはない事

項である。 

 

適用範囲 

この規格は,国際符号化文字集合を規定する。この規格は,世界の言語(用字)を書き表した形(表記

形)及び記号の表現・伝送・交換・処理・蓄積・入力・表示に適用できる。 

この規格は,国際符号化文字集合(以下,“この符号化文字集合”又は“UCS”という。)について,次

の事項を規定する。 

− この符号化文字集合の全体的な体系。 

− この規格で使用する用語の定義。 

− UCS符号空間の構造。 

− UCSの基本多言語面(BMP)の定義。 

− UCSの追加多言語面(SMP),追加漢字面(SIP),第三漢字面(TIP)及び追加特殊用途面(SSP)の

定義。 

− 世界の言語の用字及び表記形で使用する図形文字の集合の定義。 

− BMP,SMP,SIP,TIP及びSSP上の図形文字及び書式文字の名前並びにこれらのUCS符号空間にお

ける符号化表現。 

− 制御機能及び私用文字の符号化表現。 

− UCSの三つの符号化形式:UTF-8,UTF-16及びUTF-32。 

− UCSの七つの符号化方式:UTF-8,UTF-16,UTF-16BE,UTF-16LE,UTF-32,UTF-32BE及びUTF-32LE。 

− この符号化文字集合への将来の追加方法。 

UCSは,JIS X 0202で規定されたものとは異なる方式による符号系である。JIS X 0202からUCSを指示

する方法は,12.2による。 

この規格では,一つの図形文字に対して,BMP又は他の追加面の中から,ただ一つの符号位置を割り当

てる。 

注記 ユニコード標準(Unicode Standard)の第6.1版は,この規格と同一の文字,名前及び符号化表

現の一式を含んでいる。加えて,文字の特性の詳細,処理のアルゴリズム及び実装者に有用な

定義を含んでいる。 


X 0221:2014 (ISO/IEC 10646:2012) 

  

注記A この規格の対応国際規格及びその対応の程度を表す記号を,次に示す。 

ISO/IEC 10646:2012,Information technology−Universal Coded Character Set (UCS)(IDT) 

なお,対応の程度を表す記号“IDT”は,ISO/IEC Guide 21-1に基づき,“一致している”

ことを示す。 

 

適合性 

2.1 

概要 

規定外の私用文字をこの規格の規定に従って使用する場合,その文字自身は,この適合性要件の適用外

とする。 

注記 私用文字については,6.3.5を参照。 

2.2 

情報交換の適合性 

交換用符号化情報中の符号単位列(CCデータ要素)は,次の条件を全て満たしている場合に,この規

格に適合する。 

a) 符号単位列中の図形文字の符号化表現は,全て箇条6に適合し,箇条9に示すうちから選択した一つ

の識別された符号化形式に適合し,かつ,箇条10に示すうちから選択した一つの識別された符号化方

式に適合する。 

b) 符号単位列中で表現されている図形文字は,全て識別された部分集合(箇条8参照)の図形文字から

なる。 

c) 符号単位列中の制御機能の符号化表現は,全て箇条11に適合する。 

適合性を主張する場合,採用した符号化形式及び符号化方式を明示するとともに,採用した部分集合を

組及び/又は文字の一覧で明示しなければならない。 

2.3 

装置の適合性 

装置は,次のa)の要件に適合し,かつ,b)及び/又はc)に適合する場合,この規格に適合する。 

適合性を主張する場合,次のa)に規定する記述を含む文書を明示しなければならず,採用した符号化形

式,符号化方式,部分集合及び箇条11に従って採用した制御機能の種類を明示しなければならない(部分

集合は,組及び/又は文字の一覧によって示す。)。 

a) 装置についての記述 この規格に適合する装置には,それぞれ次のb)及びc)に規定するとおり,利用

者が装置に文字を送出できる方法及び/又は文字が利用者に提示されたときに利用者がそれを認識で

きる方法を明示した記述を備えなければならない。 

b) 送信装置 送信装置は,採用した部分集合から利用者が任意の文字を送出できるようにしなければな

らない。さらに,送信装置は,符号単位列中にあるそれらの文字の符号化表現を,採用した符号化形

式及び符号化方式に従って送信する能力をもたなければならない。したがって,送信装置は,誤った

形式の符号単位列を送出してはならない。 

c) 受信装置 受信装置は,符号単位列中にある任意の文字の符号化表現を,採用した符号化形式及び符

号化方式に従って受信し解釈する能力をもたなければならない。さらに,受信装置は,符号化表現に

対応する文字が採用した部分集合にある場合,その全てを,利用者が識別できる方法で,利用者に渡

さなければならない。受信装置は,誤った形式の符号単位列を誤った状態として処理しなければなら

ず,そのようなデータを文字列として解釈してはならない。 

対応する文字が採用した部分集合にない場合,それらの文字を利用者に示さなければならない。それら

を示す方法は,文字を互いに区別する必要はない。 


X 0221:2014 (ISO/IEC 10646:2012) 

 

注記1 この規格では,誤り条件についても,採用した部分集合にない文字を利用者に示す方法につ

いても,規定しない。 

注記2 再送能力をもつ受信装置については,附属書Jを参照。 

 

引用規格 

次に掲げる規格は,この規格に引用されることによって,この規格の規定の一部を構成する。これらの

引用規格は,その最新版(追補を含む。)を適用する。 

JIS X 0202 情報技術−文字符号の構造及び拡張法 

注記 対応国際規格:ISO/IEC 2022,Information technology−Character code structure and extension 

techniques(IDT) 

JIS X 0211 符号化文字集合用制御機能 

注記 対応国際規格:ISO/IEC 6429,Information technology−Control functions for coded character sets

(IDT) 

ユニコード附属書, UAX #9 The Unicode Bidirectional Algorithm 

<http://www.unicode.org/reports/tr9/tr9-25.html> 

ユニコード附属書, UAX #15 Unicode Normalization Forms 

<http://www.unicode.org/reports/tr15/tr15-35.html> 

ユニコード技術標準, UTS #37 Ideographic Variation Database 

<http://www.unicode.org/reports/tr37/tr37-8.html> 

ユニコード標準第6.1版, Chapter 4 Character Properties 

<http://www.unicode.org/versions/Unicode6.1.0/ch04.pdf> 

Section 4.3, Combining Classes−規定 

Section 4.5, General Category−規定 

Section 4.7, Bidi Mirrored−規定 

 

用語及び定義 

この規格で用いる主な用語及び定義は,次による。 

4.1 

基底文字(base character) 

結合文字でない図形文字。 

注記1 図形文字の多くは,基底文字である。基底文字を表示するときに,文脈に依存した様々な形

を用いたり,合字(ligature)の一部にしたりすることを,結合文字でないということが排除

するものではない。 

注記2 基底文字は,先行する文字と図形的に結合しないことが普通だが,幾つかの複雑な書記系で

は例外がある。 

4.2 

基本多言語面,BMP(basic multilingual plane, BMP) 

UCS符号空間の面00。 

4.3 

ブロック(block) 


X 0221:2014 (ISO/IEC 10646:2012) 

  

共通の特性をもつ文字の集合(例えば,用字)が割り当てられた符号位置の連続する範囲。ブロック同

士は,重なり合わない。ブロック中には,文字が割り当てられていない符号位置が一つ以上あってもよい。 

4.4 

基準形式(canonical form) 

この符号化文字集合の文字を,UCS符号空間中の一つの符号位置を用いて表現する形式。 

注記 基準形式を,UCS符号位置と一つ以上の符号単位との関係を意味する符号化形式と混同しては

ならない(4.23参照)。 

4.5 

文字(character) 

データの構成,制御又は表現に用いる要素の集合の構成単位。 

注記 図形記号は,一つ以上の符号化文字の列によって表現されることもある。 

4.6 

文字境界(character boundary) 

符号化文字の最後の符号単位と次に続く符号化文字の最初の符号単位との間の(符号単位列の)境目。 

4.7 

符号表(code chart, code table) 

UCS符号空間のある範囲に割り当てた符号化文字群の表現を,長方形に配置して示したもの。 

4.8 

符号化文字(coded character) 

文字と符号位置とを結びつけたもの。 

4.9 

符号化文字集合(coded character set) 

符号化文字の集合。 

4.10 

符号位置(code point, code position) 

UCS符号空間中の値。 

4.11 

符号単位(code unit) 

処理又は交換用の符号化テキストの単位を表現できる,最小のビット組合せ。 

注記 符号単位の例として,UTF-8符号形式で用いるオクテット(8ビットの符号単位),UTF-16符

号形式で用いる16ビットの符号単位及びUTF-32符号形式で用いる32ビットの符号単位があ

る。 

4.12 

符号単位列,CCデータ要素,符号化文字データ要素(code unit sequence, CC-data-element, 

coded-character-data-element) 

符号化文字集合に関する特定された一つ以上の規格に適合して,符号単位の並びを構成するように仕様

決めされた,情報交換の単位。 

注記1 この列は,どのような種類の符号位置に対応付けられる符号単位をも含むことができる。 

注記2 この規格では,この規格の以前の版と異なり,もはや実装水準を用いない。その符号単位列

の定義は,以前の実装水準3(制限のない水準)に対応する。従来,水準1又は2として知


X 0221:2014 (ISO/IEC 10646:2012) 

 

られていた符号単位列の定義は,廃止された。これらの従来の版との互換性を維持するため

に,JIS X 5605及びJIS X 5606のような規格の中の符号化表現を識別する文脈においては,

その実装の方針は,“実装水準3”として参照できる。附属書N参照。 

4.13 

組(collection) 

番号及び名前が付けられたものの集合。 

注記1 拡張組(4.25参照)でない組は,符号位置が一つ以上の識別された範囲に含まれるような符

号化文字だけからなる集合である。 

注記2 識別された範囲のいずれかに文字の割り当てられていない符号位置があり,将来この規格の

改正によってそのどこかの符号位置に追加文字が割り当てられたときには,組のレパートリ

が変わる。しかし,組の番号及び名前は,この規格の将来の版においても変えないことを意

図している。 

4.14 

結合文字(combining character) 

一般分類の値が,Spacing Combining Mark(Mc),Non Spacing Mark(Mn)又はEnclosing Mark(Me)の

いずれかである文字。 

注記 結合文字は,先行する,結合文字でない図形文字と組み合わせるか,又は結合文字ではない文

字の後に結合文字の列が続いた形のものと組み合わせることを意図している(4.17参照)。 

4.15 

結合クラス(combining class) 

結合文字の図形文字に対する作用及び結合文字の並びの中での基準順序を決定するために,個々の結合

文字に対応付けた値。 

4.16 

互換用文字(compatibility character) 

主として既存の符号化文字集合との互換性のため,この規格に符号化文字として含めた図形文字。 

4.17 

合成列(composite sequence) 

基底文字とそれに続く一つ以上の結合文字,ZERO WIDTH JOINER又はZERO WIDTH NON-JOINER

とからなる図形文字の列(4.14参照)。 

注記1 合成列からなる図形記号は,通常,その合成列を構成する各文字の図形記号の組合せからな

る。 

注記2 合成列は,この規格のレパートリとして符号化されていない文字を表現するために用いるこ

とができる。 

注記2A ZERO WIDTH JOINER及びZERO WIDTH NON-JOINERについては,F.1.1を参照。 

4.18 

制御文字(control character) 

その符号化表現が一つの符号位置からなる制御機能。 

注記 制御文字は,DELETE,FORM FEED,ESCなどの名前のようなものを用いて呼ぶことがあるが,

これらの呼び名は,正式な文字の名前ではない。JIS X 0211が制御文字に対応させている長い

名前の一覧は,箇条11を参照。 


X 0221:2014 (ISO/IEC 10646:2012) 

  

4.19 

制御機能(control function) 

符号単位列によって表現され,データの記録,処理,伝送又は解釈に影響を及ぼす動作。 

4.20 

分解写像(decomposition mapping) 

一つの文字を,基準等価又は互換等価な一つ以上の文字の一つの列に写す写像。 

4.21 

既定状態(default state) 

状態が明示的に指定されていないときに,想定する状態。 

注記 F.2.2〜F.2.4参照。 

4.22 

装置(device) 

符号単位列内の符号化情報を送信及び/又は受信できる情報処理機器の一部分。 

注記 装置は,通常の入出力機器であってもよく,応用プログラム又はゲートウェイ機能のような処

理であってもよい。 

4.23 

符号化形式(encoding form) 

UCSの文字を表す個々のUCS符号位置を,その符号化形式が用いる一つ以上の符号単位によって表す

方法を決定するもの。 

注記 この規格は,符号化形式としてUTF-8,UTF-16及びUTF-32を規定する。 

4.24 

符号化方式(encoding scheme) 

符号化形式を構成する符号単位をオクテットの並びに直列化する方法の規定。 

注記 UCSの符号化方式には,符号化形式と同じ呼び名をもつものがある。しかし,符号化方式の呼

び名と符号化形式の呼び名とは,異なる文脈で用いる。UCSの符号化形式は,メモリ上及び応

用インタフェースでのテキストデータの表現に言及する。UCSの符号化方式は,オクテットの

並びに直列化されたテキストデータに言及する。 

4.25 

拡張組(extended collection) 

正規形NFCである符号位置の列を含んでもよい組。 

注記1 3 LATIN EXTENDED-A,4 LATIN EXTENDED-B,15 ARABIC EXTENDEDなどのように

“extended”(拡張)という語を名前に含む組が多数あるが,組の名前に“extended”という

語が含まれていることとその組が拡張組であることとの間には,関係がない。 

注記2 正規形NFCについては,箇条21参照。 

注記3 符号位置の列は,名前付きUCS列識別子(箇条25参照)によって参照される。 

4.26 

確定組(fixed collection) 

識別された範囲に含まれる全ての符号位置に文字が割り当てられている組であって,この規格の将来の

版においても(その組に含まれるレパートリが)変わらないことを意図しているもの。 


X 0221:2014 (ISO/IEC 10646:2012) 

 

4.27 

書式文字(format character) 

周囲の文字の配置又は処理に作用することを主な機能とする文字。 

注記 書式文字は,通常,それ自身の可視化表現をもたない。 

4.28 

一般分類,GC(General Category, GC) 

字,句読点,記号類などの文字の重要な分類を決定するために,個々のUCS符号位置に割り当てた値。 

注記1 実際の値は,ユニコード標準の2文字省略形を用いた一般分類特性として定める(箇条3に

示す最新のユニコード標準の一般分類を参照。)。 

注記2 最初の文字が同一であるような全ての一般分類をまとめて扱うときには,一般分類の値の最

初の文字だけを用いて表すことがある。例えば,“L”は,“Lu”,“Ll”,“Lt”,“Lm”及び“Lo”

という字に関する一般分類の全体を表す。 

4.29 

図形文字(graphic character) 

制御機能でも書式文字でもない文字であって,通常は,手書き,印字又は表示の可視化表現をもつもの。 

4.30 

図形記号(graphic symbol) 

図形文字又は合成列の可視化表現。 

4.31 

上位サロゲート符号位置(high-surrogate code point) 

UTF-16で用いるために保留されているD800〜DBFFの範囲の符号位置。 

4.32 

上位サロゲート符号単位(high-surrogate code unit) 

UTF-16でサロゲートペアの先頭の符号単位として用いるD800〜DBFFの範囲の16ビットの符号単位。 

注記 9.2参照。 

4.33 

誤った形式の符号単位列(ill-formed code unit sequence) 

UCSのある符号化形式に従うと称するUCS符号単位列であって,その符号化形式の規定に適合しない

もの。 

例 対をなさないサロゲート符号単位は,誤った形式の符号単位列の例である。 

4.34 

誤った形式の符号単位列部分集合(ill-formed code unit sequence subset) 

ある符号単位列の空でない部分集合であって,その符号単位列の,正しい形式の符号単位の最小列であ

るようなサブセットに属する符号単位を含まないもの。 

注記 誤った形式の符号単位列部分集合は,正しい形式の符号単位の最小列と重ならない。 

4.35 

交換(interchange) 

通信手段又は交換可能な媒体によって,ある利用者から他の利用者に文字の符号化データを転送するこ

と。 

注記 交換は,データを直列化し,UCSの符号化方式を用いる。 


X 0221:2014 (ISO/IEC 10646:2012) 

  

4.36 

相互動作(interworking) 

それぞれ異なる符号化文字集合を採用している二つ以上のシステム間で,意味のある文字の符号化デー

タの交換ができるようにすること。 

注記 二つの符号の間での変換を含むこともある。 

4.37 

ISO/IEC 10646-1 

この規格の対応国際規格が以前に部編成であったときに,体系及び基本多言語面(BMP)を規定してい

た部。 

注記1 ISO/IEC 10646の第1部とも呼ぶ。 

注記2 ISO/IEC 10646-1には,第1版と第2版とがあった。 

4.38 

ISO/IEC 10646-2 

この規格の対応国際規格が以前に部編成であったときに,追加多言語面(SMP),追加漢字面(SIP)及

び追加特殊用途面(SSP)を規定していた部。 

注記1 ISO/IEC 10646の第2部とも呼ぶ。 

注記2 ISO/IEC 10646-2には,第1版だけがあった。 

4.39 

下位サロゲート符号位置(low-surrogate code point) 

UTF-16で用いるために保留されているDC00〜DFFFの範囲の符号位置。 

4.40 

下位サロゲート符号単位(low-surrogate code unit) 

UTF-16でサロゲートペアの末尾の符号単位として用いるD800〜DBFFの範囲の16ビットの符号単位。 

注記 9.2参照。 

4.41 

正しい形式の符号単位の最小列(minimal well-formed code unit sequence) 

正しい形式の符号単位列であって,一つのUCSスカラ値に写像されるもの。 

4.42 

鏡像文字(mirrored character) 

右から左に配置するテキストにおいて,その像が水平に反転される文字。 

4.43 

オクテット(octet) 

8ビットの符号単位。 

注記 この規格では,オクテットの値は,16進数を用いて00〜FFとして表記する(附属書K参照)。 

4.44 

面(plane) 

UCS符号空間の一部分であって,65 536の符号位置からなるもの。 

注記 UCS符号空間は,17の面からなる。 

4.45 

表示(presentation) 


X 0221:2014 (ISO/IEC 10646:2012) 

 

図形記号を書いたり,印字したり,画面表示したりする処理。 

4.46 

表示形(presentation form) 

(一部の言語の用字を表示する際に,)他の文字との相対的な位置に依存して文字を表現する図形記号の

形。 

4.47 

私用面(private use plane) 

この符号化文字集合中の面であって,この規格で文字を規定しない面。 

注記 面0F及び面10が私用面である。 

4.48 

レパートリ(repertoire) 

符号化文字集合で表現する文字の指定された集合。 

4.49 

区(row) 

面の一部であって,256の倍数の符号位置から始まり256個の連続する符号位置からなる,00〜FFの数

値によって識別されるもの。 

4.50 

用字(script) 

一つ以上の言語の表記形で使用する図形文字の集合。 

4.51 

追加面(supplementary plane) 

UCS符号空間の面00以外の面。 

注記 追加面は,基本多言語面に割り当てていない文字を収容する。 

4.52 

用字及び記号のための追加多言語面,SMP(Supplementary Multilingual Plane for scripts and symbols, SMP) 

UCS符号空間の面01。 

4.53 

追加漢字面,SIP(Supplementary Ideographic Plane, SIP) 

UCS符号空間の面02。 

4.54 

追加特殊用途面,SSP(Supplementary Special-purpose Plane, SSP) 

UCS符号空間の面0E。 

4.55 

サロゲートペア(surrogate pair) 

二つの16ビット符号単位からなる一文字の表現であって,ペアの最初の値が上位サロゲート符号単位で

あり,二番目の値が下位サロゲート符号単位であるもの。 

4.56 

第三漢字面,TIP(Tertiary Ideographic Plane, TIP) 

UCS符号空間の面03。 


10 

X 0221:2014 (ISO/IEC 10646:2012) 

  

4.57 

UCS符号空間(UCS codespace) 

UCSの文字のレパートリを割り当てるために用いる,0〜10FFFF(16進数)の整数からなる符号空間。 

4.58 

UCSスカラ値(UCS scalar value) 

上位サロゲート符号位置及び下位サロゲート符号位置を除く任意のUCS符号位置。 

4.59 

対をなさないサロゲート符号単位(unpaired surrogate code unit) 

符号単位列の中の符号単位であって,次のいずれかであるもの。 

− 上位サロゲート符号単位であって,下位サロゲート符号単位が直後にないもの。 

− 下位サロゲート符号単位であって,上位サロゲート符号単位が直前にないもの。 

4.60 

利用者(user) 

装置が提供するサービスを使う人又はそれに代わるもの。 

注記 “装置”が符号変換機又はゲートウェイ機能の場合,これは,応用プログラムのような処理で

あってもよい。 

4.61 

正しい形式の符号単位列(well-formed code unit sequence) 

UCSのある符号化形式に従うと称するUCS符号単位列であって,その符号化形式の規定に適合し,誤

った形式の符号単位列部分集合を含まないもの。 

 

国際符号化文字集号の全体構造 

ここでは,国際符号化文字集合(以下,“この符号化文字集合”という。)の大まかな構造について示し,

図1に図示する。構造の規定は,箇条6及び箇条8による。 

この符号化文字集合の基準形式(規格を理解するための形式)は,0〜10FFFFの整数からなるUCS符号

空間を用いる。 

この規格は,次の面の符号化文字を定義する。 

− 基本多言語面(BMP,すなわち,面00)。 

− 用字及び記号のための追加多言語面(SMP,すなわち,面01)。 

− 追加漢字面(SIP,すなわち,面02)。 

− 追加特殊用途面(SSP,すなわち,面0E)。 

第三漢字面(TIP,面03)を漢字のために保留する。TIPは,現在空である。面04〜0Dは,将来の標準

化のために保留する。 

面0F及び10は,私用のために保留する。 

符号空間の部分集合を,図形文字の部分レパートリを定めるために使ってもよい。 

 

基本構造及び名称 

6.1 

構造 

この規格が規定する国際符号化文字集合は,17の面からなる一つのものとみなさなければならない。 

 


11 

X 0221:2014 (ISO/IEC 10646:2012) 

 

 

図1−国際符号化文字集合の面 

 

6.2 

文字の符号化 

UCS符号空間の中で符号化される個々の文字は,0〜10FFFFの範囲の一つの整数によって表現され,符

号位置として識別される。 

一つの文字を符号位置によって識別するときには,整数の6桁形式によって次のように表現する。 

000030は,DIGIT ZEROを表現する。 

000041は,LATIN CAPITAL LETTER Aを表現する。 

010000は,LINEAR B SYLLABLE B008 Aを表現する。 

面00の中の文字を引用するときは,先頭の2桁の数字を省略してもよい。面01〜面0Fの中の文字を引

用するときは,頭の1桁の数字を省略してもよい。例えば,次のように表現してもよい。 


12 

X 0221:2014 (ISO/IEC 10646:2012) 

  

0030によって,DIGIT ZEROを表現する。 

0041によって,LATIN CAPITAL LETTER Aを表現する。 

10000によって,LINEAR B SYLLABLE B008 Aを表現する。 

6.3 

符号位置の種類 

6.3.1 

分類 

UCS符号位置は,一般分類の値に基づいて基本の種類に分類される。一般分類の値は,ユニコード標準

第6.1版の一般分類特性に従って決定する(箇条3参照)。表1に種類をまとめる。 

 

表1−符号位置の種類 

基本の種類 

概要 

一般分類 

文字の状態 

符号位置の状態 

図形 

字,マーク,数,句読点,記号及び空白 L,M,N,P,

S及びZs 

文字として 
割当て済み 

割当て済みの 
符号位置 

書式 

可視化されずに周囲の文字に影響する 

Cf,Zl及びZp 

制御 

一つの符号位置からなる制御機能 

Cc 

私用 

この規格の外側での私的な合意に基づ
き定義する用途 

Co 

サロゲート 

UTF-16のために永久に保留 

Cs 

文字として 
割り当てていない 

非文字 

内部利用のために永久に保留 

Cn 

保留 

将来の割当てのために保留 

割り当てていない 
符号位置 

 

サロゲート,非文字(noncharacter)及び保留の符号位置は,文字として割り当てていないので交換には

制約がある。例えば,サロゲート符号位置は,どのUCS符号化形式にも正しい形式の表現がない。 

6.3.2 

図形文字 

同一の図形文字を複数の符号位置に割り当てることはない。この符号化文字集合には,似た形の図形文

字が複数存在するが,それらは,異なる目的で使用する異なる文字であって,異なる名前をもつ。 

6.3.3 

書式文字 

書式文字は,可視化されずに周囲の文字に影響を与えるような文字の分類である。 

6.3.4 

制御文字 

BMPの符号位置0000〜001F及び007F〜009Fは,制御文字のために保留する(箇条11参照)。 

6.3.5 

私用文字 

BMPの符号位置E000〜F8FFは,私用のために保留する。面0F及び面10の,FFFFE,FFFFF,10FFFE

及び10FFFFを除く全ての符号位置は,私用のために保留する。 

この規格では,私用文字にはいかなる制限も加えない。私用文字は,利用者定義の文字を備えるのに使

用できる。例えば,これは,漢字の用字の利用者には一般的な要件となる。 

注記 私用文字の意味のある交換のためには,この規格とは別に,送信者と受信者との間の合意が必

要となる。 

6.3.6 

サロゲート符号位置 

符号位置D800〜DFFFは,UTF-16の符号化形式で使用するために保留する(9.2参照)。前半(D800〜

DBFF)を上位サロゲート符号位置とし,後半(DC00〜DFFF)を下位サロゲート符号位置とする。 

6.3.7 

非文字符号位置 

非文字である符号位置の状態を将来の規格の改正によって変更することは,ない。非文字は,FDD0〜


13 

X 0221:2014 (ISO/IEC 10646:2012) 

 

FDEF及び下位4桁がFFFE又はFFFFであるような全ての符号位置とする。 

注記 符号位置FFFEは,“印”(しるし)用に保留する。符号位置FDD0〜FDEF及びFFFFは,符号

化文字ではないことが保証された数値を必要とする内部処理に使用できる(例えば,表を終了

させる,テキストの終わりを通知するなど。)。さらに,FFFFは,BMPの最大値であるから,

UTF-16の文脈においては,2進探索又は順次探索の索引最終値として使用することもできる。 

6.3.8 

保留符号位置 

保留符号位置は,将来の標準化のために保留する。保留符号位置を他の目的に用いてはならない。この

規格の将来の版は,保留の符号位置に文字を割り当てることがある。 

6.4 

文字の名前 

この規格は,全ての図形文字及び書式文字に一意的な名前を付ける。命名の基準は,次のいずれかとす

る。 

a) 文字の慣例的な意味を示す。 

b) 対応する図形記号の形を表す。 

c) 中国,日本及び韓国の漢字(CJK漢字)については,24.6に示す規則に従う。 

d) ハングル音節については,24.7に示す規則に従う。 

文字によっては,文字の別名と呼ぶ代替の名前を一つ以上もつことがある。これは,元の名前を補正す

るものである。文字の名前を構成するためのその他の規則は,箇条24に示す。 

CJK統合漢字及びハングル音節以外の文字の名前の一覧を箇条31に示す。 

注記 文字の名前の一覧は,ユニコードの文字データベースにも含まれている。これは,

<http://www.unicode.org/Public/UNIDATA/NamesList.txt>

<http://www.unicode.org/Public/UNIDATA/NamesList.html>に記載されている。 

6.5 

符号位置の短い識別子(UID) 

この規格は,保留されている(未割当ての)符号位置を含む各符号位置の短い識別子(short identifier)

を定義する。いずれの符号位置の短い識別子も,他のいずれの符号位置の短い識別子とは異なる。ある文

字がある符号位置に配置されているとき,その符号位置の短い識別子は,その符号位置に配置される文字

を引用するために使用できる。 

注記1 例えば,U+DC00は,サロゲートの符号位置を識別し,U+FFFFは,非文字の符号位置を識

別する。U+0025は,図形文字が配置されている符号位置を識別する。同時に,U+0025は,

そこに配置される文字(すなわち,PERCENT SIGN)をも識別する。 

注記2 この短い識別子は,規格の記述に使用される言語とは独立である。規格の文章を翻訳する場

合でも,そのままにする。 

ここでは,短い識別子を次のいずれかとして定義する。 

a) 短い識別子の6桁形式は,文字の符号位置を示す六つの16進数字の列とする(6.2参照)。 

b) 短い識別子の4〜5桁形式は,6桁形式の最後の四つ又は五つの数字とする。4桁を超える部分の頭の

0は,省略する。 

c) 短い識別子の4〜5桁形式又は6桁形式の前に,文字“+”(PLUS SIGN)を付けてもよい。 

d) 上のa)〜c)で定義した三つの短い識別子の形式の前に,前置文字(prefix letter)“U”(LATIN CAPITAL 

LETTER U)を付けてもよい。 

短い識別子の中に現れる大文字のA〜F及びUは,対応する小文字に置き換えてもよい。 

バッカス・ナウア記法(Backus-Naur form)による,短い識別子の完全な構文は,次による。 


14 

X 0221:2014 (ISO/IEC 10646:2012) 

  

{ U | u }{+}(xxxx | xxxxx | xxxxxx) 

ここに,“x”は,一つの16進数字(0〜9,A〜F又はa〜f)を表す。 

例 LATIN SMALL LETTER LONG Sは,次のいずれの形式によって表記してもよい。 

 

017F 

+017F 

U017F 

U+017F 

任意の大文字を対応する小文字に置き換えてもよい。 

6.6 

UCS列識別子 

この規格は,この規格中の任意の符号位置の列に対して識別子を定義する。このような識別子を,UCS

列識別子(以下,USIという。)という。n個の符号位置からなる列のUCS識別子は,次の形式とする。 

<UID1, UID2, ..., UIDn> 

ここに,UID1,UID2などは,対応する符号位置の短い識別子であって,列における符号位置の出現順序

と同じ順に表記する。このような列におけるそれぞれの符号位置に文字が割り当てられている場合,それ

らの符号位置に割り当てられた文字の列を識別するためにUSIを用いることができる。UID1,UID2など

の構文は,6.5で規定する。UIDの間は,COMMA(コンマ)で区切る。COMMAの後ろに一つのSPACE(ス

ペース)を付加してもよい。UCS列識別子は,少なくとも二つのUIDを含み,LESS-THAN SIGN[不等

号(より小)]で始まり,GREATER-THAN SIGN[不等号(より大)]で終わる。 

バッカス・ナウア記法による,UCS列識別子の完全な構文は,次による。 

“<” (xxxx | xxxxx | xxxxxx) ((“,” space?) (xxxx | xxxxx | xxxxxx))+ “>” 

ここに,“x”は,一つの16進数字(0〜9,A〜F又はa〜f)を表す。 

注記 UCS列識別子は,部分集合の内容の指定に用いることはできない。UCS列識別子は,この規格

の外で,対応付けを示す合成列,フォントでのレパートリなどの指定に用いてもよい。 

6.7 

オクテット列識別子 

符号化形式の定義(箇条10参照)の文脈において,直列化されたオクテットを表現するために,この規

格は,直列化したオクテット列の識別子を定義する。n個のオクテットからなる列は,次による。 

<xx1 xx2 … xxn> 

ここに,xx1,xx2及びxxnは,二つの16進数字からなる最初,2番目及びn番目のオクテットを表す。 

 

UCSの維持・改正 

この符号化文字集合は,ISO/IEC JTC 1(情報技術)のSC 2(符号化文字集合)によって,維持・改正

される。 

注記0A この規格の維持・改正は,ISO/IEC JTC 1での作業に応じて,日本工業標準調査会で審議す

る。 

この符号化文字集合における全ての文字の名前及び符号位置割当ては,この規格の将来の版及び改正に

よって変更されない。これは文字の別名も含まれる。 

注記 規格の出版後に文字の名前を変更できないので,文字の名前が不適切であった場合は,文字の

別名を作成する。 

 

部分集合 

この規格は,情報交換,送信装置及び受信装置で使用するための,符号化図形文字の部分集合の仕様を

規定する。 

部分集合の仕様として,制限部分集合及び選択部分集合の二つを規定する。採用される部分集合は,こ


15 

X 0221:2014 (ISO/IEC 10646:2012) 

 

の二つのいずれか又は両者の組合せで構成してもよい。 

8.1 

制限部分集合 

制限部分集合は,指定する部分集合が含む図形文字の一覧によって示す。この仕様は,他の符号系を使

う適用業務群及び装置群が,この符号化文字集合との間で相互動作することを可能とする。 

制限部分集合への適合性を主張する場合,この規格で定義された図形文字の名前又は符号位置を用いて,

部分集合中の図形文字の一覧を示さなければならない。 

8.2 

選択部分集合 

選択部分集合は,この規格で定義された図形文字の組の一覧によって示す。選択の対象となる組の一覧

を附属書Aに示す。選択部分集合では,符号位置0020〜007Eが,いつでも自動的に含まれる。 

選択部分集合への適合性を主張する場合,選択された,この規格で定義されている組の一覧を,示さな

ければならない。 

 

UCSの符号化形式 

この規格は,個々のUCSスカラ値を一つ以上の符号単位の一意の列で表現する符号化形式を三つ規定す

る。これらを,UTF-8,UTF-16及びUTF-32という。 

9.1 

UTF-8 

UTF-8は,表2で指定されるように各UCSスカラ値を一つ〜四つのオクテットのオクテット列に割り当

てるUCSの符号化形式である。 

− 組BASIC LATINのUCS文字は,UTF-8では,ISO/IEC 4873に従って表現される。すなわち,20〜

7Eの値をもつ単一オクテットである。 

− 符号位置0000〜001Fの制御機能及び符号位置007FのDELETEは,箇条11で規定する詰込みオクテ

ットなしで表現される。すなわち,ISO/IEC 4873及びJIS X 0202の8ビット構造に従った,それぞれ

00〜1F及び7Fの値の単一オクテットである。 

− その他には,00〜7Fの値のオクテットは,いかなる文字のUTF-8符号化表現においても使われない。

これによって,UTF-8符号化表現と,これらのオクテット値を手掛かりにして符号単位列を解析する

ような既存のファイル操作システム及び通信サブシステムとの互換性が保たれる。 

− 任意の位置から始めて符号単位列を1オクテットずつ調べるとき,いかなる文字も,そのUTF-8符号

化表現の最初のオクテットを直ちに識別できる。そのオクテットは,その文字の符号化表現を構成す

る複数オクテットの列に含まれる継続オクテット(もしあれば)の数を示す。 

表2は,UTF-8符号化形式におけるビット割当てを指定し,UCSスカラ値の範囲と一つ〜四つのオクテ

ット列との対応を示す。 

 

表2−UTF-8ビット割当て 

スカラ値 

第1オクテット 

第2オクテット 

第3オクテット 

第4オクテット 

000000000xxxxxxx 

0xxxxxxx 

 

 

 

00000yyyyyxxxxxx 

110yyyyy 

10xxxxxx 

 

 

zzzzyyyyyyxxxxxx 

1110zzzz 

10yyyyyy 

10xxxxxx 

 

000uuuuuzzzzyyyyyyxxxxxx 

11110uuu 

10uuzzzz 

10yyyyyy 

10xxxxxx 

 

サロゲート符号位置は,UCSスカラ値ではないため,符号位置D800〜DFFFに対応するUTF-8のいか

なる列も,誤った形式である。 


16 

X 0221:2014 (ISO/IEC 10646:2012) 

  

表3は,全ての正しい形式のUTF-8のオクテット列の範囲を一覧する。表3で一覧されるパターンに一

致しない任意のUTF-8列は,誤った形式である。 

 

表3−正しい形式のUTF-8オクテット列 

符号位置 

第1オクテット 

第2オクテット 

第3オクテット 

第4オクテット 

0000〜007F 

00〜7F 

 

 

 

0080〜07FF 

C2〜DF 

80〜BF 

 

 

0800〜0FFF 

E0 

A0〜BF 

80〜BF 

 

1000〜CFFF 

E1〜EC 

80〜BF 

80〜BF 

 

D000〜D7FF 

ED 

80〜9F 

80〜BF 

 

E000〜FFFF 

EE〜EF 

80〜BF 

80〜BF 

 

10000〜3FFFF 

F0 

90〜BF 

80〜BF 

80〜BF 

40000〜FFFFF 

F1〜F3 

80〜BF 

80〜BF 

80〜BF 

100000〜10FFFF 

F4 

80〜8F 

80〜BF 

80〜BF 

 

表3で示す形式の正しさの条件の結果として,C0〜C1及びF5〜FEのオクテット値は,UTF-8では許さ

れない。 

9.2 

UTF-16 

UTF-16は,表4で指定されるように各UCSスカラ値を一つ〜二つの符号なし16ビット符号単位列に割

り当てるUCSの符号化形式である。 

UTF-16符号化形式では,0000〜D7FF及びE000〜FFFFの範囲の符号位置は,単一の16ビット符号単位

で表現される。10000〜10FFFFの範囲にある符号位置は,二つの16ビット符号単位で表現される。この特

別な符号単位の対を,サロゲートペアという。 

サロゲートペアに用いる符号単位は,単一符号単位の表現で使用する符号単位と重複しないので,

UTF-16における全ての符号位置の表現は,他の表現と重なることがない。 

UTF-16は,一般的に使用される文字の大多数を含むBMPの文字の表現に最適化されている。 

サロゲート符号位置は,UCSスカラ値ではないため,単独のサロゲート符号単位は,誤った形式である。 

表4は,UTF-16符号化形式のビット割当てを指定する。サロゲートペアの計算において,スカラ値のオ

フセット開始の計算に当たり16進数の10000の減算が行われる(表中において“wwww = uuuuu−1”で

表現される。)。 

 

表4−UTF-16ビット割当て 

スカラ値 

UTF-16 

xxxxxxxxxxxxxxxx 

xxxxxxxxxxxxxxxx 

000uuuuuxxxxxxxxxxxxxxxx 

110110wwwwxxxxxx  110111xxxxxxxxxx 

 

注記 この規格の以前の版には,UCS-2という2オクテットBMP形式が含まれていた。これは,UTF-16

符号化形式のサブセットであって,UCSスカラ値をBMPの範囲に制限したものとみなすこと

ができた。UCS-2符号化形式は,廃止された。 

9.3 

UTF-32(UCS-4) 

UTF-32(UCS-4も同じ。)は,各UCSスカラ値を単一の符号なし32ビット符号単位に割り当てるUCS

符号化形式である。用語UTF-32とUCS-4とは,この符号化形式を指定するために互いに取り替えて用い

てもよい。 


17 

X 0221:2014 (ISO/IEC 10646:2012) 

 

サロゲート符号位置は,UCSスカラ値ではないため,0000D800〜0000DFFFの範囲のUTF-32符号単位

は,誤った形式である。 

 

10 UCSの符号化方式 

符号化方式とは,それぞれのUCS符号化形式に特有のオクテット直列化の方式であって,印の仕様もそ

の一部である。印(しるし)は,対応する符号化形式における,符号位置FEFFのZERO WIDTH NO-BREAK 

SPACEに対応する符号単位列とする。印が使われる場合,印は,直列化オクテット列の先頭において,文

字の表現に使われる符号化形式におけるオクテットの順序を示す。 

この規格では,UTF-8,UTF-16BE,UTF-16LE,UTF-16,UTF-32BE,UTF-32LE及びUTF-32の七つの

符号化方式を規定する。 

10.1 UTF-8 

UTF-8符号化方式では,UTF-8の符号単位列を,その符号単位列の順序そのままに直列化する。 

UTF-8で表現するとき,印は,オクテット列<EF BB BF>になる。UTF-8データ列の先頭におけるその利

用は必要でなく,また,推奨もされないが,適合性に影響しない。 

10.2 UTF-16BE 

UTF-16BE符号化方式は,UTF-16の符号単位列を,上位オクテットを下位オクテットより前置するオク

テットの並べ方によって直列化する(この並べ方は,ビッグエンディアンとしても知られている。)。 

UTF-16BEでは,先頭のオクテット列<FE FF>は,FEFF ZERO WIDTH NO-BREAK SPACEとして解釈さ

れ,印としての意味は,もたない。 

10.3 UTF-16LE 

UTF-16LE符号化方式は,UTF-16の符号単位列を,下位オクテットを上位オクテットより前置するオク

テットの並べ方によって直列化する(この並べ方は,リトルエンディアンとしても知られている。)。 

UTF-16LEでは,先頭のオクテット列<FF FE>は,FEFF ZERO WIDTH NO-BREAK SPACEとして解釈さ

れ,印としての意味は,もたない。 

10.4 UTF-16 

UTF-16符号化方式は,UTF-16の符号単位列を,上位オクテットを下位オクテットより前置又は後置す

るオクテットの並べ方によって直列化する。 

UTF-16符号化方式では,<FE FF>として読み込まれる最初の印は,上位オクテットを下位オクテットよ

り前置することを示し,<FF FE> は,その逆を示す。印は,テキストデータの一部には,含まれない。 

印がない場合は,UTF-16符号化方式のオクテット順序は,上位オクテットを下位オクテットより前置す

る。 

10.5 UTF-32BE 

UTF-32BE符号化方式は,UTF-32の符号単位列を,上位オクテットを下位オクテットより前置するオク

テットの並べ方によって直列化する(この並べ方は,ビッグエンディアンとしても知られている。)。 

UTF-32BEでは,先頭のオクテット列<00 00 FE FF>は,FEFF ZERO WIDTH NO-BREAK SPACEとして

解釈され,印としての意味は,もたない。 

10.6 UTF-32LE 

UTF-32LE符号化方式は,UTF-32の符号単位列を,下位オクテットを上位オクテットより前置するオク

テットの並べ方によって直列化する(この並べ方は,リトルエンディアンとしても知られている。)。 

UTF-32BEでは,先頭のオクテット列< FF FE 00 00>は,FEFF ZERO WIDTH NO-BREAK SPACEとして


18 

X 0221:2014 (ISO/IEC 10646:2012) 

  

解釈され,印としての意味は,もたない。 

10.7 UTF-32 

UTF-32符号化方式は,UTF-32の符号単位列を,下位のオクテットを上位のオクテットより前置又は後

置するオクテットの並べ方によって直列化する。 

印がない場合は,UTF-32符号化方式のオクテット順序は,上位のオクテットを下位のオクテットより前

置する。 

 

11 UCSでの制御機能の使用 

この符号化文字集合は,JIS X 0211又は同様な構造の制御機能の規格及びこれらから導出された規格に

従って符号化された制御機能を使用できるようにする。これらの符号化制御機能の集合又は部分集合は,

この符号化文字集合とともに使ってもよい。これらの規格は,制御機能を1オクテット以上の列で符号化

している。 

JIS X 0211の制御文字をこの符号化文字集合とともに使うときは,その制御文字の符号化表現は,採用

した符号化形式の符号単位でのオクテット数(箇条9参照)と一致するように詰め込まなければならない。

この場合,最下位オクテットは,JIS X 0211で規定されたビット組合せとし,上位のオクテットは,全て

00とする。 

例えば,制御文字FORM FEEDは,UTF-16符号化形式では“000C”で,UTF-32符号化形式では“0000 000C”

で表現する。 

符号化制御文字の後に20〜7Fの範囲にあるビット組合せが続く形のエスケープシーケンス,制御シー

ケンス及び制御列(JIS X 0211参照)については,それぞれのビット組合せは,00の値をもつオクテット

を詰め込まなければならない。 

例えば,エスケープシーケンスの“ESC 02/00 04/00”は,UTF-8符号化形式では“1B 20 40”で,UTF-16

符号化形式では“001B 0020 0040”で,UTF-32符号化形式では“0000001B 00000020 00000040”で表現す

る。 

注記1 JIS X 0211で規定される制御機能の多くのものの定義では,その制御機能が動作する要素を

識別するために,“文字”という語が現れる。そのような制御機能をこの規格の符号化文字に

適用する場合,制御機能の動作は,制御機能が作用する要素(又は文字)として応用が選択

した,この規格の要素の種類による。これらの要素としては,文字(基底文字及び/又は結

合文字)が選ばれてもよいし,適切であれば他のもの(例えば,合成列など)が選ばれても

よい。 

JIS X 0202の符号拡張制御機能(指示用エスケープシーケンス,シングルシフト及びロッキングシフト)

は,この符号化文字集合と一緒に使ってはならない。 

注記2 JIS X 0211が制御文字に関連付けて用いている長い名前の一覧を次に示す。 

0000 

NULL 

0001 

START OF HEADING 

0002 

START OF TEXT 

0003 

END OF TEXT 

0004 

END OF TRANSMISSION 

0005 

ENQUIRY 

0006 

ACKNOWLEDGE 

0007 

BELL 

0008 

BACKSPACE 

0009 

CHARACTER TABULATION 


19 

X 0221:2014 (ISO/IEC 10646:2012) 

 

000A 

LINE FEED 

000B 

LINE TABULATION 

000C 

FORM FEED 

000D 

CARRIAGE RETURN 

000E 

SHIFT-OUT 

000F 

SHIFT-IN 

0010 

DATA LINK ESCAPE 

0011 

DEVICE CONTROL ONE 

0012 

DEVICE CONTROL TWO 

0013 

DEVICE CONTROL THREE 

0014 

DEVICE CONTROL FOUR 

0015 

NEGATIVE ACKNOWLEDGE 

0016 

SYNCHRONOUS IDLE 

0017 

END OF TRANSMISSION BLOCK 

0018 

CANCEL 

0019 

END OF MEDIUM 

001A 

SUBSTITUTE 

001B 

ESCAPE 

001C 

INFORMATION SEPARATOR FOUR 

001D 

INFORMATION SEPARATOR THREE 

001E 

INFORMATION SEPARATOR TWO 

001F 

INFORMATION SEPARATOR ONE 

007F 

DELETE 

0082 

BREAK PERMITTED HERE 

0083 

NO BREAK HERE 

0084 

INDEX 

0085 

NEXT LINE 

0086 

START OF SELECTED AREA 

0087 

END OF SELECTED AREA 

0088 

CHARACTER TABULATION SET 

0089 

CHARACTER TABULATION WITH JUSTIFICATION 

008A 

LINE TABULATION SET 

008B 

PARTIAL LINE FORWARD 

008C 

PARTIAL LINE BACKWARD 

008D 

REVERSE LINE FEED 

008E 

SINGLE-SHIFT TWO 

008F 

SINGLE-SHIFT THREE 

0090 

DEVICE CONTROL STRING 

0091 

PRIVATE USE ONE 

0092 

PRIVATE USE TWO 

0093 

SET TRANSMIT STATE 

0094 

CANCEL CHARACTER 

0095 

MESSAGE WAITING 

0096 

START OF GUARDED AREA 

0097 

END OF GUARDED AREA 

0098 

START OF STRING 

009A 

SINGLE CHARACTER INTRODUCER 

009B 

CONTROL SEQUENCE INTRODUCER 

009C 

STRING TERMINATOR 

009D 

OPERATING SYSTEM COMMAND 

009E 

PRIVACY MESSAGE 

009F 

APPLICATION PROGRAM COMMAND 

制御文字0084 INDEXは,JIS X 0211:1994以降削除されている。加えて,制御文字000E

及び000Fは,7ビット環境では,それぞれSHIFT-OUT及びSHIFT-INと呼ばれ,8ビット

環境では,LOCKING-SHIFT ONE及びLOCKING-SHIFT ZEROと呼ばれる。 

 


20 

X 0221:2014 (ISO/IEC 10646:2012) 

  

12 機能識別の宣言 

12.1 識別の目的及び構文 

この規格に適合する符号単位列は,送信者と受信者との間で交換される符号化情報の構成要素の全て又

は一部となることを意図している。送信者がこの規格(符号化形式及び符号化方式も含む。)を採用してい

るという識別情報及び 符号化空間の部分集合の識別情報は,受信者にも届くことが望ましい。これらの識

別情報を受信者に伝える経路は,この規格の適用範囲外とする。 

しかし,幾つかの符号化情報の交換のための規格は,符号単位列に適用される識別情報を交換情報の一

部に含めることを,許してもよいし,要求してもよい。ここでは,部分集合をもつUCSを識別するための

符号化表現,並びにこの規格と一緒に使うJIS X 0211の制御機能のC0集合及びC1集合を識別するための

符号化表現を規定する。このような符号化表現は,識別データ要素の全て又は一部となり,関係する規格

に従って,情報交換で用いてもよい。 

これらの識別情報の目的においては,直列化に当たって上位オクテットを下位オクテットより前置する

ので,UTF-8,UTF-16及びUTF-32の各符号化形式において選択できる符号化方式は,それぞれUTF-8,

UTF-16BE及びUTF-32BEだけである。 

識別情報が二つ以上ある場合は,この識別の順序は,ここに規定した順序による。 

注記 別の識別法を附属書Nに示す。 

注記A 箇条10に規定する印も,識別法の一種である。 

12.2 UCSの符号化形式の識別 

JIS X 0202のエスケープシーケンスを使う場合,この規格で規定するUCSの符号化形式(箇条9参照)

の識別は,次に示す指示シーケンスによる。 

ESC 02/05 02/15 04/09 UTF-8符号化形式によるUTF-8符号化方式 

ESC 02/05 02/15 04/12 UTF-16符号化形式によるUTF-16BE符号化方式 

ESC 02/05 02/15 04/06 UTF-32符号化形式によるUTF-32BE符号化方式 

注記1 この規格の以前の版で使われていた,実装水準1及び2を識別する指示シーケンスESC 02/05 

02/15 04/00,ESC 02/05 02/15 04/01,ESC 02/05 02/15 04/03,ESC 02/05 02/15 04/04,ESC 02/05 

02/15 04/07,ESC 02/05 02/15 04/08,ESC 02/05 02/15 04/10及びESC 02/05 02/15 04/11は,廃

止した。残っているエスケープシーケンスは,この規格の以前の版の実装水準3に対応する

ものであるが,この実装水準が現在有効な唯一の符号単位列の内容定義に相当する。 

注記2 次のエスケープシーケンスも使用してもよい。 

ESC 02/05 04/07 UTF-8符号化形式によるUTF-8符号化方式 

JIS X 0202の符号系への復帰に使うエスケープシーケンスは,詰め込まない(12.5参照)。 

このようなエスケープシーケンスがJIS X 0202に適合した符号単位列に現れる場合,ここに示す一連の

ビット組合せのとおりでなければならない。 

このようなエスケープシーケンスが,この規格に適合した符号単位列に現れる場合,箇条11の規定に従

って詰め込まなければならない。 

12.3 図形文字部分集合の識別 

JIS X 0211の制御シーケンスを使うときは,この規格で規定する部分集合(箇条8参照)を制御シーケ

ンスIDENTIFY UNIVERSAL CHARACTER SUBSET(IUCS,国際符号化文字部分集合識別)で,次に示す

とおりに識別しなければならない。 

CSI Ps... 02/00 06/13 


21 

X 0221:2014 (ISO/IEC 10646:2012) 

 

Ps... は,選択パラメタが複数個あってもよいことを示す。パラメタは,附属書Aに示す部分集合の組番号

からなる。パラメタが二つ以上ある場合,それぞれのパラメタ値は,03/11の値をもつオクテットで区切る。 

パラメタ値は,数字0〜9にそれぞれ対応するオクテット値03/00〜03/09の数字で表現する。 

このエスケープシーケンスは,JIS X 0202に適合した符号単位列中に現れる場合,ここに示す一連のビ

ット組合せのとおりでなければならない。 

この制御シーケンスは,この規格に適合した符号単位列中に現れる場合,箇条11の規定に従って詰め込

まなければならない。 

12.4 制御機能集合の識別 

JIS X 0202のエスケープシーケンスを使う場合,この規格と一緒に使用するJIS X 0211の制御機能の集

合(箇条11参照)は,次に示す形の識別シーケンスで識別する。 

ESC 02/01 04/00 JIS X 0211の全C0集合を識別する。 

ESC 02/02 04/03 JIS X 0211の全C1集合を識別する。 

これら以外のC0集合又はC1集合については,終端オクテットFは,符号化文字集合の国際登録簿から

得る。これらの集合の識別シーケンスを,次に示す。 

ESC 02/01 F C0集合を識別する。 

ESC 02/02 F C1集合を識別する。 

このエスケープシーケンスは,JIS X 0202に適合した符号単位列中に現れる場合,ここに示す一連のビ

ット組合せのとおりでなければならない。 

このエスケープシーケンスは,この規格に適合した符号単位列中に現れる場合,箇条11の規定に従って

詰め込まなければならない。 

12.5 JIS X 0202の符号化方式の識別 

JIS X 0202のエスケープシーケンスを使う場合,UCSからJIS X 0202の符号化方式への復帰又は遷移は,

エスケープシーケンスESC 02/05 04/00による。このエスケープシーケンスは,この規格に適合した符号単

位列中に現れる場合,箇条11の規定に従って詰め込まなければならない。 

このエスケープシーケンスは,JIS X 0202に適合した符号単位列中に現れる場合,ここに示す一連のビ

ット組合せのとおりでなければならない。 

注記 ESC 02/05 04/00のエスケープシーケンスは,通常,JIS X 0202から移ったときに保持されたJIS 

X 0202の状態に復帰するために使われる。ここで規定するESC 02/05 04/00のエスケープシー

ケンスは,詰込みオクテットがあるために,JIS X 0202に規定されたものと同一ではないこと

がある。このため,12.2のUCSを識別するためのエスケープシーケンスは,復帰が必ずしも

JIS X 0202に適合しないことを示すために02/15オクテットを含んでいる。 

 

13 符号表及び一覧表の構造 

箇条31に図形文字の詳細符号表及び文字の名前の一覧表を示す。これによって,それぞれの文字に対す

る,図形記号,符号化表現及び文字の名前を規定する。 

注記 箇条31は,名付け若しくは用法又は付随する図形記号のような,文字の幾つかの特徴を明らか

にするための,文字についての追加情報も含む。 

図形記号は,文字の代表的な可視化表現とする。この規格は,各文字の正確な形又は色を規定しようと

するものではない。文字の形は,採用するフォント又はその他の表示手段のデザインに左右されるもので

あり,この規格の適用範囲外とする。この規格における代表字形は,一貫して白黒で表示されているが,


22 

X 0221:2014 (ISO/IEC 10646:2012) 

  

この規格は,特定の一色若しくは複数の色をもつ図形記号,一部若しくは全部をアニメーション化した図

形,又はその両方を組み合わせて実装することを妨げるものではない。文字が特定の色と関連付けられて

いる場合には,符号表では,ヨーロッパの紋章で使用される慣習を用いて,単色の線画として表示してい

る。さらに,文字名に現れるBLACK(“黒”)又はWHITE(“白”)の語は,特定の色を指定するものでは

なく,単にいわゆるベタ文字といわゆる袋文字とを識別するためのものである。 

この規格で規定する図形文字は,その名前で一意に識別される。名前が異なっていても,図形文字を可

視化した図形記号が常に異なるわけではない。類似の図形記号をもつ図形文字の例としては,LATIN 

CAPITAL LETTER A(ラテン大文字A),GREEK CAPITAL LETTER ALPHA(ギリシア大文字A)及び

CYRILLIC CAPITAL LETTER A(キリル大文字A)がある。 

文字のもつ意味は,この規格では規定しない。これは,国によって異なったり,適用業務によって異な

ったりする。 

アルファベット類の用字については,文字をほぼアルファベット順に区の中に配列することを基本原則

とする。用字に大文字と小文字とがある場合には,対にして配列する。しかし,例えば,用字を配列した

規格が存在する場合には,基本原則よりもその規格に従うことを優先して文字を割り当てる。このように

文字を符号表中に配列することによって,既存の規格とこの符号化文字集合との間の変換が容易になる。

しかし,一般的には,この符号化文字集合と他の符号化文字集合との間の変換には,変換表を使うことに

なると考えられる。 

この規格では,利用者が必要とする文字が,符号表のどこかの部分にまとまって見つかることを意図し

ていないし,実際に分散していることが多い。 

さらに,利用者は,どの用字を使うにせよ,必要とする文字の幾つかが,この符号化文字集合の別の所

で定義されているのに気付くことが多いであろう。これは,特に,数字,記号及び複数の用字を使う場合

のラテン文字などについていえることである。 

したがって,この符号化文字集合の利用者は,最初にA.2のブロック名の一覧表又は図7〜図12の面の

概観を調べ,その後に関連する用字,記号及び数字の符号表を調べるのが望ましい。附属書Gにアルファ

ベット順に分類した文字の名前の一覧を示す。 

 

14 ブロック及び組の名前 

14.1 ブロックの名前 

連続した符号位置からなる名前の付いたブロックを,共通の特性(例えば,用字)をもった文字を割り

当てる目的で,面の中に定める。BMP,SMP,SIP及びSSPの中に定義されたブロックをA.2に示し,図

7〜図12に図示する。 

ブロックの名前を構成するための規則は,24.5.1で規定する。 

14.2 組の名前 

組は,附属書Aで定義する。 

組の名前を構成するための規則は,24.5.2で規定する。 

 

15 双方向文脈での鏡像文字 

15.1 鏡像文字 

ある種の文字は,双方向テキストの文脈で,特別な意味をもつ。これらの文字の解釈及び表示は,符号

単位列中にその文字の符号化表現が現れた時点での文字の進行方向に関係する。これらの文字の一覧は,


23 

X 0221:2014 (ISO/IEC 10646:2012) 

 

ユニコード標準の“Bidi̲Mirrord”属性が“Y”に設定されているものからなる。これらの値は,ユニコー

ド標準第6.1版の双方向鏡像属性(箇条3参照)で決定される。 

注記1 一般的には,鏡像文字は,右から左に並べられたときに用いる水平方向に裏返した画像をも

つ。しかし,幾つかの数学記号においては,“鏡像”は,単純な裏返しにはならない。詳細は,

ユニコード技術報告書 UTR #25“Unicode Support for Mathematics”(ユニコードの数学向け機

能)を参照。 

このような文字の裏返しは,対になった文字に限定されるものでなく,同種の文字全てに適用しなけれ

ばならない。 

例 右から左のテキスト断片では,GREATER-THAN SIGN(左から右のテキストでは“>”と表示さ

れる。)は,“<”という図形記号で表示されることがある。 

注記2 多くの古代文字及び幾つかの現在の用字では,右から左及び左から右の両方で書くことがで

きる。これらの用字の中には,しばしば慣習的に,垂直軸の周りで対称でない図形記号の任

意の文字表現に,適切な鏡像図形記号を用いるものがある。この場合,図形画像を運用上の

書記方向に合わせて適切に表示するのは,表示システムの責任となる。文字符号表の代表図

形記号の方向は,用字の既定の書記方向と対応する。これらの用字に属する文字は,ユニコ

ード標準の“Bidi̲Mirrored”属性が“N”に設定されている(箇条3のユニコード標準双方

向鏡像属性を参照)。 

このような用字には,既定の書記方向が左から右である古代用字である古代イタリア文字,

及び既定の用字方向が右から左である古代用字であるキプロス文字が含まれる。 

15.2 双方向テキストの方向性 

The Unicode Bidirectional Algorithm(ユニコード双方向アルゴリズム)(箇条3参照)は,双方向テキス

トの方向性を決定するアルゴリズムについて記載している。この規格でもそれを用いる。 

 

16 特殊文字 

印字できる図形記号がないか,又は他の何らかの点で特別な文字がある。 

16.1 空白の文字 

次の文字は,空白の文字とする。これらは,一般分類の値が“Zs”である全ての文字の一覧である。 

符号位置 文字の名前 
0020 

SPACE 

00A0 

NO-BREAK SPACE 

1680 

OGHAM SPACE MARK 

180E 

MONGOLIAN VOWEL SEPARATOR 

2000 

EN QUAD 

2001 

EM QUAD 

2002 

EN SPACE 

2003 

EM SPACE 

2004 

THREE-PER-EM SPACE 

2005 

FOUR-PER-EM SPACE 

2006 

SIX-PER-EM SPACE 

2007 

FIGURE SPACE 

2008 

PUNCTUATION SPACE 

2009 

THIN SPACE 

200A 

HAIR SPACE 

202F 

NARROW NO-BREAK SPACE 

205F 

MEDIUM MATHEMATICAL SPACE 

3000 

IDEOGRAPHIC SPACE 


24 

X 0221:2014 (ISO/IEC 10646:2012) 

  

注記1 文字1680 OGHAM SPACE MARKは,中心ステム線を示す見えるグリフによって表現されるこ

とも多いが,ステムなし書体のフォントでは空白のグリフによって表現される。 

注記2 180E MONGOLIAN VOWEL SEPARATORは,語の最後のMONGOLIAN LETTER A又はMONGOLIAN 

LETTER Eと,これに先行する子音の字との間で使ってもよい。これは,MONGOLIAN LETTER 

A又はMONGOLIAN LETTER Eの字及び先行する子音の図形記号の特別な形を指示する。可

視的に表示する場合,一般には文字の間の幅の狭いスペースのように表すが,時には,利用

者の補助のため,特定の図形記号として表してもよい。 

注記3 202F NARROW NO-BREAK-SPACEは,改行しないスペース文字(non-breaking space)である。

00A0 NO-BREAK SPACE(ノーブレークスペース)と同様であるが,これより表示幅が狭い。

モンゴルの用字とともに使われるとき,通常この文字は,普通のスペースの3分の1の幅で

表示され,モンゴル語の語幹から接尾辞を分離する。これによって,その位置に語の境界が

ないことを示しながら,モンゴル文字の字形選択の通常の規則が適用できる。 

16.2 通貨記号 

この規格の通貨記号は,必ずしもある国の通貨を特定するものではない。例えば,YEN SIGN(円記号)

は,日本の円に使うこともできるが,中国の元に使うこともできる。さらに,DOLLAR SIGN(ドル記号)

は,米国も含め,多くの国で使用できる。 

16.3 書式文字 

次の文字は,書式文字とする(6.3.3参照)。これらは,一般分類の値が“Cf”,“Zl”及び“Zp”である

全ての文字の一覧である。附属書Fを参照。 

符号位置 文字の名前 
00AD 

SOFT HYPHEN 

0600 

ARABIC NUMBER SIGN 

0601 

ARABIC SIGN SANAH 

0602 

ARABIC FOOTNOTE MARKER 

0603 

ARABIC SIGN SAFHA 

0604 

ARABIC SIGN SAMVAT 

06DD 

ARABIC END OF AYAH 

070F 

SYRIAC ABBREVIATION MARK 

17B4 

KHMER VOWEL INHERENT AQ 

17B5 

KHMER VOWEL INHERENT AA 

200B 

ZERO WIDTH SPACE 

200C 

ZERO WIDTH NON-JOINER 

200D 

ZERO WIDTH JOINER 

200E 

LEFT-TO-RIGHT MARK 

200F 

RIGHT-TO-LEFT MARK 

2028 

LINE SEPARATOR 

2029 

PARAGRAPH SEPARATOR 

202A 

LEFT-TO-RIGHT EMBEDDING 

202B 

RIGHT-TO-LEFT EMBEDDING 

202C 

POP DIRECTIONAL FORMATTING 

202D 

LEFT-TO-RIGHT OVERRIDE 

202E 

RIGHT-TO-LEFT OVERRIDE 

2060 

WORD JOINER 

2061 

FUNCTION APPLICATION 

2062 

INVISIBLE TIMES 

2063 

INVISIBLE SEPARATOR 

2064 

INVISIBLE PLUS 

206A 

INHIBIT SYMMETRIC SWAPPING 

206B 

ACTIVATE SYMMETRIC SWAPPING 

206C 

INHIBIT ARABIC FORM SHAPING 


25 

X 0221:2014 (ISO/IEC 10646:2012) 

 

206D 

ACTIVATE ARABIC FORM SHAPING 

206E 

NATIONAL DIGIT SHAPES 

206F 

NOMINAL DIGIT SHAPES 

FEFF 

ZERO WIDTH NO-BREAK SPACE 

FFF9 

INTERLINEAR ANNOTATION ANCHOR 

FFFA 

INTERLINEAR ANNOTATION SEPARATOR 

FFFB 

INTERLINEAR ANNOTATION TERMINATOR 

110BD 

KAITHI NUMBER SIGN 

1D173 

MUSICAL SYMBOL BEGIN BEAM 

1D174 

MUSICAL SYMBOL END BEAM 

1D175 

MUSICAL SYMBOL BEGIN TIE 

1D176 

MUSICAL SYMBOL END TIE 

1D177 

MUSICAL SYMBOL BEGIN SLUR 

1D178 

MUSICAL SYMBOL END SLUR 

1D179 

MUSICAL SYMBOL BEGIN PHRASE 

1D17A 

MUSICAL SYMBOL END PHRASE 

E0001 

LANGUAGE TAG 

E0020〜E007F 

 

TAG SPACE 〜 CANCEL TAG 

16.4 漢字構成記述文字 

漢字構成記述文字(Ideographic Description Character,以下IDCという。)は,漢字構成記述文字列

(Ideographic Description Sequence,以下IDSという。)を作り出すため,他の図形文字の列とともに使われ

る図形文字である。この種の文字列は,この規格で規定されていない漢字のような文字(ideographic 

character)を記述する目的で使ってもよい。附属書Iに詳細な説明がある。IDCは,次による。 

符号位置 名前 
2FF0 

IDEOGRAPHIC DESCRIPTION CHARACTER LEFT TO RIGHT 

2FF1 

IDEOGRAPHIC DESCRIPTION CHARACTER ABOVE TO BELOW 

2FF2 

IDEOGRAPHIC DESCRIPTION CHARACTER LEFT TO MIDDLE AND RIGHT 

2FF3 

IDEOGRAPHIC DESCRIPTION CHARACTER ABOVE TO MIDDLE AND BELOW 

2FF4 

IDEOGRAPHIC DESCRIPTION CHARACTER FULL SURROUND 

2FF5 

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM ABOVE 

2FF6 

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM BELOW 

2FF7 

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM LEFT 

2FF8 

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM UPPER LEFT 

2FF9 

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM UPPER RIGHT 

2FFA 

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM LOWER LEFT 

2FFB 

IDEOGRAPHIC DESCRIPTION CHARACTER OVERLAID 

16.5 字形選択子及び字形指示列 

字形選択子は,特別な種類の結合文字であって,分解可能でない基底文字の直後に置かれ,その基底文

字の図形記号の特定の変形を示す。文字が分解可能であるとは,文字に等価な合成列が存在することをい

う。分解可能でない基底文字とそれに続く字形選択子との列を字形指示列という。 

注記1 モンゴル自由字形選択子のように用字に固有な字形選択子もあり,数学記号その他各種の基

底文字に併用する字形選択子もある。 

この箇条で定義又は参照される字形指示列だけが,図形記号の特定の変形を規定する。他の全ての字形

指示列は,許容しない。さらに,他の基底文字及び結合文字の次に来る字形選択子は,符号化文字に対応

する図形記号の選択に何の効果ももたない。 

VARIATION SELECTOR-2(字形選択子2)〜VARIATION SELECTOR-16(字形選択子16)の文字を

用いる字形指示列は,この規格のこの版では定義しない。 

基底文字として統合漢字を用い,追加特殊用途面(SSP)のVARIATION SELECTOR-17(字形選択子

17)〜VARIATION SELECTOR-256(字形選択子256)の文字とともに構成される字形指示列は,ユニコ


26 

X 0221:2014 (ISO/IEC 10646:2012) 

  

ード技術標準 UTS #37によって規定される漢字字形データベース(Ideographic Variation Database,IVD)

に登録される。この規格では,箇条3に示す版を用いる。 

注記2 この規格は,2010-11-14版の漢字字形データベースの字形指示列の一覧を参照し,取り込ん

でいる。これは,次にある。<http://www.unicode.org/ivd/data/2010-11-14/> 

字形選択子と組み合わせてもよい全ての数学記号の基底文字と,それに対応する変形とを,次に示す。 

注記3 VARIATION SELECTOR-1(字形選択子1)は,数学記号とともに使用する唯一の字形選択

子である。 

列のUIDによる表記 

変形 

<2229, FE00> 

セリフをもつINTERSECTION 

<222A, FE00> 

セリフをもつUNION 

<2268, FE00> 

垂直画線をもつLESS-THAN BUT NOT EQUAL TO 

<2269, FE00> 

垂直画線をもつGREATER-THAN BUT NOT EQUAL TO 

<2272, FE00> 

下側の斜線に沿うLESS-THAN OR EQUIVALENT TO 

<2273, FE00> 

下側の斜線に沿うGREATER-THAN OR EQUIVALENT TO 

<228A, FE00> 

底部の要素を貫通する画線をもつSUBSET OF WITH NOT EQUAL TO 

<228B, FE00> 

底部の要素を貫通する画線をもつSUPERSET OF WITH NOT EQUAL TO 

<2293, FE00> 

セリフをもつSQUARE CAP 

<2294, FE00> 

セリフをもつSQUARE CUP 

<2295, FE00> 

隙間のあるCIRCLED PLUS 

<2297, FE00> 

隙間のあるCIRCLED TIMES 

<229C, FE00> 

等号が円に接触するCIRCLED EQUALS 

<22DA, FE00> 

傾斜した等号をもつLESS-THAN EQUAL TO OR GREATER-THAN 

<22DB, FE00> 

傾斜した等号をもつGREATER-THAN EQUAL TO OR LESS-THAN 

<2A3C, FE00> 

縦長で下辺の幅の狭いINTERIOR PRODUCT 

<2A3D, FE00> 

縦長で下辺の幅の狭いRIGHTHAND INTERIOR PRODUCT 

<2A9D, FE00> 

上部の斜線に沿う相似記号をもつSIMILAR OR LESS-THAN 

<2A9E, FE00> 

上部の斜線に沿う相似記号をもつSIMILAR OR GREATER-THAN 

<2AAC, FE00> 

傾斜した等号をもつSMALLER THAN OR EQUAL TO 

<2AAD, FE00> 

傾斜した等号をもつLARGER THAN OR EQUAL TO 

<2ACB, FE00> 

底部の要素を貫通する画線をもつSUBSET OF ABOVE NOT EQUAL TO 

<2ACC, FE00> 

底部の要素を貫通する画線をもつSUPERSET OF ABOVE NOT EQUAL TO 

字形選択子と組み合わせてもよい全てのモンゴル文字の基底文字と,それに対応する変形とを,次に示

す。モンゴル自由字形選択子とともに用いるモンゴル文字の基底文字の幾つかの表示形だけが変形を生成

する。 

注記4 モンゴル文字は,符号単位列中の位置に依存して,各種の異なる表示形をもつ。これらの表

示形は,語頭形(initial),語中形(medial),語末形(final)又は独立形(isolate)のいずれか

に分類される。 

列のUIDによる表記 

位置 

変形 

<1820, 180B> 

独立形,中間形,語末形 

MONGOLIAN LETTER Aの第2形式 

<1820, 180C> 

中間形 

MONGOLIAN LETTER Aの第3形式 

<1821, 180B> 

語頭形,語末形 

MONGOLIAN LETTER Eの第2形式 

<1822, 180B> 

中間形 

MONGOLIAN LETTER Iの第2形式 

<1823, 180B> 

中間形,語末形 

MONGOLIAN LETTER Oの第2形式 

<1824, 180B> 

中間形 

MONGOLIAN LETTER Uの第2形式 

<1825, 180B> 

中間形,語末形 

MONGOLIAN LETTER OEの第2形式 

<1825, 180C> 

中間形 

MONGOLIAN LETTER OEの第3形式 


27 

X 0221:2014 (ISO/IEC 10646:2012) 

 

<1826, 180B> 

独立形,中間形,語末形 

MONGOLIAN LETTER UEの第2形式 

<1826, 180C> 

中間形 

MONGOLIAN LETTER UEの第3形式 

<1828, 180B> 

語頭形,中間形 

MONGOLIAN LETTER NAの第2形式 

<1828, 180C> 

中間形 

MONGOLIAN LETTER NAの第3形式 

<1828, 180D> 

中間形 

MONGOLIAN LETTER NAの分離形式 

<182A, 180B> 

語末形 

MONGOLIAN LETTER BAの代替形式 

<182C, 180B> 

語頭形,中間形 

MONGOLIAN LETTER QAの第2形式 

<182C, 180B> 

独立形 

MONGOLIAN LETTER QAの女性形第2形式 

<182C, 180C> 

中間形 

MONGOLIAN LETTER QAの第3形式 

<182C, 180D> 

中間形 

MONGOLIAN LETTER QAの第4形式 

<182D, 180B> 

語頭形,中間形 

MONGOLIAN LETTER GAの第2形式 

<182D, 180B> 

語末形 

MONGOLIAN LETTER GAの女性形 

<182D, 180C> 

中間形 

MONGOLIAN LETTER GAの第3形式 

<182D, 180D> 

中間形 

MONGOLIAN LETTER GAの女性形 

<1830, 180B> 

語末形 

MONGOLIAN LETTER SAの第2形式 

<1830, 180C> 

語末形 

MONGOLIAN LETTER SAの第3形式 

<1832, 180B> 

中間形 

MONGOLIAN LETTER TAの第2形式 

<1833, 180B> 

語頭形,中間形,語末形 

MONGOLIAN LETTER DAの第2形式 

<1835, 180B> 

語末形 

MONGOLIAN LETTER JAの第2形式 

<1836, 180B> 

語頭形,中間形 

MONGOLIAN LETTER YAの第2形式 

<1836, 180C> 

中間形 

MONGOLIAN LETTER YAの第3形式 

<1838, 180B> 

語末形 

MONGOLIAN LETTER WAの第2形式 

<1844, 180B> 

中間形 

MONGOLIAN LETTER TODO Eの第2形式 

<1845, 180B> 

中間形 

MONGOLIAN LETTER TODO Iの第2形式 

<1846, 180B> 

中間形 

MONGOLIAN LETTER TODO Oの第2形式 

<1847, 180B> 

独立形,中間形,語末形 

MONGOLIAN LETTER TODO Uの第2形式 

<1847, 180C> 

中間形 

MONGOLIAN LETTER TODO Uの第3形式 

<1848, 180B> 

中間形 

MONGOLIAN LETTER TODO OEの第2形式 

<1849, 180B> 

独立形,中間形 

MONGOLIAN LETTER TODO UEの第2形式 

<184D, 180B> 

語頭形,中間形 

MONGOLIAN LETTER TODO QAの女性形 

<184E, 180B> 

中間形 

MONGOLIAN LETTER TODO GAの第2形式 

<185D, 180B> 

中間形,語末形 

MONGOLIAN LETTER SIBE Eの第2形式 

<185E, 180B> 

中間形,語末形 

MONGOLIAN LETTER SIBE Iの第2形式 

<185E, 180C> 

中間形,語末形 

MONGOLIAN LETTER SIBE Iの第3形式 

<1860, 180B> 

中間形,語末形 

MONGOLIAN LETTER SIBE UEの第2形式 

<1863, 180B> 

中間形 

MONGOLIAN LETTER SIBE KAの第2形式 

<1868, 180B> 

語頭形,中間形 

MONGOLIAN LETTER SIBE TAの第2形式 

<1868, 180C> 

中間形 

MONGOLIAN LETTER SIBE TAの第3形式 

<1869, 180B> 

語頭形,中間形 

MONGOLIAN LETTER SIBE DAの第2形式 

<186F, 180B> 

語頭形,中間形 

MONGOLIAN LETTER SIBE ZAの第2形式 

<1873, 180B> 

中間形,語末形 

MONGOLIAN LETTER MANCHU Iの第2形式 

<1873, 180C> 

中間形,語末形 

MONGOLIAN LETTER MANCHU Iの第3形式 

<1873, 180D> 

中間形 

MONGOLIAN LETTER MANCHU Iの第4形式 

<1874, 180B> 

中間形 

MONGOLIAN LETTER MANCHU KAの第2形式 

<1874, 180B> 

語末形 

MONGOLIAN LETTER MANCHU KAの女性形第1形式 

<1874, 180C> 

中間形 

MONGOLIAN LETTER MANCHU KAの女性形第1形式 

<1874, 180C> 

語末形 

MONGOLIAN LETTER MANCHU KAの女性形第2形式 

<1874, 180D> 

中間形 

MONGOLIAN LETTER MANCHU KAの女性形第2形式 

<1876, 180B> 

語頭形,中間形 

MONGOLIAN LETTER MANCHU FAの第2形式 


28 

X 0221:2014 (ISO/IEC 10646:2012) 

  

<1880, 180B> 

全て 

MONGOLIAN LETTER ALI GALI ANUSVARA ONEの第

2形式 

<1881, 180B> 

全て 

MONGOLIAN LETTER ALI GALI VISARGA ONEの第

2形式 

<1887, 180B> 

独立形,語末形 

MONGOLIAN LETTER ALI GALI Aの第2形式 

<1887, 180C> 

語末形 

MONGOLIAN LETTER ALI GALI Aの第3形式 

<1887, 180D> 

語末形 

MONGOLIAN LETTER ALI GALI Aの第4形式 

<1888, 180B> 

語末形 

MONGOLIAN LETTER ALI GALI Iの第2形式 

<188A, 180B> 

語頭形,中間形 

MONGOLIAN LETTER ALI GALI NGAの第2形式 

字形選択子と組み合わせてもよい全てのパスパ文字の基底文字と,それに対応する変形とを,次に示す。

これらの字形選択子の列は,特定の可視化表示を選択するのではなく,字形選択子の直前の文字から予測

される通常の形とは左右反転した表示を選択する。 

列のUIDによる表記 

変形 

<A856, FE00> 

PHAGS-PA LETTER SMALL Aの左右反転した形 

<A85C, FE00> 

PHAGS-PA LETTER HAの左右反転した形 

<A85E, FE00> 

PHAGS-PA LETTER Iの左右反転した形 

<A85F, FE00> 

PHAGS-PA LETTER Uの左右反転した形 

<A860, FE00> 

PHAGS-PA LETTER Eの左右反転した形 

<A868, FE00> 

PHAGS-PA SUBJOINED LETTER YAの左右反転した形 

注記5 字形選択子は,既存の符号化文字の異なる字形を選択するだけである。字形選択子は,一般

的な符号拡張のための仕組みを意図したものではない。 

注記6 漢字字形指示列以外の標準の字形指示列は,ユニコードの文字データベースでも

StandardizedVariants.html

(http://www.unicode.org/Public/4.0-Update/StandardizedVariants-4.0.0.html)として網羅されてい

る。 

 

17 文字の表示形 

文字の表示形は,特定の文脈で使用するために,他の図形文字領域にある文字又はそれらの文字列がも

つ通常の形に対する代替の形を与える。通常の形から表示形への変換は,置換,重ね合せ又は組合せによ

ってもよい。 

重ね合せ,形の異なる文字なのか若しくは合字(ligature)への組合せなのかの選択,又は連結(これは,

極度に複雑になることが多い。)のための規則は,この規格では規定しない。 

表示形は,一般に,この符号化文字集合で規定する図形文字の通常の形の代替として使用することを意

図していない。しかし,特定の適用業務では,既存の装置との互換性などの特殊事情のために,通常の形

の代わりに表示形を用いてもよい。表示形の探索・分類及び表示形に対するその他の処理操作の規則は,

この規格の適用範囲外とする。 

BMPでは,これらの文字のほとんどは,区FB〜FF内の符号位置に割り当ててある。 

 

18 互換用文字 

この規格には互換用文字が含まれているが,これは,既存の符号化文字集合との互換性を保ち,情報を

失うことなく双方向の符号変換を可能にすることを目的としている。 

BMPでは,これらの文字の多くは,区F9,FA,FE及びFF内並びに区31及び33内の符号位置に割り

当てている。互換用文字の幾つかは,他の区の中にも割り当てている。 


29 

X 0221:2014 (ISO/IEC 10646:2012) 

 

注記1 BMPの区FAの中には,CJK統合漢字として割り当てた符号位置が12か所ある。 

追加漢字面(SIP)では,これらの文字は,区F8〜FAの中の符号位置に割り当てている。 

CJK互換漢字とは,附属書Sに示す統合の規則によってCJK統合漢字の一つに統合される漢字である。

それにもかかわらずCJK互換漢字がこの規格に含まれているのは,特定の国及び地域に特有の様々な国家

的,文化的又は歴史的な理由に基づいて,それらの文字がある国家又は地域の規格で異なる符号位置に割

り当てられているからである。 

注記2 このため,互換漢字は,特定の国家,地域又はその他の規格との間の往復の変換を維持及び

担保するためにだけ用いることが望ましい。他の用途には用いないことを強く推奨する。 

 

19 文字の順序 

通常,符号化文字は,論理的な順序で符号単位列として現れる(論理的な順序又は記憶順序とは,おお

よそ,キーボードから文字が入力され,挿入,削除及び重ね打ちをした後の順序に対応する。)。これは,

進行方向が異なる文字が混在する場合にも適用する。例えば,左から右への用字(ギリシア文字,ラテン

文字,タイ文字など)と,右から左への用字(アラビア文字,ヘブライ文字など)又は縦への用字(モン

ゴル文字など)とが混在する場合にも,適用する。 

幾つかの文字は,最終の出力テキスト中に同じ順序で現れない場合がある。例えば,DEVANAGARI VOWEL 

SIGN I(デーヴァナーガリー母音記号I)の中間形は,符号単位列で論理的にある文字の後にそのデーヴ

ァナーガリー母音記号Iが続くとき,その文字の前にそのデーヴァナーガリー母音記号Iを表示する。 

 

20 結合文字 

ここでは,結合文字の使用方法を規定する(4.14参照)。 

20.1 結合文字の順序 

結合文字の符号化表現は,それが結合される基底文字の符号化表現の後に置かなければならない。例え

ば,LATIN SMALL LETTER A(ラテン小文字A)の後にCOMBINING TILDE[チルド(合成可能)]が

続く符号化表現は,ラテンの合成列“ã”を表現する。 

一つの結合文字自身を合成列とみなさなければならない場合,その結合文字は,文字00A0 NO-BREAK 

SPACE(ノーブレークスペース)と結合した合成列として符号化しなければならない。例えば,グレーブ

アクセントは,00A0のNO-BREAK SPACEの後に0300のCOMBINING GRAVE ACCENT[グレーブアクセ

ント(合成可能)]を置いて合成できる。 

注記 インド系の用字で母音を意味する結合文字は,特殊な部類の結合文字である。理由は,その表

示が周囲の二つ以上の文字に依存できるからである。したがって,インド系の用字の結合文字

をNO-BREAK SPACEと結合させるのは,望ましくない。 

20.2 結合クラス及び基準順序 

それぞれの結合文字は,ユニコード標準によって定められた結合クラスの値をもつ。これらの値は,ユ

ニコード標準第6.1版の結合クラス属性に従って定める(箇条3参照)。結合クラスは,正規化手続

(normalization process)の一部である規範順序を定めるために用いる(箇条21参照)。基準順序では,結

合文字を結合クラスの昇順に並べ替える。結合クラスの値がゼロである文字と組み合わされた結合文字は,

他の文字との相対位置に並べ直すことはない。 

20.3 符号表上での形 

基底文字に相対的に位置決めしようとする結合文字は,文字符号表上では,基底文字との相対的位置を


30 

X 0221:2014 (ISO/IEC 10646:2012) 

  

示すための破線の円の上,下,右,左,中,周り又は貫通位置に示す。結合文字は,表示のときに,先立

つ基底文字に相対的に位置決めされることを意図したものであって,それ自身では,基底文字として独立

して存在したり,基底文字の機能を果たしたりしない。そのため,結合文字と名付けられている。 

注記 ダイアクリティカルマーク(diacritics)は,ヨーロッパのアルファベットで用いられる結合文

字の主要種類となっている。インド及び東南アジアで使われる他の多くの用字では,結合文字

は,母音の字を符号化したものである。そのため,通常,“ダイアクリティカルマーク”とは呼

ばない。 

20.4 符号化表現のばらつき 

複数の結合文字を異なった順序で使用したり,文字と合成列との等価な組合せを混用したりすることに

よって,テキストの符号化表現にばらつきが生じる。ばらつきのある符号化表現の結果として,一つのテ

キストが複数の表現をもつことになる。ばらつきのある符号化表現を正規化(箇条21参照)することによ

って,完全に排除できないまでも,符号化表現のばらつきが大幅に減る。 

注記 例えば,フランス語の“là”は,LATIN SMALL LETTER L(ラテン小文字L)の次にLATIN SMALL 

LETTER A WITH GRAVE(グレーブアクセント付きA小文字)が続くと表現できるし,LATIN 

SMALL LETTER L(ラテン小文字L),次にLATIN SMALL LETTER A(ラテン小文字A),そ

の次にCOMBINING GRAVE ACCENT[グレーブアクセント(合成可能)]が続くと表現できる。

これらの符号化表現のばらつきに正規化を適用することによって,ただ一つの符号化表現が残

る。残る符号化表現の形式は,どの正規形を用いるかによって異なる。 

20.5 結合文字の重複 

二つ以上の結合文字が一つの基底文字に結合されることもある。この規格では,一つの基底文字に結合

される結合文字の個数は,制限しない。結合文字の重複の規則は,次のとおりとする。 

a) 結合文字同士が(例えば,COMBINING MACRON[マクロン(合成可能)]とCOMBINING DIAERESIS

[ダイエレシス(合成可能)]とが)表示に影響し合う場合,結果の図形表示中での結合文字の位置は,

結合文字の符号化表現の順序による。結合文字の表示は,基底文字から外に向かって位置決めする。

例えば,基底文字の上に置く結合文字は,符号化表現の列で最初に出てきたものから始め,基底文字

に続く符号化された結合文字のある限り,順次,上に積み重ねる。基底文字の下に置く結合文字の場

合,積重ねの状態は,逆になり,基底文字から始め,結合文字を順次,下に重ねる。 

基底文字の上に複数の結合文字を置く例がタイ文字にある。タイ文字では,子音字の上に0E34〜

0E37の母音記号の一つを置くことができ,更にその上に0E48〜0E4Bの四つの声調記号(tone mark)

の一つを置くことができる。この符号化表現の順序は,子音字の基底文字,次に母音記号,その次に

声調記号となる。 

b) ある特別の結合文字は,既定の積重ね動作に従わず,縦ではなく横に並べたり,隣り合った結合文字

と合字(ligature)を作ったりする。横に並べるときは,符号化表現の順序は,結合文字を使用する用

字の主要な進行方向中での位置によって決まる。例えば,左から右への用字では,横に並べて置かれ

るアクセントは,左から右へ符号化する。 

既定の積重ね動作をしない,このような特別な文字は,特定の用字又はアルファベットで使われる。

例えば,COMBINING GREEK KORONIS(0343)と,それに続くアキュートアクセント記号又はグレ

ーブアクセント記号とを一緒に用いる場合,COMBINING GREEK KORONISの上にアクセント記号を

積み重ねず,一つの文字の上でそれらを横に並べなければならない。符号化表現の順序は,文字自身,

次に気息記号(breathing mark),その次にアクセント記号の順とする。ラテンのアキュートアクセン


31 

X 0221:2014 (ISO/IEC 10646:2012) 

 

ト記号及びグレーブアクセント記号と同じ外観をもつベトナム語の二つの声調記号は,サーカムフレ

クスダイアクリティカルマーク(circumflex diacritic)を既に含んでいる三つの母音文字(â,ê及びô)

の上には重ねずに,母音文字のサーカムフレクスダイアクリティカルマークと合字を作る。 

c) 結合文字同士が表示上で互いに影響を与えない場合(例えば,一つの結合文字が図形文字の上に置か

れ,他の結合文字が下に置かれる。),基底文字と,順序が異なる複数の結合文字とからできる結果の

図形記号は,同じに見えてもよい。例えば,LATIN SMALL LETTER A,次にCOMBINING CARON,

その次にCOMBINING OGONEKと続く符号化表現からできる図形記号と,LATIN SMALL LETTER A,

次にCOMBINING OGONEK,その次にCOMBINING CARONと続く符号化表現からできる図形記号とは,

結果的に同じになってもよい。 

ヘブライ又はアラビアの用字の結合文字は,通常,互いに影響を与えない。したがって,合成列を

なすそれらの符号化表現の順序は,図形記号に影響を与えない。図形記号の結合を作る規則は,この

規格の適用範囲外とする。 

20.6 結合文字を含む組 

附属書Aに示す文字の組の幾つかには,例えば,組14[BASIC ARABIC(基本アラビア文字)]又は組

25[THAI(タイ文字)]には,結合文字と基底文字との両方が含まれている。 

附属書Aに示す他の幾つかの文字の組は,結合文字だけからなっている[例えば,組7(COMBINING 

DIACRITICAL MARKS)]。 

20.7 図形素結合子(合成可能) 

文字034F COMBINING GRAPHEME JOINER[図形素結合子(合成可能)]は,言語に依存する照合及び

検索の目的のために前後の文字を一まとまりとして扱うことを示すために用いる。言語に依存する照合及

び検索において,その目的のために特別に調整した照合要素表の場合以外は,図形素結合子を無視しなけ

ればならない。 

注記 COMBINING GRAPHEME JOINERは,ある結合文字の二つの用法のうちの一つを他の用法と区

別するために用いてもよい。例えば,ウムラウトとトレマとを区別する必要がある場合,

COMBINING GRAPHEME JOINER(034F)の後にCOMBINING DIAERESIS(0308)が続くも

のをトレマとし,COMBINING DIAERESIS(0308)だけのものをウムラウトとしてもよい。 

 

21 正規形 

正規形(normalization form)は,同一のテキストの幾つかの符号化表現のばらつきのうちで,ただ一つ

の符号化表現を選択するための機構である。この規格で用いる正規形は,ユニコード附属書 UAX #15(箇

条3参照)に規定されており,この規格でも用いる。正規形には,次の四つがある。 

a) 正規形D(NFD) 

b) 正規形C(NFC) 

c) 正規形KD(NFKD) 

d) 正規形KC(NFKC) 

注記1 これらの正規形のいずれかを符号単位列に適用した結果は,将来にわたって安定しているこ

とを意図している。すなわち,この規格で割当てが行われている文字を含む符号単位列の正

規化表現は,この規格が改正されても,正規化された状態である。 

注記2 幾つかの正規形は,テキストの短い表現よりもある種の合成列を優先し,他の幾つかの正規

形は,テキストの短い表現を優先する。テキストの短い表現を定義するに当たってISO/IEC 


32 

X 0221:2014 (ISO/IEC 10646:2012) 

  

10646-1:2000(第2版)及びISO/IEC 10646-2:2001(第1版)を参照用の版として確定するこ

とで,後方互換の要求が満たされる。両規格のレパートリの和集合は,確定組UNICODE 3.2

(A.6.2参照)と同一である。 

注記3 正規形の幾つかの目的の中で特に重要なものは,任意に与えられた符号単位列に対する正規

形をただ一つ定めることによって,同一性の一致判定(identity matching)を容易にすること

である。正規形は,言語学的な観点では必ずしも適切な並びとは限らない。 

 

22 個々の用字及び記号の特性 

22.1 ハングル音節の合成方法 

描字では,ハングル字母(HANGUL JAMOブロック,1100〜11FF)の列は,一連の音節ブロックとして

表示される。字母は,初声(音節頭子音字,choseong),中声(音節核をなす母音字,jungseong)及び終声

(音節末子音字,jongseong)の三つに分類される。完全な音節ブロックは,初声,中声及び付加的な終声

から構成される。 

完全な音節を構成していない一つ以上の文字の列(例えば,初声だけ,中声だけ,終声だけ,又は中声

の後ろに終声が続いたもの。)を不完全な音節(incomplete syllable)という。中声で始まる不完全な音節は,

その前に必ずCHOSEONG FILLER(初声埋め文字,115F)がなければならない。終声だけからなる不完全

な音節は,その前に必ずCHOSEONG FILLER(115F)及びJUNGSEONG FILLER(中声埋め文字,1160)

がなければならない。初声だけからなる不完全な音節は,その後に必ずJUNGSEONG FILLER(1160)が

なければならない。 

注記1 ハングル字母は,結合文字ではない。 

注記2 HANGUL SINGLE DOT TONE MARK(ハングル単点声調記号,302E)のような結合文字をハ

ングル字母の列に適用することを意図するときには,その列の末尾で,完全な音節ブロック

の最後に位置するハングル字母の次にその結合文字を付加することが望ましい。 

注記3 この規格では,ハングルのテキストは,複数の異なる方法で表現できる。韓国の規格KS X 

1026-1: Information Technology−Universal Multiple-Octet Coded Character set (UCS)−Hangul−

Part 1, Hangul processing guide for information interchangeは,情報交換において相互運用性を確

実にするためのガイドラインを提供している。 

22.2 インド及び他の南アジアで使う用字の特性 

BMPの,区09〜0D及び区0Fの符号表,並びに区10のMYANMAR(ビルマ文字)ブロック(箇条31参

照)の符号表では,幾つかの文字に対する図形記号は,同じ表にある他の二つの文字の図形記号の合成に

よって形作られたように示してある。 

例1 0906 DEVANAGARI LETTER AAの図形記号は,0905 DEVANAGARI LETTER A及び093E 

DEVANAGARI VOWLEL SIGN AAの図形記号から構成されたように示してある。 

例2 0D08 MALAYALAM LETTER IIの図形記号は,0D07 MALAYALAM LETTER I及び0D57 

MALAYALAM AU LENGTH MARKの図形記号から構成されたように示してある。 

そのような場合,合成列(4.17参照)と同様に,単独の符号化文字が,結合されると,その単独の符号

化文字の図形記号と視覚的に似るような図形記号をもつ二つの符号化文字の列と同等であるとして,利用

者に対して現れてもよい。 

この規格では,次のような独自のつづり規則(unique-spelling rule)を規定する。この規則では,区09

〜0D若しくは0Fの符号表又は区10のMYANMARブロックの符号表においては,次に示す例外を除いて,


33 

X 0221:2014 (ISO/IEC 10646:2012) 

 

いかなる符号化文字も,同じ符号表の他の符号化文字の長さ2以上の列と同等であるとは,みなさない。 

− 2部分からなる母音記号(two-part dependent vowel sign)。 

− 独立母音字である1025 MYANMAR LETTER UU。 

− ヌクタ記号の付いた子音字。 

注記 これらの全ての文字は,2文字からなる列への基準写像をもつ。 

22.3 ビザンチン音楽記号 

ビザンチン音楽の記譜法は,3段の帯状の表現を利用する。記号は,上段,中段又は下段の帯の中に書

く。これとは別に,楽譜の歌詞の部分に,音楽文字と呼ぶ記号を書く。複数の記号は,適切な帯の中で積

み重ねて表記することができる。 

22.4 絵文字記号の原典情報 

幾つかの記号は,複数の原典との対応関係をもつ。CJK統合漢字とは異なり,これらの参照は,文字を

特定するものではない。これらの原典における一つの文字は,単一の符号位置又は符号位置の列に対応す

る。 

記号の原典は,次のとおりである。 

− DoCoMoのシフトJIS符号 

− KDDIのシフトJIS符号 

− SoftBankのシフトJIS符号 

添付ファイルは,テキストファイルであり,ISO/IEC 646のIRVの文字及び行末を表すLINE FEEDを

使用する。ファイルの先頭の6行は,ヘッダであり,その後の“#”で始まる行は,注釈である。その後に,

原典参照の行が続く。各行は,次の項目からなる。項目は,“;”で区切る。 

− 項目1は,UCS 符号位置又は符号位置の列を (hhhh | hhhhh) (<space> (hhhh | hhhhh))* の形式で示す。 

− 項目2は,DoCoMoのシフトJIS 符号を (hhhh) の形式で示す。 

− 項目3は,KDDIのシフトJIS 符号を (hhhh) の形式で示す。 

− 項目4は,SoftBankのシフトJIS 符号を (hhhh) の形式で示す。 

ここに,ʻhʼは,16進数を表し,<space>は,SPACE文字を表す。 

参照ファイルは,“EmojiSrc.txt”とする。 

注記1 (対応国際規格の注記1は,この規格では該当しないため不採用とした。) 

注記2 ファイルの内容は,一方をUCSの符号位置又は符号位置の列とし,他方を携帯電話通信事業

者の絵文字を示すシフトJISの符号とする写像を与える。個々の対応は,同等な,UCSと携

帯電話通信事業者の記号とに関して,単独でも列としてでも,対称である(いわゆる“往復

の保全性”をもつ。)。このファイルは,いずれの写像方向においても,似ているが同じでは

ない記号に対応させるような最善の(best-fit)写像[代用(fallback)写像ともいう。]を含

まない。 

 

23 漢字の原典参照 

23.1 原典参照一覧 

漢字のそれぞれの文字には,少なくとも一つの原典参照がある。原典参照は,機械可読形式の添付ファ

イルで示す。原典参照は,この規格の規定の一部である。 

注記1 添付ファイルは,この規格を機械可読形式で入手したものだけが利用できる。しかし,この

ファイルを印刷して利用することもできる。 


34 

X 0221:2014 (ISO/IEC 10646:2012) 

  

原典参照情報は,漢字の文字を識別する。原典参照は,漢字の符号位置を,この箇条において次に示す

原典の中の値に関連付ける。これらの原典を次のとおり分類する。 

− 原典G 

− 原典H 

− 原典M 

− 原典T 

− 原典J 

− 原典K 

− 原典KP 

− 原典V 

− 原典U 

ある符号位置には,原典の分類(すなわち,G,H,M,T,J,K,KP,V及びU)ごとにただ一つの原

典参照だけを作成する。広範な原典の分類に対応できるように,原典参照は,原典と漢字との一意的な関

係を全て示す。 

BMP及びSIPの漢字が参照する原典の一覧を次に示す。 

注記2 原典が更新されても,原典参照は,更新しない。更新された原典は,古い版に含まれていな

い文字の識別だけに用いてもよい。 

原典Gは,次のとおりに識別する。 

G0 

GB 2312-80 

G1 

GB 12345-90 

G3 

GB 7589-87 繁体字 

G5 

GB 7590-87 繁体字 

G7 

現代漢語通用字表及び簡化字総表 

GS 

シンガポールの漢字 

G8 

GB 8565-88 

G9 

GB 18030-2000 

GE 

GB 16500-95 

GH 

GB 15564-1995 香港の一部の文字放送用の漢字体系 

GK 

GB 12052-89 情報交換用ハングル文字符号化文字情報 

G4K 

四庫全書 

GBK 

中国大百科全書 

GCH 

辞海 

GCY 

辞源 

GCYY 

中国測絵科学院用字 

GFZ 

方正排版系統 

GGH 

古代漢語詞典 

GHC 

漢語大詞典 

GHZ 

漢語大字典 

GIDC 

中国公安省IDシステム 

GJZ  

商務印書館用字 

GKX 

康熙字典及び康熙字典補遺 

GXC 

現代漢語詞典 

GZFY 

古代漢語詞典 

GZH  

中華字海 

GZJW 

殷周金文集成引得 

注記3 康煕字典(GKX)として参照されている文字に対する符号表上での図形記号は,現在中国で

使用されているものであり,康煕字典に示されている図形記号とは僅かに異なる場合がある。 

原典Hは,次のとおりに識別する。 

香港増補字符集 2008 


35 

X 0221:2014 (ISO/IEC 10646:2012) 

 

HB0 

Big-5: 計算機での中国語字形と文字符号との対応表, Technical Report C-26, 電脳用中文字型与字碼対
照表, 技術通報C-26, 1984, Symbols 

HB1 

Big-5, Level 1 

HB2 

Big-5, Level 2 

原典Mは,次のとおりに識別する。 

MAC 

Macao Information System Character Set(澳門資訊系統字集) 

原典Tは,次のとおりに識別する。 

T1 

TCA-CNS 11643-1992 第1面 

T2 

TCA-CNS 11643-1992 第2面 

T3 

TCA-CNS 11643-1992 第3面及び幾つかの追加文字 

T4 

TCA-CNS 11643-1992 第4面 

T5 

TCA-CNS 11643-1992 第5面 

T6 

TCA-CNS 11643-1992 第6面 

T7 

TCA-CNS 11643-1992 第7面 

TB 

TCA-CNS 11643-2007 第11面 

TC 

TCA-CNS 11643-2007 第12面 

TD 

TCA-CNS 11643-2007 第13面 

TE 

TCA-CNS 11643-2007 第14面 

TF 

TCA-CNS 11643-2007 第15面 

原典Jは,次のとおりに識別する。 

J0 

JIS X 0208-1990 

J1 

JIS X 0212-1990 

J3 

JIS X 0213:2000 第3水準 

J3A 

JIS X 0213:2004 第3水準 

J4 

JIS X 0213:2000 第4水準 

JA 

国内5社漢字統合表,1993 

JH 

汎用電子情報交換環境整備プログラム 2002〜2009 

JK 

日本国字集 

JARIB 

電波産業会 ARIB STD-B24 第5.1版,2007年3月14日 

原典Kは,次のとおりに識別する。 

K0 

KS X 1001:2004(以前は,KS C 5601-1987であった。) 

K1 

KS X 1002:2001(以前は,KS C 5657-1991であった。) 

K2 

PKS C 5700-1 1994 

K3 

PKS C 5700-2 1994 

K4 

PKS 5700-3:1998 

K5 

Korean IRG Hanja Character Set 5th Edition: 2001 

注記4 K2,K3,K4及びK5に含まれる漢字は,新しい韓国規格群において改正作業が進んでいる。 

原典KPは,次のとおりに識別する。 

KP0 

KPS 9566-97 

KP1 

KPS 10721:2000及びKPS 10721:2003 

原典Vは,次のとおりに識別する。 

V0 

TCVN 5773:1993 

V1 

TCVN 6056:1995 

V2 

VHN 01:1998 

V3 

VHN 02:1998 

V4 

Dictionary on Nom 2006, Dictionary on Nom of Tay ethnic 2006, Lookup Table for Nom in the South 1994 

原典Uは,次のとおりに識別する。 

UTC 

ユニコード技術報告書 UTR #45, U-source Ideographs, May 2010 

23.2 CJK統合漢字の原典参照 

原典から統合漢字を引き出すために用いた手順及び箇条31の符号表での配列の規則は,附属書Sに示

す。 

注記1 附属書SのS.1.6で記述された原規格分離漢字の取扱規則は,BMP内のCJK統合漢字だけに

適用する。 


36 

X 0221:2014 (ISO/IEC 10646:2012) 

  

添付ファイルは,テキストファイルであり,ISO/IEC 646のIRVの文字及び行末を表すLINE FEEDを

使用する。ファイルの先頭の13行は,ヘッダであり,その後に0面及び2面にあるCJK統合漢字の総数

と同じ行数の情報が続く。行は,次の項目からなる。項目は,“;”で区切る。空の項目は,文字を含まな

い。 

− 項目1は,BMP又はSMPの符号位置を(0hhhh)又は(2hhhh)の形式で示す。 

− 項目2は,部首画数索引を(d{1,3}'.d{1,2})の形式で示す。この項目は,参考情報であり,1桁〜3桁の

部首索引及びFULL STOP(ピリオド)に続く,1桁又は2桁の部首内画数で構成される。部首画数索

引にAPOSTROPHE(アポストロフィー)が付加されているものは,簡体字の部首である。 

注記2 全ての漢字は,様々な漢字の字書中の部首・画数の順に従って分類する。この項で示す値

は,できるだけ一般的な値を採用した。詳しい情報が,UAX#38 Unicode Han Databaseに示

されている。 

http://www.unicode.org/reports/tr38/ 

− 項目3は,原典Gを(G0-hhhh),(G1-hhhh),(G3-hhhh),(G5-hhhh),(G7-hhhh),(GS-hhhh),(G8-hhhh),

(G9-hhhh),(GE-hhhh),(GH-hhhh),(GK-hhhh),(G4K),(GBK),(GBK-dddd.dd),(GCH),(GCH-dddd.dd),

(GCY),(GCYY-ddddd),(GFZ),(GFZ-ddddd),(GGH-ddddd.dd),(GHC),(GHC-dddd.dd),(GHZ-ddddd.dd),

(GIDC-ddd),(GJZ-ddddd),(GKX-dddd.dd),(GXC-dddd.dd),(GZFY-ddddd),(GZH-dddd.dd)又は

(GZJW-ddddd)の形式で示す。 

− 項目4は,原典Tを(T1-hhhh),(T2-hhhh),(T3-hhhh),(T4-hhhh),(T5-hhhh),(T6-hhhh),(T7-hhhh),

(TB-hhhh),(TC-hhhh),(TD-hhhh),(TE-hhhh)又は(TF-hhhh)の形式で示す。 

− 項目5は,原典Jを(J0-hhhh),(J1-hhhh),(J3-hhhh),(J3A-hhhh),(J4-hhhh),(JA-hhhh),(JH-xxxxxx),

(JH-xxxxxxS),(JK-ddddd)又は(JARIB-hhhh)の形式で示す。 

− 項目6は,原典Kを(K0-hhhh),(K1-hhhh),(K2-hhhh),(K3-hhhh),(K4-hhhh)又は(K5-hhhh)の形式で

示す。 

− 項目7は,原典Vを(V0-hhhh),(V1-hhhh),(V2-hhhh),(V3-hhhh)又は(V4-hhhh)の形式で示す。 

− 項目8は,原典Hを(H-hhhh),(HB0-hhhh),(HB1-hhhh)又は(HB2-hhhh)の形式で示す。 

− 項目9は,原典KPを(KP0-hhhh)又は(KP1-hhhh)の形式で示す。 

− 項目10は,原典Uを(UTC-ddddd)又は(UCI-ddddd)の形式で示す。 

− 項目11は,原典Mを(MAC-ddddd)の形式で示す。 

ここに,“d”は,10進数の1桁を,“h”は,16進数の1桁を,“x”は,英数字1文字(0〜9及びA〜Z)

を表す。括弧に囲まれた英大文字,数字及び記号は,ここに示したとおりに現れる。 

注記3 JIS X 0213:2000及びJIS X 0213:2004については,第4水準は,漢字集合2面に,他の水準

は,漢字集合1面に,それぞれ対応する。 

注記4 K4(PKS 5700-3:1998)及びK5(Korean IRG Hanja Character Set 5th Edition:2001)に含まれる

原典参照は,漢字符号を区点番号ではなく単純な10進数で表記している。他の規格との整合

性を考慮して,参照ファイルでは,K4の値を16進数に変換している。他のK0〜K3の索引

値と異なり,K4及びK5の値は,区点番号に分解できない。 

参照ファイルは,添付ファイル“CJKU̲SR.txt”とする。 

注記5 (対応国際規格の注記5は,この規格では該当しないため不採用とした。) 

注記6 形式UCI-ddddd(原典U)である文字は,識別可能な原典参照がない。UCI値は,単純に場

所を確保する。 


37 

X 0221:2014 (ISO/IEC 10646:2012) 

 

23.3 CJK統合漢字の原典参照の表示 

一つの文字に対して一つの図形記号しか示さない他の多くの文字レパートリと異なり,CJK統合漢字の

文字は,原典参照ごとに部首,画数及び様々な原典の数値とともに図形記号を示す。 

注記 CJK互換漢字ブロックに含まれる12文字の表示は,23.5とは異なる形式で記載されている。 

符号位置の直後に,部首の図形表現を部首番号及び画数とともに示す。画数には,部首そのものの画数

を含まない。 

CJK統合漢字ブロック(4E00〜9FFF)の符号表は,固定カラム形式を用いる。すなわち,ある原典から

の原典情報は,常に同じカラムに示される。一方,他のCJK統合漢字ブロックの符号表では,G,T,J,

K,KP,V,H,M及びUの出現順に存在するものだけが示される。 

23.3.1 CJK統合漢字ブロックの原典参照の表示 

図2は,CJK UNIFIED IDEOGRAPHS(CJK統合漢字)ブロックの表示を示している。原典G,原典H,

原典T,原典J,原典K及び原典Vが存在する場合は,この順番に表記する。原典Uは,原典Hの代わり

に第2カラムに表記する。このブロックには,原典H及び原典Uを共にもつ字は存在しない。 

図2には,4E00〜4E09及び4E14〜4E1Dの文字の例を示す。 

 

 

図2−CJK統合漢字の符号表表示 

 

23.3.2 CJK統合漢字拡張Aの原典参照の表示 

図3にCJK UNIFIED IDEOGRAPHS EXTENSION A(CJK統合漢字拡張A)ブロックの表示を示す。1

文字ごとに1行に最大3個の原典参照を示す。4個以上の原典がある場合は,更に1行を用いて示す。 


38 

X 0221:2014 (ISO/IEC 10646:2012) 

  

図3には,41C9〜41CC,41DB〜41DD及び41EE〜41F0の文字の例を示す。 

 

 

図3−CJK統合漢字拡張Aの符号表表示 

 

23.3.3 CJK統合漢字拡張Bの原典参照の表示 

図4に,CJK UNIFIED IDEOGRAPHS EXTENSION B(CJK統合漢字拡張B)ブロックの表示を示す。

最初の図形記号は,この規格の対応国際規格の第1版及び第2版(順に2003年版及び2011年版)での字

形を“UCS2003”という記述とともに示す。1文字ごとに1行に最大2個の原典参照を示す。3個以上の原

典参照がある場合は,更に1行を用いて示す。 

図4には,200E8〜200EB,200FC〜200FF及び2010E〜20110の文字の例を示す。 

 

 

図4−CJK統合漢字拡張Bの符号表表示 

 

23.3.4 CJK統合漢字拡張C及び拡張Dの原典参照の表示 

図5にCJK UNIFIED IDEOGRAPHS EXTENSION C(CJK統合漢字拡張C)及びCJK UNIFIED IDEOGRAPHS 

EXTENSION D(CJK統合漢字拡張D)ブロックの表示を示す。1文字ごとに1行に最大2個の原典参照を

示す。3個以上の原典が存在する場合は,更に1行を用いて示す。 

図5には,2A7A0〜2A7A2,2A7B4〜2A7B6,2A7C8〜2A7CA及び2A7DC〜2A7DEの文字の例を示す。 

 

 

図5−CJK統合漢字拡張C及び拡張Dの符号表表示 


39 

X 0221:2014 (ISO/IEC 10646:2012) 

 

23.4 CJK互換漢字の原典参照 

添付ファイルは,テキストファイルであり,ISO/IEC 646のIRVの文字及び行末を表すLINE FEEDを

使用する。ファイルの先頭の11行は,ヘッダであり,その後にCJK互換漢字の数と同じ行数の情報が続

く。行は,次の項目からなる。項目は,“;”で区切る。空の項目は,文字を含まない。 

− 項目1は,BMP又はSIPの符号位置を(0hhhh)又は(2hhhh)の形式で示す。 

− 項目2は,対応するCJK統合漢字の符号位置を(0hhhh)又は(2hhhh)の形式で示す。 

− 項目3は,部首画数索引を(d{1,3}'.d{1,2})の形式で示す。この参考情報の項目は,1桁〜3桁の部首索

引及びFULL STOP(ピリオド)に続く,1桁又は2桁の部首内画数で構成される。部首画数索引に

APOSTROPHE(アポストロフィー)が付加されているものは,簡体字の部首である。 

− 項目4は,原典Tを(T3-hhhh),(T4-hhhh),(T5-hhhh),(T6-hhhh),(T7-hhhh)又は(TF-hhhh)の形式で示

す。 

− 項目5は,原典Hを(H-hhhh)又は(HB2-hhhh)の形式で示す。 

− 項目6は,原典Jを(J3-hhhh),(J4-hhhh)又は(JARIB-hhhh)の形式で示す。 

− 項目7は,原典Kを(K0-hhhh)の形式で示す。 

− 項目8は,原典Uを(UTC-ddddd)又は(UCI-ddddd)の形式で示す。 

− 項目9は,原典KPを(KP1-hhhh)の形式で示す。 

ここに,“h”は,16進数の1桁を表す。括弧に囲まれた英大文字,数字及び記号は,ここに示したとお

りに現れる。 

注記1 JIS X 0213:2000及びJIS X 0213:2004については,第4水準は,漢字集合2面に,他の水準

は,漢字集合1面に,それぞれ対応する。 

参照ファイルは,添付ファイル“CJKC̲SR.txt”とする。 

注記2 (対応国際規格の注記2は,この規格では該当しないため不採用とした。) 

注記3 形式UCI-ddddd(原典U)である文字は,識別可能な原典参照がない。UCI値は,単純に場

所を確保する。 

23.5 CJK互換漢字の原典参照の表示 

CJK統合漢字と同様に,CJK互換漢字の符号表は,原典参照ごとに一つの図形記号を,部首,画数及び

様々な原典参照の数値のような文字の特定に関する追加情報とともに示す。 

部首の図形表現についても符号位置のすぐ下に,部首番号及び画数とともに示す。画数には,部首その

ものの画数を含まない。 

追加情報として,31.2に記載した参考情報の項目(例えば,分解写像)をも,表記中に表示する。 

注記 CJK互換漢字ブロックに含まれる12個のCJK統合漢字の表示も,この形式に従う。この12個

のCJK統合漢字の表示は,分解写像を含まない。 

図6には,FA0C〜FA0E,FA19〜FA1D及びFA28〜FA2Cの各文字に対する例を示す。 

 


40 

X 0221:2014 (ISO/IEC 10646:2012) 

  

 

図6−CJK互換漢字の符号表の表示 

 

24 文字の名前及び注記 

24.1 名前 

この規格は,次に示すものの名前を規定する。 

− 文字(文字の名前及び文字の別名) 

− 名前付きUCS列識別子(箇条25参照) 

− ブロック(箇条14及びA.2参照) 

− 組(A.1参照) 

この規格がこれらのものに付与する名前は,この箇条24が規定する名前の形式及び名前の一意性に関す

る規則に従わなければならない。この規則は,この規格の英語の版に対して適用する。 

注記1 英語以外の規格では,次のとおりである。 

a) その言語に適切と考えられる言葉及び構文を用いて文字の名前を付けられるように,規

則を修正してもよい。 

b) この規格が規定する名前を,上のa)によって修正した規則に従って構成した同等な一意

な名前によって,置き換えてもよい。 

注記1A この規格では,英語の対応国際規格の規則を修正しないし,名前を置き換えることもしない。

名前は,英語の対応国際規格のものと同一とする。ただし,理解のために必要な場合は,日

本語による通用名称を参考として併記する。日本語による通用名称は,名前又はその一部で

はなく,必ずしも箇条24の規定に従わない。 

注記1B この規格では,日本語による通用名称を併記する場合,通用名称を括弧で囲み点線の下線を

施した。 

注記2 名前付けに関する追加の指針を,附属書Lに示す。 

24.2 名前の形式 

名前は,次の文字だけを含んでよい。 

− LATIN CAPITAL LETTER A(ラテン大文字A)〜LATIN CAPITAL LETTER Z(ラテン大文字Z) 

− DIGIT ZERO(0)〜DIGIT NINE(9) 


41 

X 0221:2014 (ISO/IEC 10646:2012) 

 

− SPACE(スペース) 

− HYPHEN-MINUS(ハイフン,負符号) 

− FULL STOP(ピリオド)(組の名前に限る。) 

名前の最初の文字は,ラテンの大文字とする。名前の最後の文字は,ラテンの大文字又は数字とする。 

名前は,連続する2個以上のSPACE又は連続する2個以上のHYPHEN-MINUSを含んではならない。さ

らに,組以外のものの名前は,SPACEに続く数字(DIGIT ZERO〜DIGIT NINE)を含んではならない。

組の名前は,連続する2個以上のFULL STOPを含んではならない。 

SPACEにHYPHEN-MINUSが続く列,又はHYPHEN-MINUSにSPACEが続く列は,文字の名前又は名前

付きUCS列識別子の名前にだけ現れてもよい。 

例1 次に示す二つの文字の名前は,SPACEとHYPHEN-MINUSとの並びを含んでいる。 

TIBETAN LETTER -A 

TIBETAN MARK BKA- SHOG YIG MGO 

FULL STOPは,組の名前の中で,二つの英数字(LATIN CAPITAL LETTER A〜LATIN CAPTITAL LETTER 

Z又はDIGIT ZERO〜DIGIT NINE)の間にだけ現れてもよい。 

例2 次に示す組の名前は,2個の数字DIGIT FOUR(4)とDIGIT ONE(1)との間にFULL STOP

を含む。 

UNICODE 4.1 

例3 次に示す組の名前は,1個のラテン文字LATIN CAPITAL LETTER D(ラテン大文字D)と1

個の数字DIGIT SEVEN(7)との間にFULL STOPを含む。 

BMP-AMD.7 

24.3 名前の単一性 

この規格の中で名前付けられる全てのものは,それぞれ名前を一つだけ付与する。 

注記 この規定は,明確化を目的とし,参考のために使用する別名又は省略形の使用を妨げるもので

はない。しかし,規定としての名前は,一つだけである。こうした,参考としての別名は,文

字の名前として同じ名前空間を共有し,規定事項である文字の別名と混同しないほうがよい。 

24.4 名前の不変性 

ある種の名前は,この規格の将来の版においても変更されない。この性質は,文字の名前及び文字の別

名に適用される。箇条7参照。 

24.5 名前の一意性 

名前は,この箇条で示すように,対応する名前空間内で一意でなければならない。 

24.5.1 ブロックの名前 

ブロックの名前の集合は,一つの名前空間を構成する。一つ一つのブロックの名前は,一意であって,

この規格が規定する他の全てのブロックの名前と区別できなければならない。 

24.5.2 組の名前 

組の名前の集合は,一つの名前空間を構成する。一つ一つの組の名前は,一意であって,この規格が規

定する他の全ての組の名前と区別できなければならない。 

24.5.3 文字の名前,文字の別名及び名前付きUCS列識別子 

文字の名前,文字の別名及び名前付きUCS列識別子は,それらを共に含む集合が一つの名前空間を構成

する。一つ一つの文字の名前,文字の別名又は名前付きUCS列識別子は,一意であって,この規格が規定

する他の全ての文字の名前,文字の別名及び名前付きUCS列識別子と区別できなければならない。 


42 

X 0221:2014 (ISO/IEC 10646:2012) 

  

24.5.4 一意性の判定 

ブロックの名前及び組の名前は,二つの名前をSPACE及び中間のHYPHEN-MINUSを無視して比較を行

っても異なる場合に,一意であって区別できるものとみなす。 

注記1 中間のHYPHEN-MINUSとは,SPACE以外の文字に挟まれた1個のHYPHEN-MINUSである。 

例1 次に示す架空のブロックの名前は,一意であって区別できる。 

LATIN-A 

LATIN-B 

例2 次に示す架空のブロックの名前は,一意ではなく区別できない。 

LATIN-A 

LATIN A 

LATINA 

文字の名前及び名前付きUCS列識別子の名前は,二つの名前をSPACE及び中間のHYPHEN-MINUSを

無視し,更に,“LETTER”,“CHARACTER”及び“DIGIT”の語を無視して比較を行っても異なる場合に,

一意であって区別できるものとみなす。 

例3 次に示す二つの架空の文字の名前は,一意ではなく区別できない。 

MANICHAEAN CHARACTER A 

MANICHAEAN LETTER A 

例4 次に示す二つの実在の文字の名前は,中間のHYPHEN-MINUSでない一つのHYPHEN-MINUSに

よって異なるので,一意であって区別できる。 

TIBETAN LETTER A 

TIBETAN LETTER -A 

ただし,次に示す二つの文字の名前は,一意であって区別できるものとみなす。 

HANGUL JUNGSEONG OE 

HANGUL JUNGSEONG O-E 

注記2 これら二つの文字の名前だけは,特別に例外として取り扱う。なぜならば,これらは,この

規格の以前の版で規定されたものであって,その版ではまだ名前の一意性に関する要求事項

が規定されていなかったからである。これら二つの文字は,この規格での一意性に関する規

則における唯一の例外であって,今後ともこれ以外の例外を設けることはない。 

24.6 漢字の名前 

CJK統合漢字の名前は,“CJK UNIFIED IDEOGRAPH-”(CJK統合漢字)の後に,CJK互換漢字の名前

は,“CJK COMPATIBILITY IDEOGRAPH-”(CJK互換漢字)の後に,それぞれ16進表記の符号化表現を

付けることによって,アルゴリズム的に構成する。 

BMPの漢字では,符号化表現は,4桁の16進数で表現された2オクテットの値で示す。例えば,BMP

中の最初のCJK統合漢字は,“CJK UNIFIED IDEOGRAPH-3400”という名前をもつ。 

SIPの漢字では,符号化表現は,5桁の16進数の値である。例えば,SIP中の最初のCJK統合漢字は,

“CJK UNIFIED IDEOGRAPH-20000”という名前をもつ。 

24.7 ハングル音節文字の名前 

符号位置AC00〜D7A3のハングル音節文字の名前は,その符号位置の値から,次の計算手順によって導

出する。これらの文字の名前の一覧は,符号表に示さない。 

a) ハングル音節文字の符号位置の数を得る。これは,h1h2h3h4の形式である。ここで,数h1h2h3h4は,AC00


43 

X 0221:2014 (ISO/IEC 10646:2012) 

 

〜D7A3の範囲にある。 

b) それぞれ,16進数h1,h2,h3及びh4と値が等しい10進数d1,d2,d3及びd4を導出する。 

c) 文字の指標Cを,次の式によって計算する。 

C=4 096×(d1−10)+256×(d2−12)+16×d3+d4 

d) 音節要素(syllablecomponent)の指標I,P及びFを次の式によって計算する。 

I=C/588 

(0≦I≦18) 

P=(C%588)/28 

(0≦P≦20) 

F=C%28 

(0≦F≦27) 

ここに,“/”は,整数除算(すなわち,x/yは,商の整数部分とする。)を示し,“%”は,剰余演算

(すなわち,x%yは,整数除算x/yの剰余とする。)を示す。 

e) 三つの指標I,P及びFに対応するラテンの文字列を,それぞれ表5の欄2,欄3及び欄4から得る(I

=11及びF=0に対応する文字列は,空である。)。この三つの文字列を左から右の順に連結し,音節

名(syllable-name)の文字列を得る。 

f) 

このとき,符号位置h1h2h3h4の文字の名前は,次のとおりとする。 

HANGUL SYLLABLE s-n 

ここに,“s-n”は,e)で得られた音節名を示す。 

例 符号位置D4DEの文字では,次のようになる。 

d1=13,d2=4,d3=13,d4=14 

C=10462 

I=17,P=16,F=18 

対応するラテンの文字列は,P,WI及びBSである。音節名は,PWIBSであり,文字の名前

は,HANGUL SYLLABLE PWIBSである。 

それぞれのハングル音節文字に対して,短い注記を規定し,附属書Rにそれぞれの文字名とともに

示す。この注記は,そのハングル音節文字のラテン文字への,代替の翻字からなる。これらも,また,

その符号位置の数値から,次の同様の計算手順によって導き出される。 

g) 上のa)〜d)の段階を実行する。 

h) 表5の欄5,欄6及び欄7から,I,P及びFの三つの指標に相当するラテンの文字列を得る(I=11

とF=0とに対応する文字列は,空である。)。この三つの文字列を左から右の順に連結し,一つの文

字列を得る。 

例 符号位置D4DEの文字では,次のようになる。 

d1=13,d2=4,d3=13,d4=14 

C=10 462 

I=17,P=16,F=18 

対応するラテンの文字列は,ph,wi及びpsである。追加情報は,phwipsとなる。 

 

注記 附属書Rにハングル音節の名前を添付ファイルで参照できるようにしてある。 

 


44 

X 0221:2014 (ISO/IEC 10646:2012) 

  

表5−ハングル音節文字の名前及び追加情報の要素 

 

音節名の要素 

注記の要素 

指標の数値 

Iの文字列 

Pの文字列 

Fの文字列 

Iの文字列 

Pの文字列 

Fの文字列 

 

 

GG 

AE 

kk 

ae 

YA 

GG 

ya 

kk 

YAE 

GS 

yae 

ks 

DD 

EO 

tt 

eo 

NJ 

nc 

YEO 

NH 

yeo 

nh 

YE 

ye 

BB 

pp 

WA 

LG 

wa 

lk 

10 

SS 

WAE 

LM 

ss 

wae 

lm 

11 

 

OE 

LB 

 

oe 

lp 

12 

YO 

LS 

yo 

ls 

13 

JJ 

LT 

cc 

lth 

14 

WEO 

LP 

ch 

weo 

lph 

15 

WE 

LH 

kh 

we 

lh 

16 

WI 

th 

wi 

17 

YU 

ph 

yu 

18 

EU 

BS 

eu 

ps 

19 

 

YI 

 

yi 

20 

 

SS 

 

ss 

21 

 

 

NG 

 

 

ng 

22 

 

 

 

 

23 

 

 

 

 

ch 

24 

 

 

 

 

kh 

25 

 

 

 

 

th 

26 

 

 

 

 

ph 

27 

 

 

 

 

注記1 表5に示す音節名の要素のI及びFの文字列は,符号表の1100〜1112(110Bを除く)及

び11A8〜11C2の範囲のハングル字母の名前の後に注記として示されているハングル字
母の短い名前に対応する。短い名前は,これらのハングルの音訳である。 

注記2 音節名の要素のI及びFの文字列は,ISO/TR 11941:1996 Information and documentation−

Transliteration of Korean script into Latin charactersの方法Iに基づく。同じ表の注記の要素
のI及びFは,ISO/TR 11941の方法IIに基づく。音節名の要素及び注記の要素のPの文
字列は,ISO/TR 11941に基づく。ISO/TR 11941は,2000年7月4日に大韓民国文化観光
部が発行したRevised Romanization of Korean script(改訂版韓国語用字のローマ字表記)
とは,異なっている。 

 

 

25 名前付きUCS列識別子 

名前付きUCS列識別子(以下,“名前付きUSI”又は“NUSI”という。)は,文字の名前と同じ規則に

従った名前を伴うUSIとする。名前付きUCS列識別子の名前付けの規則は,箇条24に従う。 

注記1 UCS列識別子に名前を付ける目的は,一まとまりとして扱う文字の列を特定することであ

る。例えば,フォント又はキーボードの,特定の種類の処理,規格による参照又はレパート


45 

X 0221:2014 (ISO/IEC 10646:2012) 

 

リの列挙である。 

各NUSIに対応するUCS列識別子の値は,正規形NFC(箇条21参照)によって決定される符号化表現

を使って記述される。それぞれの名前付きUCS列識別子は,一意の符号化表現をもつ。この規格に含まれ

る全ての名前付きUCS列識別子は,添付ファイルで参照できる。他の全ての名前付き列は,定義されてい

ない。 

添付ファイルは,テキストファイルであり,ISO/IEC 646のIRVの文字及び行末を表すLINE FEEDを

使用する。ファイルの先頭の5行は,ヘッダであり,その後に名前付きUCS列識別子が示される。各行は,

次の情報がTAB文字で区切られた項目で構成されている。 

− 項目1は,6.6で定義された文法によるUCS列である。 

− 項目2は,NUSIの名前である(箇条24の規則に従う。)。 

参照ファイルは,添付ファイル“NUSI.txt”である。 

注記2 (対応国際規格の注記2は,この規格では該当しないため不採用とした。) 

注記3 この国際規格によって許容される全ての名前付きUCS列識別子は,ユニコード附属書 UAX 

#34, Unicode Named Character Sequences: https://www.unicode.org/reports/tr34/tr34-11.htmlでも示

される。 

 

26 基本多言語面の構造 

基本多言語面の概観を図7に示し,区00〜33のそれより詳細な概観を図8に示す。 

基本多言語面には,表音文字,音節文字及び漢字の用字で一般的に用いる文字並びに様々な記号及び数

字が含まれる。 

 


46 

X 0221:2014 (ISO/IEC 10646:2012) 

  

 

 

注記 区の中の縦の区切りは,おおよその位置の目安を示しているだけである。 

 

図7−基本多言語面の概観 

 


47 

X 0221:2014 (ISO/IEC 10646:2012) 

 

 

 

注記1 新タイ ロ文字は,シーソンパンナータイ文字とも呼ぶ。 
注記2 区の中の縦の区切りは,おおよその位置の目安を示しているだけである。 

 

図8−基本多言語面区00〜33の概観 

 

27 用字及び記号群に用いる追加多言語面の構造 

漢字の追加のために別の追加面を用意したので,現時点では,SMP(面01)を漢字の符号化に用いない。


48 

X 0221:2014 (ISO/IEC 10646:2012) 

  

SMPは,世界の他の用字で用いる図形文字のうちBMPで符号化されない文字の符号化に用いる。現時点

では,SMPで符号化する用字の大半は,現存の用字として現代の利用者集団が用いるものではない。 

注記 SMPを次のように分割することが提案されている。 

− アルファベットの用字 

− 象形文字,表意文字及び音節文字 

− 漢字以外の表意文字 

− 新規に発明された用字 

− 記号の集合 

SMPの概観を図9に,区00〜7Fのそれより詳細な概観を図10に示す。 

 

 

 

注記 区の中の縦の区切りは,おおよその位置の目安を示しているだけである。 

 

図9−用字及び記号群に用いる追加多言語面の概観 

 


49 

X 0221:2014 (ISO/IEC 10646:2012) 

 

 

 

注記1 区の中の縦の区切りは,おおよその位置の目安を示しているだけである。 
注記2 OLD ITALIC(古代イタリア文字)ブロックは,エトルリア文字,オスク文字,ウンブリア文字,ファリス

ク文字,北ピケーノ文字及び南ピケーノ文字を包含する統合用字を表す。これらのアルファベットの幾つか
は,右から左にも,左から右にも書くことができる。符号表の字形は,左から右に進むものを示した。 

 

図10−用字及び記号群に用いる追加多言語面の区00〜7Fの概観 

 

28 追加漢字面の構造 

SIP(面02)は,CJK統合漢字(東アジアの漢字を統合したもの。)のうち,BMPで符号化されないも

のに用いる。統合の手順及び配列の規則を,附属書Sに示す。 

SIPは,CJK互換漢字にも用いる。CJK互換漢字は,箇条18で規定する互換用文字である。 

SIPの概観を図11に示す。 

 


50 

X 0221:2014 (ISO/IEC 10646:2012) 

  

 

 

注記 区の中の縦の区切りは,おおよその位置の目安を示しているだけである。 

 

図11−追加漢字面の概観 

 

29 第三漢字面の構造 

TIP(面03)は,古代の漢字のような用字であって,CJK統合漢字と関連するがCJK統合漢字には分類

されない用字に用いる。現在のところTIPに符号化されている文字はない。 

注記 この規格の将来の版ではTIPに甲骨文字又は金文を含めるかもしれない。 

 

30 追加特殊用途面の構造 

SSP(面0E)は,特殊な用途の図形文字及び書式文字に用いる。 

SSPの概観を図12に示す。 

注記 通常の処理又は表示では,この範囲の未定義の符号位置は,無視することが望ましい。 

 

 

 

注記 区の中の縦の区切りは,おおよその位置の目安を示しているだけである。 

 

図12−追加特殊用途面の概観 

 


51 

X 0221:2014 (ISO/IEC 10646:2012) 

 

31 符号表及び文字の名前一覧表 

基本多言語面(BMP),追加多言語面(SMP),追加漢字面(SIP)及び追加特殊用途面(SSP)に対する

詳細符号表及び文字の名前の一覧を添付ファイルによって示す。符号表は,ブロックごとに整理されてお

り,複数ページにまたがるブロックもある。 

それぞれの符号表の後には,対応する文字の名前一覧を示す(ただし,漢字及びハングル音節のブロッ

クを除く。)。 

注記 場所が許せば,一つのブロックの符号表と文字の名前一覧とを一つのページにまとめることも

ある。 

注記A 漢字の符号表は,形式が異なる(23.3及び23.5参照)。 

31.1 符号表 

符号表は,文字を表す図形記号を,それぞれが16個の記号を含む1〜16桁に編成した配列として表示さ

れる。符号化表現の下位1桁を左側の余白に表示し,残りの上位桁を上側の余白に表示する。さらに,符

号化表現の全体をそれぞれの図形記号の下に表示する。 

注記 図形文字の表示に対応する図形記号は,参考である。箇条13参照。 

31.2 文字の名前の一覧表 

文字の名前の一覧表は,規定事項と参考情報との両方を含む。次の項目は,規定事項とする。 

− 文字の符号位置。 

− 付随する文字の名前。 

− 文字の別名(“※”に引き続いて記載する。)。 

他の全ての情報は,参考情報であり,次のようなものがある。 

− 文字に関連付いた図形記号。 

− あるブロックの様々な部分に対する見出し。例えば,LATIN-1 SUPPLEMENTブロックには,“Latin-1 

punctuation and symbols”,“Letters”及び“Mathematical operator”の見出しがある。 

− 見出し又はブロック全体に関して補足する説明の文章。 

− “=”に引き続いて記載する,参考の別名。これは,文字の代替の名前を示す。 

− “→”に引き続いて記載する,相互参照。これは,関連する文字を示す。 

− “・”に引き続いて記載する,言語に関する情報。これは,その文字を使用する言語を非網羅的に示

す。大文字と小文字とをもつ用字の場合,この情報は,小文字に対してだけ示す。 

− やはり“・”に引き続いて記載する,大文字と小文字との対応情報。これは,名前から単純に類推す

ることができない場合にだけ示す。 

− やはり“・”に引き続いて記載する,その他の情報。これは,奇妙な名前,歴史的配慮事項等の,文

字に関して記録すべき特徴を示す。 

− 分解写像。“≡”に引き続いて基準写像を,“≈”に引き続いて互換写像を,それぞれ記載する。 

注記 分解写像の文法は,ユニコード標準第6.0版の17.1に詳しい記載がある。 

次の例は,ここに示した参考項目を含む,文字名一覧の様々な部分を用いて説明している。 


52 

X 0221:2014 (ISO/IEC 10646:2012) 

  

例 

 

 

31.3 符号表及び文字の名前一覧の添付ファイル 

基本多言語面(BMP),追加多言語面(SMP),追加漢字面(SIP)及び追加特殊用途面(SSP)に対する

詳細符号表及び文字の名前の一覧を添付ファイルによって示す。これらの符号表及び名前の一覧は,次の

とおりとする。 

− BASIC LATIN〜YIJING HEXAGRAM SYMBOLS(0000〜4DFF)は,添付ファイル

“ISO10646-2012-1-0000-4DFF.pdf”とする。 

− CJK UNIFIED IDEOGRAPHS(4E00〜9FFF)は,添付ファイル“ISO10646-2012-2-4E00-9FFF.pdf”と

する。 

− YI SYLLABLES〜ALCHEMICAL SYMBOLS(A000〜1FFFF)は,添付ファイル

“ISO10646-2012-3-A000-1FFFF.pdf”とする。 

− CJK UNIFIED IDEOGRAPHS EXTENSION Bの前半(20000〜25333)は,添付ファイル


53 

X 0221:2014 (ISO/IEC 10646:2012) 

 

“ISO10646-2012-4-20000-25333.pdf”とする。 

− CJK UNIFIED IDEOGRAPHS EXTENSION Bの後半(25334〜2A6FF)は,添付ファイル

“ISO10646-2012-5-25334-2A6FF.pdf”とする。 

− CJK UNIFIED IDEGRAPHS EXTENSION C〜VARIATION SELECTORS SUPPLEMENT(2A700〜10FFFF)

は,添付ファイル“ISO10646-2012-6-2A700-10FFFF.pdf”とする。 

注記 符号表の奇数・偶数レイアウトを保つために,実際の符号表の直前のブロックの1枚を挿入す

ることがある。 

 


54 

X 0221:2014 (ISO/IEC 10646:2012) 

  

附属書A 

(規定) 

部分集合用図形文字の組 

 

A.1 符号化図形文字の組 

次に示す組は,組番号の順に並べている。“符号位置”の * は,その組が確定組であることを示す。 

組番号 名前 

符号位置 

BASIC LATIN 

0020〜007E * 

LATIN-1 SUPPLEMENT 

00A0〜00FF * 

LATIN EXTENDED-A 

0100〜017F * 

LATIN EXTENDED-B 

0180〜024F * 

IPA EXTENSIONS 

0250〜02AF * 

SPACING MODIFIER LETTERS 

02B0〜02FF * 

COMBINING DIACRITICAL MARKS 

0300〜036F * 

BASIC GREEK 

0370〜03CF 

GREEK SYMBOLS AND COPTIC 

03D0〜03FF 

10 

CYRILLIC 

0400〜04FF * 

11 

ARMENIAN 

0530〜058F 

12 

BASIC HEBREW 

05D0〜05EA * 

13 

HEBREW EXTENDED 

0590〜05CF 
05EB〜05FF 

14 

BASIC ARABIC 

0600〜065F 

15 

ARABIC EXTENDED 

0660〜06FF * 

16 

DEVANAGARI 

0900〜097F 
200C,200D 

17 

BENGALI 

0980〜09FF 
200C,200D 

18 

GURMUKHI 

0A00〜0A7F 
200C,200D 

19 

GUJARATI 

0A80〜0AFF 
200C,200D 

20 

ORIYA 

0B00〜0B7F 
200C,200D 

21 

TAMIL 

0B80〜0BFF 
200C,200D 

22 

TELUGU 

0C00〜0C7F 
200C,200D 

23 

KANNADA 

0C80〜0CFF 
200C,200D 

24 

MALAYALAM 

0D00〜0D7F 
200C,200D 

25 

THAI 

0E00〜0E7F 

26 

LAO 

0E80〜0EFF 

27 

BASIC GEORGIAN 

10D0〜10FF 

28 

GEORGIAN EXTENDED 

10A0〜10CF 

29 

HANGUL JAMO 

1100〜11FF * 

30 

LATIN EXTENDED ADDITIONAL 

1E00〜1EFF * 

31 

GREEK EXTENDED 

1F00〜1FFF 

32 

GENERAL PUNCTUATION 

2000〜206F 

33 

SUPERSCRIPTS AND SUBSCRIPTS 

2070〜209F 

34 

CURRENCY SYMBOLS 

20A0〜20CF 

35 

COMBINING DIACRITICAL MARKS FOR SYMBOLS 

20D0〜20FF 

36 

LETTERLIKE SYMBOLS 

2100〜214F * 


55 

X 0221:2014 (ISO/IEC 10646:2012) 

 

37 

NUMBER FORMS 

2150〜218F 

38 

ARROWS 

2190〜21FF * 

39 

MATHEMATICAL OPERATORS 

2200〜22FF * 

40 

MISCELLANEOUS TECHNICAL 

2300〜23FF 

41 

CONTROL PICTURES 

2400〜243F 

42 

OPTICAL CHARACTER RECOGNITION 

2440〜245F 

43 

ENCLOSED ALPHANUMERICS 

2460〜24FF * 

44 

BOX DRAWING 

2500〜257F * 

45 

BLOCK ELEMENTS 

2580〜259F * 

46 

GEOMETRIC SHAPES 

25A0〜25FF * 

47 

MISCELLANEOUS SYMBOLS 

2600〜26FF * 

48 

DINGBATS 

2700〜27BF 

49 

CJK SYMBOLS AND PUNCTUATION 

3000〜303F * 

50 

HIRAGANA 

3040〜309F 

51 

KATAKANA 

30A0〜30FF * 

52 

BOPOMOFO 

3100〜312F 
31A0〜31BF 

53 

HANGUL COMPATIBILITY JAMO 

3130〜318F 

54 

CJK MISCELLANEOUS 

3190〜319F 

55 

ENCLOSED CJK LETTERS AND MONTHS 

3200〜32FF 

56 

CJK COMPATIBILITY 

3300〜33FF * 

57〜59 [これらの組番号は,使用しない(注記2参照)。] 
60 

CJK UNIFIED IDEOGRAPHS 

4E00〜9FFF 

61 

PRIVATE USE AREA 

E000〜F8FF 

62 

CJK COMPATIBILITY IDEOGRAPHS 

F900〜FAFF 

63 

(組63は,他の組の組合せによって定義する。) 

64 

ARABIC PRESENTATION FORMS-A 

FB50〜FDCF 
FDF0〜FDFF 

65 

COMBINING HALF MARKS 

FE20〜FE2F 

66 

CJK COMPATIBILITY FORMS 

FE30〜FE4F * 

67 

SMALL FORM VARIANTS 

FE50〜FE6F 

68 

ARABIC PRESENTATION FORMS-B 

FE70〜FEFE 

69 

HALFWIDTH AND FULLWIDTH FORMS 

FF00〜FFEF 

70 

SPECIALS 

FFF0〜FFFD 

71 

HANGUL SYLLABLES 

AC00〜D7A3 * 

72 

BASIC TIBETAN 

0F00〜0FBF 

73 

ETHIOPIC 

1200〜137F 

74 

UNIFIED CANADIAN ABORIGINAL SYLLABICS 

1400〜167F * 

75 

CHEROKEE 

13A0〜13FF 

76 

YI SYLLABLES 

A000〜A48F 

77 

YI RADICALS 

A490〜A4CF 

78 

KANGXI RADICALS 

2F00〜2FDF 

79 

CJK RADICALS SUPPLEMENT 

2E80〜2EFF 

80 

BRAILLE PATTERNS 

2800〜28FF 

81 

CJK UNIFIED IDEOGRAPHS EXTENSION A 

3400〜4DBF 
FA1F,FA23 

82 

OGHAM 

1680〜169F 

83 

RUNIC 

16A0〜16FF 

84 

SINHALA 

0D80〜0DFF 

85 

SYRIAC 

0700〜074F 

86 

THAANA 

0780〜07BF 

87 

BASIC MYANMAR 

1000〜104F 
200C,200D * 

88 

KHMER 

1780〜17FF 
200C,200D 

89 

MONGOLIAN 

1800〜18AF * 


56 

X 0221:2014 (ISO/IEC 10646:2012) 

  

90 

EXTENDED MYANMAR 

1050〜109F 

91 

TIBETAN 

0F00〜0FFF 

92 

CYRILLIC SUPPLEMENT 

0500〜052F 

93 

TAGALOG 

1700〜171F 

94 

HANUNOO 

1720〜173F 

95 

BUHID 

1740〜175F 

96 

TAGBANWA 

1760〜177F 

97 

MISCELLANEOUS MATHEMATICAL SYMBOLS-A 

27C0〜27EF * 

98 

SUPPLEMENTAL ARROWS-A 

27F0〜27FF * 

99 

SUPPLEMENTAL ARROWS-B 

2900〜297F * 

100 

MISCELLANEOUS MATHEMATICAL SYMBOLS-B 

2980〜29FF * 

101 

SUPPLEMENTAL MATHEMATICAL OPERATORS 

2A00〜2AFF * 

102 

KATAKANA PHONETIC EXTENSIONS 

31F0〜31FF * 

103 

VARIATION SELECTORS 

FE00〜FE0F * 

104 

LTR ALPHABETIC PRESENTATION FORMS 

FB00〜FB1C 

105 

RTL ALPHABETIC PRESENTATION FORMS 

FB1D〜FB4F 

106 

LIMBU 

1900〜194F 

107 

TAI LE 

1950〜197F 

108 

KHMER SYMBOLS 

19E0〜19FF * 

109 

PHONETIC EXTENSIONS 

1D00〜1D7F * 

110 

MISCELLANEOUS SYMBOLS AND ARROWS 

2B00〜2BFF 

111 

YIJING HEXAGRAM SYMBOLS 

4DC0〜4DFF * 

112 

ARABIC SUPPLEMENT 

0750〜077F * 

113 

ETHIOPIC SUPPLEMENT 

1380〜139F 

114 

NEW TAI LUE 

1980〜19DF 

115 

BUGINESE 

1A00〜1A1F 

116 

PHONETIC EXTENSIONS SUPPLEMENT 

1D80〜1DBF * 

117 

COMBINING DIACRITICAL MARKS SUPPLEMENT 

1DC0〜1DFF 

118 

GLAGOLITIC 

2C00〜2C5F 

119 

COPTIC 

03E2〜03EF 
2C80〜2CFF 

120 

GEORGIAN SUPPLEMENT 

2D00〜2D2F 

121 

TIFINAGH 

2D30〜2D7F 

122 

ETHIOPIC EXTENDED 

2D80〜2DDF 

123 

SUPPLEMENTAL PUNCTUATION 

2E00〜2E7F 

124 

CJK STROKES 

31C0〜31EF 

125 

MODIFIER TONE LETTERS 

A700〜A71F * 

126 

SYLOTI NAGRI 

A800〜A82F 

127 

VERTICAL FORMS 

FE10〜FE1F 

128 

NKO 

07C0〜07FF 

129 

BALINESE 

1B00〜1B7F 

130 

LATIN EXTENDED-C 

2C60〜2C7F * 

131 

LATIN EXTENDED-D 

A720〜A7FF 

132 

PHAGS-PA 

A840〜A87F 

133 

SUNDANESE 

1B80〜1BBF * 

134 

LEPCHA 

1C00〜1C4F 

135 

OL CHIKI 

1C50〜1C7F * 

136 

VAI 

A500〜A63F 

137 

SAURASHTRA 

A880〜A8DF 

138 

KAYAH LI 

A900〜A92F * 

139 

REJANG 

A930〜A95F 

140 

CYRILLIC EXTENDED-A 

2DE0〜2DFF * 

141 

CYRILLIC EXTENDED-B 

A640〜A69F 

142 

CHAM 

AA00〜AA5F 

143 

TAI THAM 

1A20〜1AAF 

144 

HANGUL JAMO EXTENDED-A 

A960〜A97F 


57 

X 0221:2014 (ISO/IEC 10646:2012) 

 

145 

TAI VIET 

AA80〜AADF 

146 

HANGUL JAMO EXTENDED-B 

D7B0〜D7FF 

147 

SAMARITAN 

0800〜083F 

148 

UNIFIED CANADIAN ABORIGINAL SYLLABICS EXTENDED 18B0〜18FF 

149 

VEDIC EXTENSIONS 

1CD0〜1CFF 

150 

LISU 

A4D0〜A4FF * 

151 

BAMUM 

A6A0〜A6FF 

152 

COMMON INDIC NUMBER FORMS 

A830〜A83F 

153 

DEVANAGARI EXTENDED 

A8E0〜A8FF 

154 

JAVANESE 

A980〜A9DF 

155 

MYANMAR EXTENDED-A 

AA60〜AA7F 

156 

MEETEI MAYEK 

ABC0〜ABFF 

157 

MANDAIC 

0840〜085F 

158 

BATAK 

1BC0〜1BFF 

159 

ETHIOPIC EXTENDED-A 

AB00〜AB2F 

160 

ARABIC EXTENDED-A 

08A0〜08FF 

161 

SUNDANESE SUPPLEMENT 

1CC0〜1CCF 

162 

MEETEI MAYEK EXTENSIONS 

AAE0〜AAFF 

1001 

OLD ITALIC 

10300〜1032F 

1002 

GOTHIC 

10330〜1034F 

1003 

DESERET 

10400〜1044F * 

1004 

BYZANTINE MUSICAL SYMBOLS 

1D000〜1D0FF 

1005 

MUSICAL SYMBOLS 

1D100〜1D1FF 

1006 

MATHEMATICAL ALPHANUMERIC SYMBOLS 

1D400〜1D7FF 

1007 

LINEAR B SYLLABARY 

10000〜1007F 

1008 

LINEAR B IDEOGRAMS 

10080〜100FF 

1009 

AEGEAN NUMBERS 

10100〜1013F 

1010 

UGARITIC 

10380〜1039F 

1011 

SHAVIAN 

10450〜1047F * 

1012 

OSMANYA 

10480〜104AF 

1013 

CYPRIOT SYLLABARY 

10800〜1083F 

1014 

TAI XUAN JING SYMBOLS 

1D300〜1D35F 

1015 

ANCIENT GREEK NUMBERS 

10140〜1018F 

1016 

OLD PERSIAN 

103A0〜103DF 

1017 

KHAROSHTHI 

10A00〜10A5F 

1018 

ANCIENT GREEK MUSICAL NOTATION 

1D200〜1D24F 

1019 

PHOENICIAN 

10900〜1091F 

1020 

CUNEIFORM 

12000〜123FF 

1021 

CUNEIFORM NUMBERS AND PUNCTUATION 

12400〜1247F 

1022 

COUNTING ROD NUMERALS 

1D360〜1D37F 

1023 

PHAISTOS DISC 

101D0〜101FF 

1024 

LYCIAN 

10280〜1029F 

1025 

CARIAN 

102A0〜102DF 

1026 

LYDIAN 

10920〜1093F 

1027 

ANCIENT SYMBOLS 

10190〜101CF 

1028 

MAHJONG TILES 

1F000〜1F02F 

1029 

DOMINO TILES 

1F030〜1F09F 

1030 

AVESTAN 

10B00〜10B3F 

1031 

EGYPTIAN HIEROGLYPHS 

13000〜1342F 

1032 

IMPERIAL ARAMAIC 

10840〜1085F 

1033 

OLD SOUTH ARABIAN 

10A60〜10A7F 

1034 

INSCRIPTIONAL PARTHIAN 

10B40〜10B5F 

1035 

INSCRIPTIONAL PAHLAVI 

10B60〜10B7F 

1036 

OLD TURKIC 

10C00〜10C4F 

1037 

RUMI NUMERAL SYMBOLS 

10E60〜10E7F 

1038 

KAITHI 

11080〜110CF 


58 

X 0221:2014 (ISO/IEC 10646:2012) 

  

1039 

ENCLOSED ALPHANUMERIC SUPPLEMENT 

1F100〜1F1FF 

1040 

ENCLOSED IDEOGRAPHIC SUPPLEMENT 

1F200〜1F2FF 

1041 

BRAHMI 

11000〜1107F 

1042 

KANA SUPPLEMENT 

1B000〜1B0FF 

1043 

BAMUM SUPPLEMENT 

16800〜16A3F 

1044 

PLAYING CARDS 

1F0A0〜1F0FF 

1045 

MISCELLANEOUS SYMBOLS AND PICTOGRAPHS 

1F300〜1F5FF 

1046 

EMOTICONS 

1F600〜1F64F 

1047 

TRANSPORT AND MAP SYMBOLS 

1F680〜1F6FF 

1048 

ALCHEMICAL SYMBOLS 

1F700〜1F77F 

1049 

MEROITIC HIEROGLYPHS 

10980〜1099F * 

1050 

MEROITIC CURSIVE 

109A0〜109FF 

1051 

SORA SOMPENG 

110D0〜110FF 

1052 

CHAKMA 

11100〜1114F 

1053 

SHARADA 

11180〜111DF 

1054 

TAKRI 

11680〜116CF 

1055 

MIAO 

16F00〜16F9F 

1056 

ARABIC MATHEMATICAL ALPHABETIC SYMBOLS 

1EE00〜1EEFF 

2001 

CJK UNIFIED IDEOGRAPHS EXTENSION B 

20000〜2A6DF 

2002 

CJK COMPATIBILITY IDEOGRAPHS SUPPLEMENT 

2F800〜2FA1F 

2003 

CJK UNIFIED IDEOGRAPHS EXTENSION C 

2A700〜2B73F 

2004 

CJK UNIFIED IDEOGRAPHS EXTENSION D 

2B740〜2B81F 

3001 

TAGS 

E0000〜E007F 

3003 

VARIATION SELECTORS SUPPLEMENT 

E0100〜E01EF * 

次の組は,代替書式及び用字に特有の書式で使用する文字を規定する(附属書F参照)。 

200 

ZERO-WIDTH BOUNDARY INDICATORS 

200B〜200D 
FEFF 

201 

FORMAT SEPARATORS 

2028〜2029 

202 

BI-DIRECTIONAL FORMAT MARKS 

200E〜200F 

203 

BI-DIRECTIONAL FORMAT EMBEDDINGS 

202A〜202E 

204 

HANGUL FILL CHARACTERS 

115F〜1160 
3164,FFA0 

205 

CHARACTER SHAPING SELECTORS 

206A〜206D 

206 

NUMERIC SHAPE SELECTORS 

206E〜206F 

207 

IDEOGRAPHIC DESCRIPTION CHARACTERS 

2FF0〜2FFF 

208 

CONTROL CHARACTERS 

0000〜001F 
007F〜009F 

3002 

ALTERNATE FORMAT CHARACTERS 

E0000〜E0FFF 

次の組は,この規格の対応国際規格の以前の版が発行された時点でのUCS全体を表す組である。 

299 

(この組番号は,使用しない。A.3.2を参照。) 

301 

BMP-AMD.7 

A.3.1を参照。* 

302 

BMP SECOND EDITION 

A.3.3を参照。* 

303 

UNICODE 3.1 

A.6.1を参照。* 

304 

UNICODE 3.2 

A.6.2を参照。* 

305 

UNICODE 4.0 

A.6.3を参照。* 

306 

UNICODE 4.1 

A.6.4を参照。* 

307 

UNICODE 5.0 

A.6.5を参照。* 

308 

UNICODE 5.1 

A.6.6を参照。* 

309 

UNICODE 5.2 

A.6.7を参照。* 

311 

UNICODE 6.0 

A.6.8を参照。* 

312 

UNICODE 6.1 

A.6.9を参照。* 

340 

COMBINED FIRST EDITION 

A.3.4を参照。* 

10646 

UNICODE 

0000〜FDCF 
FDF0〜FFFD 
10000〜1FFFD 


59 

X 0221:2014 (ISO/IEC 10646:2012) 

 

20000〜2FFFD 
30000〜3FFFD 
40000〜4FFFD 
50000〜5FFFD 
60000〜6FFFD 
70000〜7FFFD 
80000〜8FFFD 
90000〜9FFFD 
A0000〜AFFFD 
B0000〜BFFFD 
C0000〜CFFFD 
D0000〜DFFFD 
E0000〜EFFFD 
F0000〜FFFFD 
100000〜10FFFD 

注記1 組UNICODEは,この規格が現在符号化している全ての文字を包含する。 

次の組は,漢字だけを含む。 

370 

IICORE 

A.4.1を参照。* 

371 

JIS2004 IDEOGRAPHICS EXTENSION 

A.4.2を参照。* 

372 

JAPANESE IDEOGRAPHICS SUPPLEMENT 

A.4.3を参照。* 

380 

CJK UNIFIED IDEOGRAPHS-2001 

3400〜4DB5 
4E00〜9FA5 
FA0E〜FA0F 
FA11 
FA13〜FA14 
FA1F,FA21 
FA23〜FA24 
FA27〜FA29 
20000〜2A6D6 * 

381 

CJK COMPATIBILITY IDEOGRAPHS-2001 

F900〜FA0D 
FA10,FA12 
FA15〜FA1E 
FA20,FA22 
FA25〜FA26 
FA2A〜FA6A 
2F800〜2FA1D * 

382 

CJK UNIFIED IDEOGRAPHS-2005 

組380 
9FA6〜9FBB * 

383 

CJK COMPATIBILITY IDEOGRAPHS-2005 

組381 
FA70〜FAD9 * 

384 

CJK UNIFIED IDEOGRAPHS-2007 

組382 
9FBC〜9FC3 * 

385 

CJK UNIFIED IDEOGRAPHS-2008 

組384 
9FC4〜9FC6 
2A700〜2B734 * 

386 

CJK COMPATIBILITY IDEOGRAPHS-2008 

組383 
FA6B〜FA6D * 

387 

CJK UNIFIED IDEOGRAPHS-2009 

組385 
9FC7〜9FCB 
2B740〜2B81D * 

その他の組(拡張組を含む。)を,次に規定する。 

270 

COMBINING CHARACTERS 

BMPにある結合文字(4.14参照)。 

271 

(この組番号は,使用しない。注記2を参照。) 

281 

MES-1 

A.5.1を参照。* 

282 

MES-2 

A.5.2を参照。* 

283 

MODERN EUROPEAN SCRIPTS 

A.5.3を参照。* 


60 

X 0221:2014 (ISO/IEC 10646:2012) 

  

284 

CONTEMPORARY LITHUANIAN LETTERS 

A.5.4を参照。* 

285 

BASIC JAPANESE 

A.5.5を参照。* 

286 

JAPANESE NON IDEOGRAPHICS EXTENSION 

A.5.6を参照。* 

287 

COMMON JAPANESE 

A.5.7を参照。* 

288 

MULTILINGUAL LATIN SUBSET 

A.5.8を参照。* 

300 

BMP 

0000〜D7FF 
E000〜FFFD 

400 

[この組番号は,使用しない(注記3参照)。] 

401 

PRIVATE USE PLANES-0F-10 

面0F〜10 

500 

[この組番号は,使用しない(注記3参照)。] 

1000 

SMP 

10000〜1FFFD 

1900 

SMP COMBINING CHARACTERS 

SMPにある結合文字(4.14参照)。 

2000 

SIP 

20000〜2FFFD 

3000 

SSP 

E0000〜EFFFD 

上に定義した特定の組を組み合わせた組を,次に規定する。 

63 

ALPHABETIC PRESENTATION FORMS 

組104〜105 

250 

GENERAL FORMAT CHARACTERS 

組200〜203 

251 

SCRIPT-SPECIFIC FORMAT CHARACTERS 

組204〜206 

4000 

UCS PART-2 

組1000,2000,3000 

注記2 番号57〜59の組は,ISO/IEC 10646-1の最初の版で規定されていたが,その後,削除された。

番号400及び500の組は,ISO/IEC 10646-1の最初の版及び第2版で規定されていたが,そ

の後,削除された。番号271の組は,この規格の最初の版で規定されていたが,その後,削

除された。 

注記3 上に示した組の名前で使われる主要な語(キーワード)を,アルファベット順に,次に列挙

する。各語の行には,組の名前がその語を含む組番号を全て示す。ただし,これらの語は,

用字の名前など,特定の属性をもつ文字を見つけ出すことができるような組全てへの完全な

相互参照となるものではない。これらの語の多くは,組の中の文字の属性を識別するが,そ

の属性をもつ文字の中には,他の,その語の行に番号が現れない組に入れたものもある。 

Aegean numbers 

1009 

Alphabetic 

63 

Alphanumeric 

43 

Ancient Greek 

1015,1018 

Arabic 

14,15,64,68,112,160,1056 

Armenian 

11 

Arrows 

38,98,99,110 

Avestan 

1030 

Balinese 

129 

Bamum 

151,1043 

Batak 

158 

Bengali 

17 

Bidirectional 

202,203 

Block elements 

45 

BMP 

300〜302 (299) 

Box drawing 

44 

Bopomofo 

52 

Brahmi 

1041 

Braille patterns 

80 

Buginese 

115 

Buhid 

95 

Byzantine musical symbols 

1004 

Canadian Aboriginal 

74,148 

Carian 

1025 

Chakma 

1052 

Cham 

142 

Cherokee 

75 


61 

X 0221:2014 (ISO/IEC 10646:2012) 

 

CJK 

49,54〜56,60,62,66,78,81,124,2001,2002 

Combining 

7,35,65,117,270,271 

Compatibility 

53,56,62,66 

Control pictures 

41 

Coptic 

9,119 

Counting Rod numerals 

1022 

Cuneiform 

1020,1021 

Currency 

34 

Cypriot syllabary 

1013 

Cyrillic 

10,92,140,141 

Deseret 

1003 

Devanagari 

16,153 

Diacritical marks 

7,35,117 

Dingbats 

48 

Enclosed 

43,55 

Egyptian hieroglyphs 

1031 

Ethiopic 

73,113,122,159 

Format 

201〜203,250,251 

Fullwidth 

69 

Game tiles 

1028,1029 

Geometric shapes 

46 

Georgian 

27,28,120 

Glagolitic 

118 

Gothic 

1002 

Greek 

8,9,31 

Gujarati 

19 

Gurmukhi 

18 

Half (marks, width) 

65,69 

Hangul 

29,53,71,144,146,204 

Hanunoo 

94 

Hebrew 

12,13 

Hiragana 

50,1042 

Ideographs 

60,62,81,207,380,381 

Imperial Aramaic 

1032 

Inscriptional Pahlavi 

1035 

Inscriptional Parthian 

1034 

IPA extensions 

Jamo 

29,53,144,146 

Javanese 

154 

Kaithi 

1038 

Kangxi 

78 

Kannada 

23 

Katakana 

51,102,1042 

Kayah Li 

138 

Kharoshthi 

1017 

Khmer 

88,108 

Lao 

26 

Latin 

1〜4,30,130,131 

Lepcha 

134 

Letter 

36,55,1039,1040 

Limbu 

106 

Linear B ideograms 

1008 

Linear B syllabary 

1007 

Lisu 

150 

Lycian 

1024 

Lydian 

1026 

Malayalam 

24 

Mandaic 

157 

Mathematical alphanumeric symbols 

1006,1056 

Mathematical operators 

39,101 

Mathematical symbols 

97,100 

Meetei Mayek 

156,162 


62 

X 0221:2014 (ISO/IEC 10646:2012) 

  

Meroitic 

1049,1050 

MES 

281,282 

Miao 

1055 

Mongolian 

89 

Months 

55 

Musical notation 

1018 

Musical symbols 

1004,1005 

Myanmar 

87,90,155 

New Tai Lue 

114 

NKo 

128 

Number 

37,152,1009,1015 

Ogham 

82 

Ol Chiki 

135 

Old Italic 

1001 

Old Persian 

1016 

Old South Arabian 

1033 

Old Turkic 

1036 

Optical character recognition 

42 

Oriya 

20 

Osmanya 

1012 

Phags-pa 

132 

Phaistos Disc 

1023 

Phoenician 

1019 

Phonetic extensions 

109,116 

Presentation forms 

63,64,68,104,105 

Private use 

61,401 

Punctuation 

32,49,123 

Radicals 

77〜79 

Rejang 

139 

Rumi numeral symbols 

1037 

Runic 

83 

Samaritan 

147 

Saurashtra 

137 

Shape, shaping 

205,206 

Sharada 

1053 

Shavian 

1011 

Sinhala 

84 

Small form 

67 

Sora Sompeng 

1051 

Spacing modifier 

6,125 

Specials 

70 

Strokes 

124 

Subscripts, superscripts 

33 

Sundanese 

133,161 

Syllables, syllabics 

71,74,76 

Syloti Nagri 

126 

Symbols 

9,34〜36,47,49,97,100,1027,1044〜1048 

Syriac 

85 

Tagalog 

93 

Tagbanwa 

96 

Tags 

3001 

Tai Tham 

143 

Tai Viet 

145 

Tai Xuan Jing symbols 

1014 

Tail Le 

107 

Takri 

1054 

Tamil 

21 

Technical 

40 

Telugu 

22 

Thaana 

86 

Thai 

25 

Tibetan 

72,91 

Tifinagh 

121 


63 

X 0221:2014 (ISO/IEC 10646:2012) 

 

Ugaritic 

1010 

Unicode 

303〜310,10646 

Vai 

136 

Variation selectors 

103,3003 

Vedic 

149 

Vertical form 

127 

Yi 

76,77 

Yijing hexagram symbols 

111 

Zero-width 

200 

 

A.2 ブロックの一覧 

A.2.1 BMPのブロック 

次のブロックは,BMPで規定される。次は,符号位置の順に並べている。 

ブロックの名前 

から まで 

[日本語による通用名称(参考)] 

BASIC LATIN 

0020〜007E 

(基本ラテン文字) 

LATIN-1 SUPPLEMENT 

00A0〜00FF 

(ラテン1補助) 

LATIN EXTENDED-A 

0100〜017F 

(ラテン文字拡張A) 

LATIN EXTENDED-B 

0180〜024F 

(ラテン文字拡張B) 

IPA (INTERNATIONAL PHONETIC ALPHABET) EXTENSIONS 

0250〜02AF 

(IPA拡張) 

SPACING MODIFIER LETTERS 

02B0〜02FF 

(前進を伴う修飾文字) 

COMBINING DIACRITICAL MARKS  

0300〜036F 

[ダイアクリティカルマーク(合成可能)] 

GREEK AND COPTIC 

0370〜03FF 

(ギリシア文字及びコプト文字) 

CYRILLIC 

0400〜04FF 

(キリル文字) 

CYRILLIC SUPPLEMENT 

0500〜052F 

(キリル文字補助) 

ARMENIAN 

0530〜058F 

(アルメニア文字) 

HEBREW 

0590〜05FF 

(ヘブライ文字) 

ARABIC 

0600〜06FF 

(アラビア文字) 

SYRIAC 

0700〜074F 

(シリア文字) 

ARABIC SUPPLEMENT 

0750〜077F 

(アラビア文字補助) 

THAANA 

0780〜07BF 

(ターナ文字) 

NKO 

07C0〜07FF 

(ンコ文字) 

SAMARITAN 

0800〜083F  

(サマリア文字) 

MANDAIC 

0840〜085F  

(マンダ文字) 

ARABIC EXTENDED-A 

08A0〜08FF 

(アラビア文字拡張A) 

DEVANAGARI 

0900〜097F 

(デーヴァナーガリー文字) 

BENGALI 

0980〜09FF 

(ベンガル文字) 

GURMUKHI 

0A00〜0A7F 

(グルムキー文字) 

GUJARATI 

0A80〜0AFF 

(グジャラート文字) 

ORIYA 

0B00〜0B7F 

(オリヤー文字) 

TAMIL 

0B80〜0BFF 

(タミル文字) 

TELUGU 

0C00〜0C7F 

(テルグ文字) 

KANNADA 

0C80〜0CFF 

(カンナダ文字) 

MALAYALAM 

0D00〜0D7F 

(マラヤーラム文字) 

SINHALA 

0D80〜0DFF 

(シンハラ文字) 

THAI 

0E00〜0E7F 

(タイ文字) 

LAO 

0E80〜0EFF 

(ラオス文字) 

TIBETAN 

0F00〜0FFF 

(チベット文字) 

MYANMAR 

1000〜109F 

(ビルマ文字) 

GEORGIAN 

10A0〜10FF 

(グルジア文字) 

HANGUL JAMO 

1100〜11FF 

(ハングル字母) 

ETHIOPIC 

1200〜137F 

(エチオピア文字) 

ETHIOPIC SUPPLEMENT 

1380〜139F 

(エチオピア文字補助) 

CHEROKEE 

13A0〜13FF 

(チェロキー文字) 


64 

X 0221:2014 (ISO/IEC 10646:2012) 

  

UNIFIED CANADIAN ABORIGINAL SYLLABICS 

1400〜167F 

(統合カナダ先住民音節) 

OGHAM 

1680〜169F 

(オガム文字) 

RUNIC 

16A0〜16FF 

(ルーン文字) 

TAGALOG 

1700〜171F 

(タガログ文字) 

HANUNOO 

1720〜173F 

(ハヌノオ文字) 

BUHID 

1740〜175F 

(ブヒッド文字) 

TAGBANWA 

1760〜177F 

(タグバヌア文字) 

KHMER 

1780〜17FF 

(クメール文字) 

MONGOLIAN 

1800〜18AF 

(モンゴル文字) 

UNIFIED CANADIAN ABORIGINAL SYLLABICS EXTENDED 

18B0〜18FF 

(統合カナダ先住民音節拡張) 

LIMBU 

1900〜194F 

(リンブ文字) 

TAI LE 

1950〜197F 

(タイ ロ文字) 

NEW TAI LUE 

1980〜19DF 

(新タイ ロ文字) 

KHMER SYMBOLS 

19E0〜19FF 

(クメール文字用記号) 

BUGINESE 

1A00〜1A1F 

(ブギス文字) 

TAI THAM 

1A20〜1AAF  

(タイタム文字) 

BALINESE 

1B00〜1B7F 

(バリ文字) 

SUNDANESE 

1B80〜1BBF  

(スンダ文字) 

BATAK 

1BC0〜1BFF  

(バタク文字) 

LEPCHA 

1C00〜1C4F  

(レプチャ文字) 

OL CHIKI 

1C50〜1C7F  

(オルチキ文字) 

SUNDANESE SUPPLEMENT 

1CC0〜1CCF  

(スンダ文字補助) 

VEDIC EXTENSIONS 

1CD0〜1CFF  

(ヴェーダ用拡張) 

PHONETIC EXTENSIONS 

1D00〜1D7F 

(音声記号拡張) 

PHONETIC EXTENSIONS SUPPLEMENT 

1D80〜1DBF 

(音声記号拡張補助) 

COMBINING DIACRITICAL MARKS SUPPLEMENT 

1DC0〜1DFF 

[ダイアクリティカルマーク(合成可能)補助] 

LATIN EXTENDED ADDITIONAL 

1E00〜1EFF 

(ラテン文字拡張追加) 

GREEK EXTENDED 

1F00〜1FFF 

(ギリシア文字拡張) 

GENERAL PUNCTUATION 

2000〜206F 

(一般句読点) 

SUPERSCRIPTS AND SUBSCRIPTS 2070〜209F 

(上付き・下付き) 

CURRENCY SYMBOLS 

20A0〜20CF 

(通貨記号) 

COMBINING DIACRITICAL MARKS FOR SYMBOLS 

20D0〜20FF 

[記号用ダイアクリティカルマーク(合成可能)] 

LETTERLIKE SYMBOLS 

2100〜214F 

(文字様記号) 

NUMBER FORMS 

2150〜218F 

(数字に準じるもの) 

ARROWS 

2190〜21FF 

(矢印) 

MATHEMATICAL OPERATORS 

2200〜22FF 

(数学記号) 

MISCELLANEOUS TECHNICAL 

2300〜23FF 

(その他の技術用記号) 

CONTROL PICTURES 

2400〜243F 

(制御機能用記号) 

OPTICAL CHARACTER RECOGNITION 

2440〜245F 

(光学的文字認識,OCR) 

ENCLOSED ALPHANUMERICS 

2460〜24FF 

(囲み英数字) 

BOX DRAWING 

2500〜257F 

(けい線素辺) 

BLOCK ELEMENTS 

2580〜259F 

(ブロック要素) 

GEOMETRIC SHAPES 

25A0〜25FF 

(幾何学模様) 

MISCELLANEOUS SYMBOLS 

2600〜26FF 

(その他の記号) 

DINGBATS 

2700〜27BF 

(装飾記号) 

MISCELLANEOUS MATHEMATICAL SYMBOLS-A 

27C0〜27EF 

(その他の数学記号A) 

SUPPLEMENTAL ARROWS-A 

27F0〜27FF 

(補助矢印A) 

BRAILLE PATTERNS 

2800〜28FF 

(点字図形) 

SUPPLEMENTAL ARROWS-B 

2900〜297F 

(補助矢印B) 

MISCELLANEOUS MATHEMATICAL SYMBOLS-B 


65 

X 0221:2014 (ISO/IEC 10646:2012) 

 

2980〜29FF 

(その他の数学記号B) 

SUPPLEMENTAL MATHEMATICAL OPERATORS 

2A00〜2AFF 

(補助数学記号) 

MISCELLANEOUS SYMBOLS AND ARROWS 

2B00〜2BFF 

(その他の記号及び矢印) 

GLAGOLITIC 

2C00〜2C5F 

(グラゴル文字) 

LATIN EXTENDED-C 

2C60〜2C7F 

(ラテン文字拡張C) 

COPTIC 

2C80〜2CFF 

(コプト文字) 

GEORGIAN SUPPLEMENT 

2D00〜2D2F 

(グルジア文字補助) 

TIFINAGH 

2D30〜2D7F 

(ティフナグ文字) 

ETHIOPIC EXTENDED 

2D80〜2DDF 

(エチオピア文字拡張) 

CYRILLIC EXTENDED-A 

2DE0〜2DFF 

(キリル文字拡張A) 

SUPPLEMENTAL PUNCTUATION 

2E00〜2E7F 

(補助句読点) 

CJK RADICALS SUPPLEMENT 

2E80〜2EFF 

(CJK部首補助) 

KANGXI RADICALS 

2F00〜2FDF 

(康熙部首) 

IDEOGRAPHIC DESCRIPTION CHARACTERS 

2FF0〜2FFF 

(漢字構成記述文字,IDC) 

CJK SYMBOLS AND PUNCTUATION 3000〜303F 

(CJKの記号及び句読点) 

HIRAGANA 

3040〜309F 

(平仮名) 

KATAKANA 

30A0〜30FF 

(片仮名) 

BOPOMOFO 

3100〜312F 

(注音字母) 

HANGUL COMPATIBILITY JAMO 

3130〜318F 

(ハングル互換字母) 

KANBUN (CJK miscellaneous) 

3190〜319F 

[漢文用記号(その他のCJK文字)] 

BOPOMOFO EXTENDED 

31A0〜31BF 

(注音字母拡張) 

CJK STROKES 

31C0〜31EF 

(CJKの筆画) 

KATAKANA PHONETIC EXTENSIONS 31F0〜31FF 

(片仮名拡張) 

ENCLOSED CJK LETTERS AND MONTHS 

3200〜32FF 

(囲みCJK文字・月) 

CJK COMPATIBILITY 

3300〜33FF 

(CJK互換用文字) 

CJK UNIFIED IDEOGRAPHS EXTENSION A 

3400〜4DBF 

(CJK統合漢字拡張A) 

YIJING HEXAGRAM SYMBOLS 

4DC0〜4DFF 

(易経記号) 

CJK UNIFIED IDEOGRAPHS 

4E00〜9FFF 

(CJK統合漢字) 

YI SYLLABLES 

A000〜A48F 

(イ文字) 

YI RADICALS 

A490〜A4CF 

(イ文字部首) 

LISU 

A4D0〜A4FF  

(リス文字) 

VAI 

A500〜A63F  

(ヴァイ文字) 

CYRILLIC EXTENDED-B 

A640〜A69F 

(キリル文字拡張B) 

BAMUM 

A6A0〜A6FF  

(バムン文字) 

MODIFIER TONE LETTERS 

A700〜A71F 

(声調修飾文字) 

LATIN EXTENDED-D 

A720〜A7FF 

(ラテン文字拡張D) 

SYLOTI NAGRI 

A800〜A82F 

(シロティナーガリー文字) 

COMMON INDIC NUMBER FORMS 

A830〜A83F  

(インド慣用数量記号) 

PHAGS-PA 

A840〜A87F 

(パスパ文字) 

SAURASHTRA 

A880〜A8DF  

(サウラーシュトラ文字) 

DEVANAGARI EXTENDED 

A8E0〜A8FF 

(デーヴァナーガリー文字拡張) 

KAYAH LI 

A900〜A92F  

(カヤー文字) 

REJANG 

A930〜A95F  

(レジャン文字) 

HANGUL JAMO EXTENDED-A 

A960〜A97F 

(ハングル字母拡張A) 

JAVANESE 

A980〜A9DF  

(ジャワ文字) 

CHAM 

AA00〜AA5F  

(チャム文字) 

MYANMAR EXTENDED-A 

AA60〜AA7F 

(ビルマ文字拡張A) 

TAI VIET 

AA80〜AADF  (タイヴィエト文字) 

MEETEI MAYEK EXTENSIONS 

AAE0〜AAFF   (メイテイ文字拡張) 

ETHIOPIC EXTENDED-A 

AB00〜AB2F 

(エチオピア文字拡張A) 

MEETEI MAYEK 

ABC0〜ABFF  

(メイテイ文字) 


66 

X 0221:2014 (ISO/IEC 10646:2012) 

  

HANGUL SYLLABLES 

AC00〜D7A3 

(ハングル音節文字) 

HANGUL JAMO EXTENDED-B 

D7B0〜D7FF 

(ハングル字母拡張B) 

PRIVATE USE AREA 

E000〜F8FF 

(私用領域) 

CJK COMPATIBILITY IDEOGRAPHS F900〜FAFF 

(CJK互換漢字) 

ALPHABETIC PRESENTATION FORMS 

FB00〜FB4F 

(アルファベット表示形) 

ARABIC PRESENTATION FORMS-A FB50〜FDFF 

(アラビア表示形A) 

VARIATION SELECTORS 

FE00〜FE0F 

(字形選択子) 

VERTICAL FORMS 

FE10〜FE1F 

(縦書き形) 

COMBINING HALF MARKS 

FE20〜FE2F 

[半記号(合成可能)] 

CJK COMPATIBILITY FORMS 

FE30〜FE4F 

(CJK互換形) 

SMALL FORM VARIANTS 

FE50〜FE6F 

(小字形) 

ARABIC PRESENTATION FORMS-B FE70〜FEFE 

(アラビア表示形B) 

HALFWIDTH AND FULLWIDTH FORMS 

FF00〜FFEF 

(半角・全角形) 

SPECIALS 

FFF0〜FFFD 

(特殊用途文字) 

A.2.2 SMPのブロック 

次のブロックは,SMPで規定される。次は,符号位置の順に並べている。 

ブロックの名前 

から まで 

[日本語による通用名称(参考)] 

LINEAR B SYLLABARY 

10000〜1007F 

(線文字B音節文字) 

LINEAR B IDEOGRAMS 

10080〜100FF 

(線文字B表意文字) 

AEGEAN NUMBERS 

10100〜1013F 

(エーゲ数字) 

ANCIENT GREEK NUMBERS 

10140〜1018F 

(古代ギリシア数字) 

ANCIENT SYMBOLS 

10190〜101CF  (古代記号) 

PHAISTOS DISC 

101D0〜101FF  (ファイストスの円盤文字) 

LYCIAN 

10280〜1029F  

(リュキア文字) 

CARIAN 

102A0〜102DF  (カリア文字) 

OLD ITALIC 

10300〜1032F 

(古代イタリア文字) 

GOTHIC 

10330〜1034F 

(ゴート文字) 

UGARITIC 

10380〜1039F 

(ウガリト文字) 

OLD PERSIAN 

103A0〜103DF 

(古代ペルシャ文字) 

DESERET 

10400〜1044F 

(デザレット文字) 

SHAVIAN 

10450〜1047F 

(ショー文字) 

OSMANYA 

10480〜104AF 

(オスマニア文字) 

CYPRIOT SYLLABARY 

10800〜1083F 

(キプロス音節文字) 

IMPERIAL ARAMAIC 

10840〜1085F  

(帝国アラム文字) 

PHOENICIAN 

10900〜1091F 

(フェニキア文字) 

LYDIAN 

10920〜1093F  

(リュディア文字) 

MEROITIC HIEROGLYPHS 

10980〜1099F  

(メロエ文字楷書体) 

MEROITIC CURSIVE 

109A0〜109FF  (メロエ文字草書体) 

KHAROSHTHI 

10A00〜10A5F 

(カローシュティー文字) 

OLD SOUTH ARABIAN 

10A60〜10A7F  (古代南アラビア文字) 

AVESTAN 

10B00〜10B3F  (アヴェスタ文字) 

INSCRIPTIONAL PARTHIAN 

10B40〜10B5F  (碑文パルティア文字) 

INSCRIPTIONAL PAHLAVI 

10B60〜10B7F  (碑文パフラヴィ文字) 

OLD TURKIC 

10C00〜10C4F  (突厥文字) 

RUMI NUMERAL SYMBOLS 

10E60〜10E7F  (ルミ数字記号) 

BRAHMI 

11000〜1107F  

(ブラーフミー文字) 

KAITHI 

11080〜110CF  (カイティー文字) 

SORA SOMPENG 

110D0〜110FF  (ソラングソンペング文字) 

CHAKMA 

11100〜1114F 

(チャクマ文字) 

SHARADA 

11180〜111DF  (シャーラダー文字) 

TAKRI 

11680〜116CF  (タークリー文字) 

CUNEIFORM 

12000〜123FF 

(くさび形文字) 

CUNEIFORM NUMBERS AND PUNCTUATION 


67 

X 0221:2014 (ISO/IEC 10646:2012) 

 

12400〜1247F 

(くさび形文字の数字及び句読点) 

EGYPTIAN HIEROGLYPHS 

13000〜1342F  

(エジプト聖刻文字) 

BAMUM SUPPLEMENT 

16800〜16A3F  (バムン文字補助) 

MIAO 

16F00〜16F9F  (ミャオ文字) 

KANA SUPPLEMENT 

1B000〜1B0FF  (仮名補助) 

BYZANTINE MUSICAL SYMBOLS 

1D000〜1D0FF 

(ビザンチン音楽記号) 

MUSICAL SYMBOLS 

1D100〜1D1FF 

(音楽記号) 

ANCIENT GREEK MUSICAL NOTATION 

1D200〜1D24F 

(古代ギリシア音符記号) 

TAI XUAN JING SYMBOLS 

1D300〜1D35F 

(太玄経記号) 

COUNTING ROD NUMERALS 

1D360〜1D37F 

(算木用数字) 

MATHEMATICAL ALPHANUMERIC SYMBOLS 

1D400〜1D7FF 

(数学用英数字記号) 

ARABIC MATHEMATICAL ALPHABETICAL SYMBOLS 

1EE00〜1EEFF 

(アラビア数学記号) 

MAHJONG TILES 

1F000〜1F02F 

(マージャン記号) 

DOMINO TILES 

1F030〜1F09F 

(ドミノ記号) 

PLAYING CARDS 

1F0A0〜1F0FF 

(トランプ記号) 

ENCLOSED ALPHANUMERIC SUPPLEMENT 

1F100〜1F1FF 

(囲み英数字補助) 

ENCLOSED IDEOGRAPHIC SUPPLEMENT 

1F200〜1F2FF  (囲み漢字補助) 

MISCELLANEOUS SYMBOLS AND PICTOGRAPHS 

1F300〜1F5FF  (その他の記号及び絵記号) 

EMOTICONS 

1F600〜1F64F 

(顔文字) 

TRANSPORT AND MAP SYMBOLS 

1F680〜1F6FF 

(交通及び地図記号) 

ALCHEMICAL SYMBOLS 

1F700〜1F77F 

(錬金術記号) 

A.2.3 SIPのブロック 

次のブロックは,SIPで規定される。次は,符号位置の順に並べている。 

ブロックの名前 

から まで 

[日本語による通用名称(参考)] 

CJK UNIFIED IDEOGRAPHS EXTENSION B 

20000〜2A6DF 

(CJK統合漢字拡張B) 

CJK UNIFIED IDEOGRAPHS EXTENSION C 

2A700〜2B73F 

(CJK統合漢字拡張C) 

CJK UNIFIED IDEOGRAPHS EXTENSION D 

2B740〜2B81F 

(CJK統合漢字拡張D) 

CJK COMPATIBILITY IDEOGRAPHS SUPPLEMENT 

2F800〜2FA1F 

(CJK互換漢字補助) 

A.2.4 SSPのブロック 

次のブロックは,SSPで規定される。次は,符号位置の順に並べている。 

ブロックの名前 

から まで 

[日本語による通用名称(参考)] 

TAGS 

E0000〜E007F 

(タグ) 

VARIATION SELECTORS SUPPLEMENT 

E0100〜E01EF 

(字形選択子補助) 

 

A.3 BMP全体の確定組(ユニコードの組を除く。) 

次に示す確定組(4.26参照)は,この規格の以前の版が発行された時点でのUCSの割当て済み文字全て

を含む。ユニコードの組は,A.1に示す。 

A.3.1 301 BMP-AMD.7 

組番号301の確定組BMP-AMD.7は,次のとおり規定する。これは,ISO/IEC 10646-1の最初の版に,国

際規格の追補7までの変更だけを適用した結果のBMPに含まれていた符号化文字だけからなる。したが

って,この組のレパートリは,それ以降の変更によって新しい文字がBMPに加えられても,変更の対象


68 

X 0221:2014 (ISO/IEC 10646:2012) 

  

にならない。 

組301 BMP-AMD.7は,次のそれぞれの区又は隣接した区の列で示す符号位置の範囲によって規定する。 

面00 

区 

区の中の値 

00 

20〜7E,A0〜FF 

01 

00〜F5,FA〜FF 

02 

00〜17,50〜A8,B0〜DE,E0〜E9 

03 

00〜45,60〜61,74〜75,7A,7E,84〜8A,8C,8E〜A1,A3〜CE,D0〜D6,DA,DC,DE,
E0,E2〜F3 

04 

01〜0C,0E〜4F,51〜5C,5E〜86,90〜C4,C7〜C8,CB〜CC,D0〜EB,EE〜F5,F8〜F9 

05 

31〜56,59〜5F,61〜87,89,91〜A1,A3〜B9,BB〜C4,D0〜EA,F0〜F4 

06 

0C,1B,1F,21〜3A,40〜52,60〜6D,70〜B7,BA〜BE,C0〜CE,D0〜ED,F0〜F9 

09 

01〜03,05〜39,3C〜4D,50〜54,58〜70,81〜83,85〜8C,8F〜90,93〜A8,AA,B0,B2,
B6〜B9,BC,BE〜C4,C7〜C8,CB〜CD,D7,DC〜DD,DF〜E3,E6〜FA 

0A 

02,05〜0A,0F〜10,13〜28,2A〜30,32〜33,35〜36,38〜39,3C,3E〜42,47〜48,4B〜
4D,59〜5C,5E,66〜74,81〜83,85〜8B,8D,8F〜91,93〜A8,AA〜B0,B2〜B3,B5〜
B9,BC〜C5,C7〜C9,CB〜CD,D0,E0,E6〜EF 

0B 

01〜03,05〜0C,0F〜10,13〜28,2A〜30,32〜33,36〜39,3C〜43,47〜48,4B〜4D,56〜
57,5C〜5D,5F〜61,66〜70,82〜83,85〜8A,8E〜90,92〜95,99〜9A,9C,9E〜9F,A3
〜A4,A8〜AA,AE〜B5,B7〜B9,BE〜C2,C6〜C8,CA〜CD,D7,E7〜F2 

0C 

01〜03,05〜0C,0E〜10,12〜28,2A〜33,35〜39,3E〜44,46〜48,4A〜4D,55〜56,60
〜61,66〜6F,82〜83,85〜8C,8E〜90,92〜A8,AA〜B3,B5〜B9,BE〜C4,C6〜C8,CA
〜CD,D5〜D6,DE,E0〜E1,E6〜EF 

0D 

02〜03,05〜0C,0E〜10,12〜28,2A〜39,3E〜43,46〜48,4A〜4D,57,60〜61,66〜6F 

0E 

01〜3A,3F〜5B,81〜82,84,87〜88,8A,8D,94〜97,99〜9F,A1〜A3,A5,A7,AA〜
AB,AD〜B9,BB〜BD,C0〜C4,C6,C8〜CD,D0〜D9,DC〜DD 

0F 

00〜47,49〜69,71〜8B,90〜95,97,99〜AD,B1〜B7,B9 

10 

A0〜C5,D0〜F6,FB 

11 

00〜59,5F〜A2,A8〜F9 

1E 

00〜9B,A0〜F9 

1F 

00〜15,18〜1D,20〜45,48〜4D,50〜57,59,5B,5D,5F〜7D,80〜B4,B6〜C4,C6〜D3,
D6〜DB,DD〜EF,F2〜F4,F6〜FE 

20 

00〜2E,30〜46,6A〜70,74〜8E,A0〜AB,D0〜E1 

21 

00〜38,53〜82,90〜EA 

22 

00〜F1 

23 

00,02〜7A 

24 

00〜24,40〜4A,60〜EA 

25 

00〜95,A0〜EF 

26 

00〜13,1A〜6F 

27 

01〜04,06〜09,0C〜27,29〜4B,4D,4F〜52,56,58〜5E,61〜67,76〜94,98〜AF,B1
〜BE 

30 

00〜37,3F,41〜94,99〜9E,A1〜FE 

31 

05〜2C,31〜8E,90〜9F 

32 

00〜1C,20〜43,60〜7B,7F〜B0,C0〜CB,D0〜FE 

33 

00〜76,7B〜DD,E0〜FE 

4E〜9F 

4E00〜9FA5 

AC〜D7 

AC00〜D7A3 

E0〜F8 

E000〜F8FF 

F9〜FA 

F900〜FA2D 

FB 

00〜06,13〜17,1E〜36,38〜3C,3E,40〜41,43〜44,46〜B1,D3〜FF 

FC 

00〜FF 

FD 

00〜3F,50〜8F,92〜C7,F0〜FB 

FE 

20〜23,30〜44,49〜52,54〜66,68〜6B,70〜72,74,76〜FC,FF 

FF 

01〜5E,61〜BE,C2〜C7,CA〜CF,D2〜D7,DA〜DC,E0〜E6,E8〜EE,FD 


69 

X 0221:2014 (ISO/IEC 10646:2012) 

 

A.3.2 299 BMP FIRST EDITION 

組番号299の確定組BMP FIRST EDITIONは,ISO/IEC 10646-1の最初の版のBMPに含まれていた符

号化文字の全てを識別するために保留されている。この組は,今では,この規格に適合するものではない。 

注記 組299 BMP FIRST EDITIONの定義は,次に示す二つの変更を除いて,組301 BMP-AMD.7の

規定と同じであった。 

次のとおり,対応する区の内容を置き換える。 

区 

区の中の値 

05 

31〜56,59〜5F,61〜87,89,B0〜B9,BB〜C3,D0〜EA,F0〜F4 

0F 

(該当する位置なし) 

1E 

00〜9A,A0〜F9 

20 

00〜2E,30〜46,6A〜70,74〜8E,A0〜AA,D0〜E1 

AC〜D7 

(該当する位置なし) 

ISO/IEC 10646-1の最初の版以降にこの規格から削除した符号化文字が含まれていた三つの

組(57〜59)に対応する符号の範囲に関連して次の区の範囲を含める。 

区 

区の中の値 

34〜4D 

3400〜4DFF 

A.3.3 302 BMP SECOND EDITION 

組番号302の確定組BMP SECOND EDITIONは,ISO/IEC 10646-1の第2版のBMPに含まれる符号化

文字だけからなる。この組のレパートリは,それ以降の変更によって新しい文字がBMPに追加されても,

変更の対象にならない。 

組302 BMP SECOND EDITIONは,次の,それぞれの区又は隣接した区の列によって示す符号位置の範

囲によって規定する。 

面00 

区 

区の中の値 

00 

20〜7E,A0〜FF 

01 

00〜FF 

02 

00〜1F,22〜33,50〜AD,B0〜EE 

03 

00〜4E,60〜62,74〜75,7A,7E,84〜8A,8C,8E〜A1,A3〜CE,D0〜D7,DA〜F3 

04 

00〜86,88〜89,8C〜C4,C7〜C8,CB〜CC,D0〜F5,F8〜F9 

05 

31〜56,59〜5F,61〜87,89〜8A,91〜A1,A3〜B9,BB〜C4,D0〜EA,F0〜F4 

06 

0C,1B,1F,21〜3A,40〜55,60〜6D,70〜ED,F0〜FE 

07 

00〜0D,0F〜2C,30〜4A,80〜B0 

09 

01〜03,05〜39,3C〜4D,50〜54,58〜70,81〜83,85〜8C,8F〜90,93〜A8,AA〜B0,B2,
B6〜B9,BC,BE〜C4,C7〜C8,CB〜CD,D7,DC〜DD,DF〜E3,E6〜FA 

0A 

02,05〜0A,0F〜10,13〜28,2A〜30,32〜33,35〜36,38〜39,3C,3E〜42,47〜48,4B〜
4D,59〜5C,5E,66〜74,81〜83,85〜8B,8D,8F〜91,93〜A8,AA〜B0,B2〜B3,B5〜
B9,BC〜C5,C7〜C9,CB〜CD,D0,E0,E6〜EF 

0B 

01〜03,05〜0C,0F〜10,13〜28,2A〜30,32〜33,36〜39,3C〜43,47〜48,4B〜4D,56〜
57,5C〜5D,5F〜61,66〜70,82〜83,85〜8A,8E〜90,92〜25,99〜9A,9C,9E〜9F,A3
〜A4,A8〜AA,AE〜B5,B7〜B9,BE〜C2,C6〜C8,CA〜CD,D7,E7〜F2 

0C 

01〜03,05〜0C,0E〜10,12〜28,2A〜33,35〜39,3E〜44,46〜48,4A〜4D,55〜56,60
〜61,66〜6F,82〜83,85〜8C,8E〜90,92〜A8,AA〜B3,B5〜B9,BE〜C4,C6〜C8,CA
〜CD,D5〜D6,DE,E0〜E1,E6〜EF 

0D 

02〜03,05〜0C,0E〜10,12〜28,2A〜39,3E〜43,46〜48,4A〜4D,57,60〜61,66〜6F,
82〜83,85〜96,9A〜B1,B3〜BB,BD,C0〜C6,CA,CF〜D4,D6,D8〜DF,F2〜F4 

0E 

01〜3A,3F〜5B,81〜82,84,87〜88,8A,8D,94〜97,99〜9F,A1〜A3,A5,A7,AA〜
AB,AD〜B9,BB〜BD,C0〜C4,C6,C8〜CD,D0〜D9,DC〜DD 

0F 

00〜47,49〜6A,71〜8B,90〜97,99〜BC,BE〜CC,CF 

10 

00〜21,23〜27,29〜2A,2C〜32,36〜39,40〜59,A0〜C5,D0〜F6,FB 

11 

00〜59,5F〜A2,A8〜F9 

12 

20〜26,28〜46,48,4A〜4D,50〜56,58,5A〜5D,60〜86,88,8A〜8D,90〜AE,B0,B2


70 

X 0221:2014 (ISO/IEC 10646:2012) 

  

〜B5,B8〜BE,C0,C2〜C5,C8〜CE,D0〜D6,D8〜EE,F0〜FF 

13 

00〜0E,10,12〜15,18〜1E,20〜46,48〜5A,61〜7C,A0〜F4 

14〜15 

1401〜15FF 

16 

00〜76,80〜9C,A0〜F0 

17 

80〜DC,E0〜E9 

18 

00〜0E,10〜19,20〜77,80〜A9 

1E 

00〜9B,A0〜F9 

1F 

00〜15,18〜1D,20〜45,48〜4D,50〜57,59,5B,5D,5F〜7D,80〜B4,B6〜C4,C6〜D3,
D6〜DB,DD〜EF,F2〜F4,F6〜FE 

20 

00〜46,48〜4D,6A〜70,74〜8E,A0〜AF,D0〜E3 

21 

00〜3A,53〜83,90〜F3 

22 

00〜F1 

23 

00〜7B,7D〜9A 

24 

00〜26,40〜4A,60〜EA 

25 

00〜95,A0〜F7 

26 

00〜13,19〜71 

27 

01〜04,06〜09,0C〜27,29〜4B,4D,4F〜52,56,58〜5E,61〜67,76〜94,98〜AF,B1
〜BE 

28 

00〜FF 

2E 

80〜99,9B〜F3 

2F 

00〜D5,F0〜FB 

30 

00〜3A,3E〜3F,41〜94,99〜9E,A1〜FE 

31 

05〜2C,31〜8E,90〜B7 

32 

00〜1C,20〜43,60〜7B,7F〜B0,C0〜CB,D0〜FE 

33 

00〜76,7B〜DD,E0〜FE 

34〜4D 

3400〜4DB5 

4E〜9F 

4E00〜9FA5 

A0〜A3 

A000〜A3FF 

A4 

00〜8C,90〜A1,A4〜B3,B5〜C0,C2〜C4,C6 

AC〜D7 

AC00〜D7A3 

E0〜F8 

E000〜F8FF 

F9〜FA 

F900〜FA2D 

FB 

00〜06,13〜17,1D〜36,38〜3C,3E,40〜41,43〜44,46〜B1,D3〜FF 

FC 

00〜FF 

FD 

00〜3F,50〜8F,92〜C7,F0〜FB 

FE 

20〜23,30〜44,49〜52,54〜66,68〜6B,70〜72,74,76〜FC,FF 

FF 

01〜5E,61〜BE,C2〜C7,CA〜CF,D2〜D7,DA〜DC,E0〜E6,E8〜EE,F9〜FD 

A.3.4 340 COMBINED FIRST EDITION 

組番号340の確定組COMBINED FIRST EDITIONは,次のとおり規定する。組340は,この規格の対

応国際規格の最初の版であるISO/IEC 10646:2003に含まれていた符号化文字だけを含み,A.1及びA.3に

示す幾つかの組と幾つかの符号位置の範囲とからなる。この組を,面ごとに次に示す。 

面00 

組番号 

名前 

302 

BMP SECOND EDITION 

98 

SUPPLEMENTAL ARROWS-A 

99 

SUPPLEMENTAL ARROWS-B 

100 

MISCELLANEOUS MATHEMATICAL SYMBOLS-B 

101 

SUPPLEMENTAL MATHEMATICAL OPERATORS 

102 

KATAKANA PHONETIC EXTENSIONS 

103 

VARIATION SELECTORS 

108 

KHMER SYMBOLS 

111 

YIJING HEXAGRAM SYMBOLS 

区 

区の中の値 

02 

20〜21,34〜36,AE〜AF,EF〜FF 

03 

4F〜57,5D〜5F,63〜6F,D8〜D9,F4〜FB 

04 

8A〜8B,C5〜C6,C9〜CA,CD〜CE 


71 

X 0221:2014 (ISO/IEC 10646:2012) 

 

05 

00〜0F 

06 

00〜03,0D〜15,56〜58,6E〜6F,EE〜EF,FF 

07 

2D〜2F,4D〜4F,B1 

09 

04,BD 

0A 

01,03,8C,E1〜E3,F1 

0B 

35,71,F3〜FA 

0C 

BC〜BD 

10 

F7〜F8 

17 

00〜0C,0E〜14,20〜36,40〜53,60〜6C,6E〜70,72〜73,DD,F0〜F9 

19 

00〜1C,20〜2B,30〜3B,40,44〜4F,50〜6D,70〜74 

1D 

00〜6B 

20 

47,4E〜54,57,5F〜63,71,B0〜B1,E4〜EA 

21 

3B,3D〜4B,F4〜FF 

22 

F2〜FF 

23 

7C,9B〜D0 

24 

EB〜FF 

25 

96〜9F,F8〜FF 

26 

14〜17,72〜7D,80〜91,A0〜A1 

27 

68〜75,D0〜EB 

2B 

00〜0D 

30 

3B〜3D,95〜96,9F〜A0,FF 

32 

1D〜1E,50〜5F,7C〜7D,B1〜BF,CC〜CF 

33 

77〜7A,DE〜DF,FF 

A4 

A2〜A3,B4,C1,C5 

FA 

30〜6A 

FD 

FC〜FD 

FE 

45〜48,73 

FF 

5F〜60 

面01 

組番号 

名前 

1003 

DESERET 

1011 

SHAVIAN 

区 

区の中の値 

00 

00〜0B,0D〜26,28〜3A,3C〜3D,3F〜4D,50〜5D,80〜FA 

01 

00〜02,07〜33,37〜3F 

03 

80〜9D,9F 

04 

80〜9D,A0〜A9 

08 

00〜05,08,0A〜35,37〜38,3C,3F 

D0 

00〜F5 

D1 

00〜26,2A〜DD 

D3 

00〜56 

D4 

00〜54,56〜9C,9E〜9F,A2,A5〜A6,A9〜AC,AE〜B9,BB,BD〜C3,C5〜FF 

D5 

00〜05,07〜0A,0D〜14,16〜1C,1E〜39,3B〜3E,40〜44,46,4A〜50,52〜FF 

D6 

00〜A3,A8〜FF 

D7 

00〜C9,CE〜FF 

面02 

区 

区の中の値 

00〜A6 

0000〜A6D6 

F8〜FA 

F800〜FA1D 

面0E 

組番号 

名前 

3003 

VARIATION SELECTORS SUPPLEMENT 

区 

区の中の値 

00 

01,20〜7F 

面0F 

区 

区の中の値 


72 

X 0221:2014 (ISO/IEC 10646:2012) 

  

00〜FF 

0000〜FFFD 

面10 

区 

区の中の値 

00〜FF 

0000〜FFFD 

 

A.4 CJKの組 

A.4.1 370 IICORE 

組番号370の確定組IICOREは,組CJK UNIFIED IDEOGRAPHS-2001の,国際的な中核となる部分

集合である。 

注記1 文字数(9 810字)が多く符号位置の範囲が不連続なので,この組は,符号位置の一覧を文章

中に列挙するのではなく添付ファイルによって規定する。 

添付ファイルは,テキストファイルであり,ISO/IEC 646のIRVの文字及び行末を表すLINE FEEDを

使用する。ファイルの先頭の11行は,ヘッダであり,その後にIICOREの文字と同数の行が続く。各行

は,次の固定長の項目からなる。 

− 項目1は,BMP又はSIPの符号位置を,(0hhhh)又は(2hhhh)の形式で示す。項目1は,規定とす

る。 

− 項目2は,原典Gの漢字の用途の識別子である(G0a),(G1a),(G3a),(G5a),(G7a),(G8a),(G9a)

又は(GEa)のいずれかを示す。項目2は,参考とする。 

− 項目3は,原典Tの漢字の用途の識別子である(T1a),(T2a),(T3a),(T4a),(T5a)又は(TFa)の

いずれかを示す。項目3は,参考とする。 

− 項目4は,原典Jの漢字の用途の識別子である(J1A)を示す。項目4は,参考とする。 

− 項目5は,原典Hの漢字の用途の識別子である(H1a)を示す。項目5は,参考とする。 

− 項目6は,原典Kの漢字の用途の識別子である(K0a),(K1a),(K2a)又は(K3a)のいずれかを示

す。項目6は,参考とする。 

− 項目7は,原典M[マカオ(澳門)特別行政区に対応する。]の漢字の用途の識別子である(M1a)を

示す。項目7は,参考とする。 

− 項目8は,原典KPの漢字の用途の識別子である(P0a)を示す。項目8は,参考とする。 

− 項目9は,一般性の分類をA,B又はCによって示す(Cが最も一般性が低い。)。項目9は,参考と

する。 

ここに,“h”は,16進数の1桁を表し,“a”は,“A”〜“G”の1文字を表す。括弧に囲まれた英大文

字及び数字は,ここに示したとおりに現れる。 

注記2 ここで,用途とは,それぞれの原典(G,T,J,H,K,M又はKP)の文脈においてIICORE

の個々の文字の利用及び優先の度合いを示す。用途の識別を,箇条23が規定する全てのCJK

統合漢字に対する識別を確立するためのCJK統合漢字の原典参照と混同しないように注意す

る。 

参照ファイルは,添付ファイル“IICORE.txt”とする。 

注記3 (対応国際規格の注記3は,この規格では該当しないため不採用とした。) 

A.4.2 371 JIS2004 IDEOGRAPHICS EXTENSION 

組番号371の確定組JIS2004 IDEOGRAPHICS EXTENSION(JIS2004拡張漢字集合)は,JIS X 0213:2004

の第3水準及び第4水準漢字からなる。 


73 

X 0221:2014 (ISO/IEC 10646:2012) 

 

注記1 文字数(3 695字)が多く符号位置の範囲が不連続なので,この組は,符号位置の一覧を文章

中に列挙するのではなく添付ファイルによって規定する。 

添付ファイルは,テキストファイルであり,ISO/IEC 646のIRVの文字及び行末を表すLINE FEEDを

使用する。ファイルの先頭の3行は,ヘッダであり,その後にこの組の文字と同数の行が続く。各行は,

次の固定長の項目からなる。 

− BMP又はSIPの符号位置を,(0hhhh)又は(2hhhh)の形式で示す。この項目は,規定とする。 

ここに,“h”は,16進数の1桁を表す。括弧に囲まれた数字は,ここに示したとおりに現れる。 

参照ファイルは,添付ファイル“JIEx.txt”とする。 

注記2 (対応国際規格の注記2は,この規格では該当しないため不採用とした。) 

A.4.3 372 JAPANESE IDEOGRAPHICS SUPPLEMENT 

組番号372の確定組JAPANESE IDEOGRAPHICS SUPPLEMENT(補助漢字集合)は,JIS X 0212:1990

の全ての漢字からなる。組372は,5 801文字を含む。 

注記 組371と組372とは,2 742文字を共有している。 

この組の符号位置は,CJK統合漢字の原典参照ファイル(CJKU̲SR.txt)においてJ1で識別される原典

Jの漢字全てとする(23.1参照)。 

 

A.5 その他の組 

A.5.1〜A.5.8では,利用者コミュニティの参照の用を満たすための組を規定する。文字は,異なる書記

系から選ばれていたり,異なる面に符号化されていたりする。リトアニア,日本,及び欧州全体の利用者

コミュニティの組を含む。 

注記 略語MESは,多言語欧州部分集合(Multilingual European Subset)を意味する。 

A.5.1 281 MES-1 

組番号281の確定組MES-1は,それぞれの区に対する符号位置の範囲によって次のとおり規定する。 

区 

区の中の値 

00 

20〜7E,A0〜FF 

01 

00〜13,16〜2B,2E〜4D,50〜7E 

02 

C7,D8〜DB,DD 

20 

15,18〜19,1C〜1D,AC 

21 

22,26,5B〜5E,90〜93 

26 

6A 

A.5.2 282 MES-2 

組番号282の確定組MES-2は,それぞれの区に対する符号位置の範囲によって次のとおり規定する。 

区 

区の中の値 

00 

20〜7E,A0〜FF 

01 

00〜7F,8F,92,B7,DE〜EF,FA〜FF 

02 

18〜1B,1E〜1F,59,7C,92,BB〜BD,C6〜C7,C9,D8〜DD,EE 

03 

74〜75,7A,7E,84〜8A,8C,8E〜A1,A3〜CE,D7,DA〜E1 

04 

00〜5F,90〜C4,C7〜C8,CB〜CC,D0〜EB,EE〜F5,F8〜F9 

1E 

02〜03,0A〜0B,1E〜1F,40〜41,56〜57,60〜61,6A〜6B,80〜85,9B,F2〜F3 

1F 

00〜15,18〜1D,20〜45,48〜4D,50〜57,59,5B,5D,5F〜7D,80〜B4,B6〜C4,C6〜D3,
D6〜DB,DD〜EF,F2〜F4,F6〜FE 

20 

13〜15,17〜1E,20〜22,26,30,32〜33,39〜3A,3C,3E,44,4A,7F,82,A3〜A4,A7,
AC,AF 

21 

05,16,22,26,5B〜5E,90〜95,A8 

22 

00,02〜03,06,08〜09,0F,11〜12,19〜1A,1E〜1F,27〜2B,48,59,60〜61,64〜65,
82〜83,95,97 


74 

X 0221:2014 (ISO/IEC 10646:2012) 

  

23 

02,10,20〜21,29〜2A 

25 

00,02,0C,10,14,18,1C,24,2C,34,3C,50〜6C,80,84,88,8C,90〜93,A0,AC,
B2,BA,BC,C4,CA〜CB,D8,D9 

26 

3A〜3C,40,42,60,63,65〜66,6A〜6B 

FB 

01〜02 

FF 

FD 

A.5.3 283 MODERN EUROPEAN SCRIPTS 

組番号283の組MODERN EUROPEAN SCRIPTS(現代ヨーロッパの用字)は,次に示す組の全体とする。 

組番号 

名前 

BASIC LATIN 

LATIN-1 SUPPLEMENT 

LATIN EXTENDED-A 

LATIN EXTENDED-B 

IPA EXTENSIONS 

SPACING MODIFIER LETTERS 

COMBINING DIACRITICAL MARKS 

BASIC GREEK 

GREEK SYMBOLS AND COPTIC 

10 

CYRILLIC 

11 

ARMENIAN 

27 

BASIC GEORGIAN 

30 

LATIN EXTENDED ADDITIONAL 

31 

GREEK EXTENDED 

32 

GENERAL PUNCTUATION 

33 

SUPERSCRIPTS AND SUBSCRIPTS 

34 

CURRENCY SYMBOLS 

35 

COMBINING DIACRITICAL MARKS FOR SYMBOLS 

36 

LETTERLIKE SYMBOLS 

37 

NUMBER FORMS 

38 

ARROWS 

39 

MATHEMATICAL OPERATORS 

40 

MISCELLANEOUS TECHNICAL 

42 

OPTICAL CHARACTER RECOGNITION 

44 

BOX DRAWING 

45 

BLOCK ELEMENTS 

46 

GEOMETRIC SHAPES 

47 

MISCELLANEOUS SYMBOLS 

65 

COMBINING HALF MARKS 

70 

SPECIALS 

92 

CYRILLIC SUPPLEMENT 

104 

LTR ALPHABETIC PRESENTATION FORMS 

A.5.4 284 CONTEMPORARY LITHUANIAN LETTERS 

組番号284の確定組である拡張組CONTEMPORARY LITHUANIAN LETTERS(現代リトアニア文字)を,

次のように定める。 

面00 

区 

区の中の値 

00 

41〜50,52〜56,59〜5A,61〜70,72〜76,79〜7A,C0〜C1,C3,C8〜C9,CC〜CD,D1〜
D3,D5,D9〜DA,DD,E0〜E1,E3,E8〜E9,F1〜F3,F5,F9〜FA,FD 

01 

04〜05,0C〜0D,16〜19,28,2E〜2F,60〜61,68〜6B,72〜73,7D〜7E 

1E 

BC〜BD,F8〜F9 

UCS列識別子 

 

<0104, 0301>,<0105, 0301>,<0104, 0303>,<0105, 0303>,<0118, 0301>,<0119, 0301>,<0118, 0303>,

<0119, 0303>,<0116, 0301>,<0117, 0301>,<0116, 0303>,<0117, 0303>,<0069, 0307, 0300>,<0069, 
0307, 0301>,<0069, 0307, 0303>,<012E, 0301>,<012F, 0307, 0301>,<012E, 0303>,<012F, 0307, 
0303>,<004A, 0303>,<006A, 0307, 0303>,<004C, 0303>,<006C, 0303>,<004D, 0303>,<006D, 


75 

X 0221:2014 (ISO/IEC 10646:2012) 

 

0303>,<0052, 0303>,<0072, 0303>,<0172, 0301>,<0173, 0301>,<0172, 0303>,<0173, 0303>,
<016A, 0301>,<016B, 0301>,<016A, 0303>,<016B, 0303> 

A.5.5 285 BASIC JAPANESE 

組番号285の確定組BASIC JAPANESE(基本日本文字集合)は,日本の文字の基本的な部分集合であ

る。これに含まれる6 884文字は,次のとおりである。 

− CJK統合漢字の原典参照ファイル(CJKU̲SR.txt)において,J0で識別される原典Jの漢字全て(23.1

参照)。 

− 次に示す符号位置の範囲。 

面00 

区 

区の中の値 

00 

20〜7E,A2,A3,A5,A7〜A8,AC,B0〜B1,B4,B6,D7,F7 

03 

91〜A1,A3〜A9,B1〜C1,C3〜C9 

04 

01,10〜4F,51 

20 

10,14,16,18〜19,1C〜1D,20〜21,25〜26,30,32〜33,3B,3E 

21 

03,2B,90〜93,D2,D4 

22 

00,02〜03,07〜08,0B,12,1A,1D〜1E,20,27〜2C,34〜35,3D,52,60〜61,66〜67,
6A〜6B,82〜83,86〜87,A5 

23 

12 

25 

00〜03,0C,0F〜10,13〜14,17〜18,1B〜1D,20,23〜25,28,2B〜2C,2F〜30,33〜34,
37〜38,3B〜3C,3F,42,4B,A0〜A1,B2〜B3,BC〜BD,C6〜C7,CB,CE〜CF,EF 

26 

05〜06,40,42,6A,6D,6F 

30 

00〜03,05〜15,1C,41〜93,9B〜9E,A1〜F6,FB〜FE 

A.5.6 286 JAPANESE NON IDEOGRAPHICS EXTENSION 

組番号286の確定組JAPANESE NON IDEOGRAPHICS EXTENSION(拡張非漢字集合)は,日本の文字

の部分集合である。これは,組285 BASIC JAPANESE又は組287 COMMON JAPANESEのいずれかと組み

合わせて,JIS X 0213の非漢字のレパートリを補完する。組286は,631文字を含み,次に示す符号位置

の範囲からなる。 

面00 

区 

区の中の値 

00 

A0〜A1,A4,A6,A9〜AB,AD〜AF,B2〜B3,B7〜D6,D8〜F6,F8〜FF 

01 

00〜09,0C〜0F,11〜13,18〜1D,24〜25,27,2A〜2B,34〜35,39〜3A,3D〜3E,41〜44,
47〜48,4B〜4D,50〜55,58〜65,6A〜71,79〜7E,93,C2,CD〜CE,D0〜D2,D4,D6,
D8,DA,DC,F8〜F9,FD 

02 

50〜5A,5C,5E〜61,64〜68,6C〜73,75,79〜7B,7D〜7E,81〜84,88〜8E,90〜92,94
〜95,98,9D,A1〜A2,C7〜C8,CC,D0〜D1,D8〜D9,DB,DD〜DE,E5〜E9 

03 

00〜04,06,08,0B〜0C,0F,18〜1A,1C〜20,24〜25,29〜2A,2C,2F〜30,34,39〜3D,
61,C2 

1E 

3E〜3F 

1F 

70〜73 

20 

13,22,3C,3F,42,47〜49,51,AC 

21 

0F,13,16,21,27,35,53〜55,60〜6B,70〜7B,94,96〜99,C4,E6〜E9 

22 

05,09,13,1F,25〜26,2E,43,45,48,62,76〜77,84〜85,8A〜8B,95〜97,BF,DA
〜DB 

23 

05〜06,18,BE〜CC,CE 

24 

23,60〜73,D0〜E9,EB〜FE 

25 

B1,B6〜B7,C0〜C1,C9,D0〜D3,E6 

26 

00〜03,0E,16〜17,1E,60〜69,6B〜6C,6E 

27 

13,56,76〜7F 

29 

34〜35,BF,FA〜FB 

30 

16〜19,1D,1F〜20,33〜35,3B〜3D,94〜96,9A,9F〜A0,F7〜FA,FF 

31 

F0〜FF 

32 

31〜32,39,51〜5F,A4〜A8,B1〜BF,D0〜E3,E5,E9,EC〜ED,FA 


76 

X 0221:2014 (ISO/IEC 10646:2012) 

  

33 

03,0D,14,18,22〜23,26〜27,2B,36,3B,49〜4A,4D,51,57,7B〜7E,8E〜8F,9C
〜9E,A1,C4,CB,CD 

FE 

45〜46 

FF 

5F〜60 

A.5.7 287 COMMON JAPANESE 

組番号287の確定組COMMON JAPANESE(通用日本文字集合)は,日本の文字の基本的な部分集合であ

って,7 493文字を含む。A.5.5に規定する一つの確定組と符号位置の範囲とからなる。 

面00 

組番号 

名前 

285 

BASIC JAPANESE 

面00 

区 

区の中の値 

20 

15 

21 

16,21,60〜69,70〜79 

22 

11,1F,25,2E,BF 

24 

60〜73 

30 

1D,1F 

32 

31〜32,39,A4〜A8 

33 

03,0D,14,18,22〜23,26〜27,2B,36,3B,49〜4A,4D,51,57,7B〜7E,8E〜8F,9C
〜9E,A1,C4,CD 

4E 

28,E1,FC 

4F 

00,03,39,56,8A,92,94,9A,C9,CD,FF 

50 

1E,22,40,42,46,70,94,D8,F4 

51 

4A,64,9D,BE,EC 

52 

15,9C,A6,AF,C0,DB 

53 

00,07,24,72,93,B2,DD 

54 

8A,9C,A9,FF 

55 

86 

57 

59,65,AC,C7〜C8 

58 

9E,B2 

59 

0B,53,5B,5D,63,A4,BA 

5B 

56,C0,D8,EC 

5C 

1E,A6,BA,F5 

5D 

27,42,53,6D,B8〜B9,D0 

5F 

21,34,45,67,B7,DE 

60 

5D,85,8A,D5,DE,F2 

61 

11,20,30,37,98 

62 

13,A6 

63 

F5 

64 

60,9D,CE 

65 

4E 

66 

00,09,15,1E,24,2E,31,3B,57,59,65,73,99,A0,B2,BF,FA〜FB 

67 

0E,66,BB,C0 

68 

01,44,52,C8,CF 

69 

68,98,E2 

6A 

30,46,6B,73,7E,E2,E4 

6B 

D6 

6C 

3F,5C,6F,86,DA 

6D 

04,6F,87,96,AC,CF,F2,F8,FC 

6E 

27,39,3C,5C,BF 

6F 

88,B5,F5 

70 

05,07,28,85,AB,BB 

71 

04,0F,46〜47,5C,C1,FE 

72 

B1,BE 

73 

24,77,BD,C9,D2,D6,E3,F5 

74 

07,26,29〜2A,2E,62,89,9F 


77 

X 0221:2014 (ISO/IEC 10646:2012) 

 

75 

01,2F,6F 

76 

82,9B〜9C,9E,A6 

77 

46 

78 

21,4E,64,7A 

79 

30,94,9B 

7A 

D1,E7,EB 

7B 

9E 

7D 

48,5C,A0,B7,D6 

7E 

52,8A 

7F 

47,A1 

83 

01,62,7F,C7,F6 

84 

48,B4,DC 

85 

53,59,6B,B0 

88 

07,F5 

89 

1C 

8A 

12,37,79,A7,BE,DF,F6 

8B 

53,7F 

8C 

F0,F4 

8D 

12,76 

8E 

CF 

90 

67,DE 

91 

15,27,D7,DA,DE,E4〜E5,ED〜EE 

92 

06,0A,10,39〜3A,3C,40,4E,51,59,67,77〜78,88,A7,D0,D3,D5,D7,D9,E0,
E7,F9,FB,FF 

93 

02,1D〜1E,21,25,48,57,70,A4,C6,DE,F8 

94 

31,45,48 

95 

92 

96 

9D,AF 

97 

33,3B,43,4D,4F,51,55 

98 

57,65 

99 

27,9E 

9A 

4E,D9,DC 

9B 

72,75,8F,B1,BB 

9C 

00 

9D 

6B,70 

9E 

19,D1 

F9 

29,DC 

FA 

0E〜2D 

FF 

01〜5E,61〜9F,E0〜E5 

A.5.8 288 MULTILINGUAL LATIN SUBSET 

組番号288の確定組MULTILINGUAL LATIN SUBSET(多言語ラテン文字部分集合)は,国際的に利用

するラテン文字の部分集合である。これは,それぞれの区に対する符号位置の範囲によって次のとおり規

定する。 

面00 

区 

区の中の値 

00 

20〜7E,A0〜FF 

01 

00〜80,8F,97,9A〜9B,9D〜A1,AF〜B0,B5〜B7,CD〜DC,DE〜F0,F4〜F5,F8〜FF 

02 

00〜1B,1E〜20,22〜23,26〜33,3A〜3E,41〜44,46〜49,4C〜4F,59,68,72,75,7C,
89,92,94,B7,B9〜BC,BE〜C1,C7〜C8,CC〜CD,D8〜DB,DD 

03 

00〜04,06〜11,13,15,1B,23〜29,2D〜2E,31〜32,35,38,44,47〜48,5C〜61 

1D 

7D,CD 

1E 

00〜19,1C〜2B,2E〜73,76〜99,9B,9E,A0〜F9 

20 

0C,11,13〜15,18〜1A,1C〜1E,26,2F,32〜33,39〜3A,4A,A5,AC 

21 

22,26,4D,5B〜5E,90〜93,9A〜9B 

22 

12,15,60,64〜65,6E〜71 

23 

00 


78 

X 0221:2014 (ISO/IEC 10646:2012) 

  

26 

6A 

2C 

63,65〜66 

A7 

88,8B〜8C 

 

A.6 ユニコードの組 

A.6.1〜A.6.9に示す組は,ユニコード標準の様々な版に相当する。ユニコードの組は,BMPの文字と追

加面の文字とを含む。 

注記 ユニコード標準の第2.0版は,組301に相当する。ユニコード標準の第2.1版では,組301に

20AC EURO SIGN及びFFFC OBJECT REPLACEMENT CHARACTERの符号位置が加わる。ユニ

コード標準の第3.0版は,組302に相当する。 

A.6.1 303 UNICODE 3.1 

組番号303の確定組UNICODE 3.1は,A.3で規定する組と幾つかの符号位置の範囲とからなる。この

組を,面ごとに次に示す。 

面00 

組番号 

名前 

302 

BMP SECOND EDITION 

区 

区の中の値 

03 F4〜F5 

面01 

区 

区の中の値 

03 

00〜1E,20〜23,30〜4A 

04 

00〜25,28〜4D 

D0 

00〜F5 

D1 

00〜26,2A〜DD 

D4 

00〜54,56〜9C,9E〜9F,A2,A5〜A6,A9〜AC,AE〜B9,BB,BD〜C0,C2〜C3,C5〜FF 

D5 

00〜05,07〜0A,0D〜14,16〜1C,1E〜39,3B〜3E,40〜44,46,4A〜50,52〜FF 

D6 

00〜A3,A8〜FF 

D7 

00〜C9,CE〜FF 

面02 

区 

区の中の値 

00〜A6 

0000〜A6D6 

F8〜FA 

F800〜FA1D 

面0E 

区 

区の中の値 

00 

01,20〜7F 

面0F 

区 

区の中の値 

00〜FF 

0000〜FFFD 

面10 

区 

区の中の値 

00〜FF 

0000〜FFFD 

A.6.2 304 UNICODE 3.2 

組番号304の確定組UNICODE 3.2は,A.1で規定する組と幾つかの符号位置の範囲とからなる。この

組を,面ごとに次に示す。 

面00〜10 

組番号 

名前 

303 

UNICODE 3.1 

面00 


79 

X 0221:2014 (ISO/IEC 10646:2012) 

 

組番号 

名前 

98 

SUPPLEMENTAL ARROWS-A 

99 

SUPPLEMENTAL ARROWS-B 

100 

MISCELLANEOUS MATHEMATICAL SYMBOLS-B 

101 

SUPPLEMENTAL MATHEMATICAL OPERATORS 

102 

KATAKANA PHONETIC EXTENSIONS 

103 

VARIATION SELECTORS 

区 

区の中の値 

02 

20 

03 

4F,63〜6F,D8〜D9,F6 

04 

8A〜8B,C5〜C6,C9〜CA,CD〜CE 

05 

00〜0F 

06 

6E〜6F 

07 

B1 

10 

F7〜F8 

17 

00〜0C,0E〜14,20〜36,40〜53,60〜6C,6E〜70,72〜73 

20 

47,4E〜52,57,5F〜63,71,B0〜B1,E4〜EA 

21 

3D〜4B,F4〜FF 

22 

F2〜FF 

23 

7C,9B〜CE 

24 

EB〜FE 

25 

96〜9F,F8〜FF 

26 

16〜17,72〜7D,80〜89 

27 

68〜75,D0〜EB 

30 

3B〜3D,95〜96,9F〜A0,FF 

32 

51〜5F,B1〜BF 

A4 

A2〜A3,B4,C1,C5 

FA 

30〜6A 

FE 

45〜46,73 

FF 

5F〜60 

A.6.3 305 UNICODE 4.0 

組番号305の確定組UNICODE 4.0は,確定組340 COMBINED FIRST EDITIONと同一とする。 

A.6.4 306 UNICODE 4.1 

組番号306の確定組UNICODE 4.1は,A.1で規定する確定組と幾つかの符号位置の範囲とからなる。

この組を,面ごとに次に示す。 

面00〜10 

組番号 

名前 

305 

UNICODE 4.0 

面00 

区 

区の中の値 

02 

37〜41 

03 

58〜5C,FC〜FF 

04 

F6〜F7 

05 

A2,C5〜C7 

06 

0B,1E,59〜5E 

07 

50〜6D 

09 

7D,CE 

0B 

B6,E6,0F,D0〜D1 

10 

F9〜FA,FC 

12 

07,47,87,AF,CF,EF 

13 

0F,1F,47,5F〜60,80〜99 

19 

80〜A9,B0〜C9,D0〜D9,DE〜DF 

1A 

00〜1B,1E〜1F,1D,6C〜C3 

20 

55〜56,58〜5E,90〜94,B2〜B5,EB 

21 

3C,4C 


80 

X 0221:2014 (ISO/IEC 10646:2012) 

  

23 

D1〜DB 

26 

18,7E〜7F,92〜9C,A2〜B1 

27 

C0〜C6 

2B 

0E〜13 

2C 

00〜2E,30〜5E,80〜EA,F9〜FF 

2D 

00〜25,30〜65,6F,80〜96,A0〜A6,A8〜AE,B0〜B6,B8〜BE,C0〜C6,C8〜CE,D0〜
D6,D8〜DE 

2E 

00〜17,1C〜1D 

31 

C0〜CF 

32 

7E 

9F 

A6〜BB 

A7 

00〜16 

A8 

00〜2B 

FA 

70〜D9 

FE 

10〜19 

面01 

区 

区の中の値 

01 

40〜8A 

03 

A0〜C3,C8〜D5 

0A 

00〜03,05〜06,0C〜13,15〜17,19〜33,38〜3A,3F〜47,50〜58 

D2 

00〜45 

D6 

A4〜A5 

A.6.5 307 UNICODE 5.0 

組番号307の確定組UNICODE 5.0は,A.1で規定する確定組と幾つかの符号位置の範囲とからなる。

この組を,面ごとに次に示す。 

面00〜10 

組番号 

名前 

306 

UNICODE 4.1 

面00 

区 

区の中の値 

02 

42〜4F 

03 

7B〜7D 

04 

CF,FA〜FF 

05 

10〜13,BA 

07 

C0〜FA 

0C 

E2〜E3,F1〜F2 

1B 

00〜4B,50〜7C 

1D 

C4〜CA,FE〜FF 

20 

EC〜EF 

21 

4D〜4E,84 

23 

DC〜E7 

26 

B2 

27 

C7〜CA 

2B 

14〜1A,20〜23 

2C 

60〜6C,74〜77 

A7 

17〜1A,20〜21 

A8 

40〜77 

面01 

区 

区の中の値 

09 

00〜19,1F 

20〜22 

00〜FF 

23 

00〜6E 

24 

00〜62,70〜73 

D3 

60〜71 

D7 

CA〜CB 


81 

X 0221:2014 (ISO/IEC 10646:2012) 

 

A.6.6 308 UNICODE 5.1 

組番号308の確定組UNICODE 5.1を,面ごとに次に示す。 

面00 

区 

区の中の値 

00 

20〜7E,A0〜FF 

01〜02 

0100〜02FF 

03 

00〜77,7A〜7E,84〜8A,8C,8E〜A1,A3〜FF 

04 

00〜FF 

05 

00〜23,31〜56,59〜5F,61〜87,89〜8A,91〜C7,D0〜EA,F0〜F4 

06 

00〜03,06〜1B,1E〜1F,21〜5E,60〜FF 

07 

00〜0D,0F〜4A,4D〜B1,C0〜FA 

09 

01〜39,3C〜4D,50〜54,58〜72,7B〜7F,81〜83,85〜8C,8F〜90,93〜A8,AA〜B0,B2,
B6〜B9,BC〜C4,C7〜C8,CB〜CE,D7,DC〜DD,DF〜E3,E6〜FA 

0A 

01〜03,05〜0A,0F〜10,13〜28,2A〜30,32〜33,35〜36,38〜39,3C,3E〜42,47〜48,
4B〜4D,51,59〜5C,5E,66〜75,81〜83,85〜8D,8F〜91,93〜A8,AA〜B0,B2〜B3,B5
〜B9,BC〜C5,C7〜C9,CB〜CD,D0,E0〜E3,E6〜EF,F1 

0B 

01〜03,05〜0C,0F〜10,13〜28,2A〜30,32〜33,35〜39,3C〜44,47〜48,4B〜4D,56〜
57,5C〜5D,5F〜63,66〜71,82〜83,85〜8A,8E〜90,92〜95,99〜9A,9C,9E〜9F,A3
〜A4,A8〜AA,AE〜B9,BE〜C2,C6〜C8,CA〜CD,D0,D7,E6〜FA 

0C 

01〜03,05〜0C,0E〜10,12〜28,2A〜33,35〜39,3D〜44,46〜48,4A〜4D,55〜56,58
〜59,60〜63,66〜6F,78〜7F,82〜83,85〜8C,8E〜90,92〜A8,AA〜B3,B5〜B9,BC〜
C4,C6〜C8,CA〜CD,D5〜D6,DE,E0〜E3,E6〜EF,F1〜F2 

0D 

02〜03,05〜0C,0E〜10,12〜28,2A〜39,3D〜44,46〜48,4A〜4D,57,60〜63,66〜75,
79〜7F,82〜83,85〜96,9A〜B1,B3〜BB,BD,C0〜C6,CA,CF〜D4,D6,D8〜DF,F2
〜F4 

0E 

01〜3A,3F〜5B,81〜82,84,87〜88,8A,8D,94〜97,99〜9F,A1〜A3,A5,A7,AA〜
A8,AD〜B9,BB〜BD,C0〜C4,C6,C8〜CD,D0〜D9,DC〜DD 

0F 

00〜47,49〜6C,71〜8B,90〜97,99〜BC,BE〜CC,CE〜D4 

10 

00〜99,9E〜C5,D0〜FC 

11 

00〜59,5F〜A2,A8〜F9 

12 

00〜48,4A〜4D,50〜56,58,5A〜5D,60〜88,8A〜8D,90〜B0,B2〜B5,B8〜BE,C0,
C2〜C5,C8〜D6,D8〜FF 

13 

00〜10,12〜15,18〜5A,5F〜7C,80〜99,A0〜F4 

14〜15 

1401〜15FF 

16 

00〜76,80〜9C,A0〜F0 

17 

00〜0C,0E〜14,20〜36,40〜53,60〜6C,6E〜70,72〜73,80〜DD,E0〜E9,F0〜F9 

18 

00〜0E,10〜19,20〜77,80〜AA 

19 

00〜1C,20〜2B,30〜3B,40,44〜6D,70〜74,80〜A9,B0〜C9,D0〜D9,DE〜FF 

1A 

00〜1B,1E〜1F 

1B 

00〜4B,50〜7C,80〜AA,AE〜B9 

1C 

00〜37,3B〜49,4D〜7F 

1D 

00〜E6,FE〜FF 

1E 

00〜FF 

1F 

00〜15,18〜1D,20〜45,48〜4D,50〜57,59,5B,5D,5F〜7D,80〜B4,B6〜C4,C6〜D3,
D6〜DB,DD〜EF,F2〜F4,F6〜FE 

20 

00〜64,6A〜71,74〜8E,90〜94,A0〜B5,D0〜F0 

21 

00〜4F,53〜88,90〜FF 

22 

00〜FF 

23 

00〜E7 

24 

00〜26,40〜4A,60〜FF 

25 

00〜FF 

26 

00〜9D,A0〜BC,C0〜C3 

27 

01〜04,06〜09,0C〜27,29〜4B,4D,4F〜52,56,58〜5E,61〜94,98〜AF,B1〜BE,C0
〜CA,CC,D0〜FF 

28〜2A 

2800〜2AFF 

2B 

00〜4C,50〜54 


82 

X 0221:2014 (ISO/IEC 10646:2012) 

  

2C 

00〜2E,30〜5E,60〜6F,71〜7D,80〜EA,F9〜FF 

2D 

00〜25,30〜65,6F,80〜96,A0〜A6,A8〜AE,B0〜B6,B8〜BE,C0〜C6,C8〜CE,D0〜
D6,D8〜DE,E0〜FF 

2E 

00〜30,80〜99,9B〜F3 

2F 

00〜D5,F0〜FB 

30 

00〜3F,41〜96,99〜FF 

31 

05〜2D,31〜8E,90〜B7,C0〜E3,F0〜FF 

32 

00〜1E,20〜43,50〜FE 

33 

00〜FF 

34〜4C 

3400〜4CFF 

4D 

00〜B5,C0〜FF 

4E〜9F 

4E00〜9FC3 

A0〜A3 

A000〜A3FF 

A4 

00〜8C,90〜C6 

A5 

00〜FF 

A6 

00〜2B,40〜5F,62〜73,7C〜97 

A7 

00〜8C,FB〜FF 

A8 

00〜2B,40〜77,80〜C4,CE〜D9 

A9 

00〜53,5F 

AA 

00〜36,40〜4D,50〜59,5C〜5F 

AC〜D7 

AC00〜D7A3 

E0〜F8 

E000〜F8FF 

F9 

00〜FF 

FA 

00〜2D,30〜6A,70〜D9 

FB 

00〜06,13〜17,1D〜36,38〜3C,3E,40〜41,43〜44,46〜B1,D3〜FF 

FC 

00〜FF 

FD 

00〜3F,50〜8F,92〜C7,F0〜FD 

FE 

00〜19,20〜26,30〜52,54〜66,68〜6B,70〜74,76〜FC,FF 

FF 

01〜BE,C2〜C7,CA〜CF,D2〜D7,DA〜DC,E0〜E6,E8〜EE,F9〜FD 

面01 

区 

区の中の値 

00 

00〜0B,0D〜26,28〜3A,3C〜3D,3F〜4D,50〜5D,80〜FA 

01 

00〜02,07〜33,37〜8A,90〜9B,D0〜FD 

02 

80〜9C,A0〜D0 

03 

00〜1E,20〜23,30〜4A,80〜9D,9F〜C3,C8〜D5 

04 

00〜9D,A0〜A9 

08 

00〜05,08,0A〜35,37〜38,3C,3F 

09 

00〜19,1F〜39,3F 

0A 

00〜03,05〜06,0C〜13,15〜17,19〜33,38〜3A,3F〜47,50〜58 

20〜22 

2000〜22FF 

23 

00〜6E 

24 

00〜62,70〜73 

D0 

00〜F5 

D1 

00〜26,29〜DD 

D2 

00〜45 

D3 

00〜56,60〜71 

D4 

00〜54,56〜9C,9E〜9F,A2,A5〜A6,A9〜AC,AE〜B9,BB,BD〜C3,C5〜FF 

D5 

00〜05,07〜0A,0D〜14,16〜1C,1E〜39,3B〜3E,40〜44,46,4A〜50,52〜FF 

D6 

00〜A5,A8〜FF 

D7 

00〜CB,CE〜FF 

F0 

00〜2B,30〜93 

面02 

区 

区の中の値 

00〜A6 

0000〜A6D6 

F8〜FA 

F800〜FA1D 

面0E 


83 

X 0221:2014 (ISO/IEC 10646:2012) 

 

区 

区の中の値 

00 

01,20〜7F 

01 

00〜EF 

面0F 

区 

区の中の値 

00〜FF 

0000〜FFFD 

面10 

区 

区の中の値 

00〜FF 

0000〜FFFD 

注記 組308 UNICODE 5.1は,A.1に示す別の確定組と幾つかの符号位置の範囲とで示すこともで

きる。 

面00〜10 

組番号 

名前 

308 

UNICODE 5.0 

面00 

区 

区の中の値 

03 

70〜73,76〜77,CF 

04 

87 

05 

14〜23 

06 

06〜0A,16〜1A,3B〜3F 

07 

6E〜7F 

09 

71〜72 

0A 

51,75 

0B 

44,62〜63,D0 

0C 

3D,58〜59,62〜63,78〜7F 

0D 

3D,44,62〜63,70〜75,79〜7F 

0F 

6B〜6C,CE,D2〜D4 

10 

22,28,2B,33〜35,3A〜3F,5A〜8A 

18 

AA 

1B 

80〜AA,AE〜B9 

1C 

00〜37,3B〜49,4D〜7F 

1D 

CB〜E6 

1E 

9C〜9F,FA〜FF 

20 

64,F0 

21 

4F,85〜88 

26 

9D,B3〜BC,C0〜C3 

27 

CC,EC〜EF 

2B 

1B〜1F,24〜4C,50〜54 

2C 

6D〜6F,71〜73,78〜7D 

2D 

E0〜FF 

2E 

18〜1B,1E〜30 

31 

2D,D0〜E3 

9F 

BC〜C3 

A5 

00〜FF 

A6 

00〜2B,40〜5F,62〜73,7C〜97 

A7 

1B〜1F,22〜8C,FB〜FF 

A8 

80〜C4,CE〜D9 

A9 

00〜53,5F 

AA 

00〜36,40〜4D,50〜59,5C〜5F 

FE 

24〜26 

面01 

区 

区の中の値 

01 

90〜9B,D0〜FD 

02 

80〜9C,A0〜D0 

09 

20〜39,3F 


84 

X 0221:2014 (ISO/IEC 10646:2012) 

  

D1 

29 

F0 

00〜2B,30〜93 

A.6.7 309 UNICODE 5.2 

組番号309の確定組UNICODE 5.2を,面ごとに次に示す。 

面00 

区 

区の中の値 

00 

20〜7E,A0〜FF 

01〜02 

0100〜02FF 

03 

00〜77,7A〜7E,84〜8A,8C,8E〜A1,A3〜FF 

04 

00〜FF 

05 

00〜25,31〜56,59〜5F,61〜87,89〜8A,91〜C7,D0〜EA,F0〜F4 

06 

00〜03,06〜1B,1E〜1F,21〜5E,60〜FF 

07 

00〜0D,0F〜4A,4D〜B1,C0〜FA 

08 

00〜2D,30〜3E 

09 

00〜39,3C〜4E,50〜55,58〜72,79〜7F,81〜83,85〜8C,8F〜90,93〜A8,AA〜B0,B2,
B6〜B9,BC〜C4,C7〜C8,CB〜CE,D7,DC〜DD,DF〜E3,E6〜FB 

0A 

01〜03,05〜0A,0F〜10,13〜28,2A〜30,32〜33,35〜36,38〜39,3C,3E〜42,47〜48,
4B〜4D,51,59〜5C,5E,66〜75,81〜83,85〜8D,8F〜91,93〜A8,AA〜B0,B2〜B3,B5
〜B9,BC〜C5,C7〜C9,CB〜CD,D0,E0〜E3,E6〜EF,F1 

0B 

01〜03,05〜0C,0F〜10,13〜28,2A〜30,32〜33,35〜39,3C〜44,47〜48,4B〜4D,56〜
57,5C〜5D,5F〜63,66〜71,82〜83,85〜8A,8E〜90,92〜95,99〜9A,9C,9E〜9F,A3
〜A4,A8〜AA,AE〜B9,BE〜C2,C6〜C8,CA〜CD,D0,D7,E6〜FA 

0C 

01〜03,05〜0C,0E〜10,12〜28,2A〜33,35〜39,3D〜44,46〜48,4A〜4D,55〜56,58
〜59,60〜63,66〜6F,78〜7F,82〜83,85〜8C,8E〜90,92〜A8,AA〜B3,B5〜B9,BC〜
C4,C6〜C8,CA〜CD,D5〜D6,DE,E0〜E3,E6〜EF,F1〜F2 

0D 

02〜03,05〜0C,0E〜10,12〜28,2A〜39,3D〜44,46〜48,4A〜4D,57,60〜63,66〜75,
79〜7F,82〜83,85〜96,9A〜B1,B3〜BB,BD,C0〜C6,CA,CF〜D4,D6,D8〜DF,F2
〜F4 

0E 

01〜3A,3F〜5B,81〜82,84,87〜88,8A,8D,94〜97,99〜9F,A1〜A3,A5,A7,AA〜
A8,AD〜B9,BB〜BD,C0〜C4,C6,C8〜CD,D0〜D9,DC〜DD 

0F 

00〜47,49〜6C,71〜8B,90〜97,99〜BC,BE〜CC,CE〜D8 

10 

00〜C5,D0〜FC 

11 

00〜FF 

12 

00〜48,4A〜4D,50〜56,58,5A〜5D,60〜88,8A〜8D,90〜B0,B2〜B5,B8〜BE,C0,
C2〜C5,C8〜D6,D8〜FF 

13 

00〜10,12〜15,18〜5A,5F〜7C,80〜99,A0〜F4 

14〜15 

1400〜15FF 

16 

00〜9C,A0〜F0 

17 

00〜0C,0E〜14,20〜36,40〜53,60〜6C,6E〜70,72〜73,80〜DD,E0〜E9,F0〜F9 

18 

00〜0E,10〜19,20〜77,80〜AA,B0〜F5 

19 

00〜1C,20〜2B,30〜3B,40,44〜6D,70〜74,80〜AB,B0〜C9,D0〜DA,DE〜FF 

1A 

00〜1B,1E〜5E,60〜7C,7F〜89,90〜99,A0〜AD 

1B 

00〜4B,50〜7C,80〜AA,AE〜B9 

1C 

00〜37,3B〜49,4D〜7F,D0〜F2 

1D 

00〜E6,FD〜FF 

1E 

00〜FF 

1F 

00〜15,18〜1D,20〜45,48〜4D,50〜57,59,5B,5D,5F〜7D,80〜B4,B6〜C4,C6〜D3,
D6〜DB,DD〜EF,F2〜F4,F6〜FE 

20 

00〜64,6A〜71,74〜8E,90〜94,A0〜B8,D0〜F0 

21 

00〜89,90〜FF 

22 

00〜FF 

23 

00〜E8 

24 

00〜26,40〜4A,60〜FF 

25 

00〜FF 

26 

00〜CD,CF〜E1,E3,E8〜FF 

27 

01〜04,06〜09,0C〜27,29〜4B,4D,4F〜52,56〜5E,61〜94,98〜AF,B1〜BE,C0〜CA,


85 

X 0221:2014 (ISO/IEC 10646:2012) 

 

CC,D0〜FF 

28〜2A 

2800〜2AFF 

2B 

00〜4C,50〜59 

2C 

00〜2E,30〜5E,60〜7F,80〜F1,F9〜FF 

2D 

00〜25,30〜65,6F,80〜96,A0〜A6,A8〜AE,B0〜B6,B8〜BE,C0〜C6,C8〜CE,D0〜
D6,D8〜DE,E0〜FF 

2E 

00〜31,80〜99,9B〜F3 

2F 

00〜D5,F0〜FB 

30 

00〜3F,41〜96,99〜FF 

31 

05〜2D,31〜8E,90〜B7,C0〜E3,F0〜FF 

32 

00〜1E,20〜FE 

33 

00〜FF 

34〜4C 

3400〜4CFF 

4D 

00〜B5,C0〜FF 

4E〜9F 

4E00〜9FC6 

A0〜A3 

A000〜A3FF 

A4 

00〜8C,90〜C6,D0〜FF 

A5 

00〜FF 

A6 

00〜2B,40〜5F,62〜73,7C〜97,A0〜F7 

A7 

00〜8C,FB〜FF 

A8 

00〜2B,30〜39,40〜77,80〜C4,CE〜D9,E0〜FB 

A9 

00〜53,5F〜7C,80〜CD,CF〜D9,DE〜DF 

AA 

00〜36,40〜4D,50〜59,5C〜7B,80〜C2,DB〜DF 

AB 

C0〜ED,F0〜F9 

AC〜D6 

AC00〜D6FF 

D7 

00〜A3,B0〜C6,CB〜FB 

E0〜F8 

E000〜F8FF 

F9 

00〜FF 

FA 

00〜2D,30〜6D,70〜D9 

FB 

00〜06,13〜17,1D〜36,38〜3C,3E,40〜41,43〜44,46〜B1,D3〜FF 

FC 

00〜FF 

FD 

00〜3F,50〜8F,92〜C7,F0〜FD 

FE 

00〜19,20〜26,30〜52,54〜66,68〜6B,70〜74,76〜FC,FF 

FF 

01〜BE,C2〜C7,CA〜CF,D2〜D7,DA〜DC,E0〜E6,E8〜EE,F9〜FD 

面01 

区 

区の中の値 

00 

00〜0B,0D〜26,28〜3A,3C〜3D,3F〜4D,50〜5D,80〜FA 

01 

00〜02,07〜33,37〜8A,90〜9B,D0〜FD 

02 

80〜9C,A0〜D0 

03 

00〜1E,20〜23,30〜4A,80〜9D,9F〜C3,C8〜D5 

04 

00〜9D,A0〜A9 

08 

00〜05,08,0A〜35,37〜38,3C,3F〜55,57〜5F 

09 

00〜1B,1F〜39,3F 

0A 

00〜03,05〜06,0C〜13,15〜17,19〜33,38〜3A,3F〜47,50〜58,60〜7F 

0B 

00〜35,39〜55,58〜72,78〜7F 

0C 

00〜48 

0E 

60〜7E 

10 

80〜C1 

20〜22 

2000〜22FF 

23 

00〜6E 

24 

00〜62,70〜73 

30〜34 

3000〜342E 

D0 

00〜F5 

D1 

00〜26,29〜DD 

D2 

00〜45 

D3 

00〜56,60〜71 

D4 

00〜54,56〜9C,9E〜9F,A2,A5〜A6,A9〜AC,AE〜B9,BB,BD〜C3,C5〜FF 


86 

X 0221:2014 (ISO/IEC 10646:2012) 

  

D5 

00〜05,07〜0A,0D〜14,16〜1C,1E〜39,3B〜3E,40〜44,46,4A〜50,52〜FF 

D6 

00〜A5,A8〜FF 

D7 

00〜CB,CE〜FF 

F0 

00〜2B,30〜93 

F1 

00〜0A,10〜2E,31,3D,3F,42,46,4A〜4E,57,5F,79,7B〜7C,7F,8A〜8D,90 

F2 

00,10〜31,40〜48 

面02 

区 

区の中の値 

00〜A6 

0000〜A6D6 

A7〜B7 

A700〜B734 

F8〜FA 

F800〜FA1D 

面0E 

区 

区の中の値 

00 

01,20〜7F 

01 

00〜EF 

面0F 

区 

区の中の値 

00〜FF 

0000〜FFFD 

面10 

区 

区の中の値 

00〜FF 

0000〜FFFD 

注記 組番号309の組UNICODE 5.2は,A.1に示す別の確定組と幾つかの符号位置の範囲とで示す

こともできる。 

面00〜10 

組番号 

名前 

308 

UNICODE 5.1 

面00 

区 

区の中の値 

05 

24〜25 

08 

00〜2D,30〜3E 

09 

00,4E,55,79〜7A,FB 

0F 

D5〜D8 

10 

9A〜9D 

11 

5A〜5E,A3〜A7,FA〜FF 

14 

00 

16 

77〜7F 

18 

B0〜F5 

19 

AA〜AB,DA 

1A 

20〜5E,60〜7C,7F〜89,90〜99,A0〜AD 

1C 

D0〜F2 

1D 

FD 

20 

B6〜B8 

21 

50〜52,89 

23 

E8 

26 

9E〜9F,BD〜BF,C4〜CD,CF〜E1,E3,E8〜FF 

27 

57 

2B 

55〜59 

2C 

70,7E〜7F,EB〜F1 

2D 

E0〜FF 

2E 

31 

32 

44〜4F 

9F 

C4〜C6 

A4 

D0〜FF 

A6 

A0〜F7 

A8 

30〜39,E0〜FB 


87 

X 0221:2014 (ISO/IEC 10646:2012) 

 

A9 

60〜7C,80〜CD,CF〜D9,DE〜DF 

AA 

60〜7B,80〜C2,DB〜DF 

AB 

C0〜ED,F0〜F9 

D7 

B0〜C6,CB〜FB 

FA 

6B〜6D 

面01 

区 

区の中の値 

08 

40〜55,57〜5F 

09 

1A〜1B 

0A 

60〜7F 

0B 

00〜35,39〜55,58〜72,78〜7F 

0C 

00〜48 

0E 

60〜7E 

10 

80〜C1 

30〜34 

3000〜342E 

F1 

00〜0A,10〜2E,31,3D,3F,42,46,4A〜4E,57,5F,79,7B〜7C,7F,8A〜
8D,90 

F2 

00,10〜31,40〜48 

面02 

区 

区の中の値 

A7〜B7 

A700〜B734 

A.6.8 310 UNICODE 6.0 

組番号310の組UNICODE 6.0を,面ごとに次に示す。 

面00 

区 

区の中の値 

00 

20〜7E,A0〜FF 

01〜02 

0100〜02FF 

03 

00〜77,7A〜7E,84〜8A,8C,8E〜A1,A3〜FF 

04 

00〜FF 

05 

00〜27,31〜56,59〜5F,61〜87,89〜8A,91〜C7,D0〜EA,F0〜F4 

06 

00〜03,06〜1B,1E〜FF 

07 

00〜0D,0F〜4A,4D〜B1,C0〜FA 

08 

00〜2D,30〜3E,40〜5B,5E 

09 

00〜77,79〜7F,81〜83,85〜8C,8F〜90,93〜A8,AA〜B0,B2,B6〜B9,BC〜C4,C7〜
C8,CB〜CE,D7,DC〜DD,DF〜E3,E6〜FB 

0A 

01〜03,05〜0A,0F〜10,13〜28,2A〜30,32〜33,35〜36,38〜39,3C,3E〜42,47〜48,
4B〜4D,51,59〜5C,5E,66〜75,81〜83,85〜8D,8F〜91,93〜A8,AA〜B0,B2〜B3,B5
〜B9,BC〜C5,C7〜C9,CB〜CD,D0,E0〜E3,E6〜EF,F1 

0B 

01〜03,05〜0C,0F〜10,13〜28,2A〜30,32〜33,35〜39,3C〜44,47〜48,4B〜4D,56〜
57,5C〜5D,5F〜63,66〜77,82〜83,85〜8A,8E〜90,92〜95,99〜9A,9C,9E〜9F,A3
〜A4,A8〜AA,AE〜B9,BE〜C2,C6〜C8,CA〜CD,D0,D7,E6〜FA 

0C 

01〜03,05〜0C,0E〜10,12〜28,2A〜33,35〜39,3D〜44,46〜48,4A〜4D,55〜56,58
〜59,60〜63,66〜6F,78〜7F,82〜83,85〜8C,8E〜90,92〜A8,AA〜B3,B5〜B9,BC〜
C4,C6〜C8,CA〜CD,D5〜D6,DE,E0〜E3,E6〜EF,F1〜F2 

0D 

02〜03,05〜0C,0E〜10,12〜3A,3D〜44,46〜48,4A〜4E,57,60〜63,66〜75,79〜7F,
82〜83,85〜96,9A〜B1,B3〜BB,BD,C0〜C6,CA,CF〜D4,D6,D8〜DF,F2〜F4 

0E 

01〜3A,3F〜5B,81〜82,84,87〜88,8A,8D,94〜97,99〜9F,A1〜A3,A5,A7,AA〜
A8,AD〜B9,BB〜BD,C0〜C4,C6,C8〜CD,D0〜D9,DC〜DD 

0F 

00〜47,49〜6C,71〜97,99〜BC,BE〜CC,CE〜DA 

10 

00〜C5,D0〜FC 

11 

00〜FF 

12 

00〜48,4A〜4D,50〜56,58,5A〜5D,60〜88,8A〜8D,90〜B0,B2〜B5,B8〜BE,C0,
C2〜C5,C8〜D6,D8〜FF 

13 

00〜10,12〜15,18〜5A,5D〜7C,80〜99,A0〜F4 

14〜15 

1400〜15FF 


88 

X 0221:2014 (ISO/IEC 10646:2012) 

  

16 

00〜9C,A0〜F0 

17 

00〜0C,0E〜14,20〜36,40〜53,60〜6C,6E〜70,72〜73,80〜DD,E0〜E9,F0〜F9 

18 

00〜0E,10〜19,20〜77,80〜AA,B0〜F5 

19 

00〜1C,20〜2B,30〜3B,40,44〜6D,70〜74,80〜AB,B0〜C9,D0〜DA,DE〜FF 

1A 

00〜1B,1E〜5E,60〜7C,7F〜89,90〜99,A0〜AD 

1B 

00〜4B,50〜7C,80〜AA,AE〜B9,C0〜F3,FC〜FF 

1C 

00〜37,3B〜49,4D〜7F,D0〜F2 

1D 

00〜E6,FC〜FF 

1E 

00〜FF 

1F 

00〜15,18〜1D,20〜45,48〜4D,50〜57,59,5B,5D,5F〜7D,80〜B4,B6〜C4,C6〜D3,
D6〜DB,DD〜EF,F2〜F4,F6〜FE 

20 

00〜64,6A〜71,74〜8E,90〜9C,A0〜B9,D0〜F0 

21 

00〜89,90〜FF 

22 

00〜FF 

23 

00〜F3 

24 

00〜26,40〜4A,60〜FF 

25 

00〜FF 

26 

00〜FF 

27 

01〜CA,CC,CE〜FF 

28〜2A 

2800〜2AFF 

2B 

00〜4C,50〜59 

2C 

00〜2E,30〜5E,60〜7F,80〜F1,F9〜FF 

2D 

00〜25,30〜65,6F〜70,7F〜96,A0〜A6,A8〜AE,B0〜B6,B8〜BE,C0〜C6,C8〜CE,
D0〜D6,D8〜DE,E0〜FF 

2E 

00〜31,80〜99,9B〜F3 

2F 

00〜D5,F0〜FB 

30 

00〜3F,41〜96,99〜FF 

31 

05〜2D,31〜8E,90〜BA,C0〜E3,F0〜FF 

32 

00〜1E,20〜FE 

33 

00〜FF 

34〜4C 

3400〜4CFF 

4D 

00〜B5,C0〜FF 

4E〜9F 

4E00〜9FCB 

A0〜A3 

A000〜A3FF 

A4 

00〜8C,90〜C6,D0〜FF 

A5 

00〜FF 

A6 

00〜2B,40〜73,7C〜97,A0〜F7 

A7 

00〜8E,90〜91A0〜A9,FA〜FF 

A8 

00〜2B,30〜39,40〜77,80〜C4,CE〜D9,E0〜FB 

A9 

00〜53,5F〜7C,80〜CD,CF〜D9,DE〜DF 

AA 

00〜36,40〜4D,50〜59,5C〜7B,80〜C2,DB〜DF 

AB 

01〜06,09〜0E,11〜16,20〜26,28〜2E,C0〜ED,F0〜F9 

AC〜D6 

AC00〜D6FF 

D7 

00〜A3,B0〜C6,CB〜FB 

E0〜F8 

E000〜F8FF 

F9 

00〜FF 

FA 

00〜2D,30〜6D,70〜D9 

FB 

00〜06,13〜17,1D〜36,38〜3C,3E,40〜41,43〜44,46〜C1,D3〜FF 

FC 

00〜FF 

FD 

00〜3F,50〜8F,92〜C7,F0〜FD 

FE 

00〜19,20〜26,30〜52,54〜66,68〜6B,70〜74,76〜FC,FF 

FF 

01〜BE,C2〜C7,CA〜CF,D2〜D7,DA〜DC,E0〜E6,E8〜EE,F9〜FD 

面01 

区 

区の中の値 

00 

00〜0B,0D〜26,28〜3A,3C〜3D,3F〜4D,50〜5D,80〜FA 

01 

00〜02,07〜33,37〜8A,90〜9B,D0〜FD 

02 

80〜9C,A0〜D0 


89 

X 0221:2014 (ISO/IEC 10646:2012) 

 

03 

00〜1E,20〜23,30〜4A,80〜9D,9F〜C3,C8〜D5 

04 

00〜9D,A0〜A9 

08 

00〜05,08,0A〜35,37〜38,3C,3F〜55,57〜5F 

09 

00〜1B,1F〜39,3F 

0A 

00〜03,05〜06,0C〜13,15〜17,19〜33,38〜3A,3F〜47,50〜58,60〜7F 

0B 

00〜35,39〜55,58〜72,78〜7F 

0C 

00〜48 

0E 

60〜7E 

10 

00〜4D,52〜6F,80〜C1 

20〜22 

2000〜22FF 

23 

00〜6E 

24 

00〜62,70〜73 

30〜34 

3000〜342E 

68〜6A 

6800〜6A38 

B0 

00〜01 

D0 

00〜F5 

D1 

00〜26,29〜DD 

D2 

00〜45 

D3 

00〜56,60〜71 

D4 

00〜54,56〜9C,9E〜9F,A2,A5〜A6,A9〜AC,AE〜B9,BB,BD〜C3,C5〜FF 

D5 

00〜05,07〜0A,0D〜14,16〜1C,1E〜39,3B〜3E,40〜44,46,4A〜50,52〜FF 

D6 

00〜A5,A8〜FF 

D7 

00〜CB,CE〜FF 

F0 

00〜2B,30〜93,A0〜AE,B1〜BE,C1〜CF,D1〜DF 

F1 

00〜0A,10〜2E,30〜69,70〜8E,90〜9A,E6〜FF 

F2 

00〜02,10〜3A,40〜48,50〜51 

F3 

00〜20,30〜35,37〜7C,80〜93,A0〜C4,C6〜CA,E0〜F0 

F4 

00〜3E,40,42〜F7,F9〜FC 

F5 

00〜3D,50〜67,FB〜FF 

F6 

01〜10,12〜14,16,18,1A,1C〜1E,20〜25,28〜2B,2D,30〜33,35〜40,45〜4F,80〜
C5 

F7 

00〜73 

面02 

区 

区の中の値 

00〜A6 

0000〜A6D6 

A7〜B6 

A700〜B6FF 

B7 

00〜34,40〜FF 

B8 

00〜1D 

F8〜FA 

F800〜FA1D 

面0E 

区 

区の中の値 

00 

01,20〜7F 

01 

00〜EF 

面0F 

区 

区の中の値 

00〜FF 

0000〜FFFD 

面10 

区 

区の中の値 

00〜FF 

0000〜FFFD 

注記 組310 UNICODE 6.0は,A.1に示す別の確定組と幾つかの符号位置の範囲とで示すこともで

きる。組UNICODE 6.0は,この規格のこの版で追加された20B9 INDIAN RUPEE SIGNを含

む。 

面00〜10 

組番号 

名前 


90 

X 0221:2014 (ISO/IEC 10646:2012) 

  

309 

UNICODE 5.2 

面00 

区 

区の中の値 

05 

26〜27 

08 

40〜5B,5E 

09 

3A〜3B,4F,56〜57,73〜77 

0B 

72〜77 

0D 

29,3A,4E 

0F 

8C〜8F,D9〜DA 

13 

5D〜5E 

1B 

C0〜F3,FC〜FF 

1D 

FC 

20 

B9 

23 

E9〜F3 

26 

CE,E2,E4〜E7 

27 

05,0A〜0B,28,4C,4E,53〜55,5F〜60,95〜97,B0,BF,CE,CF 

2D 

70,7F 

30 

97 

31 

B8〜BA 

9F 

C7〜CB 

A6 

60〜61 

A7 

8D〜8E,90〜91,A0〜A9,FA 

AB 

01〜06,09〜0E,11〜16,20〜26,28〜2E 

FB 

B2〜C1 

面01 

区 

区の中の値 

10 

00〜4D,52〜6F 

68〜6A 

6800〜6A38 

B0 

00〜01 

F0 

A0〜AE,B1〜BE,C1〜CF,D1〜DF 

F1 

30,32〜3C,3E,40〜41,43〜45,47〜49,4F〜56,58〜5E,60〜69,70〜78,7A,
7D〜7E,80〜89,8E〜8F,91〜9A,E6〜FF 

F2 

01〜02,32〜3A,50〜51 

F3 

00〜20,30〜35,37〜7C,80〜93,A0〜C4,C6〜CA,E0〜F0 

F4 

00〜3E,40,42〜F7,F9〜FC 

F5 

00〜3D,50〜67,FB〜FF 

F6 

01〜10,12〜14,16,18,1A,1C〜1E,20〜25,28〜2B,2D,30〜33,35〜40,45
〜4F,80〜C5 

F7 

00〜73 

面02 

区 

区の中の値 

B7 

40〜FF 

B8 

00〜1D 

 

A.6.9 311 UNICODE 6.1 

組番号311の組UNICODE 6.1を,面ごとに次に示す。 

面00 

区 

区の中の値 

00 

20〜7E,A0〜FF 

01〜02 

0100〜02FF 

03 

00〜77,7A〜7E,84〜8A,8C,8E〜A1,A3〜FF 

04 

00〜FF 

05 

00〜27,31〜56,59〜5F,61〜87,89〜8A,8F,91〜C7,D0〜EA,F0〜F4 

06 

00〜04,06〜1B,1E〜FF 

07 

00〜0D,0F〜4A,4D〜B1,C0〜FA 


91 

X 0221:2014 (ISO/IEC 10646:2012) 

 

08 

00〜2D,30〜3E,40〜5B,5E,A0,A2〜AC,E4〜FE 

09 

00〜77,79〜7F,81〜83,85〜8C,8F〜90,93〜A8,AA〜B0,B2,B6〜B9,BC〜C4,C7〜
C8,CB〜CE,D7,DC〜DD,DF〜E3,E6〜FB 

0A 

01〜03,05〜0A,0F〜10,13〜28,2A〜30,32〜33,35〜36,38〜39,3C,3E〜42,47〜48,
4B〜4D,51,59〜5C,5E,66〜75,81〜83,85〜8D,8F〜91,93〜A8,AA〜B0,B2〜B3,B5
〜B9,BC〜C5,C7〜C9,CB〜CD,D0,E0〜E3,E6〜F1 

0B 

01〜03,05〜0C,0F〜10,13〜28,2A〜30,32〜33,35〜39,3C〜44,47〜48,4B〜4D,56〜
57,5C〜5D,5F〜63,66〜77,82〜83,85〜8A,8E〜90,92〜95,99〜9A,9C,9E〜9F,A3
〜A4,A8〜AA,AE〜B9,BE〜C2,C6〜C8,CA〜CD,D0,D7,E6〜FA 

0C 

01〜03,05〜0C,0E〜10,12〜28,2A〜33,35〜39,3D〜44,46〜48,4A〜4D,55〜56,58
〜59,60〜63,66〜6F,78〜7F,82〜83,85〜8C,8E〜90,92〜A8,AA〜B3,B5〜B9,BC〜
C4,C6〜C8,CA〜CD,D5〜D6,DE,E0〜E3,E6〜EF,F1〜F2 

0D 

02〜03,05〜0C,0E〜10,12〜3A,3D〜44,46〜48,4A〜4E,57,60〜63,66〜75,79〜7F,
82〜83,85〜96,9A〜B1,B3〜BB,BD,C0〜C6,CA,CF〜D4,D6,D8〜DF,F2〜F4 

0E 

01〜3A,3F〜5B,81〜82,84,87〜88,8A,8D,94〜97,99〜9F,A1〜A3,A5,A7,AA〜
A8,AD〜B9,BB〜BD,C0〜C4,C6,C8〜CD,D0〜D9,DC〜DF 

0F 

00〜47,49〜6C,71〜97,99〜BC,BE〜CC,CE〜DA 

10 

00〜C5,C7,CD,D0〜FF 

11 

00〜FF 

12 

00〜48,4A〜4D,50〜56,58,5A〜5D,60〜88,8A〜8D,90〜B0,B2〜B5,B8〜BE,C0,
C2〜C5,C8〜D6,D8〜FF 

13 

00〜10,12〜15,18〜5A,5D〜7C,80〜99,A0〜F4 

14〜15 

1400〜15FF 

16 

00〜9C,A0〜F0 

17 

00〜0C,0E〜14,20〜36,40〜53,60〜6C,6E〜70,72〜73,80〜DD,E0〜E9,F0〜F9 

18 

00〜0E,10〜19,20〜77,80〜AA,B0〜F5 

19 

00〜1C,20〜2B,30〜3B,40,44〜6D,70〜74,80〜AB,B0〜C9,D0〜DA,DE〜FF 

1A 

00〜1B,1E〜5E,60〜7C,7F〜89,90〜99,A0〜AD 

1B 

00〜4B,50〜7C,80〜F3,FC〜FF 

1C 

00〜37,3B〜49,4D〜7F,C0〜C7,D0〜F6 

1D 

00〜E6,FC〜FF 

1E 

00〜FF 

1F 

00〜15,18〜1D,20〜45,48〜4D,50〜57,59,5B,5D,5F〜7D,80〜B4,B6〜C4,C6〜D3,
D6〜DB,DD〜EF,F2〜F4,F6〜FE 

20 

00〜64,6A〜71,74〜8E,90〜9C,A0〜B9,D0〜F0 

21 

00〜89,90〜FF 

22 

00〜FF 

23 

00〜F3 

24 

00〜26,40〜4A,60〜FF 

25 

00〜FF 

26 

00〜FF 

27 

01〜FF 

28〜2A 

2800〜2AFF 

2B 

00〜4C,50〜59 

2C 

00〜2E,30〜5E,60〜7F,80〜F3,F9〜FF 

2D 

00〜25,27,2D,30〜67,6F〜70,7F〜96,A0〜A6,A8〜AE,B0〜B6,B8〜BE,C0〜C6,
C8〜CE,D0〜D6,D8〜DE,E0〜FF 

2E 

00〜3B,80〜99,9B〜F3 

2F 

00〜D5,F0〜FB 

30 

00〜3F,41〜96,99〜FF 

31 

05〜2D,31〜8E,90〜BA,C0〜E3,F0〜FF 

32 

00〜1E,20〜FE 

33 

00〜FF 

34〜4C 

3400〜4CFF 

4D 

00〜B5,C0〜FF 

4E〜9F 

4E00〜9FCC 

A0〜A3 

A000〜A3FF 

A4 

00〜8C,90〜C6,D0〜FF 


92 

X 0221:2014 (ISO/IEC 10646:2012) 

  

A5 

00〜FF 

A6 

00〜2B,40〜97,9F〜F7 

A7 

00〜8E,90〜93,A0〜AA,F8〜FF 

A8 

00〜2B,30〜39,40〜77,80〜C4,CE〜D9,E0〜FB 

A9 

00〜53,5F〜7C,80〜CD,CF〜D9,DE〜DF 

AA 

00〜36,40〜4D,50〜59,5C〜7B,80〜C2,DB〜F6 

AB 

01〜06,09〜0E,11〜16,20〜26,28〜2E,C0〜ED,F0〜F9 

AC〜D6 

AC00〜D6FF 

D7 

00〜A3,B0〜C6,CB〜FB 

E0〜F8 

E000〜F8FF 

F9 

00〜FF 

FA 

00〜6D,70〜D9 

FB 

00〜06,13〜17,1D〜36,38〜3C,3E,40〜41,43〜44,46〜C1,D3〜FF 

FC 

00〜FF 

FD 

00〜3F,50〜8F,92〜C7,F0〜FD 

FE 

00〜19,20〜26,30〜52,54〜66,68〜6B,70〜74,76〜FC,FF 

FF 

01〜BE,C2〜C7,CA〜CF,D2〜D7,DA〜DC,E0〜E6,E8〜EE,F9〜FD 

面01 

区 

区の中の値 

00 

00〜0B,0D〜26,28〜3A,3C〜3D,3F〜4D,50〜5D,80〜FA 

01 

00〜02,07〜33,37〜8A,90〜9B,D0〜FD 

02 

80〜9C,A0〜D0 

03 

00〜1E,20〜23,30〜4A,80〜9D,9F〜C3,C8〜D5 

04 

00〜9D,A0〜A9 

08 

00〜05,08,0A〜35,37〜38,3C,3F〜55,57〜5F 

09 

00〜1B,1F〜39,3F,80〜B7,BE〜BF 

0A 

00〜03,05〜06,0C〜13,15〜17,19〜33,38〜3A,3F〜47,50〜58,60〜7F 

0B 

00〜35,39〜55,58〜72,78〜7F 

0C 

00〜48 

0E 

60〜7E 

10 

00〜4D,52〜6F,80〜C1,D0〜E8,F0〜F9 

11 

00〜34,36〜43,80〜C8,D0〜D9 

16 

80〜B7,C0〜C9 

20〜22 

2000〜22FF 

23 

00〜6E 

24 

00〜62,70〜73 

30〜34 

3000〜342E 

68〜6A 

6800〜6A38 

6F 

00〜44,50〜7E,8F〜9F 

B0 

00〜01 

D0 

00〜F5 

D1 

00〜26,29〜DD 

D2 

00〜45 

D3 

00〜56,60〜71 

D4 

00〜54,56〜9C,9E〜9F,A2,A5〜A6,A9〜AC,AE〜B9,BB,BD〜C3,C5〜FF 

D5 

00〜05,07〜0A,0D〜14,16〜1C,1E〜39,3B〜3E,40〜44,46,4A〜50,52〜FF 

D6 

00〜A5,A8〜FF 

D7 

00〜CB,CE〜FF 

EE 

00〜03,05〜1F,21〜22,24,27,29〜32,34〜37,39,3B,42,47,49,4B,4D〜4F,51〜
52,54,57,59,5B,5D,5F,61〜62,64,67〜6A,6C〜72,74〜77,79〜7C,7E,80〜89,
8B〜9B,A1〜A3,A5〜A9,AB〜BB,F0〜F1 

F0 

00〜2B,30〜93,A0〜AE,B1〜BE,C1〜CF,D1〜DF 

F1 

00〜0A,10〜2E,30〜6B,70〜8E,90〜9A,E6〜FF 

F2 

00〜02,10〜3A,40〜48,50〜51 

F3 

00〜20,30〜35,37〜7C,80〜93,A0〜C4,C6〜CA,E0〜F0 

F4 

00〜3E,40,42〜F7,F9〜FC 

F5 

00〜3D,40〜43,50〜67,FB〜FF 


93 

X 0221:2014 (ISO/IEC 10646:2012) 

 

F6 

00〜40,45〜4F,80〜C5 

F7 

00〜73 

面02 

区 

区の中の値 

00〜A6 

0000〜A6D6 

A7〜B6 

A700〜B6FF 

B7 

00〜34,40〜FF 

B8 

00〜1D 

F8〜FA 

F800〜FA1D 

面0E 

区 

区の中の値 

00 

01,20〜7F 

01 

00〜EF 

面0F 

区 

区の中の値 

00〜FF 

0000〜FFFD 

面10 

区 

区の中の値 

00〜FF 

0000〜FFFD 

注記 組311 UNICODE 6.1は,A.1に示す別の確定組と幾つかの符号位置の範囲とで示すこともでき

る。 

面00〜10 

組番号 

名前 

310 

UNICODE 6.0 

面00 

区 

区の中の値 

05 

8F 

06 

04 

08 

A0,A2〜AC,E4〜FE 

0A 

F0 

0E 

DE〜DF 

10 

C7,CD,FD〜FF 

1B 

AB〜AD,BA〜BF 

1C 

C0〜C7,F3〜F6 

27 

CB,CD 

2C 

F2〜F3 

2D 

27,2D,66〜67 

2E 

32〜3B 

9F 

CC 

A6 

74〜7B,9F 

A7 

92〜93,AA,F8〜F9 

AA 

E0〜F6 

FA 

2E〜2F 

面01 

区 

区の中の値 

09 

80〜B7,BE〜BF 

10 

D0〜E8,F0〜F9 

11 

00〜34,36〜43,80〜C8,D0〜D9 

16 

80〜B7,C0〜C9 

6F 

00〜44,50〜7E,8F〜9F 

EE 

00〜03,05〜1F,21〜22,24,27,29〜32,34〜37,39,3B,42,47,49,4B,4D
〜4F,51〜52,54,57,59,5B,5D,5F,61〜62,64,67〜6A,6C〜72,74〜77,
79〜7C,7E,80〜89,8B〜9B,A1〜A3,A5〜A9,AB〜BB,F0〜F1 

F1 

6A〜6B 


94 

X 0221:2014 (ISO/IEC 10646:2012) 

  

F5 

40〜43 

F6 

00,11,15,17,19,1B,1F,26〜27,2C,2E〜2F,34 


95 

X 0221:2014 (ISO/IEC 10646:2012) 

 

附属書B 

(規定) 

結合文字一覧 

 

注記 この規格の以前の版でこの附属書に記載していた内容は,文字の種類による形式的な定義に変

更した(4.14参照)。 

 


96 

X 0221:2014 (ISO/IEC 10646:2012) 

  

附属書C 
(規定) 

面01〜面10のUCS変換形式(UTF-16) 

 

注記 この規格の以前の版でこの附属書に記載していた内容は,本文に記載した。UTF-16の符号化形

式については,箇条9を参照。UTF-16の符号化方式については,箇条10を参照。 

 


97 

X 0221:2014 (ISO/IEC 10646:2012) 

 

附属書D 
(規定) 

UCS変換形式8(UTF-8) 

 

注記 この規格の以前の版でこの附属書に記載していた内容は,本文に記載した。UTF-8の符号化形

式については,箇条9を参照。UTF-8の符号化方式については,箇条10を参照。 

 


98 

X 0221:2014 (ISO/IEC 10646:2012) 

  

附属書E 

(規定) 

双方向文脈での鏡像文字 

 

注記 この規格の以前の版でこの附属書に記載していた内容は,文字の種類による形式的な鏡像文字

の定義に変更した(15.1参照)。 

 


99 

X 0221:2014 (ISO/IEC 10646:2012) 

 

附属書F 

(参考) 
書式文字 

 

書式文字と呼ぶ特別な種類の文字がある。その主要な用途は,周囲の文字の配置又は処理に影響を与え

ることである。少数の例外を除いて,書式文字は,印字可能な図形文字をもたない。符号表中では,空白

の文字と同様の点線の長方形で囲って示している。 

多くの書式文字の機能は,符号単位列の正しい表示を示すことにある。表示以外のテキストの処理(例

えば,分類及び探索)では,F.1.1で説明するZWJ及びZWNJを除く書式文字は,それを除いてしまうこと

によって,無視できる。書式文字は,JIS X 0211の双方向性制御機能とともに使うことを意図していない。 

 

F.1 

一般書式文字 

F.1.1 

幅0の境界表示子 

次の4文字は,両隣の文字を語の境界又はハイフンの境界で区切るかどうかを示すのに使う。これらの

幅0の境界表示子は,それ自身の通常の表現では幅をもたない。 

SOFT HYPHEN(00AD):SOFT HYPHEN(SHY)は,語の途中で改行するのにふさわしい候補を示す書

式文字である。行をSOFT HYPHENによって示される位置で改行する場合,辞書の参照などのような他の

仕組みによって語の途中で改行したかのように改行するとよい。言語及びその語に応じて,語の途中の改

行の可視的な結果は,異なってもよい。例えば,次のような結果としてもよい。 

− 語が分割されたことを表す図形記号を挿入し,その図形記号の直後で改行を行う。 

− 語が分割されたことを表す図形記号を挿入し,その図形記号の直後で改行し,分割された語の一部の

つづりを変更する。 

− 視覚上の変更を行わず,単にSOFT HYPHENの位置で改行する。 

何かの図形記号を挿入する場合,状況に応じて最適な様々な形,例えば,HYPHEN(2010)(ハイフン),

ARMENIAN HYPHEN(058A)(アルメニア文字用ハイフン)又はMONGOLIAN TODO SOFT HYPHEN(1806)

(モンゴルトド文字用ハイフン)の形としてもよい。 

明示的な改行の位置の指定を含むテキストを語の途中での改行を含めて符号化する場合,言語に応じて,

HYPHEN,ARMENIAN HYPHEN及びMONGOLIAN TODO SOFT HYPHENなどの文字を用いてもよい。 

語の途中の改行が可能な位置を符号化する目的で(例えば,“tug{00AD}gumi”のように)符号単位列に

SOFT HYPHENを挿入しても,文字の表示は変わらない。語の途中の改行を含む強制的な改行を符号化す

る文字を含む符号単位列を符号化する場合,テキストの列の文字による表現は,(例えば,“/”が改行を意

味するものとして,“tugg{2010}”/“gumi”とするような)語の途中の改行による一切の変更を反映しな

ければならない。 

注記1 ここに,{00AD}及び{2010}という表記法は,符号位置00AD及び2010を符号単位列中に含

めることを示す。ただし,“{”及び“}”は,符号単位列の一部ではない。 

ZERO WIDTH SPACE(200B):この文字は,SPACE(スペース)と同様に語の境界を示すが,SPACE

と異なり表示幅をもたない。例えば,この文字は,語を区切るのに可視的な間隔を使用しないタイ語の語

の境界を示すのに使える。 

WORD JOINER(2060)及びZERO WIDTH NO-BREAK SPACE(FEFF):これらの文字は,NO-BREAK 


100 

X 0221:2014 (ISO/IEC 10646:2012) 

  

SPACE(ノーブレークスペース)と同様に語の境界がないことを示すが,NO-BREAK SPACEと異なり表

示幅をもたない。例えば,これらの文字は,テキスト“base+delta”の4番目の文字の後に挿入し,“e”と

“+”との間に語の区切りがあってはならないことを示す。 

注記2 ZERO WIDTH NO-BREAK SPACEを“印”(しるし)に使う方法は,箇条10参照。 

次の2文字は,表示するときに,隣接する文字と接合するかどうかを示すのに使う[続け書き接合子

(cursive joiner)という。]。 

ZERO WIDTH NON-JOINER(200C):この文字は,通常,続け書き文字形として続ける隣接する文字

を,続け書き接合で続けないことを示す。例えば,ARABIC LETTER NOON(アラビア文字ヌーン)とARABIC 

LETTER MEEM(アラビア文字ミーム)との間のZERO WIDTH NON-JOINERは,この二つの文字を通常

の続け書き接合で表示しないことを示す。 

注記2A ZERO WIDTH NON-JOINERの略号としてZWNJを用いることがある。 

ZERO WIDTH JOINER(200D):この文字は,通常,続け書き文字形として続けない隣接する文字を,

続け書き接合で続けた形で表現することを示す。例えば,SPACEの後にARABIC LETTER BEH(アラビ

ア文字ベー)が続き,その後にSPACEが続く文では,ZERO WIDTH JOINERは,ARABIC LETTER BEH

の最終形を表示するために,最初の文字と2番目の文字との間に挿入できる。 

注記2B ZERO WIDTH JOINERの略号としてZWJを用いることがある。 

F.1.2 

書式分離子 

次の2文字は,行間又は段落間の書式上の境界を示すのに使う。 

LINE SEPARATOR(2028):この文字は,どこから新しい行を始めるかを示すのに使う。すなわち,テ

キストは次の行に続くが,新しい段落は始めないときに使う。例えば,段落間の行あけ又は段落の字下げ

は,適用されないと考えられる。 

PARAGRAPH SEPARATOR(2029):この文字は,どこから新しい段落を始めるかを示す。例えば,テ

キストは,次の行に続き,段落間の行あけ又は段落の字下げを適用すると考えられる。 

F.1.3 

双方向テキストの書式付け 

ここで示す文字は,双方向テキストの書式付けに使う。部分集合の仕様にこれらの文字が入っている場

合には,右から左へ書く文字を含むテキストは,暗黙的な双方向性アルゴリズムで表示される。 

暗黙的なアルゴリズムでは,テキストの水平行に文字を正しい順序で表示するために,文字の方向性の

特性を使う。 

次の2文字は,文字の順序付けに影響を及ぼすという意味で,右から左へ書く文字又は左から右へ書く

文字と全く同じように働く書式文字とする[双方向性書式マーク(bi-directional format mark)という。]。

これらの文字は,可視的な表現をもたず,文脈にも影響しない。 

これらの文字は,その作用範囲がより局所的であり,明示的な埋込み文字又は上書き文字の利用よりも

便利なことがある。 

LEFT-TO-RIGHT MARK(200E):双方向性の書式付けにおいて,この文字は,左から右へ書く文字(例

えば,LATIN SMALL LETTER A)のように働く。 

RIGHT-TO-LEFT MARK(200F):双方向性の書式付けにおいて,この文字は,右から左へ書く文字(例

えば,ARABIC LETTER NOON)のように働く。 

次の5文字は,テキストの一部を挿入部分として扱い,かつ,その部分に特定の順序付けがなければな

らないことを示す[双方向性書式挿入子(bi-directional format embedding)という。]。例えば,アラビア語

の文章の途中にある英語の引用には,挿入された左から右へ書く文字列としてマークを付けることができ


101 

X 0221:2014 (ISO/IEC 10646:2012) 

 

る。これらの書式文字は,ブロックの入れ子を作る。ブロックの開始(プッシュ)は,“埋込み文字(embedding 

character)”及び“上書き文字(override character)”が示す。ブロックの終了(ポップ)は,“挿入終了文字

(pop character)”が示す。 

埋込み文字と上書き文字との機能は,非常に似ている。主な違いは,埋込み文字がテキストの暗黙的な

方向性を指定するのに対して,上書き文字は,テキストの明示的な方向性を指定することにある。テキス

トが明示的な方向をもつ場合,通常の文字の方向性の特性が無視され,テキスト全体が上書き文字で定ま

る方向をもつとみなす。 

LEFT-TO-RIGHT EMBEDDING(202A):この文字は,左から右への暗黙的な方向性をもつ挿入の開始

を示すのに使う。 

RIGHT-TO-LEFT EMBEDDING(202B):この文字は,右から左への暗黙的な方向性をもつ挿入の開始

を示すのに使う。 

LEFT-TO-RIGHT OVERRIDE(202D):この文字は,左から右への明示的な方向性をもつ挿入の開始を

示すのに使う。 

RIGHT-TO-LEFT OVERRIDE(202E):この文字は,右から左への明示的な方向性をもつ挿入の開始を

示すのに使う。 

POP DIRECTIONAL FORMATTING(202C):この文字は,上の四つの文字で開始された暗黙的又は明

示的な方向性をもつ挿入の終了を示すのに使う。 

 

F.2 

用字特有の書式文字 

F.2.1 

クメール内在母音文字 

次の文字の使用は,推奨されない。これらは,現在は使用されないモデルにおいて,音声学的な違いを

表現するのに使われる。 

KHMER VOWEL INHERENT AQ(17B4) 

KHMER VOWEL INHERENT AA(17B5) 

F.2.2 

対称入替え様式文字 

次の文字は,箇条15に示す左向き用及び右向き用と対をなす鏡像文字の種類と一緒に使う。次の書式文

字は,文字の名前中にあるLEFT(左)又はRIGHT(右)という語をそれぞれ“開き”又は“閉じ”と解

釈するかどうかを示すのに使う。これらの文字は,入れ子とはならない。 

実装上の既定状態は,上位のプロトコル又はJIS X 0211のような規格で設定してもよい。このようなプ

ロトコルがない場合,既定状態は,ACTIVATE SYMMETRIC SWAPPINGによって設定される状態とする。 

INHIBIT SYMMETRIC SWAPPING(206A):この文字と(存在するならば)後続のACTIVATE 

SYMMETRIC SWAPPING書式文字との間では,箇条15に示す鏡像文字は,“左”及び“右”として解釈さ

れ,表される。箇条15で示された処理は,行わない。 

ACTIVATE SYMMETRIC SWAPPING(206B):この文字と(存在するならば)後続のINHIBIT 

SYMMETRIC SWAPPING書式文字との間では,箇条15に示す鏡像文字は,箇条15で示されたとおり“開

き”及び“閉じ”の文字として解釈され,表される。 

F.2.3 

アラビア文字の字形選択子 

次の文字,すなわち,アラビア文字の字形選択子は,アラビア文字の表示形と一緒に使う。表示処理の

間,ある文字は,続け書き接合又は合字で互いに続けてもよい。字形選択子は,この表示の効果を出すた

めに使用する字形決定処理を活性化するか又は抑制するかを示すのに使う。これらの文字は,入れ子とは


102 

X 0221:2014 (ISO/IEC 10646:2012) 

  

ならない。 

INHIBIT ARABIC FORM SHAPING(206C):この字形選択子と(存在するならば)後続のACTIVATE 

ARABIC FORM SHAPING書式文字との間では,字形決定処理は,抑制される。アラビア文字の表示形は,

字形を変更することなく表示される。これを既定状態とする。 

ACTIVATE ARABIC FORM SHAPING(206D):この字形選択子と(存在するならば)後続のINHIBIT 

ARABIC FORM SHAPING書式文字との間では,アラビア文字の表示形は,字形決定処理で字形を変更し

て表示される。 

注記 これらの字形選択子は,表示形ではない文字には影響を与えない。特に,0600〜06FFにある通

常の形のアラビア文字は,常に字形変更の対象となっており,これらの書式文字の影響を受け

ない。 

F.2.4 

数字の字形選択子 

次の文字は,0030〜0039にある数字を表すときの形を選択できるようにする。これらの文字は,入れ子

とはならない。 

NATIONAL DIGIT SHAPES(206E):この文字と(存在するならば)後続のNOMINAL DIGIT SHAPES

書式文字との間では,0030〜0039にある数字は,合意によって定められたとおりに,国で使う数字(national 

digit)の形で表される。例えば,これらを0660〜0669にあるアラビア語の数字の形で表示できる。 

NOMINAL DIGIT SHAPES(206F):この文字と(存在するならば)後続のNATIONAL DIGIT SHAPES

書式文字との間では,0030〜0039にある数字は,符号表に示されたとおりの形で表される。これを既定状

態とする。 

 

F.3 

行間注釈文字(Interlinear annotation character) 

次の文字は,ある識別された文字列[注釈文字列(annotation string)という。]が,他の識別された文字

列[基底文字列(base string)という。]の注釈を提供すると考えられることを示すために使う。 

INTERLINEAR ANNOTATION ANCHOR(FFF9):この文字は,基底文字列の開始位置を示す。 

INTERLINEAR ANNOTATION SEPARATOR(FFFA):この文字は,基底文字列の終了位置及び注釈文

字列の開始位置を示す。 

INTERLINEAR ANNOTATION TERMINATOR(FFFB):この文字は,注釈文字列の終了位置を示す。 

注釈文字列と基底文字列との関係は,送信装置の利用者と受信装置の利用者との合意によって,定義さ

れる。例えば,基底文字列が可視的に表示される場合,注釈文字列は,基底文字列と異なる行の基底文字

列に近い位置に表示してもよい。 

処理によって行間注釈文字を除いてしまう場合は,INTERLINEAR ANNOTATION SEPARATORと

INTERLINEAR ANNOTATION TERMINATORとの間の全ての文字も,一緒に除去することが望ましい。 

 

F.4 

限定性書式文字 

次の7文字は,続く文字の並びを限定する。 

0600 

ARABIC NUMBER SIGN 

0601 

ARABIC SIGN SANAH 

0602 

ARABIC FOOTNOTE MARKER 

0603 

ARABIC SIGN SAFHA 

06DD 

ARABIC END OF AYAH 

070F 

SYRIAC ABBREVIATION MARK 

110BD 

KAITHI NUMBER SIGN 


103 

X 0221:2014 (ISO/IEC 10646:2012) 

 

これらの文字は,続く数字(及び若干のその他の文字)の並びに対して,ユニコード標準6.0版(附属

書M参照)がARABIC END OF AYAHの振る舞いとして規定するとおりに働く。 

 

F.5 

連結作用素 

これらの書式文字は,数式中で区切りの文字もスペースも無しに並ぶことのある文字の区切りとして用

いる。 

FUNCTION APPLICATION(2061):この文字は,関数の適用を示す。 

INVISIBLE TIMES(2062):この文字は,乗算を示す。 

INVISIBLE SEPARATOR(2063):この文字は,隣接する数学記号がリストを形成することを示す。例

えば,複数の添え字の間に見えるCOMMAを置かないときに用いる。 

INVISIBLE PLUS(2064):この文字は,加算を示す。 

 

F.6 

西洋音楽記号 

この規格は,音楽の楽譜又は音程の符号化の完全な手段を規定しない。その種の要件を満たすためには,

この規格が規定する文字の符号化の規則に加えて,他の事柄を記述する追加の階層が必要である。しかし,

追加の階層を用いなくても,この規格が規定する文字は,一般的な音楽に関するテキスト記述において簡

単に音楽に言及するための記号として用いることができる。 

音楽の記法では,音価の短い音符をまとめる連こう(桁)が多用される。書式文字1D173 MUSICAL 

SYMBOL BEGIN BEAM[音楽記号連こう(桁)開始]及び1D174 MUSICAL SYMBOL END BEAM[音楽記

号連こう(桁)終了]を用いて,連こう(桁)によるまとまりの範囲を示すことができる。特別な場合,

連こう(桁)の端が閉じないことがある。連こう(桁)の端に符幹が付かないことを示すために,いわゆ

る“透明音符”[すなわち,MUSICAL SYMBOL NULL NOTEHEAD(音楽記号空白符頭)]を用いることが

できる。 

これと同様に,他の接続構造を表現するための別の書式文字を用意してある。次の文字は,この種の働

きをもつ。 

− 1D175 MUSICAL SYMBOL BEGIN TIE(音楽記号タイ開始) 

− 1D176 MUSICAL SYMBOL END TIE(音楽記号タイ終了) 

− 1D177 MUSICAL SYMBOL BEGIN SLUR(音楽記号スラー開始) 

− 1D178 MUSICAL SYMBOL END SLUR(音楽記号スラー終了) 

− 1D179 MUSICAL SYMBOL BEGIN PHRASE(音楽記号楽句開始) 

− 1D17A MUSICAL SYMBOL END PHRASE(音楽記号楽句終了) 

これらの対になる文字は,完全な音楽の記法において,音符及び楽句のまとまり又は配置を変更する。

音楽の一部分がプレーンテキストの一部に書かれたり描かれたりする場合,特別なソフトウェアが利用で

きないときには,開始及び終了を示す書式文字の対を括弧のように描いたり無視したりしてもよい。洗練

された組込み手続は,対になる書式文字を可能な限界まで解釈し,実際に備える制御能力を用いて,タイ,

スラー,連こう(桁)及び楽句を適切に描いてもよい。 

最大の柔軟性のために,音楽記号の文字集合は,特定の音価の音符として前もって合成された図形記号

をもつ文字と,完全な音符を組み立てる場合の基本要素としての図形記号をもつ文字との双方を含む。音

楽記号は,至る所で使われるので,主として利用者の便宜のために,前もって合成された図形記号をもつ

文字を用意してある。 


104 

X 0221:2014 (ISO/IEC 10646:2012) 

  

符号化の点では,便利ではないが,様々な符頭,符幹及び符尾並びに演奏指示の記号を組み合わせて音

符を構成する手段が,複雑な楽譜を扱う完全な実装に必要となる。この用法の例として,アメリカ式の特

別な形の音符及び現代打楽器曲の表記法がある。例えば,次のような用法がある。 

MUSICAL SYMBOL SQUARE NOTEHEAD BLACKとMUSICAL SYMBOL COMBINING STEMとの組合せ。 

MUSICAL SYMBOL X NOTEHEADとMUSICAL SYMBOL COMBINING STEMとの組合せ。 

付点及び演奏指示記号は,前もって合成された図形記号をもつ文字と組み合わせることもできるし,基

本要素から組み立てた音符と組み合わせることもできる。 

さらに,付点及び演奏指示記号は,一つの完全な音符の形を表すために必要に応じて繰り返してもよい。

例えば,次のような用法がある。 

MUSICAL SYMBOL EIGHTH NOTEとMUSICAL SYMBOL COMBINING AUGMENTATION DOTとMUSICAL 

SYMBOL COMBINING AUGMENTATION DOTとMUSICAL SYMBOL COMBINING ACCENTとの組合せ。 

 

F.7 

タグ文字による言語のタグ付け 

タグ文字は,テキストの属性を,テキストの文字列の一つの位置又は範囲に関連付けることを目的とす

る。特定のタグの値は,通常は,テキストの内容の一部とはみなさない。例えば,テキストの一部分に適

用される言語又はフォントの標識として用いることができる。その用途以外では,タグ文字は,無視して

もよい。 

タグ文字は,プレーンテキストに埋め込まなければならない何らかのASCII(ISO/IEC 646のIRVのこ

とをいう。)に基づくタグ付けの体系において文字列を書き下すために用いることができる。タグ文字は,

符号の値が工夫されているので容易に識別でき,タグ文字の利用には,負担がかからない。タグ文字は,

タグの値を表現することだけが可能であって,テキストの内容自体を表すことはできない。 

文字を,タグ文字と同様の関連付け機能を備える明示的なマーク付けを含んだプロトコル又は構文の文

脈で使う場合は,これらのプロトコルに従ってタグ文字を取り除き無視してもよい。 

例えば,SGML又はXMLでは,明示的な言語のマーク付けが規定されている。そこで,LANGUAGE TAG

(E0001)(言語タグ)及び他のタグ文字は,SGML又はXMLでは,言語の標識として使わない方がよい。

ユニコードのウェブサイト(http://www.unicode.org/reports/)から入手できる“Unicode in XML and other 

Markup Languages”(ユニコード技術報告書 UTR #20)という技術報告書をユニコードコンソーシアム及び

W3Cが共同で執筆したが,この技術報告書には,SGML又はXMLでは,タグ文字を使用しない方がよい

ことが詳細に書かれている。 

TAGS(タグ)ブロックは,97個のタグ専用の文字を含み,BASIC LATIN(基本ラテン文字)ブロック

に含まれる図形文字の複製[これは,BASIC LATINブロックの文字の名前に語“TAG”(タグ)を前置し

た名前の文字であり,符号位置E0020〜E007Eにある。]と,言語のタグを識別する文字であるLANGUAGE 

TAG(言語タグ)及びタグを取り消す文字であるCANCEL TAG(取消しタグ)とからなる。 

タグ識別文字は,異なる種類のタグを識別するための仕組みとして用いる。タグ識別文字によって,二

つ以上の種類のタグをプレーンテキストに埋め込んで共存させることが可能になり,かつ,あるタグが別

のタグと直接連続した場合のタグの切れ目の問題も解決する。現時点では,言語のタグという一つのタグ

の種類だけを規定しているが,将来異なるタグ識別文字を符号化することになれば,異なる種類のタグを

用いることもできるようになる。 

F.7.1 

タグ文字を埋め込む構文 

プレーンテキストにASCIIから導出された任意のタグを埋め込むためには,適切なタグ識別文字を前置


105 

X 0221:2014 (ISO/IEC 10646:2012) 

 

し,埋め込むタグをタグ文字によって単純に書き下す。その文字列を直接テキストに埋め込む。 

タグには,終わりを表す文字が必要ない。一つのタグは,特殊用途面の文字でない最初の文字に出会う

か又は次のタグ識別文字に出会うかのいずれかによって終わる。 

タグの引数は,タグ文字によってだけ符号化できる。その他の文字は,タグの引数を表現するためには

適切ではない。 

F.7.2 

タグの範囲及び入れ子 

タグの値は,テキストにタグが埋め込まれた位置から次のいずれかの位置まで続く。 

− 符号単位列の終わりの位置。 

− タグがCANCEL TAG文字によって明示的に取り消された位置。 

同じ種類のタグは,入れ子にならない。例えば,既に言語のタグ付けが行われているテキストに続けて,

新しく埋め込まれた言語のタグが現れたならば,続くテキストに対するタグの値が新しいタグによって指

定されたタグの値に単純に変わる。 

F.7.3 

タグの値の取消し 

CANCEL TAG(取消しタグ)文字は,特にタグの値を取り消すために用意されている。例えば,言語タ

グを取り消すには,LANGUAGE TAG(言語タグ)文字がCANCEL TAG文字の前になければならない。 

直前にタグ識別文字がないCANCEL TAG文字は,定義されているかもしれない任意のタグの値を取り消

すために用いる。 

CANCEL TAG文字の主な機能は,文字列の境目を越えて不適切なタグの値を広げてしまうことなく,複

数の文字列を,タグの内容を気にせずに連結するような操作を可能にすることである。 

F.7.4 

言語のタグ 

言語のタグは,誰でも関心があり,言語のタグのプロトコルとしての利用は,高度の相互運用性がある。

例えば,日本語を表す言語のタグを埋め込むためには,タグ文字を次のように用いることができる。 

E0001 E006A E0061 

ここで,第1の値は,LANGUAGE TAG(言語タグ)文字の符号の値であり,第2の値は,TAG LATIN SMALL 

LETTER Jに対応する値であり,かつ,第3の値は,TAG LATIN SMALL LETTER Aに対応する値であ

る。“ja”という列は,JIS X 0412群(対応国際規格:ISO 639群)において,日本語を表す2文字コード

である。 


106 

X 0221:2014 (ISO/IEC 10646:2012) 

  

附属書G 
(参考) 

文字の名前のアルファベット順一覧 

 

文字の名前のアルファベット順一覧を,機械可読形式の添付ファイルによって示す。添付ファイルは,

テキストファイルであり,ISO/IEC 646のIRVの文字及び行末を表すLINE FEEDを使用する。ファイル

の先頭の4行は,ヘッダであり,その後にハングル音節文字及び漢字(すなわち,HANGUL SYLLABLES,

CJK UNIFIED IDEOGRAPHS,CJK UNIFIED IDEOGRAPHS EXTENSION A,CJK UNIFIED IDEOGRAPHS 

EXTENSION B,CJK UNIFIED IDEOGRAPHS EXTENSION C,CJK UNIFIED IDEOGRAPHS EXTENSION 

D,CJK COMPATIBILITY IDEOGRAPHS及びCJK COMPATIBILITY IDEOGRAPHS SUPPLEMENTのブロ

ックの文字)を除く全てのこの規格の文字の名前を連ねる。 

添付ファイルの,ヘッダより後の部分の形式は,次による。第1〜第5オクテットは,UCS-4の値を5

桁に省略したものとする。第6オクテットは,文字TABとする。第7オクテットから行末までは,文字の

名前とする。 

参照ファイルは,添付ファイル“Allnames.txt”とする。 

注記1 (対応国際規格での注記1は,この規格では該当しないため不採用とした。) 

注記2 添付ファイルは,この規格を機械可読形式で入手したものだけが利用できる。しかし,この

ファイルを印刷して利用することもできる。 

 


107 

X 0221:2014 (ISO/IEC 10646:2012) 

 

附属書H 
(参考) 

UCSを識別するための“印”(しるし)の使用 

 

注記 この規格の以前の版でこの附属書に記載していた内容は,本文に記載した(箇条10参照)。 

 


108 

X 0221:2014 (ISO/IEC 10646:2012) 

  

附属書I 

(参考) 

漢字構成記述文字 

 

漢字構成記述文字(Ideographic Description Character,以下IDCという。)は,漢字構成記述文字列

(Ideographic Description Sequence,以下IDSという。)を作り出すため,他の図形文字の列とともに使われ

る図形文字である。この種の文字列は,この規格で規定されていない漢字のような文字(ideographic 

character)を記述する目的で使ってもよい。 

IDSは,一つの漢字を抽象字形で記述する。合成された一つの文字と解釈するものではなく,何らかの

特定の表示方法を意図するものでもない。 

注記 IDSは,文字ではなく,この規格のレパートリの構成単位ではない。 

 

I.1 

漢字構成記述文字列の構文 

IDSは,一つのIDCから始まり,一定の数の記述構成要素(description component,以下DCという。)

が後に続く。DCは,次のいずれかであってよい。 

− 符号化された漢字。 

− 符号化された部首。 

− 別のIDS。 

注記1 これは,あるIDSが,他のIDSに入れ子として含まれてもよいことを示す。 

各IDCは,次に示す四つの特性をもつ。これを表I.1にまとめて示す。 

− そのIDCで始まるIDSで使われるDCの数。 

− その略号の定義。 

− 対応するIDSの構文。 

− 抽象字形として記述された漢字を可視化で表現したときの,各DCの相対位置。 

それぞれのIDCから始まるIDSの構文は,表I.1の“IDSの略号及び構文”の欄で,そのIDCの略号(例

えば,IDC-LTR)と,それに続く規定の数のDC,すなわち,(D1 D2)又は(D1 D2 D3)とによって示す。 

注記2 一つのIDSの長さは,16文字以下に制限する。また,一つのIDSの中では,一つのIDC文

字の任意の二つの使用の間に,6個を超える漢字及び/又は部首が現れてはならない。 

注記2A 注記2の制限は,この規格の対応国際規格の次の版までに廃止される予定である。つまり,

この規格の将来の版では,IDSの長さに何ら制限がなく,二つのIDCの間に任意に多くの漢

字及び/又は部首が現れてもよいことになる。また,DCとして,この規格が許している三

つに加え,私用文字が追加される予定もある。 

 

I.2 

個々の漢字構成記述文字の定義 

IDEOGRAPHIC DESCRIPTION CHARACTER LEFT TO RIGHT(2FF0) 

この文字によって記述されるIDSは,D1が左に,D2が右に位置する,漢字の抽象字形を記述する。 

IDEOGRAPHIC DESCRIPTION CHARACTER ABOVE TO BELOW(2FF1) 

この文字によって記述されるIDSは,D1がD2の上に位置する,漢字の抽象字形を記述する。 

IDEOGRAPHIC DESCRIPTION CHARACTER LEFT TO MIDDLE AND RIGHT(2FF2) 


109 

X 0221:2014 (ISO/IEC 10646:2012) 

 

この文字によって記述されるIDSは,D1がD2の左に,さらに,そのD2がD3の左に位置する,漢字の

抽象字形を記述する。 

IDEOGRAPHIC DESCRIPTION CHARACTER ABOVE TO MIDDLE AND BELOW(2FF3) 

この文字によって記述されるIDSは,D1がD2の上に,さらに,そのD2がD3の上に位置する,漢字の

抽象字形を記述する。 

IDEOGRAPHIC DESCRIPTION CHARACTER FULL SURROUND(2FF4) 

この文字によって記述されるIDSは,D1がD2を囲む,漢字の抽象字形を記述する。 

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM ABOVE(2FF5) 

この文字によって記述されるIDSは,D1がD2を上及び両側から囲む,漢字の抽象字形を記述する。 

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM BELOW(2FF6) 

この文字によって記述されるIDSは,D1がD2を下及び両側から囲む,漢字の抽象字形を記述する。 

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM LEFT(2FF7) 

この文字によって記述されるIDSは,D1がD2を左及び上下から囲む,漢字の抽象字形を記述する。 

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM UPPER LEFT(2FF8) 

この文字によって記述されるIDSは,D1がD2の左上に位置し,左及び上の一部を囲む,漢字の抽象字

形を記述する。 

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM UPPER RIGHT(2FF9) 

この文字によって記述されるIDSは,D1がD2の右上に位置し,右及び上の一部を囲む,漢字の抽象字

形を記述する。 

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM LOWER LEFT(2FFA) 

この文字によって記述されるIDSは,D1がD2の左下に位置し,左及び下の一部を囲む,漢字の抽象字

形を記述する。 

IDEOGRAPHIC DESCRIPTION CHARACTER OVERLAID(2FFB) 

この文字によって記述されるIDSは,D1とD2とが互いに重なり合う,漢字の抽象字形を記述する。 

 


110 

X 0221:2014 (ISO/IEC 10646:2012) 

  

表I.1−漢字構成記述文字の属性 

文字の名前 

DC数 

IDSの略号 

及び構文 

DCの 

相対位置 

IDSの例 

IDSが表す

ものの例 

IDEOGRAPHIC DESCRIPTION 
CHARACTER LEFT TO RIGHT 

IDC-LTR D1 D2 

 

 

 

IDEOGRAPHIC DESCRIPTION 
CHARACTER ABOVE TO BELOW 

IDC-ATB D1 D2 

 

 

 

IDEOGRAPHIC DESCRIPTION 
CHARACTER LEFT TO MIDDLE AND 
RIGHT 

IDC-LMR D1 D2 D3 

 

 

 

IDEOGRAPHIC DESCRIPTION 
CHARACTER ABOVE TO MIDDLE AND 
BELOW 

IDC-AMB D1 D2 D3 

 

 

 

IDEOGRAPHIC DESCRIPTION 
CHARACTER FULL SURROUND 

IDC-FSD D1 D2 

 

 

 

IDEOGRAPHIC DESCRIPTION 
CHARACTER SURROUND FROM ABOVE 

IDC-SAV D1 D2 

 

 

 

IDEOGRAPHIC DESCRIPTION 
CHARACTER SURROUND FROM BELOW 

IDC-SBL D1 D2 

 

 

 

IDEOGRAPHIC DESCRIPTION 
CHARACTER SURROUND FROM LEFT 

IDC-SLT D1 D2 

 

 

 

IDEOGRAPHIC DESCRIPTION 
CHARACTER SURROUND FROM UPPER 
LEFT 

IDC-SUL D1 D2 

 

 

 

IDEOGRAPHIC DESCRIPTION 
CHARACTER SURROUND FROM UPPER 
RIGHT 

IDC-SUR D1 D2 

 

 

 

IDEOGRAPHIC DESCRIPTION 
CHARACTER SURROUND FROM LOWER 
LEFT 

IDC-SLL D1 D2 

 

 

 

IDEOGRAPHIC DESCRIPTION 
CHARACTER OVERLAID 

IDC-OVL D1 D2 

 

 

注* 

IDC-OVLでは,D1とD2とは,互いに重なり合う。この図は,D1が左上,D2が右下という意味ではない。 

 


111 

X 0221:2014 (ISO/IEC 10646:2012) 

 

附属書J 

(参考) 

内部記憶機能をもつ送受信兼用装置に対する推奨 

 

この附属書は,受信した符号単位列を後続の再転送のために記憶しておける装置で,広く使われている

クラスのものに適用できる。 

この附属書は,受信した符号単位列とその再転送との間で,情報の損失が最少になるように意図して推

奨するものである。 

このクラスの装置は,2.3に示した受信装置部分と送信装置部分との両方をもち,受信した符号単位列を,

その中に表現されている対応する文字を利用者が修正し又は修正せずに,再転送のために記憶できる。こ

のクラスの装置について,ここでは,2種類の異なる方法を推奨する。 

a) 完全な再転送機能をもつ受信装置 送信装置部分は,受信装置部分が識別できる部分集合外の符号化

表現も含め,受信した文字の符号化表現を,利用者が修正しない限りそのまま再転送する。 

b) 部分集合の再転送機能をもつ受信装置 送信装置部分は,その受信装置部分に採用された部分集合の

文字の符号化表現だけを再転送できる。 

 


112 

X 0221:2014 (ISO/IEC 10646:2012) 

  

附属書K 

(参考) 

オクテット値表現の記法 

 

この規格のオクテット値の表現は,箇条12を除き,JIS X 0202,JIS X 0211及びISO/IEC 8859(Information 

technology−8-bit single-byte coded graphic character sets)群のような他の符号化文字集合の規格と異なる。

この附属書は,両者の記法間の関係を明確にする。 

この規格では,オクテット値を表す記法は,zとしている。ここに,zは,00〜FFの範囲にある16進数

である。例えば,JIS X 0202の文字ESCAPE(ESC)は,この規格では1Bで表現される。 

他の符号化文字集合の規格では,オクテット値を表す記法は,x/yとしている。ここに,x及びyは,00

〜15の範囲にある二つの10進数である。x/y形式の記法とオクテット値との間の対応は,次のとおりであ

る。 

− xは,ビット8,ビット7,ビット6及びビット5で表現される数であって,これらのビットには,そ

れぞれ8,4,2及び1の重みを与える。 

− yは,ビット4,ビット3,ビット2及びビット1で表現される数であって,これらのビットには,そ

れぞれ8,4,2及び1の重みを与える。 

例えば,JIS X 0202の文字ESCは,01/11で表現される。 

このように,JIS X 0202(及び他の符号化文字集合の規格)のオクテット値の記法は,x及びyの値を

16進表記に変換することによって,この規格のオクテット値の記法に変換できる。例えば,04/15は,4F

と同値である。 

 


113 

X 0221:2014 (ISO/IEC 10646:2012) 

 

附属書L 

(参考) 

文字の名前付け指針 

 

この規格の箇条24では,名前の編成及び名前の一意性についての規則を規定している。箇条24の規則

は,ISO/IEC 646,ISO/IEC 6937,ISO/IEC 8859,ISO/IEC 10367などの他の情報技術の符号化文字集合規

格でも用いる。 

注記 JIS X 0201,JIS X 0208,JIS X 0213などの規格でも用いる。 

この附属書では,名前を作り出す場合の追加の指針を示す。 

この附属書で示す指針は,CJK統合漢字及びハングル音節文字の名前には適用しない。CJK統合漢字及

びハングル音節文字の名前は,それぞれ,24.6及び24.7で規定する規則を用いて編成する。 

指針1 

名前は,できる限り通常的に使われる意味を表す(例えば,文字の名前としてPLUS SIGN又はブロッ

ク名BENGALI。)。 

幾つかの文字の名前など,ある種の名前は,使用法ではなく形によってもよい(例えば,文字の名前と

してUPWARDS ARROW。)。 

名前は,指針4の場合を除いて,ものの特質若しくは属性を識別すること,又は言語的特徴についての

情報を提供することを意図しない。 

指針2 

略号は,ラテン大文字のA〜Z及び数字からなり,名前と関連させる。 

略号は,既に使用が定着していて,かつ,明確化のために必要なものの名前に用いる。例えば,制御機

能の名前は,略号と結びついている。 

例 

名前 

略号 

LOCKING-SHIFT TWO RIGHT 

LS2R 

SOFT HYPHEN 

SHY 

INTERNATIONAL PHONETIC ALPHABET 

IPA 

注記 JIS X 0211では,モードの名前にも略号を適用している。 

指針3 

文字の名前及び名前付きUSIの名前は,数字を英単語として書き下すことが適切でないときに限って,

数字の文字0〜9を含んでよい。 

注記 例えば,位置201Aの文字の名前は,SINGLE LOW-9 QUOTATION MARK(下9形引用符)で

ある。文字の形状を明らかにするために,数字9の記号がこの名前に含まれているが,数値に

意味は,ない。 

指針4 

文字の名前及び名前付きUSIの名前は,次に示す区分に属する語のうちで適用可能なものの集合から構

成し,次に示す順序で並べる。例外は,指針9〜11による。必要ならば,一層の明確化のために,語WITH

及びANDを含めてもよい。 

用字 


114 

X 0221:2014 (ISO/IEC 10646:2012) 

  

大文字・小文字 

種類 

言語 

属性 

意味 

マーク(複数でもよい。) 

修飾子 

この語の例を次に示す。 

 

用字 

Latin,Cyrillic,Arabic 

大文字・小文字 

capital,small 

種類 

letter,ligature,digit 

言語 

Ukrainian 

属性 

final,sharp,subscript,vulgar 

意味 

通常の名前,アルファベットの名前 

マーク 

acute,ogonek,ring above,diaeresis 

修飾子 

sign,symbol 

名前の例を次に示す。 

 

1

LATIN

2

 CAPITAL 

3

LETTER6

 A  

WITH

7

 ACUTE  

3

DIGIT

6

 FIVE  

5

LEFT

5

 CURLY 

6

BRACKET 

注記 ligatureは,二つ以上の異なる図形記号が単一の図形記号として可視化された図形記号である。 

一つの文字が一つの基底文字部と複数個のマークとから構成される文字の名前に関しては,名前中のこ

れらの順序は,マークが基底文字部に対して相対的に位置決めされる順序とする。すなわち,昇順にとら

れる文字の上に置くマークから始まり,その後に降順にとられる文字の下に置くマークが続くか,又はそ

の逆(文字の下に置くマークから始まり,その後に文字の上に置くマークが続く。)とする。 

一つの基底文字部と複数個のマークとから構成される名前付きUSIに関しては,個々の名前をそれらが

符号化される順に記述する。 

例 

 

LATIN CAPITAL LETTER O WITH CIRCUMFLEX AND DOT BELOW 

 

LATIN CAPITAL LETTER C WITH CEDILLA AND ACUTE 

 

LATIN CAPITAL LETTER U WITH OGONEK AND ACUTE 

指針5 

ラテンの用字の文字は,名前の中では,基本図形記号(A,B,Cなど)によって表現する。他の用字の

文字は,最初に刊行された国際規格の言語からの転写で表現する。 

例 K LATIN CAPITAL LETTER K 

Ю CYRILLIC CAPITAL LETTER YU 

指針6 

与えられた用字の文字が複数の言語で使われている場合,言語名は,使わない。しかし,曖昧さが生じ

る場合は,この限りではない。 

例 И CYRILLIC CAPITAL LETTER I 


115 

X 0221:2014 (ISO/IEC 10646:2012) 

 

I CYRILLIC CAPITAL LETTER BYELORUSSIAN-UKRAINIAN I 

指針7 

複数個の用字の構成要素となっている文字は,形が同じでも異なるものとみなし,異なる名前をもつ。 

例 A LATIN CAPITAL LETTER A 

A GREEK CAPITAL LETTER ALPHA 

A CYRILLIC CAPITAL LETTER A 

指針8 

可能ならば,名前付きUSIの名前は,その構成要素の名前の要素を,重複を無視して連結することによ

って構成する。この手順によって既に存在する名前が得られたならば,その名前は,文字の名前及び名前

付きUSIの名前の中での一意性を保証するために適切に修正する。一層の明確化のために,語WITH及び

ANDを含めてもよい。 

指針9 

例えば,物理量の単位に関連する図形記号のように,他の用字の中で独立して使われる一つの用字の文

字は,それ本来の用字の文字と異なる文字とみなす。 

例 μ MICRO SIGN 

指針10 

幾つかの文字は,1語又は2語からなる伝統的な名前をもっている。これを変えることは,意図しない。 

例 ʼ APOSTROPHE 

: COLON 

@ COMMERCIAL AT 

_ LOW LINE 

〜 TILDE 

指針11 

与えられた用字の文字(句読点のことが多い。)が他の用字で異なる用法で使われる場合がある。この場

合,最も一般的に使われる慣習的な名前を,その文字に与える。その用字名の後に慣習名をその用字で書

き直したものを続けて注釈として文字一覧表に付けてもよい。 

例 

 


116 

X 0221:2014 (ISO/IEC 10646:2012) 

  

附属書M 

(参考) 

文字の出所 

 

この符号化文字集合を作成するに当たって,幾つかの原典及び寄書を使用した。分野ごとに,最初に国

家規格及び国際規格を示し,その後に関連する参考文献を示す。 

 

General 

ISO international register of character sets to be used with escape sequences. (registration procedure ISO 

2375:1985) . 

ISO 8879:1986, Information processing−Text and office systems−Standard Generalized Markup Language 

(SGML). 

ISO/IEC TR 15285:1998, Information technology−An operational model for characters and glyphs. 

JIS X 0201:1976 情報交換用符号 (Code for Information Interchange). 

Allworth, Edward. Nationalities of the Soviet East: Publications and Writing Systems. New York, London, 

Columbia University Press, 1971. ISBN 0-231-03274-9. 

Barry, Randall K. 1997. ALA-LC romanization tables: transliteration schemes for non-Roman scripts. Washington, 

DC: Library of Congress Cataloging Distribution Service. ISBN 0-8444-0940-5 

Daniels, Peter T., and William Bright, eds. 1996. The world's writing systems. New York; Oxford: Oxford 

University Press. ISBN 0-19-507993-0 

Diringer, David. 1996. The alphabet: a key to the history of mankind. New Delhi: Munshiram Manoharlal. ISBN 

81-215-0780-0 

Faulmann, Carl. 1990 (1880). Das Buch der Schrift. Frankfurt am Main: Eichborn. ISBN 3-8218-1720-8 

Haarmann, Harald. 1990. Universalgeschichte der Schrift. Frankfurt/Main; New York: Campus. ISBN 

3-593-34346-0 

Imprimerie Nationale. 1990. Les caractères de l'Imprimerie nationale. Paris: Imprimerie nationale Éditions. ISBN 

2-11-081085-8 

Jensen, Hans. 1969. Die Schrift in Vergangenheit und Gegenwart. 3., neubearbeitete und erweiterte Auflage. 

Berlin: VEB Deutscher Verlag der Wissenschaften. 

Knuth, Donald E. The TeXbook. ‒ 19th. printing, rev, ‒ Reading, MA : Addison-Wesley, 1990. 

Nakanishi, Akira. 1990. Writing systems of the world: alphabets, syllabaries, pictograms. Rutland, VT: Charles E. 

Tuttle. ISBN 0-8048-1654-9 

Shepherd, Walter. Shepherd's glossary of graphic signs and symbols. Compiled and classified for ready reference. 

‒ New York : Dover Publications, [1971]. 

The Unicode Consortium The Unicode Standard. Worldwide Character Encoding Version 1.0, Volume One. ‒ 

Reading, MA : Addison-Wesley, 1991. 

The Unicode Consortium The Unicode Standard, Version 2.0. Reading, MA: Addison-Wesley, 1996. ISBN 

0-201-48345-9 


117 

X 0221:2014 (ISO/IEC 10646:2012) 

 

The Unicode Consortium The Unicode Standard, Version 3.0. Reading, MA: Addison-Wesley Developer's Press, 

2000. ISBN 0-201-61633-5 

The Unicode Consortium The Unicode standard, Version 4.0. Reading, MA: Addison-Wesley Developer's Press, 

2003. ISBN 0-321-18578-1 

The Unicode Consortium The Unicode Standard, Version 5.0. Reading, MA: Addison-Wesley Developerʼs Press, 

2007. ISBN 0-321-48091-0 

The Unicode Consortium. The Unicode Standard, Version 6.0. Mountain View, CA: The Unicode Consortium, 

2011. ISBN 978-1-936213-01-6 http://www.unicode.org/versions/Unicode6.0.0/ 

Arabic 

ISO 233:1984, Documentation−Transliteration of Arabic characters into Latin characters. 

ISO/IEC 8859, Information technology−8-bit single-byte coded graphic character sets Part 6: Latin/Arabic 

alphabet (1999) 

ISO 9036:1987, Information processing−Arabic 7-bit coded character set for information interchange. 

ASMO 449-1982 Arab Organization for Standardization and Metrology. Data processing−7-bit coded character 

set for information interchange. 

Avestan 

Geldner, Karl F. Avesta: The Sacred Books of the Parsis. Stuttgart: W. Kohlhammerm, 1880. Reprinted, with an 

introduction in Persian by Dr. Jaleh Amouzgar. Tehran: Asatir, 2003. ISBN 964-331-126-0. 

Hoffmann, Karl, and B. Forssman. Avestische Laut- und Flexionslehre. Innsbruck: Innsbrucker Beiträge zur 

Sprachwissenschaft, 1996. ISBN 3851246527. 

Oryan, Said. Pahlavi-Pazand Glossary: Farhang \ Pahlavi. Tehran: Research Institute for Islamic Culture and Art, 

1999 (1377 AP). (Language and Literature, 4). ISBN 964-471-414-8. 

Reichelt, Hans. Avesta Reader: An Approach to the Zoroasterʼs Gathas and New Avestan Texts. Translated and 

annotated with Persian translation of hymns and texts by Jalil Doostkhah. Tehran: Qoqnoos Publishing, 2004 (1383 
AP). ISBN 964-311-473-2. 

Balinese 

Medra, Nengah. Pedoman Pasang Aksara Bali. Denpasar: Dinas Kebudayaan Propinsi Bali, 2003. 

Menaka, Made. Kamus Kawi Bali / olih, made Menaka. Singaraja: Yayasan Kawi Sastra Mandala, 1990. 

Simpen, I Wayan. Pasang Aksara Bali. Denpasar: Upada Sastra, 1992. 

Bamum 

Dugast, J., and M. D. W. Jeffreys. Lʼécriture des bamum: sa naissance, son évolution, sa valeur phonétique, son 

utilisation. Mémoires de lʼInstitut Français dʼAfrique Noire, Centre du Cameroun, 1950. 

Nchare, Oumarou. The Writing of King Njoya: Genesis, Evolution, Use. Foumban: Palais des Rois Bamoun, 

Maison de la Culture, [s.d.]. 

Schmitt, Alfred. Die Bamum-Schrift. Band I: Text. Wiesbaden: Harrassowitz, 1963. 

Braille 


118 

X 0221:2014 (ISO/IEC 10646:2012) 

  

ISO 11548-1:2001. Communication aids for blind persons ‒ identifiers, names and assignation to coded character 

sets for 8-dot Braille characters ‒ Part 1: General guidelines for Braille identifiers and shift marks. 

Canadian Aboriginal Syllabics 

Canadian Aboriginal Syllabic Encoding Committee. Repertoire of Unified Canadian Aboriginal Syllabics 

Proposed for Inclusion into ISO/IEC 10646: International Standard Universal Multi-Octet Coded Character Set. 
[Canada]: CASEC [1994] 

Carian 

Adiego, Ignacio-Javier. The Carian Language. Leiden; Boston: Brill, 2007. 

Melchert, H. Craig. “Carian.” In The Cambridge Encyclopedia of the Worldʼs Ancient Languages, edited by Roger 

Woodard, 609‒613. Cambridge: Cambridge University Press, 2004. ISBN-13: 978-0521562560. 

Cham 

Aymonier, Étienne, and Antoine Cabaton. Dictionnaire Čam-Français. Paris, 1906. 

Bùi Khánh Th . T  diên Chǎm-Vi t: Inālang cam-biet đam. [H  Chí Minh]: Nhà xu t ban Khoa H c Xã H i, 

1995. 

Kōno Rokurō, Chino Eiichi, and Nishida Tatsuo. The Sanseido Encyclopaedia of Linguistics. Volume 7: Scripts 

and Writing Systems of the World [Gengogaku dai ziten (bekkan) sekai mozi ziten]. Tokyo: Sanseido Press, 2001. 
ISBN 4-385-15177-6. 

注記0A これは,次の文献である。河野六郎・千野栄一・西田龍雄 世界文字辞典 東京 三省堂出

版 2001 言語学大辞典別巻 ISBN 4-385-15177-6。 

Cherokee 

Alexander, J. T. A Dictionary of the Cherokee Indian Language. [Sperry, Oklahoma?]: Published by the author, 

1971. 

Holmes, Ruth Bradley. Beginning Cherokee, by Ruth Bradley Holmes and Betty Sharp Smith. 2nd ed. Norman: 

University of Oklahoma Press, 1977. ISBN 0-8061-1464-9. 

New Echota Letters: Contributions of Samuel A. Worcester to the Cherokee Phoenix, edited by Jack Frederick 

Kilpatrick and Anna Gritts Kilpatrick. Dallas: Southern Methodist University Press, [s.d.]. Includes reprint of an 
article by S. A. Worcester, which appeared in the Cherokee Phoenix, Feb. 21, 1828. 

CJK Ideographs 

GB2312-80 Code of Chinese Graphic Character Set for Information Interchange: Jishu Biaozhun Chubanshe 

(Technical Standards Publishing). 

GBK (Guo Biao Kuo) Han character internal code extension specification: Jishu Biaozhun Chubanshe (Technical 

Standards Publishing, Beijing) 

JIS X 0208:1990 情報交換用漢字符号 (Code of the Japanese Graphic Character Set for Information 

Interchange). 

JIS X 0212:1990 情報交換用漢字符号−補助漢字 (Code of the supplementary Japanese graphic character set 

for information interchange). 

JIS X 0213:2000 7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合 (7-bit and 8-bit double 

byte coded extended KANJI sets for information interchange), 2000-01-20. 


119 

X 0221:2014 (ISO/IEC 10646:2012) 

 

KS X 1001:2004 (formerly KS C 5601-1992) Korean Industrial Standards Association. Code for Information 

Interchange (Hangeul and Hanja) (Jeongbo gyohwanyong buhogye). 

ANSI Z39.64-1989 American National Standards Institute. East Asian character code for bibliographic use. 

Mandarin Promotion Council, Ministry of Education, Taiwan. Shiangtu yuyan biauyin fuhau shoutse (The 

Handbook of Taiwan Languages Phonetic Alphabet). 1999. 

Shinmura, Izuru. Kojien ‒ Dai 4-han. ‒ Tokyo : Iwanami Shoten, Heisei 3[1991] 

注記0B これは,次の文献である。新村出 広辞苑 第4版 東京 岩波書店 1991。 

注記 CJK統合漢字の原典については,箇条23を参照。 

Coptic 

Browne, Gerald M. Old Nubian Grammar. München: Lincom Europa, 2002. (Languages of the world: Materials, 

330). ISBN 3-89586-893-0 (pbk.). 

Kasser, Rodolphe. “La ʻGenève 1986ʼ: une nouvelle série de caractères typographiques coptes, protocoptes et 

vieux-coptes créée à Genève.” Bulletin de la Société dʼégyptologie de Genève, 12 (1988): 59‒60. ISSN 0255-6286. 

Kasser, Rodolphe. “A standard system of Sigla for referring to the dialects of Coptic.” Journal of Coptic Studies, 1 

(1990): 141‒151. ISSN 1016-5584. 

Cypriot 

“Linear B and Cypriot”を参照。 

Cyrillic 

ISO/IEC 8859, Information technology−8-bit single-byte coded graphic character sets Part 5: Latin/Cyrillic 

alphabet (1999) 

ISO 5427:1984, Extension of the Cyrillic alphabet coded character set for bibliographic information interchange. 

ISO 10754:1984, Information and documentation ‒ Extension of the Cyrillic alphabet coded character set for 

non-Slavic languages for bibliographic information interchange. 

Deseret 

Encyclopedia of Mormonism, entry for “Deseret Alphabet.” New York: Macmillan, 1992. ISBN 0-02-904040-X. 

Ivins, Stanley S. “The Deseret Alphabet” Utah Humanities Review 1 (1947): 223-39. 

Monson, Samuel C. Representative American Phonetic Alphabets. New York: 1954. Ph.D. dissertation-Columbia 

University. 

Egyptian Hieroglyphic 

Allen, James P. Middle Egyptian: An Introduction to the Language and Culture of Hieroglyphs. Cambridge: 

Cambridge University Press, 1999. ISBN 0-521-77483-7. 

Gardiner, Alan H. Catalogue of the Egyptian Hieroglyphic Printing Type, from Matrices Owned and Controlled by 

Dr. Alan H. Gardiner, in Two Sizes, 18 Point, 12 Point with Intermediate Forms. Oxford: Oxford University Press, 
1928. 

Gardiner, Alan H. “Additions to the New Hieroglyphic Fount (1928).” The Journal of Egyptian Archaeology, 15 

(1929): 95. ISSN 0307 5133. 


120 

X 0221:2014 (ISO/IEC 10646:2012) 

  

Gardiner, Alan H. “Additions to the New Hieroglyphic Fount (1931).” The Journal of Egyptian Archaeology, 17 

(1931): 245‒247. ISSN 0307 5133. 

Gardiner, Alan H. Supplement to the Catalogue of the Egyptian Hieroglyphic Printing Type, Showing Acquisitions 

to December 1953. Oxford: Oxford University Press, 1953. 

Gardiner, Alan H. Egyptian Grammar: Being an Introduction to the Study of Hieroglyphs. 3rd edition. London: 

Oxford University Press, 1957. ISBN 0-900416-35-1. 

Ethiopic 

Armbruster, Carl Hubert. Initia Amharica: an Introduction to Spoken Amharic. Cambridge, Cambridge University 

Press, 1908-20. 

Launhardt, Johannes. Guide to Learning the Oromo (Galla) Language. Addis Ababa, Launhardt [1973?] 

Leslau, Wolf. Amharic Textbook. Weisbaden, Harrassowitz; Berkeley, University of California Press, 1968. 

Glagolitic 

ISO 6861, Information and documentation−Glagolitic alphabet coded character set for bibliographic information 

interchange. 

Glagolitica: zum Ursprung der slavischen Schriftkultur, herausgegeben von Heinz Miklas, unter der Mitarbeit von 

Sylvia Richter und Velizar Sadovski. Wien: Verlag der Österreichischen Akademie der Wissenschaften, 2000. 
(Schriften der Balkan-Kommission, Philologische Abteilung, 41). ISBN 3-7001-2895-9. 

Khaburgaev, Georgii Aleksandrovich. Staroslavianskii iazyk. Izd. 2-e, perer. i dop. Moskva: Prosveshchenie, 1986. 

Žubrinic, Darko. Hrvatska glagoljica: biti pismen-biti svoj. Zagreb: Hrvatsko književno društvo sv. Jeronima (sv. 

Cirila i Metoda): Element, 1996. ISBN 953-6111-35-7. 

Gothic 

Ebbinghaus, Ernst. “The Gothic Alphabet.” In The Worldʼs Writing Systems, edited by Peter T. Daniels and 

William Bright. New York: Oxford University Press, 1996. ISBN 0-19-507993-0. 

Fairbanks, Sydney, and F. P. Magoun Jr. 1940. ʻOn writing and printing Gothicʼ, in Speculum 15:313-16. 

Greek 

ISO 5428:1984, Greek alphabet coded character set for bibliographic information interchange. 

ISO/IEC 8859, Information technology−8-bit single-byte coded graphic character sets Part 7: Latin/Greek 

alphabet (1999) 

Greek Editorial Marks 

Austin, Colin. Comicorum Graecorum Fragmenta in Papyris Reperta, ed. Colinus Austin. Berolini [Berlin], Novi 

Eboraci [New York]: de Gruyter, 1973, p. 29. ISBN 3110024012. 

Homer. Iliad. Homeri Ilias, edidit Thomas W. Allen. 3 vols. Oxonii [Oxford]: e typographeo Clarendoniano 

[Clarendon Press], 1931, vol. 2: pp. 39, 234. 

The Oxyrhynchus Papyri, Part XV, edited with translations and notes by Bernard P. Grenfell and Arthur S. Hunt. 

London: Egypt Exploration Society, 1921, p. 56. (Egypt Exploration Society, Graeco-Roman Memoirs, 18). 

Hebrew 


121 

X 0221:2014 (ISO/IEC 10646:2012) 

 

ISO/IEC 8859, Information technology−8-bit single-byte coded graphic character sets Part 8: Latin/Hebrew 

alphabet (1999) 

ISO 8957:1996, Information and documentation−Hebrew alphabet coded character sets for bibliographic 

information interchange. 

SI 1311.1 ‒ 1996: Standards Institution of Israel. Information technology. ISO 8 bit coded character set with 

Hebrew points. 

SI 1311.2 ‒ 1996, The Standards Institution of Israel. Information Technology. ISO 8-bit coded character set for 

information interchange with Hebrew points and cantillation marks. 

Imperial Aramaic 

Driver, G. R. Semitic Writing from Pictograph to Alphabet. 3rd ed. by S. A. Hopkins. London: Oxford University 

Press for the British Academy, 1976. ISBN 9780197259177. 

Lidzbarski, Mark. Handbuch der nordsemitischen Epigraphik nebst ausgewählten Inschriften. Hildesheim: Georg 

Olms Verlagsbuchhandlung, 1962. Reprint of 1898 edition. 

Naveh, Joseph. Early History of the Alphabet: An Introduction to West Semitic Epigraphy and Palaeography. 

Jerusalem: Magnes Press, the Hebrew University, 1987. ISBN 965-223-436-2. 

Porten, Bezalel, and Ada Yardeni. Textbook of Aramaic Documents from Ancient Egypt. 4 vols. Jerusalem: 

Hebrew University, 1986‒1999. ISBN 9652220752 (v. 1), 9653500031 (v. 2), 9653500147 (v. 3), 9653500899 (v. 4). 

Rosenthal, Franz. A Grammar of Biblical Aramaic. 7th rev. ed. Wiesbaden: Harrassowitz, 2006. ISBN 

3-447-05251-1. 

Inscriptional Parthian and Inscriptional Pahlavi 

Akbarzādeh, Dāriyūš. Katibe-hā-ye Pahlavi-ye Aškāni (Pārti) = Parthian Inscriptions. Vol. 2. Tehran: Pazineh 

Press, 2002 (1381 AP). ISBN 964-5722-74-8. 

Akbarzādeh, Dāriyūš. Katibe-hā-ye Pahlavi: sang-negāre, sekke, mohr, asar-e mohr, zarfnebešte = Pahlavi 

Inscriptions: Inscriptions, Coins, Seals, Sealing Impression. Vol. I. Tehran: Pazineh Press, 2003 (1382 AP). ISBN 
964-5722-44-6. 

Nyberg, Henrik Samuel. A Manual of Pahlavi. 2 vols. Wiesbaden: Harrassowitz, 1964‒1974. ISBN 

9783447015806 (vol. 2). Reprinted: Tehran: Asatir, 2003. ISBN 964-331-132-5, 964-331-131-7. 

Oryan, Saeed. Rahnmā-ye katibe-hā-ye Irāni-ye miyāne Pahlavi-Pārti = Manual of Middle Iranian Inscriptions 

(Parthian-Pahlavi). Tehran: Iranian Cultural Heritage Organization, 2003 (1382 AP). ISBN 964-7483-71-6. 

Rezai Baghbidi, Hassan. Dastur-e Zabān-e Pārti (Pahlavi-e Aškāni) = A Grammar of Parthian (Arsacid Pahlavi). 

Iranian Academy of Persian Language and Literature, 2002 (1381 AP). ISBN 964-7531-05-2. 

Indian scripts 

IS 13194:1991 Bureau of Indian Standards Indian script code for information interchange−ISCII 

LTD 37(1610)-1988 Indian standard code for information interchange. 

International Phonetic Alphabet 

Esling, John. Computer coding of the IPA: supplementary report. Journal of the International Phonetic Association, 

20:1 (1990), p. 22-26. 

International Phonetic Association. The IPA 1989 Kiel Convention Workgroup 9 report: Computer Coding of IPA 

Symbols and Computer Representation of Individual Languages. Journal of the International Phon. Assoc., 19:2 


122 

X 0221:2014 (ISO/IEC 10646:2012) 

  

(1989), p. 81-82. 

International Phonetic Association. Handbook of the International Phonetic Association: A Guide to the Use of the 

International Phonetic Alphabet. Cambridge: Cambridge University Press, 1999. ISBN 0-521-65236-7; 
0-521-63751-1 (pbk.). 

International Phonetic Association. http://www2.arts.gla.ac.uk/IPA/ipa.html. 

Journal of the International Phonetic Association, 24:2 (1994), 95‒98, and 25:1 (1995), 21. 

Pullum, Geoffrey K. Remarks on the 1989 revision of the International Phonetic Alphabet. Journal of the 

International Phonetic Association, 20:1 (1990), p. 33-40. 

Pullum, Geoffrey K., and William A. Ladusaw. Phonetic Symbol Guide. 2nd ed. Chicago: University of Chicago 

Press, 1996. ISBN 0-226-68535-7; 0-226-68536-5 (pbk.). 

Wells, John Christopher. Accents of English. Cambridge, New York: Cambridge University Press, 1982. Vol. 1: 

Introduction. ISBN 0-521-22919-7; ISBN 0-521-29719-2 (pbk.); vol. 2: The British Isles. ISBN 0-521-24224-X, 
ISBN 0-521-28540-2 (pbk.); vol. 3: Beyond the British Isles. ISBN 0-521- 24225-8, ISBN 0-521-28541-0 (pbk.). 

Javanese 

Bohatta, Hanns. Praktische Grammatik der javanischen Sprache, mit Lesestücken, einem javanisch-deutschen und 

deutsch-javanischen Wörterbuch. Wien, Pest, Leipzig: Hartleben, [1892]. (Kunst der Polyglottie, 39). 

Rochadi GK, R. H., and R. L. Sadeli Erawan BK. Cacarakan aksara Sunda. Bandung: Harisma, 1984. 

Roorda, T. Javaansche grammatica, benevens een leesboek tot oefening in de javaansche taal. Amsterdam: 

Johannes Müller, 1855. 

Walbeehm, A. H. J. G. Javaansche spraakkunst: schrift, uitspraak, taalsoorten en woordafleiding. Leiden: E. J. Brill, 

1905. 

Kaithi 

Bihar High Court of Judicature. Selection of Hindusthani Documents from the Courts of Bihar, compiled by S. K. 

Das. Patna, Bihar: Superintendent, Government Printing, 1939. 

Grierson, George A. A Handbook to the Kaithi Character. 2nd rev. ed. Calcutta: Thacker, Spink & Co., 1899. 

Revised edition of A Kaithi Handbook, 1881. 

King, Christopher R. One Language, Two Scripts: The Hindi Movement in Nineteenth Century North India. 

Bombay: Oxford University Press, 1994. 

Kayah Li 

Bennett, J. Fraser. Kayah Li Script: A Brief Description. Urbana-Champaign: University of Illinois, 1993. 

Karenni Literature Department. Ka1ya3lhi1-Ku3la3 Nghôchozha3: The Modern Western Kayah Li-English Lexicon. 

[Chiang Mai]: Payap University, 1994. [without tones = Kayalhi-Kula Nghôchozha] 

Solnit, David B. Eastern Kayah Li: Grammar, Texts, Glossary. Honolulu: University of Hawaiʻi Press, 1997. ISBN 

0-8248-1743-5. 

Kharoshthi 

Glass, Andrew. A Preliminary Study of Kharosthi Manuscript Paleography. 2000. Thesis (M.A.), University of 

Washington, 2000. 


123 

X 0221:2014 (ISO/IEC 10646:2012) 

 

Glass, Andrew. “KharoDEhG Manuscripts: A Window on GandhFran Buddhism.” Nagoya Studies in Indian 

Culture and Buddhism, 24 (2004): 129‒152. ISSN 0285-7154. 

Salomon, Richard. Ancient Buddhist Scrolls from GandhZra: The British Library Kharosthi Fragments. Seattle: 

University of Washington Press; London: British Library, 1999. ISBN 029597768X; 0295977698 (pbk). 

Latin 

ISO/IEC 646:1991, Information technology−ISO 7-bit coded character set for information interchange. 

ISO 5426:1983, Extension of the Latin alphabet coded character set for bibliographic information interchange. 

ISO 6438:1983, Documentation−African coded character set for bibliographic information interchange. 

ISO 6937:1994, Information technology−Coded graphic character set for text communication−Latin alphabet. 

ISO/IEC 8859, Information technology−8-bit single-byte coded graphic character sets 

Part 1: Latin alphabet No. 1 (1998). 

Part 2: Latin alphabet No. 2 (1999). 

Part 3: Latin alphabet No. 3 (1999). 

Part 4: Latin alphabet No. 4 (1998). 

Part 9: Latin alphabet No. 5 (1999) 

Part 10: Latin alphabet No. 6 (1998). 

ISO/IEC 10367:1991, Information technology−Standardized coded graphic character sets for use in 8-bit codes. 

ANSI X3.4-1986 American National Standards Institute. Coded character set−7-bit American national standard 

code. 

ANSI Z39.47-1985 American National Standards Institute. Extended Latin alphabet coded character set for 

bibliographic use. 

LVS 18-92 Latvian National Centre for Standardization and Metrology Libiesu kodu tabula ar 191 simbolu. 

Kuruch, Rimma Dmitrievna. Saamsko-russkiy slovar'. Moskva: Russkiy iazyk. 1985 

Lepcha 

Mainwaring, G. B. A Grammar of the Rong (Lepcha) Language as it Exists in the Dorjeling and Sikim Hills. 

Delhi: Daya Publishing House, 1985 (1876). 

Plaisier, H. “A Brief Introduction to Lepcha Orthography and Literature.” Bulletin of Tibetology 41:1 (2005), 

7‒24. 

Plaisier H. A Grammar of Lepcha. Leiden: Brill, 2007. (Brillʼs Tibetan Studies Library, Languages of the Greater 

Himalayan Region 5). 

Limbu 

Bairagi Kaila, ed. Limbu-Nepali-Angreji śabdakoś. [Limbu-Nepali-English Dictionary.] Kathmandu: Royal Nepal 


124 

X 0221:2014 (ISO/IEC 10646:2012) 

  

Academy, [in press.] 

Cemjonga, Imana Simha. Yakthun-Pene-Mikphula Pancheka. = Limbu-Nepali-Angareji śabdakoś. = 

Limbu-Nepali-English Dictionary. [Lekhaka] Imanasimha Cemajon. [Kathamandu]: Nepala Ekedemi [2018 vi., i.e., 
1962] 

Driem, George van. A Grammar of Limbu. Berlin, New York: Mouton de Gruyter, 1987. (Mouton grammar library, 

4.) ISBN 0-89925-345-8. Appendix: Anthology of Kiranti scripts, pp. 550‒558. 

Shafer, Robert. Introduction to Sino-Tibetan. Wiesbaden: Harrassowitz, 1966‒1974. 

Sprigg, R. K. “Limbu Books in the Kiranti Script.” In International Congress of Orientalists (24th: 1957: Munich). 

Akten des Vierundzwanzigsten Internationalen Orientalisten-Kongresses München 28. August bis 4. September 1957, 
hrsg. von Herbert Franke. Wiesbaden: Deutsche Morgenländische Gesellschaft, in Kommission bei Franz Steiner 
Verlag, 1959. 

Sprigg, R. K. [Review of van Driem (1987)]. Bulletin of the School of Oriental and African Studies, University of 

London, 52 (1989):1.163‒165. 

Subba, B. B. Limbu, Nepali, English Dictionary. Gangtok: Text Book Unit, Directorate of Education, Govt. of 

Sikkim, 1979 [i.e. 1980]. Cover title: Yakthun-Pene-Mikphula-panchekva. 

Subba, B. B. Yakthuŋ hu

siŋlam (“Limbu self-teaching method”) = Limbu ak

ar gāi

 (“Limbu letter guide”). 

Gangtok: Kwality Stores, 1991? 

Yo hā , Khel Rāj. Limbū Nepālī śabdakoś. [Lalitpur]: 2052 B.S. [i.e. 1995]. 

Linear B and Cypriot 

Bennett, Emmett L. “Aegean Scripts.” In The Worldʼs Writing Systems, edited by Peter T. Daniels and William 

Bright. New York: Oxford University Press, 1996. ISBN 0-19-507993-0. 

Chadwick, John. The Decipherment of Linear B. 2nd ed. London: Cambridge University Press., 1967 [i.e. 1968]. 

Chadwick, John. Linear B and Related Scripts. Berkeley: University of California Press; [London]: British 

Museum, 1987. (Reading the Past, v. 1.) ISBN 0-520-06019-9. 

Hooker, J. T. Linear B: An Introduction. Bristol: Bristol Classical Press, 1980. ISBN 0-906515-69-6. Cor-rected 

printing published 1983. ISBN 0-906515-69-6; 0-906515-62-9 (pbk.). 

International Colloquium on Mycenaean Studies (3rd: 1961: Racine, WI). Mycenaean Studies: Proceedings of the 

Third International Colloquium for Mycenaean Studies held at “Wingspread,” 4‒8 September 1961, edited by 
Emmett L. Bennett, Jr. Madison: University of Wisconsin Press, 1964. 

Masson, Olivier. Les Inscriptions chypriotes syllabiques: recueil critique et commenté. Réimpr. augm. Paris: E. de 

Boccard, 1983. 

Sampson, Geoffrey. Writing Systems: A Linguistic Introduction. Stanford, CA: Stanford University Press, 1985. 

ISBN 0-8047-1254-9. Also published: London, Hutchinson. ISBN 0-09-156980-X; 0-09-173051-1 (pbk.). 

Ventris, Michael. Documents in Mycenaean Greek. 1st ed. by Michael Ventris and John Chadwick with a foreword 

by Alan J. B. Wace. 2nd ed. by John Chadwick. Cambridge: Cambridge University Press, 1973. ISBN 
0-521-08558-6. 

Lisu 

Bya, Yuliya. Li-su Tho Uh Ba Pa Pha Tso So Du (Lisu Alphabet Primer). Chiang Mai: Christian Literature 

Fellowship, 2000. 

Xu, Lin, Yuzhang Mu, and Xingzhi Gai, eds. Lisuyu Jianzhi (A Sketch of the Lisu Language). Beijing: The Ethnic 


125 

X 0221:2014 (ISO/IEC 10646:2012) 

 

Publishing House, 1986. (Chinese Minority Language Sketch Series.) 

Yunnan Minority Language Commission, and Weixi Culture and Education Bureau, eds. Li-su Tho Uh Tso So Du 

(Lisu Primer). Kunming: Yunnan Nationality Publishing House, 1981. 

Zhu, Faqing. Li-su Be Xuh Ngo Bae Khuh Tae Du Ra (Small Lisu-Chinese Dictionary). Dehong: Dehong 

Nationality Publishing House, 1984. 

Lycian 

Carruba, O. “La scrittura licia.” Annali della scuola normale superiore di Pisa, classe di letter e filosofia. 3rd series. 

8 (1978):849‒867. 

Melchert, H. Craig. “Lycian.” In The Cambridge Encyclopedia of the Worldʼs Ancient Languages, edited by Roger 

Woodard, 591‒600. Cambridge: Cambridge University Press, 2004. ISBN-13: 978-0521562560. 

Lydian 

Gérard, Raphaël. Phonétique et morphologie de la langue lydienne. Louvain-la-Neuve: Peeters, 2005. 

Gusmani, Roberto. Lydisches Wörterbuch mit grammatischer Skizze und Inschriftensammlung. Heidelberg: Carl 

Winter, 1964. 

Melchert, H. Craig. “Lydian.” In The Cambridge Encyclopedia of the Worldʼs Ancient Languages, edited by Roger 

Woodard, 601‒608. Cambridge: Cambridge University Press, 2004. ISBN-13: 978-0521562560. 

Mandaic 

Daniels, “Aramaic Scripts for Aramaic Languages,” in Daniels & Bright, eds., The Worldʼs Writing Systems, 

Oxford University Press, 1996, pp. 511-513 “Mandaic.” 

Häberl, “Iranian Scripts for Aramaic Languages: The Origin of the Mandaic Script,” Bulletin of the American 

Schools of Oriental Research, No. 341 (Feb., 2006), pp. 53-62. 

Coulmas, The Blackwell Encyclopedia of Writing Systems, Blackwell 1999, p. 320 “Mandean script.” 

Mathematical Symbols 

ISO 6862, Information and documentation−Mathematical coded character set for bibliographic information 

interchange. 

ANSI Y10.20-1988 American National Standards Institute. Mathematic signs and symbols for use in physical 

sciences and technology. 

Mathematical Markup Language (MathML) Version 2.0. (W3C Recommendation 21 February 2001). Editors: 

David Carlisle, Patrick Ion, Robert Miner, [and] Nico Poppolier. Latest version: http://www.w3.org/TR/MathML2/ 

Selby, Samuel M. Standard mathematical tables. ‒ 16th ed. ‒ Cleveland, OH : Chemical Rubber Co., 1968. 

Shepherd, Walter. 

STIPub Consortium. STIX (Scientific and Technical Information Exchange) Project. http://www.ams.org/STIX/ 

Swanson, Ellen. Mathematics into Type. Updated ed. by Arlene OʼSean and Antoinette Schleyer. Providence, RI: 

American Mathematical Society, 1999. ISBN 0-8218-1961-5. 

Meetei Mayek 

Chelliah, Shobhana L. A Grammar of Meithei. Berlin and New York: Mouton de Gruyter, 1997. ISBN 

978-3-11-014321-8. 


126 

X 0221:2014 (ISO/IEC 10646:2012) 

  

Debendra Singh, N. Evolution of Manipuri Script. [Imphal]: Manipur University, Centre for Manipuri Studies, 

1990. (Research Report, 5). 

Musical Symbols 

ELOT 1373. The Greek Byzantine Musical Notation System. Athens, 1997 (ΣΕΠ ΕΛΟΤ 1373: 1997). 

Catholic Church. Graduale Sacrosanctae Romanae Ecclesiae de Tempore et de Sanctis SS. D. N. Pii X. Pontificis 

Maximi. Parisiis: Desclée, 1961. (Graduale Romanum, no. 696.) 

Gazimihal, Mahmut R. Anadolu türküleri ve mûsikî istikbâlimiz [by] Mahmut Ragip. [Istanbul]: Mârifet Matbaasi, 

1928. 

Heussenstamm, George. Norton Manual of Music Notation. New York: W.W. Norton, 1987. ISBN 0-393-95526-5 

(pbk.). 

Kennedy, Michael. Oxford Dictionary of Music. Oxford, New York: Oxford University Press, 1985. ISBN 

0-19-311333-3. Second ed. published 1994. ISBN 0-19-869162-9. 

New Encyclopedia Britannica. 15th ed. Entry for “Music.” 

The New Harvard Dictionary of Music, edited by Don Michael Randel. Cambridge, MA: Belknap Press of 

Harvard University Press, 1986. ISBN 0-674-61525-5. 

Ottman, Robert W. Elementary Harmony: Theory and Practice. 2nd ed. Englewood Cliffs, NJ: Prentice-Hall, 1970. 

ISBN 0-13-257451-9. Fifth ed. published 1998. ISBN 0-13-281610-5. 

Rastall, Richard. The Notation of Western Music: An Introduction. London: Dent, 1983. ISBN 0-460-04205-X. 

Also published: New York: St. Martinʼs Press, 1982. ISBN 0-312-57963-2. 

Read, Gardner. Music Notation: A Manual of Modern Practice. Boston: Allyn and Bacon, 1964. 

Stone, Kurt. Music Notation in the Twentieth Century: A Practical Guidebook. New York: W.W. Norton, 1980. 

ISBN 0-393-95053-0. 

Understanding Music with AI: Perspectives on Music Cognition, edited by Mira Balaban, Kemal Ebcioglu, and 

Otto Laske. Cambridge, MA: MIT Press; Menlo Park, CA: AAAI Press, 1992. ISBN 0-262-52170-9. 

Myanmar 

Mranmā‒A

glip abhidhān = Myanmar‒English Dictionary. Rankun: Dept. of Myanmar Language Commission, 

Ministry of Education, Union of Myanmar, 1993. Compiled and edited by the Myanmar Language Commission. 

Mranmā cālui:po

g:satpui kyam: nha

. khwaithā:. [Rankun]: 1996. Translated title: Myanmar orthography 

treatise. 

Okell, John. 1971. A guide to the romanization of Burmese. (James G. Forlang Fund; 27) London: Royal Asiatic 

Society of Great Britain and Ireland. 

Roop, D. Haigh. An Introduction to the Burmese Writing System. [Honolulu]: Center for Southeast Asian Studies, 

University of Hawaii at Manoa, 1997. (Southeast Asia Paper, 11). Originally published: New Haven: Yale University 
Press, 1972. (Yale linguistic series). ISBN 0-300-01528-3. 

N'Ko 

Kanté, Souleymane. Méthode pratique dʼécriture nʼko, 1961. Kankan, Guinea: Association de traditherapeutes et 

pharmacologues, 1995. 

NʼKo: The Common Language of Mandens. www.nkoinstitute.com 


127 

X 0221:2014 (ISO/IEC 10646:2012) 

 

NʼKo: The Mandingo Language Site. www.kanjamadi.com 

Ogham 

I. S. 434:1999, Information Technology−8-bit single-byte graphic coded character set for Ogham = 

Teicneolaíocht Eolais−Tacar carachtar grafach Oghaim códaithe go haonbheartach le 8 ngiotán. National Standards 
Authority of Ireland. 

McManus, Damian. A Guide to Ogam. Maynooth: An Sagart, 1991. (Maynooth monographs, 4). ISBN 

1-87068-417-6. 

Ol Chiki 

Hembram, S. M., et al. Adibasi Ol script = atʼipʼasi al ciki. Calcutta: Adibasi Socio-Educational & Cultural 

Association, 1972. 

Murmu, Raghunath. Rana

: A Santali Grammar in Santali. Singhbhum, Bihar: Adibasi Socio-Educational & 

Cultural Association, 1972. 

Zide, Norman. “Scripts for Munda languages.” In The Worldʼs Writing Systems, edited by Peter T. Daniels and 

William Bright. New York; Oxford: Oxford University Press, 1996. ISBN 0-19-507993-0. 

Old Italic 

Bonfante, Larissa. “The Scripts of Italy.” In The Worldʼs Writing Systems, edited by Peter T. Daniels and William 

Bright. New York: Oxford University Press, 1996. ISBN 0-19-507993-0. 

Cristofani, Mauro. “Lʼalfabeto etrusco.” In Lingue e dialetti dellʼItalia antica, a cura di Aldo Larosdocimi. Roma: 

Biblioteca di storia patria, a cura dellʼ Ente per la diffusione e lʼeducazione storia, 1978. (Popoli e civiltà dellʼItalia 
antica, VI.) 

Gordon, Arthur E. Illustrated Introduction to Latin Epigraphy. Berkeley: University of California Press, 1983. 

ISBN 0-520-03898-3. 

Marinetti, Anna. Le iscrizione sudpicene. I. Testi. Firenze: Olschki, 1985. ISBN 88-222-3331-X (v. 1). 

Parlangèli, Oronzo. Studi Messapici. Milano: Istituto lombardo di scienze e lettere, 1960. 

Old Persian 

Schmitt, Rüdiger. The Bisitun Inscriptions of Darius the Great, Old Persian Text. London, School of Oriental and 

African Studies, 1991 (Corpus Inscriptionum Iranicarum, Part I: Inscriptions of ancient Iran, v.1, Text 1). ISBN 
0-7286-0181-8. 

Schweiger, Günter. Kritische Neuedition der achaemenidischen Keilinschriften. Taimering: Schweiger 

VWT-Verlag, 1998. (Studien zur Iranistik). ISBN 3-934548-00-8. 

Old South Arabian 

Nebes, Norbert, and Peter Stein. “Ancient South Arabian.” In The Cambridge Encyclopedia of the Worldʼs 

Ancient Languages, edited by Roger D. Woodard. 454‒487. Cambridge University Press, 2004. ISBN-13: 
978-0521562560. 

Ryckmans, J. “Origin and Evolution of South Arabian Minuscule Writing on Wood (1).” Arabian Archaeology and 

Epigraphy 12 (2001): 223‒235. ISSN 0905-7196. 

Smithsonian Institution. “Written in Stone: Inscriptions from the National Museum of Saudi Arabic.” 

http://www.mnh.si.edu/epigraphy/figs-stones/x-large/color̲xl̲jpeg/fig02.jpg 


128 

X 0221:2014 (ISO/IEC 10646:2012) 

  

Stein, Peter. “The Ancient South Arabian Minuscule Inscriptions on Wood: A New Genre of Pre-Islamic 

Epigraphy.” Jaarbericht van het Vooraziatisch-Egyptisch Genootschap “Ex Oriente Lux”, 39 (2005): 181‒199. ISSN 
0075-2118. 

Old Turkic 

Erdal, Marcel. A Grammar of Old Turkic. Leiden & Boston: Brill, 2004. ISBN 9004102949. 

Scharlipp, Wolfgang Ekkehard. Eski Türk run yazitlarina giri!: ders kitabi = An Introduction to the Old Turkish 

Runic Inscriptions: A Textbook in English and Turkish. Engelschoff: Auf dem Ruffel, 2000. ISBN 3-933847-00-X. 

von Gabain, A. Alttürkische Grammatik mit Bibliographie, Lesestücken und Wörterverzeichnis, auch Neutürkisch. 

Leipzig: Harrassowitz, 1941. (Porta Linguarum Orientalium, 23). 

Osmanya 

Afkeenna iyo fartiisa: buug koowaad. Xamar: Goosanka afka iyo suugaanta Soomaalida, 1971. Translated title: 

Our language and its handwriting: book one. 

Cerulli, Enrico. “Tentativo indigeno di formare un alfabeta somalo.” Oriente moderno, 12 (1932): 212‒213. ISSN 

0030-5472. 

Gaur, Albertine. A History of Writing. London: British Library, 1992. ISBN 0-7123-0270-0. Also published: Rev. 

ed. New York: Cross River Press, 1992. ISBN 1-558-59358-6. 

Gregersen, Edgar A. Language in Africa: An Introductory Survey. New York: Gordon and Breach, 1977. (Library 

of Anthropology). ISBN: 0-677-04380-5; 0-677-04385-6 (pbk.). 

Maino, Mario. “Lʼalfabeta ʻOsmaniaʼ in Somalia.” Rassegna di studi etiopici, 10 (1951): 108‒121. ISSN 

0390-3699. 

Nakanishi, Akira. Writing Systems of the World: Alphabets, Syllabaries, Pictograms. Rutland, VT: Tuttle, 1980. 

ISBN 0-8048-1293-4; 0-8048-1654-9 (pbk.). Revised translation of Sekai no moji. 

Phags-pa 

Luo, Changpei. Basibazi yu Yuandai Hanyu [ziliao huibian] / Luo Changpei, Cai Meibiao bian zhu. Beijing: 

Kexue chubanshe, 1959. 

Poppe, Nikolai Nikolaevich. The Mongolian Monuments in hPʼags-pa Script. Translated and edited by John R. 

Krueger. 2nd ed. Wiesbaden: Harrassowitz, 1957. (Göttinger asiatische Forschungen, 8). 

Zhaonasitu. Menggu ziyun jiaoben / Zhaonasitu, Yang Naisi bian zhu. [Beijing]: Min zu chu ban she, 1987. Author 

Zhaonasitu also known as Jagunasutu or Junast. 

Philippines Scripts 

Doctrina Christiana: The First Book Printed in the Philippines, Manila 1593. A facsimile of the copy in the 

Lessing J. Rosenwald Collection, with an introductory essay by Edwin Wolf II. Washington, DC: Library of 
Congress, 1947. 

Kuipers, Joel C., and Ray McDermott. “Insular Southeast Asian Scripts.” In The Worldʼs Writing Systems. Edited 

by Peter T. Daniels and William Bright. New York: Oxford University Press, 1996. ISBN 0-19-507993-0. 

Santos, Hector. The Living Scripts. Los Angeles: Sushi Dog Graphics, 1995. (Ancient Philippine scripts series, 2). 

Userʼs guide accompanying Computer Fonts, Living Scripts software. 

Santos, Hector. Our Living Scripts. January 31, 1997. http://www.bibingka.com/dahon/living/living.htm Part of 

his A Philippine Leaf. 


129 

X 0221:2014 (ISO/IEC 10646:2012) 

 

Santos, Hector. The Tagalog Script. Los Angeles: Sushi Dog Graphics, 1994. (Ancient Philippine scripts series, 1). 

Userʼs guide accompanying Tagalog Script Fonts software. 

Santos, Hector. The Tagalog Script. October 26, 1996. http://www.bibingka.com/dahon/tagalog/tagalog.htm Part 

of his A Philippine Leaf. 

Phoenician 

Branden, Albertus van den. Grammaire phénicienne. Beyrouth: Librairie du Liban, 1969. (Bibliothèque de 

lʼUniversité Saint-Esprit, 2). 

McCarter, P. Kyle. The Antiquity of the Greek Alphabet and the Early Phoenician Scripts. Missoula, MT: 

Published by Scholars Press for Harvard Semitic Museum, 1975. (Harvard Semitic Monographs; 9.) ISBN 
0-89130-066-X. 

Noldeke, Theodor. Beiträge zur semitischen Sprachwissenschaft. Strassburg: Karl J. Trübner, 1904. Reprinted as: 

vol. 1 of Beiträge und Neue Beiträge zur semitischen Sprachwissenschaft: achtzehn Aufsätze und Studien. 
Amsterdam: APA-Philo Press, [1982]. Also published on microfiche by the American Theological Library 
Association. 

Powell, Barry B. Homer and the Origin of the Greek Alphabet. Cambridge, New York: Cambridge University 

Press, 1991. ISBN 0-521-37157-0. Reprinted, 1996. ISBN 0-521-58907-X (pbk). 

Rejang 

Jaspan, M. A. Folk Literature of South Sumatra: Redjang Ka-Ga-Nga Texts. Canberra: Australian National 

University, 1964. 

Runic 

Benneth, Solbritt, Jonas Ferenius, Helmer Gustavson, & Marit Åhlén. 1994. Runmärkt: från brev till klotter. 

Runorna under medeltiden. [Stockholm]: Carlsson Bokförlag. ISBN 91-7798-877-9 

Derolez, René. 1954. Runica manuscripta: the English tradition. (Rijksuniversiteit te Gent: Werken uitgegeven 

door de Faculteit van de Wijsbegeerte en Letteren; 118e aflevering) Brugge: De Tempel. 

Friesen, Otto von. Runorna. Stockholm, A. Bonnier [1933]. (Nordisk kultur, 6). 

Haugen, Einar Ingvald. The Scandinavian Languages: An Introduction to Their History. London: Faber, 1976. 

ISBN 0-571-10423-1. Also published: Cambridge, MA: Harvard University Press, 1976. ISBN 0-674-79002-2. 

Musset, Lucien. Introduction à la runologie. Paris: Aubier-Montaigne, 1965. 

Page, Raymond Ian. Runes. Berkeley: University of California Press; [London]: British Museum, 1987. (Reading 

the Past). ISBN 0-520-06114-4. British Museum Publications edition has ISBN 0-7141-8065-3. 

Samaritan 

Ben-Hayyam, Zeʼev. A Grammar of Samaritan Hebrew, Based on the Recitation of the Law in Comparison with 

the Tiberian and other Jewish Traditions. Jerusalem: Hebrew University Magnes Press, 2000. ISBN 1-57506-047-7. 

Macuch, Rudolf. Grammatik des samaritanischan Hebräisch. Berlin: Walter de Gruyter, 1969. ISBN 

9783110083767. 

Murtonen, A. Materials for a Non-Masoretic Hebrew Grammar III: A Grammar of the Samaritan Dialect of 

Hebrew. Helsinki: Societas Orientalis Fennica, 1964. (Studia Orientalia, 29). 

Saurashtra 


130 

X 0221:2014 (ISO/IEC 10646:2012) 

  

Norihiko Učida. Language of the Saurashtrans in Tirupati. 2nd revised ed. Bangalore: Mahalaxmi Enterprises, 

1991. (In Latin script.) 

Norihiko Učida. Saurashtra-English Dictionary. Wiesbaden: Harrassowitz, 1990. ISBN 3447030550. (In Latin 

script.) 

Shavian 

ConScript Unicode Registry [by] John Cowan and Michael Everson. “E700‒E72F Shavian.” Included in the 

ConScript Registry (http://www.evertype.com/standards/csur/index.html) in 1997. Shavian was withdrawn from the 
ConScript Registry in 2001, because of its addition to the Unicode Standard and ISO/IEC 10646. 

Crystal, David. The Cambridge Encyclopedia of Language. Cambridge, New York: Cambridge University Press, 

1987. ISBN 0-521-26438-3. 2nd ed. Cambridge, New York: Cambridge University Press, 1997. ISBN 
0-521-55050-5; 0-521-55967-7. 

DeMeyere, Ross. About Shavian. 1997. http://www.demeyere.com/Shavian/info.html. 

Shaw, George Bernard. Androcles and the Lion: An Old Fable Renovated, by Bernard Shaw, with a Parallel Text 

in Shawʼs Alphabet to Be Read in Conjunction Showing Its Economies in Writing and Reading. Harmondsworth: 
Penguin Books, 1962. 

Sinhala 

SLS 1134:1996 Sri Lanka Standards Institution Sinhala character code for information interchange. 

Gunasekara, Abraham Mendis. A comprehensive grammar of the Sinhalese language. New Delhi: Asian 

Educational Services, 1986(Reprint of 1891 edition). 

Sundanese 

Baidillah, Idin, Cucu Komara, and Deuis Fitni. Ngalagena: Panglengkep Pangajaran Aksara Sunda pikeun Murid 

Sakola Dasar/Dikdas 9 Taun. [Bandung]: CV Walatra, [2002]. 

Hardjasaputra, A. Sobana, Tedi Permadi, Undang A. Darsa, and Edi S. Ekadjati. Rancangan Pembakuan Aksara 

Sunda. Bandung, 1998. 

Symbols (Miscellaneous) 

ISO 2033:1983, Information processing−Coding of machine readable characters (MICR and OCR). 

ISO 2047:1975, Information processing−Graphical representations for the control characters of the 7-bit coded 

character set. 

ISO/IEC 9995-7:1994, Information technology ‒ Keyboard layouts for text and office systems ‒ Part 7: Symbols 

used to represent functions. 

ANSI X3.32-1973 American National Standards Institute. American national standard graphic representation of 

the control characters of American national standard code for information interchange. 

ANSI Y14.5M-1982 American National Standard. Engineering drawings and related document practices, 

dimensioning and tolerances. 

Syriac 

Kefarnissy, Paul. Grammaire de la langue araméenne syriaque. Beyrouth, 1962. 

Nöldeke, Theodor. Compendious Syriac Grammar. With a table of characters by Julius Euting. Translated from the 

2nd and improved German ed., by James A. Crichton. London: Williams & Norgate, 1904. Reprinted: Tel Aviv: Zion 


131 

X 0221:2014 (ISO/IEC 10646:2012) 

 

Pub. Co. [1970]. 

Robinson, Theodore Henry. Paradigms and Exercises in Syriac Grammar. 4th ed. Rev. by L. H. Brockington. 

Oxford: Clarendon Press; New York: Oxford University Press, 1962. ISBN 0-19-815416-X, 0-19-815458-5 (pbk.). 

Tai Le 

Coulmas, Florian. The Blackwell Encyclopedia of Writing Systems. Oxford, Cambridge: Blackwell, 1996. ISBN 

0-631-19446-0. Dehong writing, pp. 118‒119. 

Lá ai2 maɯ3 lá ai2 ka va3 mi2 tse2 laɯ ya pa me na4 ka na: tá va ʔá na kó ma6 sá na2 teh ma6. Yina5lána5 mina5su4 

su4pána2se3 (Yunnan minzu chubanshe). 1988. ISBN 7-5367-1100-4. 

Tsa va4 má3 hó va3: la ta6 mé2 sá ai3 seh va2 xo ŋa3. Yina5lána5 mina5su4 su4pána2se3 (Yunnan minzu chubanshe). 

1997. ISBN 7-5367-1455-6. 

Tai Tham 

Peltier, Anatole-Roger. 1996. Lanna Reader. Chiang Mai: Wat Tha Kradas. 

Kasēm Siriratphiriya, and Mahāwitthayālai Sukhōthaithammāthirāt. Tūa Mueang: kānrīan phāsā Lānnā phān 

khrōngsāng kham. Nonthaburī: Rōngphim Mahāwitthayālai Sukhōthaithammāthirāt, 2548 [2005]. ISBN 
974-9942-00-0. 

Rungrueangsri, Udom. 2004. Pacanānukrom Lānnā-Thai: Chabaph maefāhluang. ISBN 974-685-175-9. 

Baephryar phāsā Lānnā. ISBN 974-386-044-4. 

Thaana 

Geiger, Wilhelm. Maldivian Linguistic Studies. New Delhi: Asian Educational Services, 1996. ISBN 

81-206-1201-9. Originally published: Colombo: H. C. Cottle, Govt. Printer, 1919. 

Maniku, Hassan Ahmed. Say It in Maldivian (Dhivehi), [by] H. A. Maniku [and] J. B. Disanayaka. Colombo: 

Lake House Investments, 1990. 

Tibetan 

Beyer, Stephen V. The classical Tibetan language. State University of New York. ISBN 0-7914-1099-4 

Ugaritic 

OʼConnor, M. “Epigraphic Semitic Scripts.” In The Worldʼs Writing Systems, edited by Peter T. Daniels and 

William Bright. New York: Oxford University Press, 1996. ISBN 0-19-507993-0. 

Walker, C. B. F. Cuneiform. London: British Museum Press, 1987. (Reading the Past, v. 3.) ISBN 0-7141-8059-9. 

University of California Press edition has ISBN 0-520-06115-2 (pbk.). 

Thai 

TIS 620-2533 Thai Industrial Standard for Thai Character Code for Computer. (1990) 

Vai 

Dalby, David. “A Survey of the Indigenous Scripts of Liberia and Sierra Leone: Vai, Mende, Loma, Kpelle and 

Bassa.” African Language Studies 8 (1967):1-51. 

Kandakai, Zuke, et al. Vai kpolo saikilamaa mɛ = The Standard Vai Script. Monrovia: University of Liberia 


132 

X 0221:2014 (ISO/IEC 10646:2012) 

  

African Studies Program, 1962. 

Massaquoi, Momolu. “The Vai People and Their Syllabic Writing.” Journal of the Royal African Society 10.40, 

July (1911), 459-466. 

Singler, John. “Scripts of West Africa.” In The Worldʼs Writing Systems, edited by Peter T. Daniels and William 

Bright. New York: Oxford University Press, 1996. ISBN 0-19-507993-0. 

Stewart, Gail, and P. E. H. Hair. “A Bibliography of the Vai Language and Script.” Journal of West African 

Languages 6.2 (1969), 124. 

Yi 

GB13134: Xinxi jiaohuanyong yiwen bianma zifuji (Yi coded character set for information interchange), 

[prepared by] Sichuansheng minzushiwu weiyuanhui. Beijing, Jishu Biaozhun Chubanshe (Technical Standards 
Press), 1991. (GB 13134-1991). 

Nuo-su bbur-ma shep jie zzit. = Yi wen jian zi ben. Chengdu: Sichuan minzu chubanshe, 1984. 

Nip huo bbur-ma ssix jie. = Yi Han zidian. Chengdu: Sichuan minzu chubanshe, 1990. ISBN 7-5409-0128-4. 


133 

X 0221:2014 (ISO/IEC 10646:2012) 

 

附属書N 
(参考) 

文字レパートリに対する外部参照 

 

N.1 文字レパートリ及びその符号化の参照方法 

プログラム言語及びそれ以外のデータオブジェクトの構文を定義する方法では,通常,この規格で規定

するものの中から特定の文字レパートリを宣言することが必要になる。さらに,このレパートリに適用可

能な符号化表現のうち対応する符号化表現を宣言する必要がある場合もある。 

この規格に従った文字レパートリに対しては,そのレパートリの厳密な宣言の中に次のパラメタを含め

るのがよい。 

− この規格の識別 

− レパートリの採用した部分集合,一つ以上の組番号で識別されるもの 

− 符号単位列の内容の定義 

− 採用した符号化形式(UTF-8,UTF-16又はUTF-32) 

データオブジェクトの構文定義に現在一般的に使われている方法の一つが,JIS X 5605群[情報技術− 

抽象構文記法1(ASN.1)仕様](対応国際規格:ISO/IEC 8824群)に規定された抽象構文記法1(ASN.1)

である。これに対応する符号化表現は,JIS X 5606群(情報技術−ASN.1符号化規則)(対応国際規格:

ISO/IEC 8825群)に規定されている。この方法を使う場合の文字レパートリ及び符号化を参照する形式を,

次に示す。 

 

N.2 ASN.1文字抽象構文の識別 

この規格に従って識別されたレパートリの文字で構成される全ての文字列の集合は,JIS X 5605群の用

語では,“文字抽象構文”として定義される。個々の文字抽象構文に対して,ASN.1を使ったときにその構

文を参照できるように,対応するオブジェクト識別子の値が定義される。 

JIS X 5605-1の附属書B(オブジェクト識別子構成要素値のISOによる割当て)に,ISOの規格で規定

されたオブジェクトに対するオブジェクト識別子値の形式が規定されている。この識別子では,この規格

の機能及び任意選択機能を識別するために,弧“10646”及び弧“0”に数字(弧)を続ける方法を用いる。 

注記1 弧“0”は,ISO/IEC 10646-1及びISO/IEC 10646-2を識別するために過去に使われた弧“1”

及び弧“2”を埋め合わせるために用いる。弧“1”及び弧“2”を用いてはならない。 

この“0”に続く最初の弧は,符号単位列の内容の定義を識別し,level-3 (3)(実装水準3)として参照さ

れる。 

注記2 この規格では,符号単位列の内容に対してただ一つの定義を与える。その定義は,この規格

の以前の版で実装水準3と呼ばれていたものである。 

その次に続く弧は,次のレパートリの部分集合のいずれかを識別する。 

− all (0) 

全ての組 

− collections (1) 指定した組 

弧 (0) は,この規格で規定した文字の全てからなる組を識別する。この弧に続く弧は,ない。 

注記3 この組は,私用群及び私用面も含む。したがって,完全には定義できない。その使用につい

ては,事前の合意が必要である。 


134 

X 0221:2014 (ISO/IEC 10646:2012) 

  

弧 (1) には一つの弧又は弧の列が続く。それぞれの弧は,附属書Aの組番号とし,昇順に並べる。この

列は,その列に現れる組番号の複数の組からなる部分集合を識別する。 

注記4 例として,組BASIC LATIN,組LATIN-1 SUPPLEMENT及び組MATHEMATICAL OPERATORS

からなる部分集合のオブジェクト識別子を,次に示す。 

{iso standard 10646 (0) level-3 (3) collections (1) 1 2 39} 

さらに,JIS X 5605-1は,オブジェクト識別子値に対応するオブジェクト記述子を規定している。制約

されないレパートリに対して,対応するオブジェクト記述子は,次のとおりとする。 

3 0 : "ISO 10646 level-3 unrestricted" 

組の名前“xxx”をもつ単一の組に対しては,次のとおりとする。 

3 1 : "ISO 10646 level-3 xxx" 

m1,m2,…の組番号をもつ一つ以上の組からなるレパートリに対しては,次のとおりとする。 

3 1 : "ISO 10646 level-3 collections m1, m2, m3, .. " 

注記5 スペースは,全て1個のスペース(single space)である。 

 

N.3 ASN.1文字転送構文の識別 

この規格に従った文字からなる文字列の符号化方法は,JIS X 5605群の用語では,“文字転送構文”とし

て定義される。個々の文字転送構文に対して,ASN.1を使ったときにその構文を参照できるように,対応

するオブジェクト識別子の値が定義される。 

JIS X 5605-1の附属書B(オブジェクト識別子構成要素値のISOによる割当て)に従ったオブジェクト

識別子では,この国際規格で規定する符号化表現を識別するために,弧“10646”及び弧“0”に数字(弧)

を続ける方法を用いる。 

この“0”に続く最初の弧は,次のとおりとする。 

− transfer-syntaxes (0) 

転送構文 

その次に続く弧は,符号化形式を識別し,次のいずれかとする。 

− four-octet-form (4) 

UTF-32符号化形式 

− utf16-form (5)  

UTF-16符号化形式 

− utf8-form (8)  

UTF-8符号化形式 

注記1 UTF-32符号化形式のオブジェクト識別子の例を,次に示す。 

{iso standard 10646 (0) transfer-syntaxes (0) four-octet-form (4)} 

次のオブジェクト識別子は,有効な形式であるが,現在は,使用を禁止する。 

{iso standard 10646 (1) transfer-syntaxes (0) four-octet-form (4)} 

注記2 この規格の以前の版ではtwo-octet-BMP-form (2)を規定していたが,現在は,使用を禁止する。 

対応するオブジェクト記述子は,次のとおりとする。 

− "ISO 10646 form 4" 

− "ISO 10646 utf-16" 

− "ISO 10646 utf-8" 

注記3 この規格の以前の版ではオブジェクト識別子"ISO 10646 form 2"を規定していたが,現在は,

使用を禁止する。 


135 

X 0221:2014 (ISO/IEC 10646:2012) 

 

附属書P 

(参考) 

CJK統合漢字に関する追加情報 

 

この附属書は,CJK統合漢字に関する追加情報を示す。 

注記 この規格の以前の版では,この附属書に全ての文字に対する追加情報を記述していた。この規

格においては,そうした情報のほとんどは,符号表に含まれている。CJK統合漢字の符号表は,

名前の一覧を含まないため,それらの文字の情報は,この附属書に残してある。 

この附属書の各項目は,符号位置の後に文字の名前を記載したものを並べ,その次に関連する追加情報

を続ける。項目は,符号位置の昇順に並べている。 

 

9FB9 CJK UNIFIED IDEOGRAPH-9FB9 

9FBA CJK UNIFIED IDEOGRAPH-9FBA 

9FBB CJK UNIFIED IDEOGRAPH-9FBB 

これらの三つの文字は,漢字の特定の位置の構成要素を表すために用いることを意図している。これら

の文字と同じ構造の漢字だが特定の位置に用いる意図ではないものを,それぞれ20509,2099D及び470C

に符号化している。 

 


136 

X 0221:2014 (ISO/IEC 10646:2012) 

  

附属書Q 
(参考) 

ハングル音節文字の符号対応表 

 

注記 この規格の以前の版では,この附属書は,JIS X 0221:1995が規定していたハングル音節文字(及

び符号位置)と,その後変更した符号位置(この規格が規定する符号位置と同一)との対応表

を示していた。 

 


137 

X 0221:2014 (ISO/IEC 10646:2012) 

 

附属書R 
(参考) 

ハングル音節文字の名前 

 

この附属書では,ハングル音節文字の名前及び追加情報を添付ファイルによって示す。 

添付ファイルは,テキストファイルであり,ISO/IEC 646のIRVの文字及び行末を表すLINE FEEDを

使用する。ファイルの先頭の5行は,ヘッダであり,その後に全てのハングル音節文字を続ける。行は,

次に示す形式である。 

− 第1〜4オクテットは,符号位置を16進数によって示す。 

− 第5オクテットは,SPACE(スペース)とする。 

− 第6オクテットから行の終わりまでは,ハングル音節文字の名前を括弧に囲んだ注記とともに示す。 

ハングル音節文字の名前は,添付ファイル“HangulSy.txt”による。 

注記 (対応国際規格の注記は,この規格では該当しないため不採用とした。) 

 


138 

X 0221:2014 (ISO/IEC 10646:2012) 

  

附属書S 

(参考) 

漢字の統合及び配列の手順 

 

この規格のCJK統合漢字の図形文字の組は,箇条31で規定する。これらは,広範な国家規格及び団体

規格の符号化文字集合(原典という。)に収容された多数の漢字を基にしている。 

この附属書は,この規格の漢字が,どのような統合手順を適用して,原典から引き出されたかを記述し

ている。また,この規格の漢字が,どのように一連の符号位置に配列されるかをも記述している。 

CJK統合漢字の原典参照は,箇条23に示す。 

この規格では,統合手順を,原典グループの符号から取り出した漢字に対して適用する。この手順では,

二つ以上の原典グループから取り出した単一の漢字を関連付け,この規格で単一の符号位置を割り当てる。

関連付けは,次の手順によって行う。ここでは,漢字をこのように関連付けることを,“統合(unified)”

という。 

注記 この統合手順は,次の漢字のような文字の組には適用しない。 

− CJK RADICALS SUPPLEMENT(2E80〜2EFF) 

− KANGXI RADICALS(2F00〜2FDF) 

− CJK COMPATIBILITY IDEOGRAPHS(F900〜FAFF。ただし,FA0E,FA0F,FA11,FA13,

FA14,FA1F,FA21,FA23,FA24及びFA27〜FA29を除く。) 

− CJK COMPATIBILITY IDEOGRAPHS SUPPLEMENT(2F800〜2FA1F) 

 

S.1 

統合手順 

S.1.1 

統合の範囲 

歴史的由来から関連しないとみなされる漢字[非同系文字(non-cognate character)]は,統合しない。 

例 

 

注記 上の例の二つの漢字の形の違いは,下部横線の長さである。これは,本来の字形の違いと考え

られる。さらに,これらの漢字は,異なる意味をもつ。最初の漢字の意味は,“兵士”であり,

2番目の漢字の意味は,“土又は土地”である。 

異なる原典から取り出した漢字の関連付けは,次の分類システムに従って,字形が十分に似ているとき

に行う。 

S.1.2 

2階層分類 

分類の2階層システムを用いて,抽象字形の相違と,特定の書体で定まる実字形の相違とを,区別する。

ある漢字の異体字のうち,統合できないものは,抽象字形の相違として識別する。 

S.1.3 

手順 

二つの漢字が,同一の抽象字形をもつのか,異なる抽象字形をもつのかを決定するために,統合手順を

用いる。統合手順は,次の順序で示す二つの段階で適用する。 

a) 部分字形(component)の構造の把握。 

b) 部分字形の特徴の抽出。 


139 

X 0221:2014 (ISO/IEC 10646:2012) 

 

S.1.3.1 

部分字形の構造の把握 

手順の第1段階では,各漢字の部分字形の構造を考察する。漢字の部分字形は,点画の幾何学的な組合

せである。同じ部分字形の集まりから,別の漢字が構成されることがある。複数の部分字形を組み合わせ

ることで,入り組んだ構造の新たな部分字形を作ることができる。このことから,一つの漢字は,部分字

形の木構造として捉えられる。ここで,最上位の節点は,その漢字そのものであり,最下位の節点は,点

画である。これを図S.1に示す。 

 

 

図S.1−部分字形の構造 

 

S.1.3.2 

部分字形及び特徴抽出 

手順の第2段階では,図S.2に示すように,二つの漢字の対応する節点に位置付けられた部分字形を最

上位から比較する。 

 

 

図S.2−部分字形の最も顕著な節点 

 

比較する漢字の,次の特徴を考察する。 

a) 部分字形の数。 

b) 漢字の全体の中での,部分字形の配置位置。 

c) 対応する部分字形の構造。 

比較される漢字について,上記のa)〜c)のうち一つ以上の特徴が異なれば,それらの漢字は,抽象字形

の相違とみなし,統合しない。 

漢字の,a)〜c)の全ての特徴が同じならば,それらの漢字は,同じ抽象字形をもつとみなし,統合する。 

S.1.4 

抽象字形相違の例 

S.1.3.2のa)〜c)から導出される規則を説明するため,抽象字形の相違によって非統合となる漢字の代表

的な例をS.1.4.1〜S.1.4.3に示す。 

S.1.4.1 

部分字形の数の相違 

次の例は,S.1.3.2のa)の規則を説明する。それぞれの対の二つの漢字は,異なる数の部分字形をもつ。 

 

 

 

S.1.4.2 

部分字形の配置位置の相違 

次の例は,S.1.3.2のb)の規則を説明する。それぞれの対の二つの漢字は,同じ数の部分字形をもつが,

部分字形の配置位置が異なる。 


140 

X 0221:2014 (ISO/IEC 10646:2012) 

  

 

 

 

漢字が横に並ぶ部分字形をもつとき,左側部分字形の最後の画が右側部分字形の下部に及んでいるかど

うかの違いは,次のU+34F3の例に示すように分離符号化の根拠にはならない。 

 

 

 

S.1.4.3 

部分字形の種類の相違 

次の例は,S.1.3.2のc)の規則を説明する。それぞれの対の二つの漢字は,一つ以上の部分字形が異なる。 

 

 

 

S.1.5 

実字形の相違 

S.1.2で説明した分類を説明するため,統合する漢字の代表的な例を次に示す。次の各グループの二つ又

は三つの漢字又は部分字形は,実字形の相違をもつが,同じ抽象字形とみなし,その字形の文字又はその

字形を部分字形としてもつ漢字は,統合する。この相違は,次の例によって,分類される。 

これらの相違は,次の例に示すように,更に分類される。 

a) 点画の方向の相違 

 

b) 点画が出る・出ない(抜ける・抜けない) 

 

c) 部分字形・点画が付く・付かない 

 

d) 画線の出方の相違 

 

e) 画線の折れ曲がり方の相違 

 

f) 

ハネの有無 

 

g) 起筆の相違 

 

h) 屋根の相違 

 

i) 

重要でない点画の追加又は削除 

 

j) 

a)〜i)の組合せ 


141 

X 0221:2014 (ISO/IEC 10646:2012) 

 

 

k) その他 

 

 

注記 各グループに示された部分字形には,更に複雑な漢字の部分字形として使われたときには統合

されるが,単体の漢字としては,原規格分離漢字の取扱規則などの他の理由によって統合され

ないものがある。 

統合した漢字の実字形の相違は,箇条31の符号表の各符号位置の,対応する原典の欄に示す。 

S.1.6 

原規格分離漢字の取扱規則(source separation rule) 

複数の符号変換の段階を経たデータの完全性[“往復の保全性”(round-trip integrity)ともいう。]を確保

するため,次に示す各原典グループのいずれか一つの中で分離して符号化されている漢字は,統合しない。 

注記0A これを原規格分離漢字の取扱規則という。 

− 原典Gグループ GB 2312-80,GB 12345-90,GB 7589-87*,GB 7590-87*,GB 8565-88*,現代漢語通

用字表* 

− 原典Tグループ TCA-CNS 11643-1986/第1面,TCA-CNS 11643-1986/第2面,TCA-CNS 11643-1986/

第14面* 

− 原典Jグループ JIS X 0208:1990,JIS X 0212:1990 

− 原典Kグループ KS X 1001:2004(KS C 5601-1989であったもの),KS X 1002:2001(KS C 5657-1991

であったもの) 

注記1 規格の参照番号の後の“*”は,その規格に含まれる漢字のうち幾つかが,統合漢字集合に含

まれていないことを示す。 

しかしながら,一つの原典グループに属する二つの規格(例えば,GB 2312-80及びGB 12345-90)で符

号化されている幾つかの漢字は,原典グループから漢字を収集する手順において統合されている。 

注記1A ここで“原典”としているものは,箇条23で“原典”としているものとは,一致しない。そ

れは,原規格分離漢字の取扱規則の適用の対象となる“原典”が,この規格の最初の版に含

まれていたものに限定されるのに対して,箇条23の“原典”は,その後追加されたものを含

むためである。 

ここで示した原規格分離漢字の取扱規則は,BMPのCJK UNIFIED IDEOGRAPHSブロックに対してだ

け適用する。 

注記2 CJK互換漢字は,原規格分離漢字の取扱規則によく似た規則によって作成された。しかし,

CJK互換漢字では,似た漢字は,一つのCJK統合漢字と一つ以上のCJK互換漢字との組合

せとした。原規格分離漢字の取扱規則では,全ての似た漢字を異なるCJK統合漢字とみなす。 

 

S.2 

配列手順 

S.2.1 

配列の概要 

この規格の箇条31の符号表で,CJK UNIFIED IDEOGRAPHSの配列は,次の辞書における漢字の並び

順を基にしている。 


142 

X 0221:2014 (ISO/IEC 10646:2012) 

  

 

優先順位 

辞書 

版 

康熙字典(Kangxi Dictionary) 

北京第7版 

大漢和辞典(Daikanwa Jiten) 

第9版 

漢語大字典(Hanyu Dazidian) 

第1版 

大字源(Daejaweon) 

第1版 

 

辞書は,上の表に示す優先順位で使用する。優先順位1が最優先である。漢字が,ある辞書で見つかっ

たならば,それよりも優先順位の低い辞書は,考察しない。 

S.2.2 

手順 

S.2.2.1 

辞書にある漢字 

a) ある漢字が,康熙字典にある場合,康熙字典の順序に従って符号表に位置付ける。 

b) ある漢字が,康熙字典になく大漢和辞典にある場合,大漢和辞典でその文字よりも前に記載された文

字で,康熙字典にも記載のある文字のうち,最も近くにある文字の属する部首画数グループの末尾に

位置付ける(康熙字典の部首画数グループの最後に位置付け,康熙字典及び大漢和辞典にある漢字に

続けて配列する。)。 

c) ある漢字が,康熙字典及び大漢和辞典のいずれにもない場合,漢語大字典及び大字源を同様の手順で

参照する。 

S.2.2.2 

辞書にない漢字 

ある漢字が,四つのどの辞書にもない場合,部首画数グループの末尾に(辞書にある漢字よりも後に)

位置付け,同じ部首画数の下に配列する。 

 

S.3 

原規格分離漢字の例 

次に示す漢字の対(又は三つ組み)は,S.1に示した統合規則の例外である。これらは,S.1.6に示した

原規格分離漢字の取扱規則によって,統合しない。 

注記 原規格分離漢字の取扱規則の適用の対象となった,特定の原典グループについては,それぞれ

の漢字の対(又は三つ組み)の右側に,文字(G,J,K又はT)で示す。文字に対応する原典

グループは,この附属書の最初に示す。 

 

 

T

 4E1F 4E22 

 

 

GT

 4E48 5E7A 

 

 

GTJ

 4E89 722D 

 

 

J

4EDE4EED 

 

 

T

 4F75 5002 

 

 

T

4FA3 4FB6 

 

 

TJK

4FC1 4FE3 

 

 

T

4FDE 516A 

 

 

T

 4FF1 5036 

 

 

T

 5024 503C 

 

 

T

 5077 5078 

 

 

TJ

507D 50DE 

 

 

T

 514C 5151 

 

 

TJ

 514E 5154 

 

 

T

 5156 5157 

 

 

TJ

518A 518C 

 

 

G

 51C0 51C8 

 

 

T

 51E2 51E3 

 

 

TJ

 5203 5204 

 

 

TJ

520A 520B 


143 

X 0221:2014 (ISO/IEC 10646:2012) 

 

 

 

T

 5220 522A 

 

 

T

 5225 522B 

 

 

TJ

 5238 52B5 

 

 

T

 5239 524E 

 

 

T

 524F 5259 

 

 

T

525D 5265 

 

 

J

 5292 5294 

 

 

T

52FB 5300 

 

 

T

 5355 5358 

 

 

TK

 5373 537D 

 

 

TJ

 5377 5DFB 

 

 

GT

 53C1 53C2 

 

 

T

 53C3 53C4 

 

 

T

 5415 5442 

 

 

T

 541E 5451 

 TJ

 5433 5434 5449 

 

 

T

 5436 5450 

 

 

T

 543F 544A 

 

 

T

 5527 559E 

 

 

T

55A9 55BB 

 

 

T

 5618 5653 

 

 

GTJ

 568F 5694 

 

 

T

 56EF 56FD 

 

 

TJ

 5708 570F 

 

 

T

 570E 5713 

 

 

T

 5716 5717 

 

 

T

 5759 5DE0 

 

 

J

57D2 57D3 

 

 

T

 5848 588D 

 

 

TJ

 5861 586B 

 

 

T

 5897 589E 

 

 

GTJ

58EE 58EF 

 

 

T

58FD 5900 

 

 

T

 5910 657B 

 

 

GTJ

 5932 672C 

 

 

J

 5965 5967 

 TJ

 5968 596C 734E 

 

 

GT

 5986 599D 

 

 

T

598D 59F8 

 

 

T

59CD 59D7 

 

 

GT

59EB 59EC 

 T

5A1B 5A2F 5A31 

 

 

T

5A55 5AAB 

 

 

T

5A7E 5AAE 

 

 

TK

5AAA5ABC 

 

 

T

5AAF 5B00 

 

 

T

5B0E 5B14 

 

 

GT

 5B24 5B37 

 

 

T

 5B73 5B76 

 

 

T

5BAB5BAE 

 

 

T

5BDB5BEC 

 

 

T

5BDC5BE7 

 

 

GTJ

5BDD5BE2 

 

 

J

 5C02 5C08 

 

 

GTJ

 5C06 5C07 

 

 

T

 5C13 5C14 

 

 

T

 5C19 5C1A 

 

 

T

5C2A 5C2B 

 

 

T

 5C36 5C37 

 

 

T

5C4F 5C5B 

 

 

GT

5CE5 5D22 

 

 

T

5DD35DD4 

 

 

T

 5E21 5E32 

 

 

TJ

 5E2F 5E36 


144 

X 0221:2014 (ISO/IEC 10646:2012) 

  

 

 

T

 5E76 5E77 

 

 

T

5EC4 5ECF 

 

 

T

 5F11 5F12 

 

 

T

 5F37 5F3A 

 

 

T

 5F39 5F3E 

 

 

TJ

 5F50 5F51 

 

 

T

 5F54 5F55 

 

 

T

 5F59 5F5A 

 

 

J

5F5B 5F5C 

 

 

T

5F5D 5F5E 

 

 

T

 5F65 5F66 

 

 

T

5FB3 5FB7 

 

 

T

5FB4 5FB5 

 

 

TJ

 6075 60E0 

 

 

T

 6085 60A6 

 

 

T

 609E 60AE 

 

 

T

 60B3 60EA 

 

 

T

 6120 614D 

 

 

TJ

 613C 614E 

 

 

GT

 6229 622C 

 

 

T

 622F 6231 

 T

 6236 6237 6238 

 

 

T

 623B 623E 

 

 

T

 629B 62CB 

 

 

TJ

 629C 62D4 

 

 

T

 6329 635D 

 TJ

 633F 63D2 63F7 

 

 

TJ

 634F 63D1 

 

 

TJ

 635C 641C 

 

 

T

 63B2 63ED 

 TJ

63FA 6416 6447 

 

 

T

 63FE 6435 

 

 

TJ

 6483 64CA 

 

 

T

 654E 6559 

 

 

T

 6553 655A 

 

 

T

 65E2 65E3 

 

 

T

 6602 663B 

 

 

T

665A 6669 

 

 

T

66A8 66C1 

 

 

J

66FD 66FE 

 

 

T

 67B4 67FA 

 

 

T

 67E5 67FB 

 

 

T

 67F5 6805 

 

 

T

 68B2 68C1 

 

 

T

 6961 6986 

 

 

T

 6982 69EA 

 

 

T

 6985 69B2 

 

 

T

699D 6A27 

 

 

J

 69C7 69D9 

 

 

TJ

69D8 6A23 

 

 

T

6A2A6A6B 

 

 

T

 6B65 6B69 

 

 

T

 6B72 6B73 

 

 

T

6B7F 6B81 

 

 

GTJ

6BBB6BBC 

 

 

T

6BC0 6BC1 

 

 

T

6BCE6BCF 

 

 

T

 6C32 6C33 

 

 

T

6C5A 6C61 

 

 

TJ

 6C92 6CA1 

 

 

TJ

6D44 6DE8 

 

 

T

6D89 6E09 

 

 

T

6D97 6D9A 

 

 

T

6D99 6DDA 


145 

X 0221:2014 (ISO/IEC 10646:2012) 

 

 

 

T

6DE5 6E0C 

 

 

T

6DF8 6E05 

 

 

T

 6E07 6E34 

 

 

T

 6E29 6EAB 

 

 

T

 6E88 6F59 

 

 

T

 6E89 6F11 

 

 

T

6EDA6EFE 

 

 

GTJK

6F5B 6FF3 

 

 

T

 7028 702C 

 

 

GTJ

70BA 7232 

 

 

GTJK

712D 7162 

 

 

J

 7155 7199 

 

 

T

 7174 7185 

 

 

GT

 72B6 72C0 

 

 

TJ

 7464 7476 

 

 

T

 74F6 7501 

 

 

T

 7522 7523 

 

 

J

 75E9 7626 

 

 

T

76A1 76A5 

 

 

TJ

 771E 771F 

 

 

TJK

 773E 8846 

 

 

T

 7814 784F 

 

 

TJ

 797F 7984 

 

 

T

79BF 79C3 

 

 

T

7A05 7A0E 

 

 

TJ

7A42 7A57 

 

 

GJ

7B5D 7B8F 

 

 

T

7BB3 7C08 

 

 

T

7BE1 7C12 

 

 

T

7CA4 7CB5 

 

 

T

7D55 7D76 

 

 

T

7DA07DD1 

 

 

T

7DD27DD6 

 

 

T

7DE3 7E01 

 

 

T

7DFC 7E15 

 

 

T

 7E48 7E66 

 

 

TJ

7FAE 7FB9 

 

 

T

 7FF6 7FFA 

 

 

T

80FC 8141 

 

 

T

 812B 8131 

 

 

T

817D 8183 

 

 

GT

 8203 8204 

 

 

TJ

820D 820E 

 

 

J

 8216 8217 

 

 

TJ

 8358 838A 

 

 

TJ

83D1 8458 

 

 

T

 8480 8495 

 

 

GJ

 848B 8523 

 

 

T

848D 853F 

 

 

T

 8570 8580 

 

 

T

85AB 85B0 

 

 

T

 85F4 860A 

 

 

T

865A 865B 

 

 

T

86FB 8715 

 

 

TJK

 885B 885E 

 

 

TK

 886E 889E 

 

 

GJK

 88C5 88DD 

 

 

T

8A2E 8A7D 

 

 

T

8AAA8AAC 

 

 

TJ

8ACC8AEB 

 

 

J

 8B20 8B21 

 

 

T

8C5C 8C63 

 

 

TJ

8D70 8D71 

 

 

T

8EFF 8F27 


146 

X 0221:2014 (ISO/IEC 10646:2012) 

  

 

 

J

8F1C 8F3A 

 

 

T

8F3C 8F40 

 

 

T

8FBE 8FD6 

 

 

TJ

 8FF8 902C 

 

 

J

 9059 9065 

 

 

T

90A2 90C9 

 

 

T

90CE 90DE 

 T

 90F7 9109 9115 

 

 

T

 9196 919E 

 

 

J

91A4 91AC 

 

 

T

 9203 9292 

 

 

T

 92B3 92ED 

 

 

T

 9304 9332 

 

 

TK

 932C 934A 

 

 

TJ

93AD 93AE 

 

 

T

 95B1 95B2 

 

 

G

 9667 9689 

 

 

T

 9751 9752 

 

 

GTJ

 9759 975C 

 

 

J

976D 9771 

 

 

T

 9839 983D 

 

 

TJ

 984F 9854 

 

 

J

985A 985B 

 

 

J

98EE 98F2 

 

 

TJ

 9905 9920 

 

 

TJK

 99B1 99C4 

 

 

TK

 99E2 9A08 

 

 

T

9AA99AAB 

 

 

T

9AD89AD9 

 

 

TJ

9AEA9AEE 

 

 

T

9B2C 9B2D 

 

 

TJ

9C1B 9C2E 

 

 

T

9CEF 9CF3 

 

 

J

9D87 9DAB 

 

 

J

9DC69DCF 

 

 

T

9EAA9EAB 

 

 

T

9EBC9EBD 

 

 

T

9EC3 9EC4 

 

 

T

9ED1 9ED2 

 

S.4 

非統合の例 

S.1に記述した統合手順に従って,次に示す漢字の対(又は三つ組み)は,統合しない。非統合の理由

は,各対(又は三つ組み)の右側に示した参照によって示す。“非同系”は,S.1.1を参照。 

注記 この例での非統合の理由は,S.1.6に記述した原規格分離漢字の取扱規則とは,異なるものであ

る。 

 

 

非同系

 5191 80C4 

 

 

S.1.4.3

 51B2 6C96 

 

 

S.1.4.3

 51B3 6C7A 

 

 

S.1.4.3

 51B5 6CC1 

 

 

S.1.4.3

 579B 579C 

 

 

S.1.4.2

5B7C 5B7D 

 

 

S.1.4.3

5BF3 5BF6 

 

 

S.1.4.1

 5EF0 5EF3 

 

 

S.1.4.1

61D0 61F7 

 

 

S.1.4.3

 6560 656A 

 

 

非同系

 670C 80A6 

 

 

非同系

 670F 80D0 

 

 

非同系

 6710 80CA 

 

 

非同系

 6713 8101 

 

 

非同系

 6718 8127 

 

 

非同系

 6723 81A7 


147 

X 0221:2014 (ISO/IEC 10646:2012) 

 

 

 

S.1.4.3

 6735 6736 

 

 

S.1.4.3

 7054 7067 

 

 

S.1.4.3

7A32 7A3B 

 

 

S.1.4.3

 7FF1 7FF6 

 S.1.4.3

 8007 8008 8009 

 S.1.4.1

 8074 807C 807D 

 

 

S.1.4.2

 8346 834A 

 

 

S.1.4.3

8EB1 8EB2 

 


148 

X 0221:2014 (ISO/IEC 10646:2012) 

  

附属書T 

(参考) 

タグ文字による言語のタグ付け 

 

注記 この規格の以前の版でこの附属書に記載していた内容は,F.7に記載した。 


149 

X 0221:2014 (ISO/IEC 10646:2012) 

 

附属書U 
(参考) 

識別子用の文字 

 

UCSの実装者が判断する一般的な課題に,構文解析又は字句解析での識別子の条件がある。それぞれの

プログラム言語の標準は,それ特有の識別子の構文を規定している。プログラム言語が異なれば,ASCII

(ISO/IEC 646のIRVのことをいう。)の範囲の幾つかの文字(例えば,“$”,“@”,“#”及び“̲”。)の識

別子での使用の扱いが異なる。どの文字を構文上の区切りとし,どの文字を識別子として許すか,大文字

と小文字とで対になっている文字を同一視するかどうか,正規化を行うかどうか,などの様々な要素が,

特定のプログラム言語における識別の目的にふさわしい文字の集合の規定に関与する。 

ユニコードコンソーシアムは,ユニコード附属書 UAX #31“Identifier and Pattern Syntax”という文書を

出版することで,UCSの文字に基づく構文解析での扱いの標準化に寄与している。識別子での使用にふさ

わしいUCSの文字の一覧を決定するときには,このUAX #31の仕様を参考にするとよい。UAX #31は,

http://www.unicode.org/reports/tr31/ として参照できる。 

 


150 

X 0221:2014 (ISO/IEC 10646:2012) 

  

附属書JA 

(参考) 

日本文字部分レパートリ 

 

序文 

この附属書は,六つの日本文字部分レパートリを参考として示すものであって,規定の一部ではない。 

 

JA.1 日本文字部分レパートリ 

六つの日本文字部分レパートリは,次のa)〜f)のとおりとする。 

a) BASIC JAPANESE BASIC JAPANESE(基本日本文字集合)は,組番号285の組とする(A.5.5参照)。

これは,JIS X 0201,ISO/IEC 646のIRV及びJIS X 0208に相当する基本部分集合である。含まれる

文字の符号位置を,添付ファイル“BasicJ.txt”に参考として示す。 

b) JIS2004 IDEOGRAPHICS EXTENSION JIS2004 IDEOGRAPHICS EXTENSION(JIS2004拡張漢字

集合)は,組番号371の組とする(A.4.2参照)。これは,JIS X 0213の第3水準及び第4水準漢字部

分に相当する拡張用の部分集合である。含まれる文字の符号位置を,添付ファイル“JIExt.txt”に参考

として示す。 

c) JAPANESE IDEOGRAPHICS SUPPLEMENT JAPANESE IDEOGRAPHICS SUPPLEMENT(補助漢字

集合)は,組番号372の組とする(A.4.3参照)。これは,JIS X 0212の漢字部分に相当する拡張用の

部分集合である。含まれる文字の符号位置を,添付ファイル“JISup.txt”に参考として示す。 

d) JAPANESE NON IDEOGRAPHICS EXTENSION JAPANESE NON IDEOGRAPHICS EXTENSION(拡

張非漢字集合)は,組番号286の組とする(A.5.6参照)。これは,JIS X 0213の非漢字部分(ただし,

JIS X 0208にも含まれるものを除く。)に相当する拡張用の部分集合である。含まれる文字の符号位置

を,添付ファイル“JNIExt.txt”に参考として示す。 

e) COMMON JAPANESE COMMON JAPANESE(通用日本文字集合)は,組番号287の組とする(A.5.7

参照)。これは,a)に示したBASIC JAPANESEに,日本で広く用いられている拡張を加えた部分集合

である。含まれる文字の符号位置を,添付ファイル“CommonJ.txt”に参考として示す。 

f) 

JAPANESE NON IDEOGRAPHICS SUPPLEMENT JAPANESE NON IDEOGRAPHICS SUPPLEMENT

(追加非漢字集合)は,d)に示したJAPANESE NON IDEOGRAPHICS EXTENSIONを含み,JIS X 0212

で規定された漢字以外の文字(すなわち,“特殊文字”及び“アルファベット”)並びにJIS X 0201,

JIS X 0208及びJIS X 0212に含まれない文字のうち日本語文書で用いられる追加的な記号類からなる。

含まれる文字を,添付ファイル“JNIExt2.txt”に示す。 

 

JA.2 部分レパートリの組合せ 

日本文字部分レパートリのうち,BASIC JAPANESE及びCOMMON JAPANESEは,それぞれを単独で又

は他の日本文字部分レパートリと組み合わせて用いることを意図している。他の四つのレパートリは,単

独で用いることを意図していない。意図する組合せは,次のとおりである。 

− BASIC JAPANESE及びJIS2004 IDEOGRAPHICS EXTENSIONの組合せ。 

− BASIC JAPANESE,JIS2004 IDEOGRAPHICS EXTENSION及びJAPANESE NON IDEOGRAPHICS 

EXTENSIONの組合せ。 


151 

X 0221:2014 (ISO/IEC 10646:2012) 

 

− BASIC JAPANESE及びJAPANESE IDEOGRAPHICS SUPPLEMENTの組合せ。 

− COMMON JAPANESE及びJIS2004 IDEOGRAPHICS EXTENSIONの組合せ。 

− COMMON JAPANESE,JIS2004 IDEOGRAPHICS EXTENSION及びJAPANESE NON IDEOGRAPHICS 

EXTENSIONの組合せ。 

− COMMON JAPANESE及びJAPANESE IDEOGRAPHICS SUPPLEMENTの組合せ。 

 

JA.3 適合性 

この附属書に示す日本文字部分レパートリのうち,BASIC JAPANESE,JIS2004 IDEOGRAPHICS 

EXTENSION,JAPANESE IDEOGRAPHICS SUPPLEMENT,JAPANESE NON IDEOGRAPHICS EXTENSION

及びCOMMON JAPANESEは,この規格が規定する組である。これら五つの日本文字部分レパートリのいず

れか一つ以上の組合せを部分集合とする適合性の主張は,選択部分集合への適合性の主張の方法によるの

がよい(8.2参照)。 

JAPANESE NON IDEOGRAPHICS SUPPLEMENTは,この規格が規定する組ではない。JAPANESE NON 

IDEOGRAPHICS SUPPLEMENTを含む部分集合への適合性の主張は,制限部分集合への適合性の主張の方

法による(8.1参照)。