>サイトトップへ >このカテゴリの一覧へ

X 0221

:2014 (ISO/IEC 10646:2012)

(1) 

目  次

ページ

序文  

1

1

  適用範囲  

1

2

  適合性  

2

2.1

  概要  

2

2.2

  情報交換の適合性  

2

2.3

  装置の適合性  

2

3

  引用規格  

3

4

  用語及び定義  

3

5

  国際符号化文字集号の全体構造  

10

6

  基本構造及び名称  

10

6.1

  構造  

10

6.2

  文字の符号化  

11

6.3

  符号位置の種類  

12

6.4

  文字の名前  

13

6.5

  符号位置の短い識別子(UID  

13

6.6

  UCS 列識別子  

14

6.7

  オクテット列識別子  

14

7

  UCS の維持・改正  

14

8

  部分集合  

14

8.1

  制限部分集合  

15

8.2

  選択部分集合  

15

9

  UCS の符号化形式  

15

9.1

  UTF-8  

15

9.2

  UTF-16  

16

9.3

  UTF-32UCS-4  

16

10

  UCS の符号化方式  

17

10.1

  UTF-8  

17

10.2

  UTF-16BE  

17

10.3

  UTF-16LE  

17

10.4

  UTF-16  

17

10.5

  UTF-32BE  

17

10.6

  UTF-32LE  

17

10.7

  UTF-32  

18

11

  UCS での制御機能の使用  

18

12

  機能識別の宣言  

20


X 0221

:2014 (ISO/IEC 10646:2012)  目次

(2) 

ページ

12.1

  識別の目的及び構文  

20

12.2

  UCS の符号化形式の識別  

20

12.3

  図形文字部分集合の識別  

20

12.4

  制御機能集合の識別  

21

12.5

  JIS X 0202 の符号化方式の識別  

21

13

  符号表及び一覧表の構造  

21

14

  ブロック及び組の名前  

22

14.1

  ブロックの名前  

22

14.2

  組の名前  

22

15

  双方向文脈での鏡像文字  

22

15.1

  鏡像文字  

22

15.2

  双方向テキストの方向性  

23

16

  特殊文字  

23

16.1

  空白の文字  

23

16.2

  通貨記号  

24

16.3

  書式文字  

24

16.4

  漢字構成記述文字  

25

16.5

  字形選択子及び字形指示列  

25

17

  文字の表示形  

28

18

  互換用文字  

28

19

  文字の順序  

29

20

  結合文字  

29

20.1

  結合文字の順序  

29

20.2

  結合クラス及び基準順序  

29

20.3

  符号表上での形  

29

20.4

  符号化表現のばらつき  

30

20.5

  結合文字の重複  

30

20.6

  結合文字を含む組  

31

20.7

  図形素結合子(合成可能)  

31

21

  正規形  

31

22

  個々の用字及び記号の特性  

32

22.1

  ハングル音節の合成方法  

32

22.2

  インド及び他の南アジアで使う用字の特性  

32

22.3

  ビザンチン音楽記号  

33

22.4

  絵文字記号の原典情報  

33

23

  漢字の原典参照  

33

23.1

  原典参照一覧  

33

23.2

  CJK 統合漢字の原典参照  

35

23.3

  CJK 統合漢字の原典参照の表示  

37


X 0221

:2014 (ISO/IEC 10646:2012)  目次

(3) 

ページ

23.4

  CJK 互換漢字の原典参照  

39

23.5

  CJK 互換漢字の原典参照の表示  

39

24

  文字の名前及び注記  

40

24.1

  名前  

40

24.2

  名前の形式  

40

24.3

  名前の単一性  

41

24.4

  名前の不変性  

41

24.5

  名前の一意性  

41

24.6

  漢字の名前  

42

24.7

  ハングル音節文字の名前  

42

25

  名前付き UCS 列識別子  

44

26

  基本多言語面の構造  

45

27

  用字及び記号群に用いる追加多言語面の構造  

47

28

  追加漢字面の構造  

49

29

  第三漢字面の構造  

50

30

  追加特殊用途面の構造  

50

31

  符号表及び文字の名前一覧表  

51

31.1

  符号表  

51

31.2

  文字の名前の一覧表  

51

31.3

  符号表及び文字の名前一覧の添付ファイル  

52

附属書 A(規定)部分集合用図形文字の組  

54

附属書 B(規定)結合文字一覧  

95

附属書 C(規定)面 01∼面 10 の UCS 変換形式(UTF-16  

96

附属書 D(規定)UCS 変換形式 8UTF-8  

97

附属書 E(規定)双方向文脈での鏡像文字  

98

附属書 F(参考)書式文字  

99

附属書 G(参考)文字の名前のアルファベット順一覧  

106

附属書 H(参考)UCS を識別するための“印”(しるし)の使用  

107

附属書 I(参考)漢字構成記述文字  

108

附属書 J(参考)内部記憶機能をもつ送受信兼用装置に対する推奨  

111

附属書 K(参考)オクテット値表現の記法  

112

附属書 L(参考)文字の名前付け指針 

113

附属書 M(参考)文字の出所  

116

附属書 N(参考)文字レパートリに対する外部参照  

133

附属書 P(参考)CJK 統合漢字に関する追加情報  

135

附属書 Q(参考)ハングル音節文字の符号対応表  

136

附属書 R(参考)ハングル音節文字の名前  

137

附属書 S(参考)漢字の統合及び配列の手順  

138

附属書 T(参考)タグ文字による言語のタグ付け  

148


X 0221

:2014 (ISO/IEC 10646:2012)  目次

(4) 

ページ

附属書 U(参考)識別子用の文字  

149

附属書 JA(参考)日本文字部分レパートリ  

150


X 0221

:2014 (ISO/IEC 10646:2012)  目次

(5) 

まえがき

この規格は,工業標準化法に基づき,日本工業標準調査会の審議を経て,経済産業大臣が改正した日本

工業規格である。

これによって,JIS X 0221:2007 は改正され,この規格に置き換えられた。

この規格は,著作権法で保護対象となっている著作物である。

この規格の一部が,特許権,出願公開後の特許出願又は実用新案権に抵触する可能性があることに注意

を喚起する。経済産業大臣及び日本工業標準調査会は,このような特許権,出願公開後の特許出願及び実

用新案権に関わる確認について,責任はもたない。

この規格には,次の添付ファイル(CD-ROM:別添)がある(それぞれのファイルを参照する箇所を括

弧内に示す。

− EmojiSrc.txt(22.4

− CJKU_SR.txt(23.2

− CJKC_SR.txt(23.4

− NUSI.txt(箇条 25

− ISO10646-2012-1-0000-4DFF.pdf(31.3

− ISO10646-2012-2-4E00-9FFF.pdf(31.3

− ISO10646-2012-3-A000-1FFFF.pdf(31.3

− ISO10646-2012-4-20000-25333.pdf(31.3

− ISO10646-2012-5-25334-2A6FF.pdf(31.3

− ISO10646-2012-6-2A700-10FFFF.pdf(31.3

− IICORE.txt(

附属書 A

− Allnames.txt(

附属書 G

− HangulSy.txt(

附属書 R

− BasicJ.txt(

附属書 JA

− JIExt.txt(

附属書 JA

− JISup.txt(

附属書 JA

− JNIExt.txt(

附属書 JA

− CommonJ.txt(

附属書 JA

− JNIExt2.txt(

附属書 JA

X 0221

:2014 (ISO/IEC 10646:2012)


   

日本工業規格

JIS

 X

0221

:2014

(ISO/IEC 10646

:2012

)

国際符号化文字集合(UCS)

Information technology-Universal Coded Character Set (UCS)

序文 

この規格は,2012 年に第 3 版として発行された ISO/IEC 10646 を基に,技術的内容及び構成を変更する

ことなく作成した日本工業規格である。

なお,この規格で点線の下線を施してある参考事項及び

附属書 JA(参考)は,対応国際規格にはない事

項である。

適用範囲 

この規格は,国際符号化文字集合を規定する。この規格は,世界の言語(用字)を書き表した形(表記

形)及び記号の表現・伝送・交換・処理・蓄積・入力・表示に適用できる。

この規格は,国際符号化文字集合(以下,

“この符号化文字集合”又は“UCS”という。

)について,次

の事項を規定する。

−  この符号化文字集合の全体的な体系。

−  この規格で使用する用語の定義。

− UCS 符号空間の構造。

− UCS の基本多言語面(BMP)の定義。

− UCS の追加多言語面(SMP)

,追加漢字面(SIP)

,第三漢字面(TIP)及び追加特殊用途面(SSP)の

定義。

−  世界の言語の用字及び表記形で使用する図形文字の集合の定義。

− BMP,SMP,SIP,TIP 及び SSP 上の図形文字及び書式文字の名前並びにこれらの UCS 符号空間にお

ける符号化表現。

−  制御機能及び私用文字の符号化表現。

− UCS の三つの符号化形式:UTF-8,UTF-16 及び UTF-32。

− UCS の七つの符号化方式:UTF-8,UTF-16,UTF-16BE,UTF-16LE,UTF-32,UTF-32BE 及び UTF-32LE。

−  この符号化文字集合への将来の追加方法。

UCS は,JIS X 0202 で規定されたものとは異なる方式による符号系である。JIS X 0202 から UCS を指示

する方法は,12.2 による。

この規格では,一つの図形文字に対して,BMP 又は他の追加面の中から,ただ一つの符号位置を割り当

てる。

注記  ユニコード標準(Unicode Standard)の第 6.1 版は,この規格と同一の文字,名前及び符号化表

現の一式を含んでいる。加えて,文字の特性の詳細,処理のアルゴリズム及び実装者に有用な

定義を含んでいる。


2

X 0221

:2014 (ISO/IEC 10646:2012)

   

注記 A  この規格の対応国際規格及びその対応の程度を表す記号を,次に示す。

ISO/IEC 10646:2012

,Information technology−Universal Coded Character Set (UCS)(IDT)

なお,対応の程度を表す記号“IDT”は,ISO/IEC Guide 21-1 に基づき,

“一致している”

ことを示す。

適合性 

2.1 

概要 

規定外の私用文字をこの規格の規定に従って使用する場合,その文字自身は,この適合性要件の適用外

とする。

注記  私用文字については,6.3.5 を参照。

2.2 

情報交換の適合性 

交換用符号化情報中の符号単位列(CC データ要素)は,次の条件を全て満たしている場合に,この規

格に適合する。

a)

符号単位列中の図形文字の符号化表現は,全て箇条 に適合し,箇条 に示すうちから選択した一つ

の識別された符号化形式に適合し,かつ,箇条 10 に示すうちから選択した一つの識別された符号化方

式に適合する。

b)

符号単位列中で表現されている図形文字は,全て識別された部分集合(箇条 参照)の図形文字から

なる。

c)

符号単位列中の制御機能の符号化表現は,全て箇条 11 に適合する。

適合性を主張する場合,採用した符号化形式及び符号化方式を明示するとともに,採用した部分集合を

組及び/又は文字の一覧で明示しなければならない。

2.3 

装置の適合性 

装置は,次の a)の要件に適合し,かつ,b)及び/又は c)に適合する場合,この規格に適合する。

適合性を主張する場合,次の a)に規定する記述を含む文書を明示しなければならず,採用した符号化形

式,符号化方式,部分集合及び箇条 11 に従って採用した制御機能の種類を明示しなければならない(部分

集合は,組及び/又は文字の一覧によって示す。

a)

装置についての記述  この規格に適合する装置には,それぞれ次の b)及び c)に規定するとおり,利用

者が装置に文字を送出できる方法及び/又は文字が利用者に提示されたときに利用者がそれを認識で

きる方法を明示した記述を備えなければならない。

b)

送信装置  送信装置は,採用した部分集合から利用者が任意の文字を送出できるようにしなければな

らない。さらに,送信装置は,符号単位列中にあるそれらの文字の符号化表現を,採用した符号化形

式及び符号化方式に従って送信する能力をもたなければならない。したがって,送信装置は,誤った

形式の符号単位列を送出してはならない。

c)

受信装置  受信装置は,符号単位列中にある任意の文字の符号化表現を,採用した符号化形式及び符

号化方式に従って受信し解釈する能力をもたなければならない。さらに,受信装置は,符号化表現に

対応する文字が採用した部分集合にある場合,その全てを,利用者が識別できる方法で,利用者に渡

さなければならない。受信装置は,誤った形式の符号単位列を誤った状態として処理しなければなら

ず,そのようなデータを文字列として解釈してはならない。

対応する文字が採用した部分集合にない場合,それらの文字を利用者に示さなければならない。それら

を示す方法は,文字を互いに区別する必要はない。


3

X 0221

:2014 (ISO/IEC 10646:2012)

注記 1  この規格では,誤り条件についても,採用した部分集合にない文字を利用者に示す方法につ

いても,規定しない。

注記 2  再送能力をもつ受信装置については,附属書 を参照。

引用規格 

次に掲げる規格は,この規格に引用されることによって,この規格の規定の一部を構成する。これらの

引用規格は,その最新版(追補を含む。

)を適用する。

JIS X 0202

  情報技術−文字符号の構造及び拡張法

注記  対応国際規格:ISO/IEC 2022,Information technology−Character code structure and extension

techniques(IDT)

JIS X 0211

  符号化文字集合用制御機能

注記  対応国際規格:ISO/IEC 6429,Information technology−Control functions for coded character sets

(IDT)

ユニコード附属書, UAX #9  The Unicode Bidirectional Algorithm

<http://www.unicode.org/reports/tr9/tr9-25.html>

ユニコード附属書, UAX #15  Unicode Normalization Forms

<http://www.unicode.org/reports/tr15/tr15-35.html>

ユニコード技術標準, UTS #37  Ideographic Variation Database

<http://www.unicode.org/reports/tr37/tr37-8.html>

ユニコード標準第 6.1 , Chapter 4  Character Properties

<http://www.unicode.org/versions/Unicode6.1.0/ch04.pdf>

Section 4.3, Combining Classes−規定 
Section 4.5, General Category−規定

Section 4.7, Bidi Mirrored−規定

用語及び定義 

この規格で用いる主な用語及び定義は,次による。

4.1

基底文字(base character)

結合文字でない図形文字。

注記 1  図形文字の多くは,基底文字である。基底文字を表示するときに,文脈に依存した様々な形

を用いたり,合字(ligature)の一部にしたりすることを,結合文字でないということが排除

するものではない。

注記 2  基底文字は,先行する文字と図形的に結合しないことが普通だが,幾つかの複雑な書記系で

は例外がある。

4.2

基本多言語面,BMP(basic multilingual plane, BMP)

UCS 符号空間の面 00。

4.3

ブロック(block)


4

X 0221

:2014 (ISO/IEC 10646:2012)

   

共通の特性をもつ文字の集合(例えば,用字)が割り当てられた符号位置の連続する範囲。ブロック同

士は,重なり合わない。ブロック中には,文字が割り当てられていない符号位置が一つ以上あってもよい。

4.4

基準形式(canonical form)

この符号化文字集合の文字を,UCS 符号空間中の一つの符号位置を用いて表現する形式。

注記  基準形式を,UCS 符号位置と一つ以上の符号単位との関係を意味する符号化形式と混同しては

ならない(4.23 参照)

4.5

文字(character)

データの構成,制御又は表現に用いる要素の集合の構成単位。

注記  図形記号は,一つ以上の符号化文字の列によって表現されることもある。

4.6

文字境界(character boundary)

符号化文字の最後の符号単位と次に続く符号化文字の最初の符号単位との間の(符号単位列の)境目。

4.7

符号表(code chart, code table)

UCS 符号空間のある範囲に割り当てた符号化文字群の表現を,長方形に配置して示したもの。

4.8

符号化文字(coded character)

文字と符号位置とを結びつけたもの。

4.9

符号化文字集合(coded character set)

符号化文字の集合。

4.10

符号位置(code point, code position)

UCS 符号空間中の値。

4.11

符号単位(code unit)

処理又は交換用の符号化テキストの単位を表現できる,最小のビット組合せ。

注記  符号単位の例として,UTF-8 符号形式で用いるオクテット(8 ビットの符号単位),UTF-16 符

号形式で用いる 16 ビットの符号単位及び UTF-32 符号形式で用いる 32 ビットの符号単位があ

る。

4.12

符 号 単 位 列 , CC デ ー タ 要 素 , 符 号 化 文 字 デ ー タ 要 素 ( code unit sequence, CC-data-element,

coded-character-data-element)

符号化文字集合に関する特定された一つ以上の規格に適合して,符号単位の並びを構成するように仕様

決めされた,情報交換の単位。

注記 1  この列は,どのような種類の符号位置に対応付けられる符号単位をも含むことができる。

注記 2  この規格では,この規格の以前の版と異なり,もはや実装水準を用いない。その符号単位列

の定義は,以前の実装水準 3(制限のない水準)に対応する。従来,水準 1 又は 2 として知


5

X 0221

:2014 (ISO/IEC 10646:2012)

られていた符号単位列の定義は,廃止された。これらの従来の版との互換性を維持するため

に,JIS X 5605 及び JIS X 5606 のような規格の中の符号化表現を識別する文脈においては,

その実装の方針は,

“実装水準 3”として参照できる。

附属書 参照。

4.13

組(collection)

番号及び名前が付けられたものの集合。

注記 1  拡張組(4.25 参照)でない組は,符号位置が一つ以上の識別された範囲に含まれるような符

号化文字だけからなる集合である。

注記 2  識別された範囲のいずれかに文字の割り当てられていない符号位置があり,将来この規格の

改正によってそのどこかの符号位置に追加文字が割り当てられたときには,組のレパートリ

が変わる。しかし,組の番号及び名前は,この規格の将来の版においても変えないことを意

図している。

4.14

結合文字(combining character)

一般分類の値が,Spacing Combining Mark(Mc)

,Non Spacing Mark(Mn)又は Enclosing Mark(Me)の

いずれかである文字。

注記  結合文字は,先行する,結合文字でない図形文字と組み合わせるか,又は結合文字ではない文

字の後に結合文字の列が続いた形のものと組み合わせることを意図している(4.17 参照)

4.15

結合クラス(combining class)

結合文字の図形文字に対する作用及び結合文字の並びの中での基準順序を決定するために,個々の結合

文字に対応付けた値。

4.16

互換用文字(compatibility character)

主として既存の符号化文字集合との互換性のため,この規格に符号化文字として含めた図形文字。

4.17

合成列(composite sequence)

基底文字とそれに続く一つ以上の結合文字,ZERO WIDTH JOINER 又は ZERO WIDTH NON-JOINER

とからなる図形文字の列(4.14 参照)

注記 1  合成列からなる図形記号は,通常,その合成列を構成する各文字の図形記号の組合せからな

る。

注記 2  合成列は,この規格のレパートリとして符号化されていない文字を表現するために用いるこ

とができる。

注記 2A  ZERO WIDTH JOINER 及び ZERO WIDTH NON-JOINER については,F.1.1 を参照。

4.18

制御文字(control character)

その符号化表現が一つの符号位置からなる制御機能。

注記  制御文字は,DELETEFORM FEEDESC などの名前のようなものを用いて呼ぶことがあるが,

これらの呼び名は,正式な文字の名前ではない。JIS X 0211 が制御文字に対応させている長い

名前の一覧は,箇条 11 を参照。


6

X 0221

:2014 (ISO/IEC 10646:2012)

   

4.19

制御機能(control function)

符号単位列によって表現され,データの記録,処理,伝送又は解釈に影響を及ぼす動作。

4.20

分解写像(decomposition mapping)

一つの文字を,基準等価又は互換等価な一つ以上の文字の一つの列に写す写像。

4.21

既定状態(default state)

状態が明示的に指定されていないときに,想定する状態。

注記  F.2.2F.2.4 参照。

4.22

装置(device)

符号単位列内の符号化情報を送信及び/又は受信できる情報処理機器の一部分。

注記  装置は,通常の入出力機器であってもよく,応用プログラム又はゲートウェイ機能のような処

理であってもよい。

4.23

符号化形式(encoding form)

UCS の文字を表す個々の UCS 符号位置を,その符号化形式が用いる一つ以上の符号単位によって表す

方法を決定するもの。

注記  この規格は,符号化形式として UTF-8,UTF-16 及び UTF-32 を規定する。

4.24

符号化方式(encoding scheme)

符号化形式を構成する符号単位をオクテットの並びに直列化する方法の規定。

注記 UCS の符号化方式には,符号化形式と同じ呼び名をもつものがある。しかし,符号化方式の呼

び名と符号化形式の呼び名とは,異なる文脈で用いる。UCS の符号化形式は,メモリ上及び応

用インタフェースでのテキストデータの表現に言及する。UCS の符号化方式は,オクテットの

並びに直列化されたテキストデータに言及する。

4.25

拡張組(extended collection)

正規形 NFC である符号位置の列を含んでもよい組。

注記 1  3 LATIN EXTENDED-A4 LATIN EXTENDED-B15 ARABIC EXTENDED などのように

“extended”

(拡張)という語を名前に含む組が多数あるが,組の名前に“extended”という

語が含まれていることとその組が拡張組であることとの間には,関係がない。

注記 2  正規形 NFC については,箇条 21 参照。

注記 3  符号位置の列は,名前付き UCS 列識別子(箇条 25 参照)によって参照される。

4.26

確定組(fixed collection)

識別された範囲に含まれる全ての符号位置に文字が割り当てられている組であって,この規格の将来の

版においても(その組に含まれるレパートリが)変わらないことを意図しているもの。


7

X 0221

:2014 (ISO/IEC 10646:2012)

4.27

書式文字(format character)

周囲の文字の配置又は処理に作用することを主な機能とする文字。

注記  書式文字は,通常,それ自身の可視化表現をもたない。

4.28

一般分類,GC(General Category, GC)

字,句読点,記号類などの文字の重要な分類を決定するために,個々の UCS 符号位置に割り当てた値。

注記 1  実際の値は,ユニコード標準の 2 文字省略形を用いた一般分類特性として定める(箇条 

示す最新のユニコード標準の一般分類を参照。

注記 2  最初の文字が同一であるような全ての一般分類をまとめて扱うときには,一般分類の値の最

初の文字だけを用いて表すことがある。例えば,

“L”は,

“Lu”

“Ll”

“Lt”

“Lm”及び“Lo”

という字に関する一般分類の全体を表す。

4.29

図形文字(graphic character)

制御機能でも書式文字でもない文字であって,通常は,手書き,印字又は表示の可視化表現をもつもの。

4.30

図形記号(graphic symbol)

図形文字又は合成列の可視化表現。

4.31

上位サロゲート符号位置(high-surrogate code point)

UTF-16 で用いるために保留されている D800∼DBFF の範囲の符号位置。

4.32

上位サロゲート符号単位(high-surrogate code unit)

UTF-16 でサロゲートペアの先頭の符号単位として用いる D800∼DBFF の範囲の 16 ビットの符号単位。

注記  9.2 参照。

4.33

誤った形式の符号単位列(ill-formed code unit sequence)

UCS のある符号化形式に従うと称する UCS 符号単位列であって,その符号化形式の規定に適合しない

もの。

例  対をなさないサロゲート符号単位は,誤った形式の符号単位列の例である。

4.34

誤った形式の符号単位列部分集合(ill-formed code unit sequence subset)

ある符号単位列の空でない部分集合であって,その符号単位列の,正しい形式の符号単位の最小列であ

るようなサブセットに属する符号単位を含まないもの。

注記  誤った形式の符号単位列部分集合は,正しい形式の符号単位の最小列と重ならない。

4.35

交換(interchange)

通信手段又は交換可能な媒体によって,ある利用者から他の利用者に文字の符号化データを転送するこ

と。

注記  交換は,データを直列化し,UCS の符号化方式を用いる。


8

X 0221

:2014 (ISO/IEC 10646:2012)

   

4.36

相互動作(interworking)

それぞれ異なる符号化文字集合を採用している二つ以上のシステム間で,意味のある文字の符号化デー

タの交換ができるようにすること。

注記  二つの符号の間での変換を含むこともある。

4.37

ISO/IEC 10646-1

この規格の対応国際規格が以前に部編成であったときに,体系及び基本多言語面(BMP)を規定してい

た部。

注記 1  ISO/IEC 10646 の第 1 部とも呼ぶ。

注記 2  ISO/IEC 10646-1 には,第 1 版と第 2 版とがあった。

4.38

ISO/IEC 10646-2

この規格の対応国際規格が以前に部編成であったときに,追加多言語面(SMP)

,追加漢字面(SIP)及

び追加特殊用途面(SSP)を規定していた部。

注記 1  ISO/IEC 10646 の第 2 部とも呼ぶ。

注記 2  ISO/IEC 10646-2 には,第 1 版だけがあった。

4.39

下位サロゲート符号位置(low-surrogate code point)

UTF-16 で用いるために保留されている DC00∼DFFF の範囲の符号位置。

4.40

下位サロゲート符号単位(low-surrogate code unit)

UTF-16 でサロゲートペアの末尾の符号単位として用いる D800∼DBFF の範囲の 16 ビットの符号単位。

注記  9.2 参照。

4.41

正しい形式の符号単位の最小列(minimal well-formed code unit sequence)

正しい形式の符号単位列であって,一つの UCS スカラ値に写像されるもの。

4.42

鏡像文字(mirrored character)

右から左に配置するテキストにおいて,その像が水平に反転される文字。

4.43

オクテット(octet)

8 ビットの符号単位。

注記  この規格では,オクテットの値は,16 進数を用いて 00∼FF として表記する(附属書 参照)。

4.44

面(plane)

UCS 符号空間の一部分であって,65 536 の符号位置からなるもの。

注記 UCS 符号空間は,17 の面からなる。

4.45

表示(presentation)


9

X 0221

:2014 (ISO/IEC 10646:2012)

図形記号を書いたり,印字したり,画面表示したりする処理。

4.46

表示形(presentation form)

(一部の言語の用字を表示する際に,

他の文字との相対的な位置に依存して文字を表現する図形記号の

形。

4.47

私用面(private use plane)

この符号化文字集合中の面であって,この規格で文字を規定しない面。

注記  面 0F 及び面 10 が私用面である。

4.48

レパートリ(repertoire)

符号化文字集合で表現する文字の指定された集合。

4.49

区(row)

面の一部であって,256 の倍数の符号位置から始まり 256 個の連続する符号位置からなる,00∼FF の数

値によって識別されるもの。

4.50

用字(script)

一つ以上の言語の表記形で使用する図形文字の集合。

4.51

追加面(supplementary plane)

UCS 符号空間の面 00 以外の面。

注記  追加面は,基本多言語面に割り当てていない文字を収容する。

4.52

用字及び記号のための追加多言語面,SMP(Supplementary Multilingual Plane for scripts and symbols, SMP)

UCS 符号空間の面 01。

4.53

追加漢字面,SIP(Supplementary Ideographic Plane, SIP)

UCS 符号空間の面 02。

4.54

追加特殊用途面,SSP(Supplementary Special-purpose Plane, SSP)

UCS 符号空間の面 0E。

4.55

サロゲートペア(surrogate pair)

二つの 16 ビット符号単位からなる一文字の表現であって,

ペアの最初の値が上位サロゲート符号単位で

あり,二番目の値が下位サロゲート符号単位であるもの。

4.56

第三漢字面,TIP(Tertiary Ideographic Plane, TIP)

UCS 符号空間の面 03。


10

X 0221

:2014 (ISO/IEC 10646:2012)

   

4.57

UCS

符号空間(UCS codespace)

UCS の文字のレパートリを割り当てるために用いる,0∼10FFFF(16 進数)の整数からなる符号空間。

4.58

UCS

スカラ値(UCS scalar value)

上位サロゲート符号位置及び下位サロゲート符号位置を除く任意の UCS 符号位置。

4.59

対をなさないサロゲート符号単位(unpaired surrogate code unit)

符号単位列の中の符号単位であって,次のいずれかであるもの。

−  上位サロゲート符号単位であって,下位サロゲート符号単位が直後にないもの。

−  下位サロゲート符号単位であって,上位サロゲート符号単位が直前にないもの。

4.60

利用者(user)

装置が提供するサービスを使う人又はそれに代わるもの。

注記  “装置”が符号変換機又はゲートウェイ機能の場合,これは,応用プログラムのような処理で

あってもよい。

4.61

正しい形式の符号単位列(well-formed code unit sequence)

UCS のある符号化形式に従うと称する UCS 符号単位列であって,その符号化形式の規定に適合し,誤

った形式の符号単位列部分集合を含まないもの。

国際符号化文字集号の全体構造 

ここでは,国際符号化文字集合(以下,

“この符号化文字集合”という。

)の大まかな構造について示し,

図 に図示する。構造の規定は,箇条 及び箇条 による。

この符号化文字集合の基準形式(規格を理解するための形式)は,0∼10FFFF の整数からなる UCS 符号

空間を用いる。

この規格は,次の面の符号化文字を定義する。

−  基本多言語面(BMP,すなわち,面 00)

−  用字及び記号のための追加多言語面(SMP,すなわち,面 01)

−  追加漢字面(SIP,すなわち,面 02)

−  追加特殊用途面(SSP,すなわち,面 0E)

第三漢字面(TIP,面 03)を漢字のために保留する。TIP は,現在空である。面 04∼0D は,将来の標準

化のために保留する。

面 0F 及び 10 は,私用のために保留する。

符号空間の部分集合を,図形文字の部分レパートリを定めるために使ってもよい。

基本構造及び名称 

6.1 

構造 

この規格が規定する国際符号化文字集合は,17 の面からなる一つのものとみなさなければならない。


11

X 0221

:2014 (ISO/IEC 10646:2012)

図 1−国際符号化文字集合の面

6.2 

文字の符号化 

UCS 符号空間の中で符号化される個々の文字は,0∼10FFFF の範囲の一つの整数によって表現され,符

号位置として識別される。

一つの文字を符号位置によって識別するときには,整数の 6 桁形式によって次のように表現する。

000030 は,DIGIT ZERO を表現する。 
000041 は,LATIN CAPITAL LETTER A を表現する。

010000 は,LINEAR B SYLLABLE B008 A を表現する。

面 00 の中の文字を引用するときは,先頭の 2 桁の数字を省略してもよい。面 01∼面 0F の中の文字を引

用するときは,頭の 1 桁の数字を省略してもよい。例えば,次のように表現してもよい。


12

X 0221

:2014 (ISO/IEC 10646:2012)

   

0030 によって,DIGIT ZERO を表現する。 
0041 によって,LATIN CAPITAL LETTER A を表現する。

10000 によって,LINEAR B SYLLABLE B008 A を表現する。

6.3 

符号位置の種類 

6.3.1 

分類 

UCS 符号位置は,一般分類の値に基づいて基本の種類に分類される。一般分類の値は,ユニコード標準

第 6.1 版の一般分類特性に従って決定する(箇条 参照)

表 に種類をまとめる。

表 1−符号位置の種類

基本の種類

概要

一般分類

文字の状態

符号位置の状態

図形

字,マーク,数,句読点,記号及び空白

L,M,N,P,
S 及び Zs

文字として 
割当て済み

割当て済みの 
符号位置

書式

可視化されずに周囲の文字に影響する Cf,Zl 及び Zp

制御

一つの符号位置からなる制御機能 Cc

私用

この規格の外側での私的な合意に基づ
き定義する用途

Co

サロゲート UTF-16 のために永久に保留 Cs  文字として

割り当てていない

非文字

内部利用のために永久に保留 Cn

保留

将来の割当てのために保留

割り当てていない

符号位置

サロゲート,非文字(noncharacter)及び保留の符号位置は,文字として割り当てていないので交換には

制約がある。例えば,サロゲート符号位置は,どの UCS 符号化形式にも正しい形式の表現がない。

6.3.2 

図形文字 

同一の図形文字を複数の符号位置に割り当てることはない。この符号化文字集合には,似た形の図形文

字が複数存在するが,それらは,異なる目的で使用する異なる文字であって,異なる名前をもつ。

6.3.3 

書式文字 

書式文字は,可視化されずに周囲の文字に影響を与えるような文字の分類である。

6.3.4 

制御文字 

BMP の符号位置 0000∼001F 及び 007F∼009F は,制御文字のために保留する(箇条 11 参照)。

6.3.5 

私用文字 

BMP の符号位置 E000∼F8FF は,私用のために保留する。面 0F 及び面 10 の,FFFFE,FFFFF,10FFFE

及び 10FFFF を除く全ての符号位置は,私用のために保留する。

この規格では,私用文字にはいかなる制限も加えない。私用文字は,利用者定義の文字を備えるのに使

用できる。例えば,これは,漢字の用字の利用者には一般的な要件となる。

注記  私用文字の意味のある交換のためには,この規格とは別に,送信者と受信者との間の合意が必

要となる。

6.3.6 

サロゲート符号位置 

符号位置 D800∼DFFF は,UTF-16 の符号化形式で使用するために保留する(9.2 参照)

。前半(D800∼

DBFF)を上位サロゲート符号位置とし,後半(DC00∼DFFF)を下位サロゲート符号位置とする。

6.3.7 

非文字符号位置 

非文字である符号位置の状態を将来の規格の改正によって変更することは,ない。非文字は,FDD0∼


13

X 0221

:2014 (ISO/IEC 10646:2012)

FDEF 及び下位 4 桁が FFFE 又は FFFF であるような全ての符号位置とする。

注記  符号位置 FFFE は,“印”(しるし)用に保留する。符号位置 FDD0∼FDEF 及び FFFF は,符号

化文字ではないことが保証された数値を必要とする内部処理に使用できる(例えば,表を終了

させる,テキストの終わりを通知するなど。

。さらに,FFFF は,BMP の最大値であるから,

UTF-16 の文脈においては,2 進探索又は順次探索の索引最終値として使用することもできる。

6.3.8 

保留符号位置 

保留符号位置は,将来の標準化のために保留する。保留符号位置を他の目的に用いてはならない。この

規格の将来の版は,保留の符号位置に文字を割り当てることがある。

6.4 

文字の名前 

この規格は,全ての図形文字及び書式文字に一意的な名前を付ける。命名の基準は,次のいずれかとす

る。

a)

文字の慣例的な意味を示す。

b)

対応する図形記号の形を表す。

c)

中国,日本及び韓国の漢字(CJK 漢字)については,24.6 に示す規則に従う。

d)

ハングル音節については,24.7 に示す規則に従う。

文字によっては,文字の別名と呼ぶ代替の名前を一つ以上もつことがある。これは,元の名前を補正す

るものである。文字の名前を構成するためのその他の規則は,箇条 24 に示す。

CJK 統合漢字及びハングル音節以外の文字の名前の一覧を箇条 31 に示す。

注記  文 字 の 名 前 の 一 覧 は , ユ ニ コ ー ド の 文 字 デ ー タ ベ ー ス に も 含 ま れ て い る 。 こ れ は ,

<http://www.unicode.org/Public/UNIDATA/NamesList.txt>

<http://www.unicode.org/Public/UNIDATA/NamesList.html>に記載されている。

6.5 

符号位置の短い識別子(UID 

この規格は,保留されている(未割当ての)符号位置を含む各符号位置の短い識別子(short identifier)

を定義する。いずれの符号位置の短い識別子も,他のいずれの符号位置の短い識別子とは異なる。ある文

字がある符号位置に配置されているとき,その符号位置の短い識別子は,その符号位置に配置される文字

を引用するために使用できる。

注記 1  例えば,U+DC00 は,サロゲートの符号位置を識別し,U+FFFF は,非文字の符号位置を識

別する。U+0025 は,図形文字が配置されている符号位置を識別する。同時に,U+0025 は,

そこに配置される文字(すなわち,PERCENT SIGN)をも識別する。

注記 2  この短い識別子は,規格の記述に使用される言語とは独立である。規格の文章を翻訳する場

合でも,そのままにする。

ここでは,短い識別子を次のいずれかとして定義する。

a)

短い識別子の 6 桁形式は,文字の符号位置を示す六つの 16 進数字の列とする(6.2 参照)

b)

短い識別子の 4∼5 桁形式は,6 桁形式の最後の四つ又は五つの数字とする。4 桁を超える部分の頭の

0 は,省略する。

c)

短い識別子の 4∼5 桁形式又は 6 桁形式の前に,文字“+”

PLUS SIGN)を付けてもよい。

d)

上の a)c)で定義した三つの短い識別子の形式の前に,前置文字(prefix letter)

“U”

LATIN CAPITAL 

LETTER U

)を付けてもよい。

短い識別子の中に現れる大文字の A∼F 及び U は,対応する小文字に置き換えてもよい。

バッカス・ナウア記法(Backus-Naur form)による,短い識別子の完全な構文は,次による。


14

X 0221

:2014 (ISO/IEC 10646:2012)

   

{ U | u }{+}(xxxx | xxxxx | xxxxxx)

ここに,

“x”は,一つの 16 進数字(0∼9,A∼F 又は a∼f)を表す。

例  LATIN SMALL LETTER LONG S は,次のいずれの形式によって表記してもよい。

 017F

+017F

U017F

U+017F

任意の大文字を対応する小文字に置き換えてもよい。

6.6 UCS

列識別子 

この規格は,この規格中の任意の符号位置の列に対して識別子を定義する。このような識別子を,UCS

列識別子(以下,USI という。

)という。n 個の符号位置からなる列の UCS 識別子は,次の形式とする。

<UID1, UID2, ..., UIDn>

ここに,UID1,UID2 などは,対応する符号位置の短い識別子であって,列における符号位置の出現順序

と同じ順に表記する。このような列におけるそれぞれの符号位置に文字が割り当てられている場合,それ

らの符号位置に割り当てられた文字の列を識別するために USI を用いることができる。UID1,UID2 など

の構文は,6.5 で規定する。UID の間は,COMMA(コンマ)で区切る。COMMA の後ろに一つの SPACE(ス

ペース)を付加してもよい。UCS 列識別子は,少なくとも二つの UID を含み,LESS-THAN SIGN[不等

号(より小)

]で始まり,GREATER-THAN SIGN[不等号(より大)

]で終わる。

バッカス・ナウア記法による,UCS 列識別子の完全な構文は,次による。

“<” (xxxx | xxxxx | xxxxxx) ((“,” space?) (xxxx | xxxxx | xxxxxx))+ “>”

ここに,

“x”は,一つの 16 進数字(0∼9,A∼F 又は a∼f)を表す。

注記 UCS 列識別子は,部分集合の内容の指定に用いることはできない。UCS 列識別子は,この規格

の外で,対応付けを示す合成列,フォントでのレパートリなどの指定に用いてもよい。

6.7 

オクテット列識別子 

符号化形式の定義(箇条 10 参照)の文脈において,直列化されたオクテットを表現するために,この規

格は,直列化したオクテット列の識別子を定義する。n 個のオクテットからなる列は,次による。

<xx

1

 xx

2

 … xx

n

>

ここに,xx

1

xx

2

及び xx

n

は,二つの 16 進数字からなる最初,2 番目及び n 番目のオクテットを表す。

7 UCS

の維持・改正 

この符号化文字集合は,ISO/IEC JTC 1(情報技術)の SC 2(符号化文字集合)によって,維持・改正

される。

注記 0A  この規格の維持・改正は,ISO/IEC JTC 1 での作業に応じて,日本工業標準調査会で審議す

る。

この符号化文字集合における全ての文字の名前及び符号位置割当ては,この規格の将来の版及び改正に

よって変更されない。これは文字の別名も含まれる。

注記  規格の出版後に文字の名前を変更できないので,文字の名前が不適切であった場合は,文字の

別名を作成する。

部分集合 

この規格は,情報交換,送信装置及び受信装置で使用するための,符号化図形文字の部分集合の仕様を

規定する。

部分集合の仕様として,制限部分集合及び選択部分集合の二つを規定する。採用される部分集合は,こ


15

X 0221

:2014 (ISO/IEC 10646:2012)

の二つのいずれか又は両者の組合せで構成してもよい。

8.1 

制限部分集合 

制限部分集合は,指定する部分集合が含む図形文字の一覧によって示す。この仕様は,他の符号系を使

う適用業務群及び装置群が,この符号化文字集合との間で相互動作することを可能とする。

制限部分集合への適合性を主張する場合,

この規格で定義された図形文字の名前又は符号位置を用いて,

部分集合中の図形文字の一覧を示さなければならない。

8.2 

選択部分集合 

選択部分集合は,この規格で定義された図形文字の組の一覧によって示す。選択の対象となる組の一覧

附属書 に示す。選択部分集合では,符号位置 0020∼007E が,いつでも自動的に含まれる。

選択部分集合への適合性を主張する場合,選択された,この規格で定義されている組の一覧を,示さな

ければならない。

9 UCS

の符号化形式 

この規格は,個々の UCS スカラ値を一つ以上の符号単位の一意の列で表現する符号化形式を三つ規定す

る。これらを,UTF-8,UTF-16 及び UTF-32 という。

9.1 UTF-8 

UTF-8 は,表 で指定されるように各 UCS スカラ値を一つ∼四つのオクテットのオクテット列に割り当

てる UCS の符号化形式である。

−  組 BASIC LATIN の UCS 文字は,UTF-8 では,ISO/IEC 4873 に従って表現される。すなわち,20∼

7E の値をもつ単一オクテットである。

−  符号位置 0000∼001F の制御機能及び符号位置 007F の DELETE は,箇条 11 で規定する詰込みオクテ

ットなしで表現される。すなわち,ISO/IEC 4873 及び JIS X 0202 の 8 ビット構造に従った,それぞれ

00∼1F 及び 7F の値の単一オクテットである。

−  その他には,00∼7F の値のオクテットは,いかなる文字の UTF-8 符号化表現においても使われない。

これによって,UTF-8 符号化表現と,これらのオクテット値を手掛かりにして符号単位列を解析する

ような既存のファイル操作システム及び通信サブシステムとの互換性が保たれる。

−  任意の位置から始めて符号単位列を 1 オクテットずつ調べるとき,いかなる文字も,その UTF-8 符号

化表現の最初のオクテットを直ちに識別できる。そのオクテットは,その文字の符号化表現を構成す

る複数オクテットの列に含まれる継続オクテット(もしあれば)の数を示す。

表 は,UTF-8 符号化形式におけるビット割当てを指定し,UCS スカラ値の範囲と一つ∼四つのオクテ

ット列との対応を示す。

表 2UTF-8 ビット割当て

スカラ値

第 1 オクテット

第 2 オクテット

第 3 オクテット

第 4 オクテット

000000000xxxxxxx 0xxxxxxx

00000yyyyyxxxxxx 110yyyyy

10xxxxxx

zzzzyyyyyyxxxxxx 1110zzzz

10yyyyyy

10xxxxxx

000uuuuuzzzzyyyyyyxxxxxx 11110uuu

10uuzzzz

10yyyyyy

10xxxxxx

サロゲート符号位置は,UCS スカラ値ではないため,符号位置 D800∼DFFF に対応する UTF-8 のいか

なる列も,誤った形式である。


16

X 0221

:2014 (ISO/IEC 10646:2012)

   

表 は,全ての正しい形式の UTF-8 のオクテット列の範囲を一覧する。表 で一覧されるパターンに一

致しない任意の UTF-8 列は,誤った形式である。

表 3−正しい形式の UTF-8 オクテット列

符号位置

第 1 オクテット

第 2 オクテット

第 3 オクテット

第 4 オクテット

0000∼007F 00∼7F

0080∼07FF C2∼DF 80∼BF

0800∼0FFF E0

A0∼BF 80∼BF

1000∼CFFF E1∼EC 80∼BF 80∼BF  
D000∼D7FF ED

80∼9F 80∼BF

E000∼FFFF EE∼EF 80∼BF 80∼BF  
10000∼3FFFF F0 90∼BF 80∼BF 80∼BF 
40000∼FFFFF F1∼F3 80∼BF 80∼BF 80∼BF 
100000∼10FFFF F4  80∼8F 80∼BF 80∼BF

表 で示す形式の正しさの条件の結果として,C0∼C1 及び F5∼FE のオクテット値は,UTF-8 では許さ

れない。

9.2 UTF-16 

UTF-16 は,表 で指定されるように各 UCS スカラ値を一つ∼二つの符号なし 16 ビット符号単位列に割

り当てる UCS の符号化形式である。

UTF-16 符号化形式では,0000∼D7FF 及び E000∼FFFF の範囲の符号位置は,単一の 16 ビット符号単位

で表現される。10000∼10FFFF の範囲にある符号位置は,二つの 16 ビット符号単位で表現される。この特

別な符号単位の対を,サロゲートペアという。

サロゲートペアに用いる符号単位は,単一符号単位の表現で使用する符号単位と重複しないので,

UTF-16 における全ての符号位置の表現は,他の表現と重なることがない。

UTF-16 は,一般的に使用される文字の大多数を含む BMP の文字の表現に最適化されている。

サロゲート符号位置は,UCS スカラ値ではないため,単独のサロゲート符号単位は,誤った形式である。

表 は,UTF-16 符号化形式のビット割当てを指定する。サロゲートペアの計算において,スカラ値のオ

フセット開始の計算に当たり 16 進数の 10000 の減算が行われる(表中において“wwww  = uuuuu−1”で

表現される。

表 4UTF-16 ビット割当て

スカラ値 UTF-16

xxxxxxxxxxxxxxxx xxxxxxxxxxxxxxxx 
000uuuuuxxxxxxxxxxxxxxxx

110110wwwwxxxxxx  110111xxxxxxxxxx

注記  この規格の以前の版には,UCS-2 という 2 オクテット BMP 形式が含まれていた。これは,UTF-16

符号化形式のサブセットであって,UCS スカラ値を BMP の範囲に制限したものとみなすこと

ができた。UCS-2 符号化形式は,廃止された。

9.3 UTF-32

UCS-4 

UTF-32(UCS-4 も同じ。)は,各 UCS スカラ値を単一の符号なし 32 ビット符号単位に割り当てる UCS

符号化形式である。用語 UTF-32 と UCS-4 とは,この符号化形式を指定するために互いに取り替えて用い

てもよい。


17

X 0221

:2014 (ISO/IEC 10646:2012)

サロゲート符号位置は,UCS スカラ値ではないため,0000D800∼0000DFFF の範囲の UTF-32 符号単位

は,誤った形式である。

10 UCS

の符号化方式 

符号化方式とは,それぞれの UCS 符号化形式に特有のオクテット直列化の方式であって,印の仕様もそ

の一部である。印(しるし)は,対応する符号化形式における,符号位置 FEFF の ZERO WIDTH NO-BREAK 

SPACE

に対応する符号単位列とする。印が使われる場合,印は,直列化オクテット列の先頭において,文

字の表現に使われる符号化形式におけるオクテットの順序を示す。

この規格では,UTF-8,UTF-16BE,UTF-16LE,UTF-16,UTF-32BE,UTF-32LE 及び UTF-32 の七つの

符号化方式を規定する。

10.1 UTF-8 

UTF-8 符号化方式では,UTF-8 の符号単位列を,その符号単位列の順序そのままに直列化する。 
UTF-8 で表現するとき,印は,オクテット列<EF BB BF>になる。UTF-8 データ列の先頭におけるその利

用は必要でなく,また,推奨もされないが,適合性に影響しない。

10.2 UTF-16BE 

UTF-16BE 符号化方式は,UTF-16 の符号単位列を,上位オクテットを下位オクテットより前置するオク

テットの並べ方によって直列化する(この並べ方は,ビッグエンディアンとしても知られている。

UTF-16BE では,先頭のオクテット列<FE FF>は,FEFF ZERO WIDTH NO-BREAK SPACE として解釈さ

れ,印としての意味は,もたない。

10.3 UTF-16LE 

UTF-16LE 符号化方式は,UTF-16 の符号単位列を,下位オクテットを上位オクテットより前置するオク

テットの並べ方によって直列化する(この並べ方は,リトルエンディアンとしても知られている。

UTF-16LE では,先頭のオクテット列<FF FE>は,FEFF ZERO WIDTH NO-BREAK SPACE として解釈さ

れ,印としての意味は,もたない。

10.4 UTF-16 

UTF-16 符号化方式は,UTF-16 の符号単位列を,上位オクテットを下位オクテットより前置又は後置す

るオクテットの並べ方によって直列化する。

UTF-16 符号化方式では,<FE FF>として読み込まれる最初の印は,上位オクテットを下位オクテットよ

り前置することを示し,<FF FE>  は,その逆を示す。印は,テキストデータの一部には,含まれない。

印がない場合は,UTF-16 符号化方式のオクテット順序は,上位オクテットを下位オクテットより前置す

る。

10.5 UTF-32BE 

UTF-32BE 符号化方式は,UTF-32 の符号単位列を,上位オクテットを下位オクテットより前置するオク

テットの並べ方によって直列化する(この並べ方は,ビッグエンディアンとしても知られている。

UTF-32BE では,先頭のオクテット列<00 00 FE FF>は,FEFF ZERO WIDTH NO-BREAK SPACE として

解釈され,印としての意味は,もたない。

10.6 UTF-32LE 

UTF-32LE 符号化方式は,UTF-32 の符号単位列を,下位オクテットを上位オクテットより前置するオク

テットの並べ方によって直列化する(この並べ方は,リトルエンディアンとしても知られている。

UTF-32BE では,先頭のオクテット列< FF FE 00 00>は,FEFF ZERO WIDTH NO-BREAK SPACE として


18

X 0221

:2014 (ISO/IEC 10646:2012)

   

解釈され,印としての意味は,もたない。

10.7 UTF-32 

UTF-32 符号化方式は,UTF-32 の符号単位列を,下位のオクテットを上位のオクテットより前置又は後

置するオクテットの並べ方によって直列化する。

印がない場合は,UTF-32 符号化方式のオクテット順序は,上位のオクテットを下位のオクテットより前

置する。

11 UCS

での制御機能の使用 

この符号化文字集合は,JIS X 0211 又は同様な構造の制御機能の規格及びこれらから導出された規格に

従って符号化された制御機能を使用できるようにする。これらの符号化制御機能の集合又は部分集合は,

この符号化文字集合とともに使ってもよい。これらの規格は,制御機能を 1 オクテット以上の列で符号化

している。

JIS X 0211

の制御文字をこの符号化文字集合とともに使うときは,その制御文字の符号化表現は,採用

した符号化形式の符号単位でのオクテット数

(箇条 参照)

と一致するように詰め込まなければならない。

この場合,最下位オクテットは,JIS X 0211 で規定されたビット組合せとし,上位のオクテットは,全て

00 とする。

例えば,制御文字 FORM FEED は,UTF-16 符号化形式では“000C”で,UTF-32 符号化形式では“0000 000C”

で表現する。

符号化制御文字の後に 20∼7F の範囲にあるビット組合せが続く形のエスケープシーケンス,制御シー

ケンス及び制御列(JIS X 0211 参照)については,それぞれのビット組合せは,00 の値をもつオクテット

を詰め込まなければならない。

例えば,エスケープシーケンスの“ESC 02/00 04/00”は,UTF-8 符号化形式では“1B 20 40”で,UTF-16

符号化形式では“001B 0020 0040”で,UTF-32 符号化形式では“0000001B 00000020 00000040”で表現す

る。

注記 1  JIS X 0211 で規定される制御機能の多くのものの定義では,その制御機能が動作する要素を

識別するために,

“文字”という語が現れる。そのような制御機能をこの規格の符号化文字に

適用する場合,制御機能の動作は,制御機能が作用する要素(又は文字)として応用が選択

した,この規格の要素の種類による。これらの要素としては,文字(基底文字及び/又は結

合文字)が選ばれてもよいし,適切であれば他のもの(例えば,合成列など)が選ばれても

よい。

JIS X 0202

の符号拡張制御機能(指示用エスケープシーケンス,シングルシフト及びロッキングシフト)

は,この符号化文字集合と一緒に使ってはならない。

注記 2  JIS X 0211 が制御文字に関連付けて用いている長い名前の一覧を次に示す。

0000

NULL

0001

START OF HEADING

0002

START OF TEXT

0003

END OF TEXT

0004

END OF TRANSMISSION

0005

ENQUIRY

0006

ACKNOWLEDGE

0007

BELL

0008

BACKSPACE

0009

CHARACTER TABULATION


19

X 0221

:2014 (ISO/IEC 10646:2012)

000A

LINE FEED

000B

LINE TABULATION

000C

FORM FEED

000D

CARRIAGE RETURN

000E

SHIFT-OUT

000F

SHIFT-IN

0010

DATA LINK ESCAPE

0011

DEVICE CONTROL ONE

0012

DEVICE CONTROL TWO

0013

DEVICE CONTROL THREE

0014

DEVICE CONTROL FOUR

0015

NEGATIVE ACKNOWLEDGE

0016

SYNCHRONOUS IDLE

0017

END OF TRANSMISSION BLOCK

0018

CANCEL

0019

END OF MEDIUM

001A

SUBSTITUTE

001B

ESCAPE

001C

INFORMATION SEPARATOR FOUR

001D

INFORMATION SEPARATOR THREE

001E

INFORMATION SEPARATOR TWO

001F

INFORMATION SEPARATOR ONE

007F

DELETE

0082

BREAK PERMITTED HERE

0083

NO BREAK HERE

0084

INDEX

0085

NEXT LINE

0086

START OF SELECTED AREA

0087

END OF SELECTED AREA

0088

CHARACTER TABULATION SET

0089

CHARACTER TABULATION WITH JUSTIFICATION

008A

LINE TABULATION SET

008B

PARTIAL LINE FORWARD

008C

PARTIAL LINE BACKWARD

008D

REVERSE LINE FEED

008E

SINGLE-SHIFT TWO

008F

SINGLE-SHIFT THREE

0090

DEVICE CONTROL STRING

0091

PRIVATE USE ONE

0092

PRIVATE USE TWO

0093

SET TRANSMIT STATE

0094

CANCEL CHARACTER

0095

MESSAGE WAITING

0096

START OF GUARDED AREA

0097

END OF GUARDED AREA

0098

START OF STRING

009A

SINGLE CHARACTER INTRODUCER

009B

CONTROL SEQUENCE INTRODUCER

009C

STRING TERMINATOR

009D

OPERATING SYSTEM COMMAND

009E

PRIVACY MESSAGE

009F

APPLICATION PROGRAM COMMAND

制御文字 0084  INDEX は,JIS X 0211:1994 以降削除されている。加えて,制御文字 000E

及び 000F は,7 ビット環境では,それぞれ SHIFT-OUT 及び SHIFT-IN と呼ばれ,8 ビット

環境では,LOCKING-SHIFT ONE 及び LOCKING-SHIFT ZERO と呼ばれる。


20

X 0221

:2014 (ISO/IEC 10646:2012)

   

12 

機能識別の宣言 

12.1 

識別の目的及び構文 

この規格に適合する符号単位列は,送信者と受信者との間で交換される符号化情報の構成要素の全て又

は一部となることを意図している。送信者がこの規格(符号化形式及び符号化方式も含む。

)を採用してい

るという識別情報及び  符号化空間の部分集合の識別情報は,受信者にも届くことが望ましい。これらの識

別情報を受信者に伝える経路は,この規格の適用範囲外とする。

しかし,幾つかの符号化情報の交換のための規格は,符号単位列に適用される識別情報を交換情報の一

部に含めることを,許してもよいし,要求してもよい。ここでは,部分集合をもつ UCS を識別するための

符号化表現,並びにこの規格と一緒に使う JIS X 0211 の制御機能の C0 集合及び C1 集合を識別するための

符号化表現を規定する。このような符号化表現は,識別データ要素の全て又は一部となり,関係する規格

に従って,情報交換で用いてもよい。

これらの識別情報の目的においては,直列化に当たって上位オクテットを下位オクテットより前置する

ので,UTF-8,UTF-16 及び UTF-32 の各符号化形式において選択できる符号化方式は,それぞれ UTF-8,

UTF-16BE 及び UTF-32BE だけである。

識別情報が二つ以上ある場合は,この識別の順序は,ここに規定した順序による。

注記  別の識別法を附属書 に示す。

注記 A  箇条 10 に規定する印も,識別法の一種である。

12.2 UCS

の符号化形式の識別 

JIS X 0202

のエスケープシーケンスを使う場合,この規格で規定する UCS の符号化形式(箇条 参照)

の識別は,次に示す指示シーケンスによる。

ESC 02/05 02/15 04/09  UTF-8 符号化形式による UTF-8 符号化方式 
ESC 02/05 02/15 04/12  UTF-16 符号化形式による UTF-16BE 符号化方式 
ESC 02/05 02/15 04/06  UTF-32 符号化形式による UTF-32BE 符号化方式

注記 1  この規格の以前の版で使われていた,実装水準 1 及び 2 を識別する指示シーケンス ESC 02/05

02/15 04/00,ESC 02/05 02/15 04/01,ESC 02/05 02/15 04/03,ESC 02/05 02/15 04/04,ESC 02/05 
02/15 04/07,ESC 02/05 02/15 04/08,ESC 02/05 02/15 04/10 及び ESC 02/05 02/15 04/11 は,廃

止した。残っているエスケープシーケンスは,この規格の以前の版の実装水準 3 に対応する

ものであるが,この実装水準が現在有効な唯一の符号単位列の内容定義に相当する。

注記 2  次のエスケープシーケンスも使用してもよい。

ESC 02/05 04/07  UTF-8 符号化形式による UTF-8 符号化方式

JIS X 0202

の符号系への復帰に使うエスケープシーケンスは,詰め込まない(12.5 参照)

このようなエスケープシーケンスが JIS X 0202 に適合した符号単位列に現れる場合,ここに示す一連の

ビット組合せのとおりでなければならない。

このようなエスケープシーケンスが,この規格に適合した符号単位列に現れる場合,箇条 11 の規定に従

って詰め込まなければならない。

12.3 

図形文字部分集合の識別 

JIS X 0211

の制御シーケンスを使うときは,この規格で規定する部分集合(箇条 参照)を制御シーケ

ンス IDENTIFY UNIVERSAL CHARACTER SUBSET(IUCS,国際符号化文字部分集合識別)で,次に示す

とおりに識別しなければならない。

CSI Ps... 02/00 06/13


21

X 0221

:2014 (ISO/IEC 10646:2012)

Ps...  は,選択パラメタが複数個あってもよいことを示す。パラメタは,附属書 に示す部分集合の組番号

からなる。

パラメタが二つ以上ある場合,

それぞれのパラメタ値は,

03/11 の値をもつオクテットで区切る。

パラメタ値は,数字 0∼9 にそれぞれ対応するオクテット値 03/00∼03/09 の数字で表現する。

このエスケープシーケンスは,JIS X 0202 に適合した符号単位列中に現れる場合,ここに示す一連のビ

ット組合せのとおりでなければならない。

この制御シーケンスは,この規格に適合した符号単位列中に現れる場合,箇条 11 の規定に従って詰め込

まなければならない。

12.4 

制御機能集合の識別 

JIS X 0202

のエスケープシーケンスを使う場合,この規格と一緒に使用する JIS X 0211 の制御機能の集

合(箇条 11 参照)は,次に示す形の識別シーケンスで識別する。

ESC 02/01 04/00  JIS X 0211 の全 C0 集合を識別する。

ESC 02/02 04/03  JIS X 0211 の全 C1 集合を識別する。

これら以外の C0 集合又は C1 集合については,終端オクテット F は,符号化文字集合の国際登録簿から

得る。これらの集合の識別シーケンスを,次に示す。

ESC 02/01 F  C0 集合を識別する。 
ESC 02/02 F  C1 集合を識別する。

このエスケープシーケンスは,JIS X 0202 に適合した符号単位列中に現れる場合,ここに示す一連のビ

ット組合せのとおりでなければならない。

このエスケープシーケンスは,この規格に適合した符号単位列中に現れる場合,箇条 11 の規定に従って

詰め込まなければならない。

12.5 JIS 

0202

の符号化方式の識別 

JIS X 0202

のエスケープシーケンスを使う場合,

UCS から JIS X 0202 の符号化方式への復帰又は遷移は,

エスケープシーケンス ESC 02/05 04/00 による。このエスケープシーケンスは,この規格に適合した符号単

位列中に現れる場合,箇条 11 の規定に従って詰め込まなければならない。

このエスケープシーケンスは,JIS X 0202 に適合した符号単位列中に現れる場合,ここに示す一連のビ

ット組合せのとおりでなければならない。

注記 ESC

02/05

04/00 のエスケープシーケンスは,通常,JIS X 0202 から移ったときに保持された JIS 

X 0202

の状態に復帰するために使われる。ここで規定する ESC 02/05 04/00 のエスケープシー

ケンスは,詰込みオクテットがあるために,JIS X 0202 に規定されたものと同一ではないこと

がある。このため,12.2 の UCS を識別するためのエスケープシーケンスは,復帰が必ずしも

JIS X 0202

に適合しないことを示すために 02/15 オクテットを含んでいる。

13 

符号表及び一覧表の構造 

箇条 31 に図形文字の詳細符号表及び文字の名前の一覧表を示す。これによって,それぞれの文字に対す

る,図形記号,符号化表現及び文字の名前を規定する。

注記  箇条 31 は,名付け若しくは用法又は付随する図形記号のような,文字の幾つかの特徴を明らか

にするための,文字についての追加情報も含む。

図形記号は,文字の代表的な可視化表現とする。この規格は,各文字の正確な形又は色を規定しようと

するものではない。文字の形は,採用するフォント又はその他の表示手段のデザインに左右されるもので

あり,この規格の適用範囲外とする。この規格における代表字形は,一貫して白黒で表示されているが,


22

X 0221

:2014 (ISO/IEC 10646:2012)

   

この規格は,特定の一色若しくは複数の色をもつ図形記号,一部若しくは全部をアニメーション化した図

形,又はその両方を組み合わせて実装することを妨げるものではない。文字が特定の色と関連付けられて

いる場合には,符号表では,ヨーロッパの紋章で使用される慣習を用いて,単色の線画として表示してい

る。さらに,文字名に現れる BLACK(

“黒”

)又は WHITE(

“白”

)の語は,特定の色を指定するものでは

なく,単にいわゆるベタ文字といわゆる袋文字とを識別するためのものである。

この規格で規定する図形文字は,その名前で一意に識別される。名前が異なっていても,図形文字を可

視化した図形記号が常に異なるわけではない。類似の図形記号をもつ図形文字の例としては,LATIN 

CAPITAL LETTER A

(ラテン大文字 A)

GREEK CAPITAL LETTER ALPHA(ギリシア大文字 A)及び

CYRILLIC CAPITAL LETTER A

(キリル大文字 A)がある。

文字のもつ意味は,この規格では規定しない。これは,国によって異なったり,適用業務によって異な

ったりする。

アルファベット類の用字については,文字をほぼアルファベット順に区の中に配列することを基本原則

とする。用字に大文字と小文字とがある場合には,対にして配列する。しかし,例えば,用字を配列した

規格が存在する場合には,基本原則よりもその規格に従うことを優先して文字を割り当てる。このように

文字を符号表中に配列することによって,既存の規格とこの符号化文字集合との間の変換が容易になる。

しかし,一般的には,この符号化文字集合と他の符号化文字集合との間の変換には,変換表を使うことに

なると考えられる。

この規格では,利用者が必要とする文字が,符号表のどこかの部分にまとまって見つかることを意図し

ていないし,実際に分散していることが多い。

さらに,利用者は,どの用字を使うにせよ,必要とする文字の幾つかが,この符号化文字集合の別の所

で定義されているのに気付くことが多いであろう。これは,特に,数字,記号及び複数の用字を使う場合

のラテン文字などについていえることである。

したがって,この符号化文字集合の利用者は,最初に A.2 のブロック名の一覧表又は

図 7∼図 12 の面の

概観を調べ,その後に関連する用字,記号及び数字の符号表を調べるのが望ましい。

附属書 にアルファ

ベット順に分類した文字の名前の一覧を示す。

14 

ブロック及び組の名前 

14.1 

ブロックの名前 

連続した符号位置からなる名前の付いたブロックを,共通の特性(例えば,用字)をもった文字を割り

当てる目的で,面の中に定める。BMP,SMP,SIP 及び SSP の中に定義されたブロックを A.2 に示し,

7

図 12 に図示する。

ブロックの名前を構成するための規則は,24.5.1 で規定する。

14.2 

組の名前 

組は,

附属書 で定義する。

組の名前を構成するための規則は,24.5.2 で規定する。

15 

双方向文脈での鏡像文字 

15.1 

鏡像文字 

ある種の文字は,双方向テキストの文脈で,特別な意味をもつ。これらの文字の解釈及び表示は,符号

単位列中にその文字の符号化表現が現れた時点での文字の進行方向に関係する。これらの文字の一覧は,


23

X 0221

:2014 (ISO/IEC 10646:2012)

ユニコード標準の“Bidi_Mirrord”属性が“Y”に設定されているものからなる。これらの値は,ユニコー

ド標準第 6.1 版の双方向鏡像属性(箇条 参照)で決定される。

注記 1  一般的には,鏡像文字は,右から左に並べられたときに用いる水平方向に裏返した画像をも

つ。しかし,幾つかの数学記号においては,

“鏡像”は,単純な裏返しにはならない。詳細は,

ユニコード技術報告書 UTR #25“Unicode Support for Mathematics”

(ユニコードの数学向け機

能)を参照。

このような文字の裏返しは,対になった文字に限定されるものでなく,同種の文字全てに適用しなけれ

ばならない。

例  右から左のテキスト断片では,GREATER-THAN SIGN(左から右のテキストでは“>”と表示さ

れる。

)は,

“<”という図形記号で表示されることがある。

注記 2  多くの古代文字及び幾つかの現在の用字では,右から左及び左から右の両方で書くことがで

きる。これらの用字の中には,しばしば慣習的に,垂直軸の周りで対称でない図形記号の任

意の文字表現に,適切な鏡像図形記号を用いるものがある。この場合,図形画像を運用上の

書記方向に合わせて適切に表示するのは,表示システムの責任となる。文字符号表の代表図

形記号の方向は,用字の既定の書記方向と対応する。これらの用字に属する文字は,ユニコ

ード標準の“Bidi_Mirrored”属性が“N”に設定されている(箇条 のユニコード標準双方

向鏡像属性を参照)

このような用字には,既定の書記方向が左から右である古代用字である古代イタリア文字,

及び既定の用字方向が右から左である古代用字であるキプロス文字が含まれる。

15.2 

双方向テキストの方向性 

The Unicode Bidirectional Algorithm(ユニコード双方向アルゴリズム)(箇条 参照)は,双方向テキス

トの方向性を決定するアルゴリズムについて記載している。この規格でもそれを用いる。

16 

特殊文字 

印字できる図形記号がないか,又は他の何らかの点で特別な文字がある。

16.1 

空白の文字 

次の文字は,空白の文字とする。これらは,一般分類の値が“Zs”である全ての文字の一覧である。

符号位置  文字の名前 
0020

SPACE

00A0

NO-BREAK SPACE

1680

OGHAM SPACE MARK

180E

MONGOLIAN VOWEL SEPARATOR

2000

EN QUAD

2001

EM QUAD

2002

EN SPACE

2003

EM SPACE

2004

THREE-PER-EM SPACE

2005

FOUR-PER-EM SPACE

2006

SIX-PER-EM SPACE

2007

FIGURE SPACE

2008

PUNCTUATION SPACE

2009

THIN SPACE

200A

HAIR SPACE

202F

NARROW NO-BREAK SPACE

205F

MEDIUM MATHEMATICAL SPACE

3000

IDEOGRAPHIC SPACE


24

X 0221

:2014 (ISO/IEC 10646:2012)

   

注記 1  文字 1680 OGHAM SPACE MARK は,中心ステム線を示す見えるグリフによって表現されるこ

とも多いが,ステムなし書体のフォントでは空白のグリフによって表現される。

注記 2 180E

MONGOLIAN 

VOWEL 

SEPARATOR

は,

語の最後の MONGOLIAN LETTER A 又は MONGOLIAN 

LETTER 

E

と,これに先行する子音の字との間で使ってもよい。これは,MONGOLIAN LETTER 

A

又は MONGOLIAN LETTER E の字及び先行する子音の図形記号の特別な形を指示する。可

視的に表示する場合,一般には文字の間の幅の狭いスペースのように表すが,時には,利用

者の補助のため,特定の図形記号として表してもよい。

注記 3 202F

NARROW 

NO-BREAK-SPACE

は,改行しないスペース文字(non-breaking space)である。

00A0 NO-BREAK SPACE(ノーブレークスペース)と同様であるが,これより表示幅が狭い。

モンゴルの用字とともに使われるとき,通常この文字は,普通のスペースの 3 分の 1 の幅で

表示され,モンゴル語の語幹から接尾辞を分離する。これによって,その位置に語の境界が

ないことを示しながら,モンゴル文字の字形選択の通常の規則が適用できる。

16.2 

通貨記号 

この規格の通貨記号は,必ずしもある国の通貨を特定するものではない。例えば,YEN SIGN(円記号)

は,日本の円に使うこともできるが,中国の元に使うこともできる。さらに,DOLLAR SIGN(ドル記号)

は,米国も含め,多くの国で使用できる。

16.3 

書式文字 

次の文字は,書式文字とする(6.3.3 参照)

。これらは,一般分類の値が“Cf”

“Zl”及び“Zp”である

全ての文字の一覧である。

附属書 を参照。

符号位置  文字の名前 
00AD

SOFT HYPHEN

0600

ARABIC NUMBER SIGN

0601

ARABIC SIGN SANAH

0602

ARABIC FOOTNOTE MARKER

0603

ARABIC SIGN SAFHA

0604

ARABIC SIGN SAMVAT

06DD

ARABIC END OF AYAH

070F

SYRIAC ABBREVIATION MARK

17B4

KHMER VOWEL INHERENT AQ

17B5

KHMER VOWEL INHERENT AA

200B

ZERO WIDTH SPACE

200C

ZERO WIDTH NON-JOINER

200D

ZERO WIDTH JOINER

200E

LEFT-TO-RIGHT MARK

200F

RIGHT-TO-LEFT MARK

2028

LINE SEPARATOR

2029

PARAGRAPH SEPARATOR

202A

LEFT-TO-RIGHT EMBEDDING

202B

RIGHT-TO-LEFT EMBEDDING

202C

POP DIRECTIONAL FORMATTING

202D

LEFT-TO-RIGHT OVERRIDE

202E

RIGHT-TO-LEFT OVERRIDE

2060

WORD JOINER

2061

FUNCTION APPLICATION

2062

INVISIBLE TIMES

2063

INVISIBLE SEPARATOR

2064

INVISIBLE PLUS

206A

INHIBIT SYMMETRIC SWAPPING

206B

ACTIVATE SYMMETRIC SWAPPING

206C

INHIBIT ARABIC FORM SHAPING


25

X 0221

:2014 (ISO/IEC 10646:2012)

206D

ACTIVATE ARABIC FORM SHAPING

206E

NATIONAL DIGIT SHAPES

206F

NOMINAL DIGIT SHAPES

FEFF

ZERO WIDTH NO-BREAK SPACE

FFF9

INTERLINEAR ANNOTATION ANCHOR

FFFA

INTERLINEAR ANNOTATION SEPARATOR

FFFB

INTERLINEAR ANNOTATION TERMINATOR

110BD

KAITHI NUMBER SIGN

1D173

MUSICAL SYMBOL BEGIN BEAM

1D174

MUSICAL SYMBOL END BEAM

1D175

MUSICAL SYMBOL BEGIN TIE

1D176

MUSICAL SYMBOL END TIE

1D177

MUSICAL SYMBOL BEGIN SLUR

1D178

MUSICAL SYMBOL END SLUR

1D179

MUSICAL SYMBOL BEGIN PHRASE

1D17A

MUSICAL SYMBOL END PHRASE

E0001

LANGUAGE TAG

E0020∼E007F

TAG SPACE

  ∼

CANCEL TAG

16.4 

漢字構成記述文字 

漢字構成記述文字(Ideographic Description Character,以下 IDC という。)は,漢字構成記述文字列

(Ideographic Description Sequence,以下 IDS という。

)を作り出すため,他の図形文字の列とともに使われ

る図形文字である。この種の文字列は,この規格で規定されていない漢字のような文字(ideographic

character)を記述する目的で使ってもよい。附属書 に詳細な説明がある。IDC は,次による。

符号位置  名前 
2FF0

IDEOGRAPHIC DESCRIPTION CHARACTER LEFT TO RIGHT

2FF1

IDEOGRAPHIC DESCRIPTION CHARACTER ABOVE TO BELOW

2FF2

IDEOGRAPHIC DESCRIPTION CHARACTER LEFT TO MIDDLE AND RIGHT

2FF3

IDEOGRAPHIC DESCRIPTION CHARACTER ABOVE TO MIDDLE AND BELOW

2FF4

IDEOGRAPHIC DESCRIPTION CHARACTER FULL SURROUND

2FF5

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM ABOVE

2FF6

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM BELOW

2FF7

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM LEFT

2FF8

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM UPPER LEFT

2FF9

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM UPPER RIGHT

2FFA

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM LOWER LEFT

2FFB

IDEOGRAPHIC DESCRIPTION CHARACTER OVERLAID

16.5 

字形選択子及び字形指示列 

字形選択子は,特別な種類の結合文字であって,分解可能でない基底文字の直後に置かれ,その基底文

字の図形記号の特定の変形を示す。文字が分解可能であるとは,文字に等価な合成列が存在することをい

う。分解可能でない基底文字とそれに続く字形選択子との列を字形指示列という。

注記 1  モンゴル自由字形選択子のように用字に固有な字形選択子もあり,数学記号その他各種の基

底文字に併用する字形選択子もある。

この箇条で定義又は参照される字形指示列だけが,図形記号の特定の変形を規定する。他の全ての字形

指示列は,許容しない。さらに,他の基底文字及び結合文字の次に来る字形選択子は,符号化文字に対応

する図形記号の選択に何の効果ももたない。

VARIATION SELECTOR-2

(字形選択子 2)∼VARIATION SELECTOR-16(字形選択子 16)の文字を

用いる字形指示列は,この規格のこの版では定義しない。

基底文字として統合漢字を用い,追加特殊用途面(SSP)の VARIATION SELECTOR-17(字形選択子

17)∼VARIATION SELECTOR-256(字形選択子 256)の文字とともに構成される字形指示列は,ユニコ


26

X 0221

:2014 (ISO/IEC 10646:2012)

   

ード技術標準 UTS #37 によって規定される漢字字形データベース(Ideographic Variation Database,IVD)

に登録される。この規格では,箇条 に示す版を用いる。

注記 2  この規格は,2010-11-14 版の漢字字形データベースの字形指示列の一覧を参照し,取り込ん

でいる。これは,次にある。<http://www.unicode.org/ivd/data/2010-11-14/>

字形選択子と組み合わせてもよい全ての数学記号の基底文字と,それに対応する変形とを,次に示す。

注記 3  VARIATION SELECTOR-1(字形選択子 1)は,数学記号とともに使用する唯一の字形選択

子である。

列の UID による表記

変形

<2229, FE00>

セリフをもつ

INTERSECTION

<222A, FE00>

セリフをもつ

UNION

<2268, FE00>

垂直画線をもつ

LESS-THAN BUT NOT EQUAL TO

<2269, FE00>

垂直画線をもつ

GREATER-THAN BUT NOT EQUAL TO

<2272, FE00>

下側の斜線に沿う

LESS-THAN OR EQUIVALENT TO

<2273, FE00>

下側の斜線に沿う

GREATER-THAN OR EQUIVALENT TO

<228A, FE00>

底部の要素を貫通する画線をもつ

SUBSET OF WITH NOT EQUAL TO

<228B, FE00>

底部の要素を貫通する画線をもつ

SUPERSET OF WITH NOT EQUAL TO

<2293, FE00>

セリフをもつ

SQUARE CAP

<2294, FE00>

セリフをもつ

SQUARE CUP

<2295, FE00>

隙間のある

CIRCLED PLUS

<2297, FE00>

隙間のある

CIRCLED TIMES

<229C, FE00>

等号が円に接触する

CIRCLED EQUALS

<22DA, FE00>

傾斜した等号をもつ

LESS-THAN EQUAL TO OR GREATER-THAN

<22DB, FE00>

傾斜した等号をもつ

GREATER-THAN EQUAL TO OR LESS-THAN

<2A3C, FE00>

縦長で下辺の幅の狭い

INTERIOR PRODUCT

<2A3D, FE00>

縦長で下辺の幅の狭い

RIGHTHAND INTERIOR PRODUCT

<2A9D, FE00>

上部の斜線に沿う相似記号をもつ

SIMILAR OR LESS-THAN

<2A9E, FE00>

上部の斜線に沿う相似記号をもつ

SIMILAR OR GREATER-THAN

<2AAC, FE00>

傾斜した等号をもつ

SMALLER THAN OR EQUAL TO

<2AAD, FE00>

傾斜した等号をもつ

LARGER THAN OR EQUAL TO

<2ACB, FE00>

底部の要素を貫通する画線をもつ

SUBSET OF ABOVE NOT EQUAL TO

<2ACC, FE00>

底部の要素を貫通する画線をもつ

SUPERSET OF ABOVE NOT EQUAL TO

字形選択子と組み合わせてもよい全てのモンゴル文字の基底文字と,それに対応する変形とを,次に示

す。モンゴル自由字形選択子とともに用いるモンゴル文字の基底文字の幾つかの表示形だけが変形を生成

する。

注記 4  モンゴル文字は,符号単位列中の位置に依存して,各種の異なる表示形をもつ。これらの表

示形は,語頭形(initial)

,語中形(medial)

,語末形(final)又は独立形(isolate)のいずれか

に分類される。

列の UID による表記

位置

変形

<1820, 180B>

独立形,中間形,語末形

MONGOLIAN LETTER A

の第 2 形式

<1820, 180C>

中間形

MONGOLIAN LETTER A

の第 3 形式

<1821, 180B>

語頭形,語末形

MONGOLIAN LETTER E

の第 2 形式

<1822, 180B>

中間形

MONGOLIAN LETTER I

の第 2 形式

<1823, 180B>

中間形,語末形

MONGOLIAN LETTER O

の第 2 形式

<1824, 180B>

中間形

MONGOLIAN LETTER U

の第 2 形式

<1825, 180B>

中間形,語末形

MONGOLIAN LETTER OE

の第 2 形式

<1825, 180C>

中間形

MONGOLIAN LETTER OE

の第 3 形式


27

X 0221

:2014 (ISO/IEC 10646:2012)

<1826, 180B>

独立形,中間形,語末形

MONGOLIAN LETTER UE

の第 2 形式

<1826, 180C>

中間形

MONGOLIAN LETTER UE

の第 3 形式

<1828, 180B>

語頭形,中間形

MONGOLIAN LETTER NA

の第 2 形式

<1828, 180C>

中間形

MONGOLIAN LETTER NA

の第 3 形式

<1828, 180D>

中間形

MONGOLIAN LETTER NA

の分離形式

<182A, 180B>

語末形

MONGOLIAN LETTER BA

の代替形式

<182C, 180B>

語頭形,中間形

MONGOLIAN LETTER QA

の第 2 形式

<182C, 180B>

独立形

MONGOLIAN LETTER QA

の女性形第 2 形式

<182C, 180C>

中間形

MONGOLIAN LETTER QA

の第 3 形式

<182C, 180D>

中間形

MONGOLIAN LETTER QA

の第 4 形式

<182D, 180B>

語頭形,中間形

MONGOLIAN LETTER GA

の第 2 形式

<182D, 180B>

語末形

MONGOLIAN LETTER GA

の女性形

<182D, 180C>

中間形

MONGOLIAN LETTER GA

の第 3 形式

<182D, 180D>

中間形

MONGOLIAN LETTER GA

の女性形

<1830, 180B>

語末形

MONGOLIAN LETTER SA

の第 2 形式

<1830, 180C>

語末形

MONGOLIAN LETTER SA

の第 3 形式

<1832, 180B>

中間形

MONGOLIAN LETTER TA

の第 2 形式

<1833, 180B>

語頭形,中間形,語末形

MONGOLIAN LETTER DA

の第 2 形式

<1835, 180B>

語末形

MONGOLIAN LETTER JA

の第 2 形式

<1836, 180B>

語頭形,中間形

MONGOLIAN LETTER YA

の第 2 形式

<1836, 180C>

中間形

MONGOLIAN LETTER YA

の第 3 形式

<1838, 180B>

語末形

MONGOLIAN LETTER WA

の第 2 形式

<1844, 180B>

中間形

MONGOLIAN LETTER TODO E

の第 2 形式

<1845, 180B>

中間形

MONGOLIAN LETTER TODO I

の第 2 形式

<1846, 180B>

中間形

MONGOLIAN LETTER TODO O

の第 2 形式

<1847, 180B>

独立形,中間形,語末形

MONGOLIAN LETTER TODO U

の第 2 形式

<1847, 180C>

中間形

MONGOLIAN LETTER TODO U

の第 3 形式

<1848, 180B>

中間形

MONGOLIAN LETTER TODO OE

の第 2 形式

<1849, 180B>

独立形,中間形

MONGOLIAN LETTER TODO UE

の第 2 形式

<184D, 180B>

語頭形,中間形

MONGOLIAN LETTER TODO QA

の女性形

<184E, 180B>

中間形

MONGOLIAN LETTER TODO GA

の第 2 形式

<185D, 180B>

中間形,語末形

MONGOLIAN LETTER SIBE E

の第 2 形式

<185E, 180B>

中間形,語末形

MONGOLIAN LETTER SIBE I

の第 2 形式

<185E, 180C>

中間形,語末形

MONGOLIAN LETTER SIBE I

の第 3 形式

<1860, 180B>

中間形,語末形

MONGOLIAN LETTER SIBE UE

の第 2 形式

<1863, 180B>

中間形

MONGOLIAN LETTER SIBE KA

の第 2 形式

<1868, 180B>

語頭形,中間形

MONGOLIAN LETTER SIBE TA

の第 2 形式

<1868, 180C>

中間形

MONGOLIAN LETTER SIBE TA

の第 3 形式

<1869, 180B>

語頭形,中間形

MONGOLIAN LETTER SIBE DA

の第 2 形式

<186F, 180B>

語頭形,中間形

MONGOLIAN LETTER SIBE ZA

の第 2 形式

<1873, 180B>

中間形,語末形

MONGOLIAN LETTER MANCHU I

の第 2 形式

<1873, 180C>

中間形,語末形

MONGOLIAN LETTER MANCHU I

の第 3 形式

<1873, 180D>

中間形

MONGOLIAN LETTER MANCHU I

の第 4 形式

<1874, 180B>

中間形

MONGOLIAN LETTER MANCHU KA

の第 2 形式

<1874, 180B>

語末形

MONGOLIAN LETTER MANCHU KA

の女性形第 1 形式

<1874, 180C>

中間形

MONGOLIAN LETTER MANCHU KA

の女性形第 1 形式

<1874, 180C>

語末形

MONGOLIAN LETTER MANCHU KA

の女性形第 2 形式

<1874, 180D>

中間形

MONGOLIAN LETTER MANCHU KA

の女性形第 2 形式

<1876, 180B>

語頭形,中間形

MONGOLIAN LETTER MANCHU FA

の第 2 形式


28

X 0221

:2014 (ISO/IEC 10646:2012)

   

<1880, 180B>

全て

MONGOLIAN LETTER ALI GALI ANUSVARA ONE

の第

2 形式

<1881, 180B>

全て

MONGOLIAN LETTER ALI GALI VISARGA ONE

の第

2 形式

<1887, 180B>

独立形,語末形

MONGOLIAN LETTER ALI GALI A

の第 2 形式

<1887, 180C>

語末形

MONGOLIAN LETTER ALI GALI A

の第 3 形式

<1887, 180D>

語末形

MONGOLIAN LETTER ALI GALI A

の第 4 形式

<1888, 180B>

語末形

MONGOLIAN LETTER ALI GALI I

の第 2 形式

<188A, 180B>

語頭形,中間形

MONGOLIAN LETTER ALI GALI NGA

の第 2 形式

字形選択子と組み合わせてもよい全てのパスパ文字の基底文字と,

それに対応する変形とを,

次に示す。

これらの字形選択子の列は,特定の可視化表示を選択するのではなく,字形選択子の直前の文字から予測

される通常の形とは左右反転した表示を選択する。

列の UID による表記

変形

<A856, FE00>

PHAGS-PA LETTER SMALL A

の左右反転した形

<A85C, FE00>

PHAGS-PA LETTER HA

の左右反転した形

<A85E, FE00>

PHAGS-PA LETTER I

の左右反転した形

<A85F, FE00>

PHAGS-PA LETTER U

の左右反転した形

<A860, FE00>

PHAGS-PA LETTER E

の左右反転した形

<A868, FE00>

PHAGS-PA SUBJOINED LETTER YA

の左右反転した形

注記 5  字形選択子は,既存の符号化文字の異なる字形を選択するだけである。字形選択子は,一般

的な符号拡張のための仕組みを意図したものではない。

注記 6  漢 字 字 形 指 示 列 以 外 の 標 準 の 字 形 指 示 列 は , ユ ニ コ ー ド の 文 字 デ ー タ ベ ー ス で も

StandardizedVariants.html

(http://www.unicode.org/Public/4.0-Update/StandardizedVariants-4.0.0.html)として網羅されてい

る。

17 

文字の表示形 

文字の表示形は,特定の文脈で使用するために,他の図形文字領域にある文字又はそれらの文字列がも

つ通常の形に対する代替の形を与える。通常の形から表示形への変換は,置換,重ね合せ又は組合せによ

ってもよい。

重ね合せ,形の異なる文字なのか若しくは合字(ligature)への組合せなのかの選択,又は連結(これは,

極度に複雑になることが多い。

)のための規則は,この規格では規定しない。

表示形は,一般に,この符号化文字集合で規定する図形文字の通常の形の代替として使用することを意

図していない。しかし,特定の適用業務では,既存の装置との互換性などの特殊事情のために,通常の形

の代わりに表示形を用いてもよい。表示形の探索・分類及び表示形に対するその他の処理操作の規則は,

この規格の適用範囲外とする。

BMP では,これらの文字のほとんどは,区 FB∼FF 内の符号位置に割り当ててある。 

18 

互換用文字 

この規格には互換用文字が含まれているが,これは,既存の符号化文字集合との互換性を保ち,情報を

失うことなく双方向の符号変換を可能にすることを目的としている。

BMP では,これらの文字の多くは,区 F9,FA,FE 及び FF 内並びに区 31 及び 33 内の符号位置に割り

当てている。互換用文字の幾つかは,他の区の中にも割り当てている。


29

X 0221

:2014 (ISO/IEC 10646:2012)

注記 1 BMP の区 FA の中には,CJK 統合漢字として割り当てた符号位置が 12 か所ある。

追加漢字面(SIP)では,これらの文字は,区 F8∼FA の中の符号位置に割り当てている。

CJK 互換漢字とは,附属書 に示す統合の規則によって CJK 統合漢字の一つに統合される漢字である。

それにもかかわらず CJK 互換漢字がこの規格に含まれているのは,特定の国及び地域に特有の様々な国家

的,文化的又は歴史的な理由に基づいて,それらの文字がある国家又は地域の規格で異なる符号位置に割

り当てられているからである。

注記 2  このため,互換漢字は,特定の国家,地域又はその他の規格との間の往復の変換を維持及び

担保するためにだけ用いることが望ましい。他の用途には用いないことを強く推奨する。

19 

文字の順序 

通常,符号化文字は,論理的な順序で符号単位列として現れる(論理的な順序又は記憶順序とは,おお

よそ,キーボードから文字が入力され,挿入,削除及び重ね打ちをした後の順序に対応する。

。これは,

進行方向が異なる文字が混在する場合にも適用する。例えば,左から右への用字(ギリシア文字,ラテン

文字,タイ文字など)と,右から左への用字(アラビア文字,ヘブライ文字など)又は縦への用字(モン

ゴル文字など)とが混在する場合にも,適用する。

幾つかの文字は,最終の出力テキスト中に同じ順序で現れない場合がある。例えば,DEVANAGARI VOWEL 

SIGN I

(デーヴァナーガリー母音記号 I)の中間形は,符号単位列で論理的にある文字の後にそのデーヴ

ァナーガリー母音記号 I が続くとき,その文字の前にそのデーヴァナーガリー母音記号 I を表示する。

20 

結合文字 

ここでは,結合文字の使用方法を規定する(4.14 参照)

20.1 

結合文字の順序 

結合文字の符号化表現は,それが結合される基底文字の符号化表現の後に置かなければならない。例え

ば,LATIN SMALL LETTER A(ラテン小文字 A)の後に COMBINING TILDE[チルド(合成可能)

]が

続く符号化表現は,ラテンの合成列“ã”を表現する。

一つの結合文字自身を合成列とみなさなければならない場合,その結合文字は,文字 00A0  NO-BREAK 

SPACE

(ノーブレークスペース)と結合した合成列として符号化しなければならない。例えば,グレーブ

アクセントは,00A0 の NO-BREAK SPACE の後に 0300 の COMBINING GRAVE ACCENT[グレーブアクセ

ント(合成可能)

]を置いて合成できる。

注記  インド系の用字で母音を意味する結合文字は,特殊な部類の結合文字である。理由は,その表

示が周囲の二つ以上の文字に依存できるからである。したがって,インド系の用字の結合文字

を NO-BREAK SPACE と結合させるのは,望ましくない。

20.2 

結合クラス及び基準順序 

それぞれの結合文字は,ユニコード標準によって定められた結合クラスの値をもつ。これらの値は,ユ

ニコード標準第 6.1 版の結合クラス属性に従って定める(箇条 参照)。結合クラスは,正規化手続

(normalization process)の一部である規範順序を定めるために用いる(箇条 21 参照)

。基準順序では,結

合文字を結合クラスの昇順に並べ替える。

結合クラスの値がゼロである文字と組み合わされた結合文字は,

他の文字との相対位置に並べ直すことはない。

20.3 

符号表上での形 

基底文字に相対的に位置決めしようとする結合文字は,文字符号表上では,基底文字との相対的位置を


30

X 0221

:2014 (ISO/IEC 10646:2012)

   

示すための破線の円の上,下,右,左,中,周り又は貫通位置に示す。結合文字は,表示のときに,先立

つ基底文字に相対的に位置決めされることを意図したものであって,それ自身では,基底文字として独立

して存在したり,基底文字の機能を果たしたりしない。そのため,結合文字と名付けられている。

注記  ダイアクリティカルマーク(diacritics)は,ヨーロッパのアルファベットで用いられる結合文

字の主要種類となっている。インド及び東南アジアで使われる他の多くの用字では,結合文字

は,母音の字を符号化したものである。そのため,通常,

“ダイアクリティカルマーク”とは呼

ばない。

20.4 

符号化表現のばらつき 

複数の結合文字を異なった順序で使用したり,文字と合成列との等価な組合せを混用したりすることに

よって,テキストの符号化表現にばらつきが生じる。ばらつきのある符号化表現の結果として,一つのテ

キストが複数の表現をもつことになる。ばらつきのある符号化表現を正規化(箇条 21 参照)することによ

って,完全に排除できないまでも,符号化表現のばらつきが大幅に減る。

注記  例えば,フランス語の“là”は,LATIN SMALL LETTER L(ラテン小文字 L)の次に LATIN SMALL 

LETTER A WITH GRAVE

(グレーブアクセント付き A 小文字)が続くと表現できるし,LATIN 

SMALL LETTER L

(ラテン小文字 L)

,次に LATIN SMALL LETTER A(ラテン小文字 A)

,そ

の次に COMBINING GRAVE ACCENT[グレーブアクセント(合成可能)

]が続くと表現できる。

これらの符号化表現のばらつきに正規化を適用することによって,ただ一つの符号化表現が残

る。残る符号化表現の形式は,どの正規形を用いるかによって異なる。

20.5 

結合文字の重複 

二つ以上の結合文字が一つの基底文字に結合されることもある。この規格では,一つの基底文字に結合

される結合文字の個数は,制限しない。結合文字の重複の規則は,次のとおりとする。

a)

結合文字同士が(例えば,COMBINING MACRON[マクロン(合成可能)

]と COMBINING DIAERESIS

[ダイエレシス(合成可能)

]とが)表示に影響し合う場合,結果の図形表示中での結合文字の位置は,

結合文字の符号化表現の順序による。結合文字の表示は,基底文字から外に向かって位置決めする。

例えば,基底文字の上に置く結合文字は,符号化表現の列で最初に出てきたものから始め,基底文字

に続く符号化された結合文字のある限り,順次,上に積み重ねる。基底文字の下に置く結合文字の場

合,積重ねの状態は,逆になり,基底文字から始め,結合文字を順次,下に重ねる。

基底文字の上に複数の結合文字を置く例がタイ文字にある。タイ文字では,子音字の上に 0E34∼

0E37 の母音記号の一つを置くことができ,更にその上に 0E48∼0E4B の四つの声調記号(tone mark)

の一つを置くことができる。この符号化表現の順序は,子音字の基底文字,次に母音記号,その次に

声調記号となる。

b)

ある特別の結合文字は,既定の積重ね動作に従わず,縦ではなく横に並べたり,隣り合った結合文字

と合字(ligature)を作ったりする。横に並べるときは,符号化表現の順序は,結合文字を使用する用

字の主要な進行方向中での位置によって決まる。例えば,左から右への用字では,横に並べて置かれ

るアクセントは,左から右へ符号化する。

既定の積重ね動作をしない,

このような特別な文字は,

特定の用字又はアルファベットで使われる。

例えば,COMBINING GREEK KORONIS(0343)と,それに続くアキュートアクセント記号又はグレ

ーブアクセント記号とを一緒に用いる場合,COMBINING GREEK KORONIS の上にアクセント記号を

積み重ねず,一つの文字の上でそれらを横に並べなければならない。符号化表現の順序は,文字自身,

次に気息記号(breathing mark)

,その次にアクセント記号の順とする。ラテンのアキュートアクセン


31

X 0221

:2014 (ISO/IEC 10646:2012)

ト記号及びグレーブアクセント記号と同じ外観をもつベトナム語の二つの声調記号は,サーカムフレ

クスダイアクリティカルマーク(circumflex diacritic)を既に含んでいる三つの母音文字(â,ê 及び ô)

の上には重ねずに,母音文字のサーカムフレクスダイアクリティカルマークと合字を作る。

c)

結合文字同士が表示上で互いに影響を与えない場合(例えば,一つの結合文字が図形文字の上に置か

れ,他の結合文字が下に置かれる。

,基底文字と,順序が異なる複数の結合文字とからできる結果の

図形記号は,同じに見えてもよい。例えば,LATIN SMALL LETTER A,次に COMBINING CARON

その次に COMBINING OGONEK と続く符号化表現からできる図形記号と,LATIN SMALL LETTER A

次に COMBINING OGONEK,その次に COMBINING CARON と続く符号化表現からできる図形記号とは,

結果的に同じになってもよい。

ヘブライ又はアラビアの用字の結合文字は,通常,互いに影響を与えない。したがって,合成列を

なすそれらの符号化表現の順序は,図形記号に影響を与えない。図形記号の結合を作る規則は,この

規格の適用範囲外とする。

20.6 

結合文字を含む組 

附属書 に示す文字の組の幾つかには,例えば,組 14[BASIC ARABIC(基本アラビア文字)]又は組

25[THAI(タイ文字)]には,結合文字と基底文字との両方が含まれている。

附属書 に示す他の幾つかの文字の組は,結合文字だけからなっている[例えば,組 7(COMBINING 

DIACRITICAL MARKS

20.7 

図形素結合子(合成可能) 

文字 034F COMBINING GRAPHEME JOINER[図形素結合子(合成可能)

]は,言語に依存する照合及び

検索の目的のために前後の文字を一まとまりとして扱うことを示すために用いる。言語に依存する照合及

び検索において,その目的のために特別に調整した照合要素表の場合以外は,図形素結合子を無視しなけ

ればならない。

注記  COMBINING GRAPHEME JOINER は,ある結合文字の二つの用法のうちの一つを他の用法と区

別するために用いてもよい。例えば,ウムラウトとトレマとを区別する必要がある場合,

COMBINING GRAPHEME JOINER

(034F)の後に COMBINING DIAERESIS(0308)が続くも

のをトレマとし,COMBINING DIAERESIS(0308)だけのものをウムラウトとしてもよい。

21 

正規形 

正規形(normalization form)は,同一のテキストの幾つかの符号化表現のばらつきのうちで,ただ一つ

の符号化表現を選択するための機構である。この規格で用いる正規形は,ユニコード附属書 UAX #15(箇

条 参照)に規定されており,この規格でも用いる。正規形には,次の四つがある。

a)

正規形 D(NFD)

b)

正規形 C(NFC)

c)

正規形 KD(NFKD)

d)

正規形 KC(NFKC)

注記 1  これらの正規形のいずれかを符号単位列に適用した結果は,将来にわたって安定しているこ

とを意図している。すなわち,この規格で割当てが行われている文字を含む符号単位列の正

規化表現は,この規格が改正されても,正規化された状態である。

注記 2  幾つかの正規形は,テキストの短い表現よりもある種の合成列を優先し,他の幾つかの正規

形は,テキストの短い表現を優先する。テキストの短い表現を定義するに当たって ISO/IEC 


32

X 0221

:2014 (ISO/IEC 10646:2012)

   

10646-1:2000

(第 2 版)及び ISO/IEC 10646-2:2001(第 1 版)を参照用の版として確定するこ

とで,後方互換の要求が満たされる。両規格のレパートリの和集合は,確定組 UNICODE 3.2

A.6.2 参照)と同一である。

注記 3  正規形の幾つかの目的の中で特に重要なものは,任意に与えられた符号単位列に対する正規

形をただ一つ定めることによって,同一性の一致判定(identity matching)を容易にすること

である。正規形は,言語学的な観点では必ずしも適切な並びとは限らない。

22 

個々の用字及び記号の特性 

22.1 

ハングル音節の合成方法 

描字では,ハングル字母(HANGUL JAMO ブロック,1100∼11FF)の列は,一連の音節ブロックとして

表示される。字母は,初声(音節頭子音字,choseong)

,中声(音節核をなす母音字,jungseong)及び終声

(音節末子音字,jongseong)の三つに分類される。完全な音節ブロックは,初声,中声及び付加的な終声

から構成される。

完全な音節を構成していない一つ以上の文字の列(例えば,初声だけ,中声だけ,終声だけ,又は中声

の後ろに終声が続いたもの。

)を不完全な音節(incomplete syllable)という。中声で始まる不完全な音節は,

その前に必ず CHOSEONG FILLER(初声埋め文字,115F)がなければならない。終声だけからなる不完全

な音節は,その前に必ず CHOSEONG FILLER(115F)及び JUNGSEONG FILLER(中声埋め文字,1160)

がなければならない。初声だけからなる不完全な音節は,その後に必ず JUNGSEONG FILLER(1160)が

なければならない。

注記 1  ハングル字母は,結合文字ではない。

注記 2  HANGUL SINGLE DOT TONE MARK(ハングル単点声調記号,302E)のような結合文字をハ

ングル字母の列に適用することを意図するときには,その列の末尾で,完全な音節ブロック

の最後に位置するハングル字母の次にその結合文字を付加することが望ましい。

注記 3  この規格では,ハングルのテキストは,複数の異なる方法で表現できる。韓国の規格 KS X 

1026-1: Information Technology

−Universal Multiple-Octet Coded Character set (UCS)−Hangul−

Part 1, Hangul processing guide for information interchange は,情報交換において相互運用性を確

実にするためのガイドラインを提供している。

22.2 

インド及び他の南アジアで使う用字の特性 

BMP の,区 09∼0D 及び区 0F の符号表,並びに区 10 の MYANMAR(ビルマ文字)ブロック(箇条 31 

照)の符号表では,幾つかの文字に対する図形記号は,同じ表にある他の二つの文字の図形記号の合成に

よって形作られたように示してある。

例 1 0906

DEVANAGARI LETTER AA

の図形記号は,0905  DEVANAGARI LETTER A 及び 093E

DEVANAGARI VOWLEL SIGN AA

の図形記号から構成されたように示してある。

例 2 0D08

MALAYALAM LETTER II

の 図形 記 号 は , 0D07  MALAYALAM LETTER I 及 び 0D57

MALAYALAM AU LENGTH MARK

の図形記号から構成されたように示してある。

そのような場合,合成列(4.17 参照)と同様に,単独の符号化文字が,結合されると,その単独の符号

化文字の図形記号と視覚的に似るような図形記号をもつ二つの符号化文字の列と同等であるとして,利用

者に対して現れてもよい。

この規格では,次のような独自のつづり規則(unique-spelling rule)を規定する。この規則では,区 09

∼0D 若しくは 0F の符号表又は区 10 の MYANMAR ブロックの符号表においては,次に示す例外を除いて,


33

X 0221

:2014 (ISO/IEC 10646:2012)

いかなる符号化文字も,同じ符号表の他の符号化文字の長さ 2 以上の列と同等であるとは,みなさない。

−  2 部分からなる母音記号(two-part dependent vowel sign)

−  独立母音字である 1025 MYANMAR LETTER UU

−  ヌクタ記号の付いた子音字。

注記  これらの全ての文字は,2 文字からなる列への基準写像をもつ。

22.3 

ビザンチン音楽記号 

ビザンチン音楽の記譜法は,3 段の帯状の表現を利用する。記号は,上段,中段又は下段の帯の中に書

く。これとは別に,楽譜の歌詞の部分に,音楽文字と呼ぶ記号を書く。複数の記号は,適切な帯の中で積

み重ねて表記することができる。

22.4 

絵文字記号の原典情報 

幾つかの記号は,複数の原典との対応関係をもつ。CJK 統合漢字とは異なり,これらの参照は,文字を

特定するものではない。これらの原典における一つの文字は,単一の符号位置又は符号位置の列に対応す

る。

記号の原典は,次のとおりである。

− DoCoMo のシフト JIS 符号

− KDDI のシフト JIS 符号

− SoftBank のシフト JIS 符号

添付ファイルは,テキストファイルであり,ISO/IEC 646 の IRV の文字及び行末を表す LINE FEED 

使用する。ファイルの先頭の 6 行は,ヘッダであり,その後の“#”で始まる行は,注釈である。その後に,

原典参照の行が続く。各行は,次の項目からなる。項目は,

“;”で区切る。

−  項目 1 は,UCS  符号位置又は符号位置の列を  (hhhh | hhhhh) (<space> (hhhh | hhhhh))*  の形式で示す。

−  項目 2 は,DoCoMo のシフト JIS  符号を (hhhh) の形式で示す。

−  項目 3 は,KDDI のシフト JIS  符号を (hhhh) の形式で示す。

−  項目 4 は,SoftBank のシフト JIS  符号を (hhhh) の形式で示す。

ここに,

‘h’は,16 進数を表し,<space>は,SPACE 文字を表す。

参照ファイルは,

“EmojiSrc.txt”とする。

注記 1  (対応国際規格の注記 は,この規格では該当しないため不採用とした。)

注記 2  ファイルの内容は,一方を UCS の符号位置又は符号位置の列とし,他方を携帯電話通信事業

者の絵文字を示すシフト JIS の符号とする写像を与える。個々の対応は,同等な,UCS と携

帯電話通信事業者の記号とに関して,単独でも列としてでも,対称である(いわゆる“往復

の保全性”をもつ。

。このファイルは,いずれの写像方向においても,似ているが同じでは

ない記号に対応させるような最善の(best-fit)写像[代用(fallback)写像ともいう。

]を含

まない。

23 

漢字の原典参照 

23.1 

原典参照一覧 

漢字のそれぞれの文字には,少なくとも一つの原典参照がある。原典参照は,機械可読形式の添付ファ

イルで示す。原典参照は,この規格の規定の一部である。

注記 1  添付ファイルは,この規格を機械可読形式で入手したものだけが利用できる。しかし,この

ファイルを印刷して利用することもできる。


34

X 0221

:2014 (ISO/IEC 10646:2012)

   

原典参照情報は,漢字の文字を識別する。原典参照は,漢字の符号位置を,この箇条において次に示す

原典の中の値に関連付ける。これらの原典を次のとおり分類する。

−  原典 G

−  原典 H

−  原典 M

−  原典 T

−  原典 J

−  原典 K

−  原典 KP

−  原典 V

−  原典 U

ある符号位置には,原典の分類(すなわち,G,H,M,T,J,K,KP,V 及び U)ごとにただ一つの原

典参照だけを作成する。広範な原典の分類に対応できるように,原典参照は,原典と漢字との一意的な関

係を全て示す。

BMP 及び SIP の漢字が参照する原典の一覧を次に示す。

注記 2  原典が更新されても,原典参照は,更新しない。更新された原典は,古い版に含まれていな

い文字の識別だけに用いてもよい。

原典 G は,次のとおりに識別する。

G0

GB 2312-80

G1

GB 12345-90

G3

GB 7589-87

繁体字

G5

GB 7590-87

繁体字

G7

現代漢語通用字表及び簡化字総表

GS

シンガポールの漢字

G8

GB 8565-88

G9

GB 18030-2000

GE

GB 16500-95

GH

GB 15564-1995

香港の一部の文字放送用の漢字体系

GK

GB 12052-89

情報交換用ハングル文字符号化文字情報

G4K

四庫全書

GBK

中国大百科全書

GCH

辞海

GCY

辞源

GCYY

中国測絵科学院用字

GFZ

方正排版系統

GGH

古代漢語詞典

GHC

漢語大詞典

GHZ

漢語大字典

GIDC

中国公安省 ID システム

GJZ

商務印書館用字

GKX

康熙字典及び康熙字典補遺

GXC

現代漢語詞典

GZFY

古代漢語詞典

GZH

中華字海

GZJW

殷周金文集成引得

注記 3  康煕字典(GKX)として参照されている文字に対する符号表上での図形記号は,現在中国で

使用されているものであり,康煕字典に示されている図形記号とは僅かに異なる場合がある。

原典 H は,次のとおりに識別する。

H

香港増補字符集 2008


35

X 0221

:2014 (ISO/IEC 10646:2012)

HB0 Big-5:

計算機での中国語字形と文字符号との対応表, Technical Report C-26,  電脳用中文字型与字碼対

照表,  技術通報 C-26, 1984, Symbols

HB1

Big-5, Level 1

HB2

Big-5, Level 2

原典 M は,次のとおりに識別する。

MAC

Macao Information System Character Set(澳門資訊系統字集)

原典 T は,次のとおりに識別する。

T1 TCA-CNS 11643-1992  第 1 面 
T2 TCA-CNS 11643-1992  第 2 面 
T3 TCA-CNS 11643-1992  第 3 面及び幾つかの追加文字 
T4 TCA-CNS 11643-1992  第 4 面 
T5 TCA-CNS 11643-1992  第 5 面 
T6 TCA-CNS 11643-1992  第 6 面 
T7 TCA-CNS 11643-1992  第 7 面 
TB TCA-CNS 11643-2007  第 11 面 
TC TCA-CNS 11643-2007  第 12 面 
TD TCA-CNS 11643-2007  第 13 面 
TE TCA-CNS 11643-2007  第 14 面 
TF TCA-CNS 11643-2007  第 15 面

原典 J は,次のとおりに識別する。

J0

JIS X 0208-1990

J1

JIS X 0212-1990

J3

JIS X 0213:2000

第 3 水準

J3A

JIS X 0213:2004

第 3 水準

J4

JIS X 0213:2000

第 4 水準

JA

国内 5 社漢字統合表,1993

JH

汎用電子情報交換環境整備プログラム 2002∼2009

JK

日本国字集

JARIB

電波産業会  ARIB STD-B24  第 5.1 版,2007 年 3 月 14 日

原典 K は,次のとおりに識別する。

K0

KS X 1001:2004

(以前は,KS C 5601-1987 であった。

K1

KS X 1002:2001

(以前は,KS C 5657-1991 であった。

K2

PKS C 5700-1 1994

K3

PKS C 5700-2 1994

K4

PKS 5700-3:1998

K5

Korean IRG Hanja Character Set 5th Edition: 2001

注記 4 K2,K3,K4 及び K5 に含まれる漢字は,新しい韓国規格群において改正作業が進んでいる。

原典 KP は,次のとおりに識別する。

KP0

KPS 9566-97

KP1

KPS 10721:2000

及び KPS 10721:2003

原典 V は,次のとおりに識別する。

V0

TCVN 5773:1993

V1

TCVN 6056:1995

V2

VHN 01:1998

V3

VHN 02:1998

V4

Dictionary on Nom 2006, Dictionary on Nom of Tay ethnic 2006, Lookup Table for Nom in the South 1994

原典 U は,次のとおりに識別する。

UTC

ユニコード技術報告書  UTR #45, U-source Ideographs, May 2010

23.2 CJK

統合漢字の原典参照 

原典から統合漢字を引き出すために用いた手順及び箇条 31 の符号表での配列の規則は,

附属書 に示

す。

注記 1  附属書 の S.1.6 で記述された原規格分離漢字の取扱規則は,BMP 内の CJK 統合漢字だけに

適用する。


36

X 0221

:2014 (ISO/IEC 10646:2012)

   

添付ファイルは,テキストファイルであり,ISO/IEC 646 の IRV の文字及び行末を表す LINE FEED 

使用する。ファイルの先頭の 13 行は,ヘッダであり,その後に 0 面及び 2 面にある CJK 統合漢字の総数

と同じ行数の情報が続く。行は,次の項目からなる。項目は,

“;”で区切る。空の項目は,文字を含まな

い。

−  項目 1 は,BMP 又は SMP の符号位置を(0hhhh)又は(2hhhh)の形式で示す。

−  項目 2 は,部首画数索引を(d{1,3}'.d{1,2})の形式で示す。この項目は,参考情報であり,1 桁∼3 桁の

部首索引及び FULL STOP(ピリオド)に続く,1 桁又は 2 桁の部首内画数で構成される。部首画数索

引に APOSTROPHE(アポストロフィー)が付加されているものは,簡体字の部首である。

注記 2  全ての漢字は,様々な漢字の字書中の部首・画数の順に従って分類する。この項で示す値

は,できるだけ一般的な値を採用した。詳しい情報が,UAX#38 Unicode Han Database に示

されている。

http://www.unicode.org/reports/tr38/

−  項目 3 は,原典 G を(G0-hhhh),(G1-hhhh),(G3-hhhh),(G5-hhhh),(G7-hhhh),(GS-hhhh),(G8-hhhh),

(G9-hhhh),(GE-hhhh),(GH-hhhh),(GK-hhhh),(G4K),(GBK),(GBK-dddd.dd),(GCH),(GCH-dddd.dd),

(GCY),(GCYY-ddddd),(GFZ),(GFZ-ddddd),(GGH-ddddd.dd),(GHC),(GHC-dddd.dd),(GHZ-ddddd.dd),
(GIDC-ddd) , (GJZ-ddddd) , (GKX-dddd.dd) , (GXC-dddd.dd) , (GZFY-ddddd) , (GZH-dddd.dd) 又 は
(GZJW-ddddd)の形式で示す。

−  項目 4 は,原典 T を(T1-hhhh),(T2-hhhh),(T3-hhhh),(T4-hhhh),(T5-hhhh),(T6-hhhh),(T7-hhhh),

(TB-hhhh),(TC-hhhh),(TD-hhhh),(TE-hhhh)又は(TF-hhhh)の形式で示す。

−  項目 5 は,原典 J を(J0-hhhh),(J1-hhhh),(J3-hhhh),(J3A-hhhh),(J4-hhhh),(JA-hhhh),(JH-xxxxxx),

(JH-xxxxxxS),(JK-ddddd)又は(JARIB-hhhh)の形式で示す。

−  項目 6 は,原典 K を(K0-hhhh),(K1-hhhh),(K2-hhhh),(K3-hhhh),(K4-hhhh)又は(K5-hhhh)の形式で

示す。

−  項目 7 は,原典 V を(V0-hhhh),(V1-hhhh),(V2-hhhh),(V3-hhhh)又は(V4-hhhh)の形式で示す。

−  項目 8 は,原典 H を(H-hhhh),(HB0-hhhh),(HB1-hhhh)又は(HB2-hhhh)の形式で示す。

−  項目 9 は,原典 KP を(KP0-hhhh)又は(KP1-hhhh)の形式で示す。

−  項目 10 は,原典 U を(UTC-ddddd)又は(UCI-ddddd)の形式で示す。

−  項目 11 は,原典 M を(MAC-ddddd)の形式で示す。

ここに,

“d”は,10 進数の 1 桁を,

“h”は,16 進数の 1 桁を,

“x”は,英数字 1 文字(0∼9 及び A∼Z)

を表す。括弧に囲まれた英大文字,数字及び記号は,ここに示したとおりに現れる。

注記 3  JIS X 0213:2000 及び JIS X 0213:2004 については,第 4 水準は,漢字集合 2 面に,他の水準

は,漢字集合 1 面に,それぞれ対応する。

注記 4 K4(PKS 5700-3:1998)及び K5(Korean IRG Hanja Character Set 5th Edition:2001)に含まれる

原典参照は,漢字符号を区点番号ではなく単純な 10 進数で表記している。他の規格との整合

性を考慮して,参照ファイルでは,K4 の値を 16 進数に変換している。他の K0∼K3 の索引

値と異なり,K4 及び K5 の値は,区点番号に分解できない。

参照ファイルは,添付ファイル“CJKU_SR.txt”とする。

注記 5  (対応国際規格の注記 は,この規格では該当しないため不採用とした。)

注記 6  形式 UCI-ddddd(原典 U)である文字は,識別可能な原典参照がない。UCI 値は,単純に場

所を確保する。


37

X 0221

:2014 (ISO/IEC 10646:2012)

23.3 CJK

統合漢字の原典参照の表示 

一つの文字に対して一つの図形記号しか示さない他の多くの文字レパートリと異なり,CJK 統合漢字の

文字は,原典参照ごとに部首,画数及び様々な原典の数値とともに図形記号を示す。

注記 CJK 互換漢字ブロックに含まれる 12 文字の表示は,23.5 とは異なる形式で記載されている。

符号位置の直後に,部首の図形表現を部首番号及び画数とともに示す。画数には,部首そのものの画数

を含まない。

CJK 統合漢字ブロック(4E00∼9FFF)の符号表は,固定カラム形式を用いる。すなわち,ある原典から

の原典情報は,常に同じカラムに示される。一方,他の CJK 統合漢字ブロックの符号表では,G,T,J,

K,KP,V,H,M 及び U の出現順に存在するものだけが示される。

23.3.1 CJK

統合漢字ブロックの原典参照の表示 

図 は,CJK UNIFIED IDEOGRAPHS(CJK 統合漢字)ブロックの表示を示している。原典 G,原典 H,

原典 T,原典 J,原典 K 及び原典 V が存在する場合は,この順番に表記する。原典 U は,原典 H の代わり

に第 2 カラムに表記する。このブロックには,原典 H 及び原典 U を共にもつ字は存在しない。

図 には,4E00∼4E09 及び 4E14∼4E1D の文字の例を示す。

図 2CJK 統合漢字の符号表表示

23.3.2 CJK

統合漢字拡張 の原典参照の表示 

図 に CJK UNIFIED IDEOGRAPHS EXTENSION A(CJK 統合漢字拡張 A)ブロックの表示を示す。1

文字ごとに 1 行に最大 3 個の原典参照を示す。4 個以上の原典がある場合は,更に 1 行を用いて示す。


38

X 0221

:2014 (ISO/IEC 10646:2012)

   

図 には,41C9∼41CC,41DB∼41DD 及び 41EE∼41F0 の文字の例を示す。

図 3CJK 統合漢字拡張 の符号表表示

23.3.3 CJK

統合漢字拡張 の原典参照の表示 

図 に,CJK UNIFIED IDEOGRAPHS EXTENSION B(CJK 統合漢字拡張 B)ブロックの表示を示す。

最初の図形記号は,この規格の対応国際規格の第 1 版及び第 2 版(順に 2003 年版及び 2011 年版)での字

形を“UCS2003”という記述とともに示す。1 文字ごとに 1 行に最大 2 個の原典参照を示す。3 個以上の原

典参照がある場合は,更に 1 行を用いて示す。

図 には,200E8∼200EB,200FC∼200FF 及び 2010E∼20110 の文字の例を示す。

図 4CJK 統合漢字拡張 の符号表表示

23.3.4 CJK

統合漢字拡張 及び拡張 の原典参照の表示 

図 に CJK UNIFIED IDEOGRAPHS EXTENSION C(CJK 統合漢字拡張 C)及び CJK UNIFIED IDEOGRAPHS 

EXTENSION D

(CJK 統合漢字拡張 D)ブロックの表示を示す。1 文字ごとに 1 行に最大 2 個の原典参照を

示す。3 個以上の原典が存在する場合は,更に 1 行を用いて示す。

図 には,2A7A0∼2A7A2,2A7B4∼2A7B6,2A7C8∼2A7CA 及び 2A7DC∼2A7DE の文字の例を示す。

図 5CJK 統合漢字拡張 及び拡張 の符号表表示


39

X 0221

:2014 (ISO/IEC 10646:2012)

23.4 CJK

互換漢字の原典参照 

添付ファイルは,テキストファイルであり,ISO/IEC 646 の IRV の文字及び行末を表す LINE FEED 

使用する。ファイルの先頭の 11 行は,ヘッダであり,その後に CJK 互換漢字の数と同じ行数の情報が続

く。行は,次の項目からなる。項目は,

“;”で区切る。空の項目は,文字を含まない。

−  項目 1 は,BMP 又は SIP の符号位置を(0hhhh)又は(2hhhh)の形式で示す。

−  項目 2 は,対応する CJK 統合漢字の符号位置を(0hhhh)又は(2hhhh)の形式で示す。

−  項目 3 は,部首画数索引を(d{1,3}'.d{1,2})の形式で示す。この参考情報の項目は,1 桁∼3 桁の部首索

引及び FULL STOP(ピリオド)に続く,1 桁又は 2 桁の部首内画数で構成される。部首画数索引に

APOSTROPHE

(アポストロフィー)が付加されているものは,簡体字の部首である。

−  項目 4 は,原典 T を(T3-hhhh),(T4-hhhh),(T5-hhhh),(T6-hhhh),(T7-hhhh)又は(TF-hhhh)の形式で示

す。

−  項目 5 は,原典 H を(H-hhhh)又は(HB2-hhhh)の形式で示す。

−  項目 6 は,原典 J を(J3-hhhh),(J4-hhhh)又は(JARIB-hhhh)の形式で示す。

−  項目 7 は,原典 K を(K0-hhhh)の形式で示す。

−  項目 8 は,原典 U を(UTC-ddddd)又は(UCI-ddddd)の形式で示す。

−  項目 9 は,原典 KP を(KP1-hhhh)の形式で示す。

ここに,

“h”は,16 進数の 1 桁を表す。括弧に囲まれた英大文字,数字及び記号は,ここに示したとお

りに現れる。

注記 1  JIS X 0213:2000 及び JIS X 0213:2004 については,第 4 水準は,漢字集合 2 面に,他の水準

は,漢字集合 1 面に,それぞれ対応する。

参照ファイルは,添付ファイル“CJKC_SR.txt”とする。

注記 2  (対応国際規格の注記 は,この規格では該当しないため不採用とした。)

注記 3  形式 UCI-ddddd(原典 U)である文字は,識別可能な原典参照がない。UCI 値は,単純に場

所を確保する。

23.5 CJK

互換漢字の原典参照の表示 

CJK 統合漢字と同様に,CJK 互換漢字の符号表は,原典参照ごとに一つの図形記号を,部首,画数及び

様々な原典参照の数値のような文字の特定に関する追加情報とともに示す。

部首の図形表現についても符号位置のすぐ下に,部首番号及び画数とともに示す。画数には,部首その

ものの画数を含まない。

追加情報として,31.2 に記載した参考情報の項目(例えば,分解写像)をも,表記中に表示する。

注記 CJK 互換漢字ブロックに含まれる 12 個の CJK 統合漢字の表示も,この形式に従う。この 12 個

の CJK 統合漢字の表示は,分解写像を含まない。

図 には,FA0C∼FA0E,FA19∼FA1D 及び FA28∼FA2C の各文字に対する例を示す。


40

X 0221

:2014 (ISO/IEC 10646:2012)

   

図 6CJK 互換漢字の符号表の表示

24 

文字の名前及び注記 

24.1 

名前 

この規格は,次に示すものの名前を規定する。

−  文字(文字の名前及び文字の別名)

−  名前付き UCS 列識別子(箇条 25 参照)

−  ブロック(箇条 14 及び A.2 参照)

−  組(A.1 参照)

この規格がこれらのものに付与する名前は,

この箇条 24 が規定する名前の形式及び名前の一意性に関す

る規則に従わなければならない。この規則は,この規格の英語の版に対して適用する。

注記 1  英語以外の規格では,次のとおりである。

a)

その言語に適切と考えられる言葉及び構文を用いて文字の名前を付けられるように,規

則を修正してもよい。

b)

この規格が規定する名前を,上の a)によって修正した規則に従って構成した同等な一意

な名前によって,置き換えてもよい。

注記 1A  この規格では,英語の対応国際規格の規則を修正しないし,名前を置き換えることもしない。

名前は,英語の対応国際規格のものと同一とする。ただし,理解のために必要な場合は,日

本語による通用名称を参考として併記する。日本語による通用名称は,名前又はその一部で

はなく,必ずしも箇条 24 の規定に従わない。

注記 1B  この規格では,日本語による通用名称を併記する場合,通用名称を括弧で囲み点線の下線を

施した。

注記 2  名前付けに関する追加の指針を,附属書 に示す。

24.2 

名前の形式 

名前は,次の文字だけを含んでよい。

−  LATIN CAPITAL LETTER A(ラテン大文字 A)∼LATIN CAPITAL LETTER Z(ラテン大文字 Z)

−  DIGIT ZERO(0)∼DIGIT NINE(9)


41

X 0221

:2014 (ISO/IEC 10646:2012)

−  SPACE(スペース)

−  HYPHEN-MINUS(ハイフン,負符号)

−  FULL STOP(ピリオド)

(組の名前に限る。

名前の最初の文字は,ラテンの大文字とする。名前の最後の文字は,ラテンの大文字又は数字とする。

名前は,連続する 2 個以上の SPACE 又は連続する 2 個以上の HYPHEN-MINUS を含んではならない。さ

らに,組以外のものの名前は,SPACE に続く数字(DIGIT ZERODIGIT NINE)を含んではならない。

組の名前は,連続する 2 個以上の FULL STOP を含んではならない。

SPACE

に HYPHEN-MINUS が続く列,又は HYPHEN-MINUS に SPACE が続く列は,文字の名前又は名前

付き UCS 列識別子の名前にだけ現れてもよい。

例 1  次に示す二つの文字の名前は,SPACE と HYPHEN-MINUS との並びを含んでいる。

TIBETAN LETTER -A

TIBETAN MARK BKA- SHOG YIG MGO

FULL 

STOP

は,組の名前の中で,二つの英数字(LATIN CAPITAL LETTER ALATIN CAPTITAL LETTER 

Z

又は DIGIT ZERODIGIT NINE)の間にだけ現れてもよい。

例 2  次に示す組の名前は,2 個の数字 DIGIT FOUR(4)と DIGIT ONE(1)との間に FULL STOP

を含む。

UNICODE 4.1

例 3  次に示す組の名前は,1 個のラテン文字 LATIN CAPITAL LETTER D(ラテン大文字 D)と 1

個の数字 DIGIT SEVEN(7)との間に FULL STOP を含む。

BMP-AMD.7

24.3 

名前の単一性 

この規格の中で名前付けられる全てのものは,それぞれ名前を一つだけ付与する。

注記  この規定は,明確化を目的とし,参考のために使用する別名又は省略形の使用を妨げるもので

はない。しかし,規定としての名前は,一つだけである。こうした,参考としての別名は,文

字の名前として同じ名前空間を共有し,規定事項である文字の別名と混同しないほうがよい。

24.4 

名前の不変性 

ある種の名前は,この規格の将来の版においても変更されない。この性質は,文字の名前及び文字の別

名に適用される。箇条 参照。

24.5 

名前の一意性 

名前は,この箇条で示すように,対応する名前空間内で一意でなければならない。

24.5.1 

ブロックの名前 

ブロックの名前の集合は,一つの名前空間を構成する。一つ一つのブロックの名前は,一意であって,

この規格が規定する他の全てのブロックの名前と区別できなければならない。

24.5.2 

組の名前 

組の名前の集合は,一つの名前空間を構成する。一つ一つの組の名前は,一意であって,この規格が規

定する他の全ての組の名前と区別できなければならない。

24.5.3 

文字の名前,文字の別名及び名前付き UCS 列識別子 

文字の名前,文字の別名及び名前付き UCS 列識別子は,それらを共に含む集合が一つの名前空間を構成

する。一つ一つの文字の名前,文字の別名又は名前付き UCS 列識別子は,一意であって,この規格が規定

する他の全ての文字の名前,文字の別名及び名前付き UCS 列識別子と区別できなければならない。


42

X 0221

:2014 (ISO/IEC 10646:2012)

   

24.5.4 

一意性の判定 

ブロックの名前及び組の名前は,二つの名前を SPACE 及び中間の HYPHEN-MINUS を無視して比較を行

っても異なる場合に,一意であって区別できるものとみなす。

注記 1  中間の HYPHEN-MINUS とは,SPACE 以外の文字に挟まれた 1 個の HYPHEN-MINUS である。

例 1  次に示す架空のブロックの名前は,一意であって区別できる。

LATIN-A

LATIN-B

例 2  次に示す架空のブロックの名前は,一意ではなく区別できない。

LATIN-A

LATIN A

LATINA

文字の名前及び名前付き UCS 列識別子の名前は,二つの名前を SPACE 及び中間の HYPHEN-MINUS 

無視し,更に,

LETTER

CHARACTER”及び“DIGIT”の語を無視して比較を行っても異なる場合に,

一意であって区別できるものとみなす。

例 3  次に示す二つの架空の文字の名前は,一意ではなく区別できない。

MANICHAEAN CHARACTER A

MANICHAEAN LETTER A

例 4  次に示す二つの実在の文字の名前は,中間の HYPHEN-MINUS でない一つの HYPHEN-MINUS 

よって異なるので,一意であって区別できる。

TIBETAN LETTER A

TIBETAN LETTER -A

ただし,次に示す二つの文字の名前は,一意であって区別できるものとみなす。

HANGUL JUNGSEONG OE

HANGUL JUNGSEONG O-E

注記 2  これら二つの文字の名前だけは,特別に例外として取り扱う。なぜならば,これらは,この

規格の以前の版で規定されたものであって,その版ではまだ名前の一意性に関する要求事項

が規定されていなかったからである。これら二つの文字は,この規格での一意性に関する規

則における唯一の例外であって,今後ともこれ以外の例外を設けることはない。

24.6 

漢字の名前 

CJK 統合漢字の名前は,“CJK UNIFIED IDEOGRAPH-”(CJK 統合漢字)の後に,CJK 互換漢字の名前

は,

CJK COMPATIBILITY IDEOGRAPH-

(CJK 互換漢字)の後に,それぞれ 16 進表記の符号化表現を

付けることによって,アルゴリズム的に構成する。

BMP の漢字では,符号化表現は,4 桁の 16 進数で表現された 2 オクテットの値で示す。例えば,BMP

中の最初の CJK 統合漢字は,

CJK UNIFIED IDEOGRAPH-3400”という名前をもつ。

SIP の漢字では,符号化表現は,5 桁の 16 進数の値である。例えば,SIP 中の最初の CJK 統合漢字は,

CJK UNIFIED IDEOGRAPH-20000”という名前をもつ。

24.7 

ハングル音節文字の名前 

符号位置 AC00∼D7A3 のハングル音節文字の名前は,その符号位置の値から,次の計算手順によって導

出する。これらの文字の名前の一覧は,符号表に示さない。

a)

ハングル音節文字の符号位置の数を得る。これは,h

1

h

2

h

3

h

4

の形式である。ここで,数 h

1

h

2

h

3

h

4

は,AC00


43

X 0221

:2014 (ISO/IEC 10646:2012)

∼D7A3 の範囲にある。

b)

それぞれ,16 進数 h

1

h

2

h

3

及び h

4

と値が等しい 10 進数 d

1

d

2

d

3

及び d

4

を導出する。

c)

文字の指標 を,次の式によって計算する。

C

=4 096×(d

1

−10)+256×(d

2

−12)+16×d

3

d

4

d)

音節要素(syllablecomponent)の指標 I及び を次の式によって計算する。

I

C/588

(0≦I≦18)

P

=(C%588)/28

(0≦P≦20)

F

C%28

(0≦F≦27)

ここに,

“/”は,整数除算(すなわち,x/は,商の整数部分とする。

)を示し,

“%”は,剰余演算

(すなわち,x%は,整数除算 x/の剰余とする。

)を示す。

e)

三つの指標 I及び に対応するラテンの文字列を,それぞれ

表 の欄 2,欄 3 及び欄 4 から得る(I

=11 及び F=0 に対応する文字列は,空である。

。この三つの文字列を左から右の順に連結し,音節

名(syllable-name)の文字列を得る。

f)

このとき,符号位置 h

1

h

2

h

3

h

4

の文字の名前は,次のとおりとする。

HANGUL SYLLABLE

 s-n

ここに,

s-n”は,e)で得られた音節名を示す。

例  符号位置 D4DE の文字では,次のようになる。

d

1

=13,d

2

=4,d

3

=13,d

4

=14

C

=10462

I

=17,P=16,F=18

対応するラテンの文字列は,P,WI 及び BS である。音節名は,PWIBS であり,文字の名前

は,HANGUL SYLLABLE PWIBS である。

それぞれのハングル音節文字に対して,短い注記を規定し,

附属書 にそれぞれの文字名とともに

示す。この注記は,そのハングル音節文字のラテン文字への,代替の翻字からなる。これらも,また,

その符号位置の数値から,次の同様の計算手順によって導き出される。

g)

上の a)d)の段階を実行する。

h)

表 の欄 5,欄 6 及び欄 7 から,I及び の三つの指標に相当するラテンの文字列を得る(I=11

と F=0 とに対応する文字列は,空である。

。この三つの文字列を左から右の順に連結し,一つの文

字列を得る。

例  符号位置 D4DE の文字では,次のようになる。

d

1

=13,d

2

=4,d

3

=13,d

4

=14

C

=10 462

I

=17,P=16,F=18

対応するラテンの文字列は,ph,wi 及び ps である。追加情報は,phwips となる。

注記  附属書 にハングル音節の名前を添付ファイルで参照できるようにしてある。


44

X 0221

:2014 (ISO/IEC 10646:2012)

   

表 5−ハングル音節文字の名前及び追加情報の要素

音節名の要素

注記の要素

指標の数値

I

の文字列

P

の文字列

F

の文字列

I

の文字列

P

の文字列

F

の文字列

0 G A  k a  
1 GG

AE

G kk

ae

k

2 N YA

GG

n ya

kk

3 D YAE

GS

t yae

ks

4 DD

EO

N tt eo

n

5 R E NJ

r e nc

6

M  YEO

NH m  yeo nh

7 B YE

D p ye

t

8 BB

O L pp

o l

9 S WA

LG

s wa

lk

10 SS WAE

LM

ss wae

lm

11

 OE

LB

 oe

lp

12 J  YO

LS c  yo ls

13 JJ U LT cc u  lth 
14 C WEO

LP ch weo

lph

15 K WE

LH

kh we lh

16 T WI

M th wi m

17  P  YU B  ph yu p 
18 H EU

BS h  eu ps

19

 YI

S

 yi

s

20

 I SS

 i ss

21

 NG

 ng

22

 J

 c

23

 C

 ch

24

 K

 kh

25

 T

 th

26

 P

 ph

27

 H

 h

注記 1  表 に示す音節名の要素の 及び の文字列は,符号表の 1100∼1112(110B を除く)及

び 11A8∼11C2 の範囲のハングル字母の名前の後に

注記として示されているハングル字

母の短い名前に対応する。短い名前は,これらのハングルの音訳である。

注記 2  音節名の要素の 及び の文字列は,ISO/TR 11941:1996 Information and documentation−

Transliteration of Korean script into Latin characters の方法 I に基づく。同じ表の注記の要素
の 及び は,ISO/TR 11941 の方法 II に基づく。音節名の要素及び

注記の要素の の文

字列は,ISO/TR 11941 に基づく。ISO/TR 11941 は,2000 年 7 月 4 日に大韓民国文化観光

部が発行した Revised Romanization of Korean script(改訂版韓国語用字のローマ字表記)
とは,異なっている。

25 

名前付き UCS 列識別子 

名前付き UCS 列識別子(以下,

“名前付き USI”又は“NUSI”という。

)は,文字の名前と同じ規則に

従った名前を伴う USI とする。名前付き UCS 列識別子の名前付けの規則は,箇条 24 に従う。

注記 1 UCS 列識別子に名前を付ける目的は,一まとまりとして扱う文字の列を特定することであ

る。例えば,フォント又はキーボードの,特定の種類の処理,規格による参照又はレパート


45

X 0221

:2014 (ISO/IEC 10646:2012)

リの列挙である。

各 NUSI に対応する UCS 列識別子の値は,正規形 NFC(箇条 21 参照)によって決定される符号化表現

を使って記述される。それぞれの名前付き UCS 列識別子は,一意の符号化表現をもつ。この規格に含まれ

る全ての名前付き UCS 列識別子は,添付ファイルで参照できる。他の全ての名前付き列は,定義されてい

ない。

添付ファイルは,テキストファイルであり,ISO/IEC 646 の IRV の文字及び行末を表す LINE FEED 

使用する。ファイルの先頭の 5 行は,ヘッダであり,その後に名前付き UCS 列識別子が示される。各行は,

次の情報が TAB 文字で区切られた項目で構成されている。

−  項目 1 は,6.6 で定義された文法による UCS 列である。

−  項目 2 は,NUSI の名前である(箇条 24 の規則に従う。

参照ファイルは,添付ファイル“NUSI.txt”である。

注記 2  (対応国際規格の注記 は,この規格では該当しないため不採用とした。)

注記 3  この国際規格によって許容される全ての名前付き UCS 列識別子は,ユニコード附属書 UAX

#34, Unicode Named Character Sequences: https://www.unicode.org/reports/tr34/tr34-11.html でも示

される。

26 

基本多言語面の構造 

基本多言語面の概観を

図 に示し,区 00∼33 のそれより詳細な概観を図 に示す。

基本多言語面には,表音文字,音節文字及び漢字の用字で一般的に用いる文字並びに様々な記号及び数

字が含まれる。


46

X 0221

:2014 (ISO/IEC 10646:2012)

   

注記  区の中の縦の区切りは,おおよその位置の目安を示しているだけである。

図 7−基本多言語面の概観


47

X 0221

:2014 (ISO/IEC 10646:2012)

注記 1  新タイ  ロ文字は,シーソンパンナータイ文字とも呼ぶ。 
注記 2  区の中の縦の区切りは,おおよその位置の目安を示しているだけである。

図 8−基本多言語面区 0033 の概観

27 

用字及び記号群に用いる追加多言語面の構造 

漢字の追加のために別の追加面を用意したので,現時点では,SMP(面 01)を漢字の符号化に用いない。


48

X 0221

:2014 (ISO/IEC 10646:2012)

   

SMP は,世界の他の用字で用いる図形文字のうち BMP で符号化されない文字の符号化に用いる。現時点

では,SMP で符号化する用字の大半は,現存の用字として現代の利用者集団が用いるものではない。

注記 SMP を次のように分割することが提案されている。

−  アルファベットの用字

−  象形文字,表意文字及び音節文字

−  漢字以外の表意文字

−  新規に発明された用字

−  記号の集合

SMP の概観を図 に,区 00∼7F のそれより詳細な概観を図 10 に示す。

注記  区の中の縦の区切りは,おおよその位置の目安を示しているだけである。

図 9−用字及び記号群に用いる追加多言語面の概観


49

X 0221

:2014 (ISO/IEC 10646:2012)

注記 1  区の中の縦の区切りは,おおよその位置の目安を示しているだけである。 
注記 2  OLD ITALIC(古代イタリア文字)ブロックは,エトルリア文字,オスク文字,ウンブリア文字,ファリス

ク文字,北ピケーノ文字及び南ピケーノ文字を包含する統合用字を表す。これらのアルファベットの幾つか

は,右から左にも,左から右にも書くことができる。符号表の字形は,左から右に進むものを示した。

図 10−用字及び記号群に用いる追加多言語面の区 007F の概観

28 

追加漢字面の構造 

SIP(面 02)は,CJK 統合漢字(東アジアの漢字を統合したもの。)のうち,BMP で符号化されないも

のに用いる。統合の手順及び配列の規則を,

附属書 に示す。

SIP は,CJK 互換漢字にも用いる。CJK 互換漢字は,箇条 18 で規定する互換用文字である。 
SIP の概観を図 11 に示す。


50

X 0221

:2014 (ISO/IEC 10646:2012)

   

注記  区の中の縦の区切りは,おおよその位置の目安を示しているだけである。

図 11−追加漢字面の概観

29 

第三漢字面の構造 

TIP(面 03)は,古代の漢字のような用字であって,CJK 統合漢字と関連するが CJK 統合漢字には分類

されない用字に用いる。現在のところ TIP に符号化されている文字はない。

注記  この規格の将来の版では TIP に甲骨文字又は金文を含めるかもしれない。

30 

追加特殊用途面の構造 

SSP(面 0E)は,特殊な用途の図形文字及び書式文字に用いる。

SSP の概観を図 12 に示す。

注記  通常の処理又は表示では,この範囲の未定義の符号位置は,無視することが望ましい。

注記  区の中の縦の区切りは,おおよその位置の目安を示しているだけである。

図 12−追加特殊用途面の概観


51

X 0221

:2014 (ISO/IEC 10646:2012)

31 

符号表及び文字の名前一覧表 

基本多言語面(BMP)

,追加多言語面(SMP)

,追加漢字面(SIP)及び追加特殊用途面(SSP)に対する

詳細符号表及び文字の名前の一覧を添付ファイルによって示す。符号表は,ブロックごとに整理されてお

り,複数ページにまたがるブロックもある。

それぞれの符号表の後には,対応する文字の名前一覧を示す(ただし,漢字及びハングル音節のブロッ

クを除く。

注記  場所が許せば,一つのブロックの符号表と文字の名前一覧とを一つのページにまとめることも

ある。

注記 A  漢字の符号表は,形式が異なる(23.3 及び 23.5 参照)。

31.1 

符号表 

符号表は,文字を表す図形記号を,それぞれが 16 個の記号を含む 1∼16 桁に編成した配列として表示さ

れる。符号化表現の下位 1 桁を左側の余白に表示し,残りの上位桁を上側の余白に表示する。さらに,符

号化表現の全体をそれぞれの図形記号の下に表示する。

注記  図形文字の表示に対応する図形記号は,参考である。箇条 13 参照。

31.2 

文字の名前の一覧表 

文字の名前の一覧表は,規定事項と参考情報との両方を含む。次の項目は,規定事項とする。

−  文字の符号位置。

−  付随する文字の名前。

−  文字の別名(

“※”に引き続いて記載する。

他の全ての情報は,参考情報であり,次のようなものがある。

−  文字に関連付いた図形記号。

−  あるブロックの様々な部分に対する見出し。例えば,LATIN-1 SUPPLEMENT ブロックには,

“Latin-1

punctuation and symbols”,“Letters”及び“Mathematical operator”の見出しがある。

−  見出し又はブロック全体に関して補足する説明の文章。

−  “=”に引き続いて記載する,参考の別名。これは,文字の代替の名前を示す。

−  “→”に引き続いて記載する,相互参照。これは,関連する文字を示す。

−  “・”に引き続いて記載する,言語に関する情報。これは,その文字を使用する言語を非網羅的に示

す。大文字と小文字とをもつ用字の場合,この情報は,小文字に対してだけ示す。

−  やはり“・”に引き続いて記載する,大文字と小文字との対応情報。これは,名前から単純に類推す

ることができない場合にだけ示す。

−  やはり“・”に引き続いて記載する,その他の情報。これは,奇妙な名前,歴史的配慮事項等の,文

字に関して記録すべき特徴を示す。

−  分解写像。

“≡”に引き続いて基準写像を,

“≈”に引き続いて互換写像を,それぞれ記載する。

注記  分解写像の文法は,ユニコード標準第 6.0 版の 17.1 に詳しい記載がある。

次の例は,ここに示した参考項目を含む,文字名一覧の様々な部分を用いて説明している。


52

X 0221

:2014 (ISO/IEC 10646:2012)

   

31.3 

符号表及び文字の名前一覧の添付ファイル 

基本多言語面(BMP)

,追加多言語面(SMP)

,追加漢字面(SIP)及び追加特殊用途面(SSP)に対する

詳細符号表及び文字の名前の一覧を添付ファイルによって示す。これらの符号表及び名前の一覧は,次の

とおりとする。

−  BASIC LATIN ∼ YIJING HEXAGRAM SYMBOLS ( 0000 ∼ 4DFF ) は , 添 付 フ ァ イ ル

“ISO10646-2012-1-0000-4DFF.pdf”とする。

−  CJK UNIFIED IDEOGRAPHS(4E00∼9FFF)は,添付ファイル“ISO10646-2012-2-4E00-9FFF.pdf”と

する。

−  YI SYLLABLES ∼ ALCHEMICAL SYMBOLS ( A000 ∼ 1FFFF ) は , 添 付 フ ァ イ ル

“ISO10646-2012-3-A000-1FFFF.pdf”とする。

−  CJK UNIFIED IDEOGRAPHS EXTENSION B の 前 半 ( 20000 ∼ 25333 ) は , 添 付 フ ァ イ ル


53

X 0221

:2014 (ISO/IEC 10646:2012)

“ISO10646-2012-4-20000-25333.pdf”とする。

−  CJK UNIFIED IDEOGRAPHS EXTENSION B の 後 半 ( 25334 ∼ 2A6FF ) は , 添 付 フ ァ イ ル

“ISO10646-2012-5-25334-2A6FF.pdf”とする。

−  CJK UNIFIED IDEGRAPHS EXTENSION CVARIATION SELECTORS SUPPLEMENT(2A700∼10FFFF)

は,添付ファイル“ISO10646-2012-6-2A700-10FFFF.pdf”とする。

注記  符号表の奇数・偶数レイアウトを保つために,実際の符号表の直前のブロックの 1 枚を挿入す

ることがある。


54

X 0221

:2014 (ISO/IEC 10646:2012)

   

附属書 A

(規定)

部分集合用図形文字の組

A.1 

符号化図形文字の組 

次に示す組は,組番号の順に並べている。

“符号位置”の * は,その組が確定組であることを示す。

組番号  名前

符号位置

1

BASIC LATIN

 0020∼007E *

2

LATIN-1 SUPPLEMENT

 00A0∼00FF *

3

LATIN EXTENDED-A

 0100∼017F *

4

LATIN EXTENDED-B

 0180∼024F *

5

IPA EXTENSIONS

 0250∼02AF *

6

SPACING MODIFIER LETTERS

 02B0∼02FF *

7

COMBINING DIACRITICAL MARKS

 0300∼036F *

8

BASIC GREEK

 0370∼03CF

9

GREEK SYMBOLS AND COPTIC

 03D0∼03FF

10

CYRILLIC

 0400∼04FF *

11

ARMENIAN

 0530∼058F

12

BASIC HEBREW

 05D0∼05EA *

13

HEBREW EXTENDED

 0590∼05CF

05EB∼05FF

14

BASIC ARABIC

 0600∼065F

15

ARABIC EXTENDED

 0660∼06FF *

16

DEVANAGARI

 0900∼097F

200C,200D

17

BENGALI

 0980∼09FF

200C,200D

18

GURMUKHI

 0A00∼0A7F

200C,200D

19

GUJARATI

 0A80∼0AFF

200C,200D

20

ORIYA

 0B00∼0B7F

200C,200D

21

TAMIL

 0B80∼0BFF

200C,200D

22

TELUGU

 0C00∼0C7F

200C,200D

23

KANNADA

 0C80∼0CFF

200C,200D

24

MALAYALAM

 0D00∼0D7F

200C,200D

25

THAI

 0E00∼0E7F

26

LAO

 0E80∼0EFF

27

BASIC GEORGIAN

 10D0∼10FF

28

GEORGIAN EXTENDED

 10A0∼10CF

29

HANGUL JAMO

 1100∼11FF *

30

LATIN EXTENDED ADDITIONAL

 1E00∼1EFF *

31

GREEK EXTENDED

 1F00∼1FFF

32

GENERAL PUNCTUATION

 2000∼206F

33

SUPERSCRIPTS AND SUBSCRIPTS

 2070∼209F

34

CURRENCY SYMBOLS

 20A0∼20CF

35

COMBINING DIACRITICAL MARKS FOR SYMBOLS

 20D0∼20FF

36

LETTERLIKE SYMBOLS

 2100∼214F *


55

X 0221

:2014 (ISO/IEC 10646:2012)

37

NUMBER FORMS

 2150∼218F

38

ARROWS

 2190∼21FF *

39

MATHEMATICAL OPERATORS

 2200∼22FF *

40

MISCELLANEOUS TECHNICAL

 2300∼23FF

41

CONTROL PICTURES

 2400∼243F

42

OPTICAL CHARACTER RECOGNITION

 2440∼245F

43

ENCLOSED ALPHANUMERICS

 2460∼24FF *

44

BOX DRAWING

 2500∼257F *

45

BLOCK ELEMENTS

 2580∼259F *

46

GEOMETRIC SHAPES

 25A0∼25FF *

47

MISCELLANEOUS SYMBOLS

 2600∼26FF *

48

DINGBATS

 2700∼27BF

49

CJK SYMBOLS AND PUNCTUATION

 3000∼303F *

50

HIRAGANA

 3040∼309F

51

KATAKANA

 30A0∼30FF *

52

BOPOMOFO

 3100∼312F

31A0∼31BF

53

HANGUL COMPATIBILITY JAMO

 3130∼318F

54

CJK MISCELLANEOUS

 3190∼319F

55

ENCLOSED CJK LETTERS AND MONTHS

 3200∼32FF

56

CJK COMPATIBILITY

 3300∼33FF *

57∼59  [これらの組番号は,使用しない(注記 参照)。] 
60

CJK UNIFIED IDEOGRAPHS

 4E00∼9FFF

61

PRIVATE USE AREA

 E000∼F8FF

62

CJK COMPATIBILITY IDEOGRAPHS

 F900∼FAFF

63

(組 63 は,他の組の組合せによって定義する。

64

ARABIC PRESENTATION FORMS-A

 FB50∼FDCF

FDF0∼FDFF

65

COMBINING HALF MARKS

 FE20∼FE2F

66

CJK COMPATIBILITY FORMS

 FE30∼FE4F *

67

SMALL FORM VARIANTS

 FE50∼FE6F

68

ARABIC PRESENTATION FORMS-B

 FE70∼FEFE

69

HALFWIDTH AND FULLWIDTH FORMS

 FF00∼FFEF

70

SPECIALS

 FFF0∼FFFD

71

HANGUL SYLLABLES

 AC00∼D7A3 *

72

BASIC TIBETAN

 0F00∼0FBF

73

ETHIOPIC

 1200∼137F

74

UNIFIED CANADIAN ABORIGINAL SYLLABICS

 1400∼167F *

75

CHEROKEE

 13A0∼13FF

76

YI SYLLABLES

 A000∼A48F

77

YI RADICALS

 A490∼A4CF

78

KANGXI RADICALS

 2F00∼2FDF

79

CJK RADICALS SUPPLEMENT

 2E80∼2EFF

80

BRAILLE PATTERNS

 2800∼28FF

81

CJK UNIFIED IDEOGRAPHS EXTENSION A

 3400∼4DBF

FA1F,FA23

82

OGHAM

 1680∼169F

83

RUNIC

 16A0∼16FF

84

SINHALA

 0D80∼0DFF

85

SYRIAC

 0700∼074F

86

THAANA

 0780∼07BF

87

BASIC MYANMAR

 1000∼104F

200C,200D *

88

KHMER

 1780∼17FF

200C,200D

89

MONGOLIAN

 1800∼18AF *


56

X 0221

:2014 (ISO/IEC 10646:2012)

   

90

EXTENDED MYANMAR

 1050∼109F

91

TIBETAN

 0F00∼0FFF

92

CYRILLIC SUPPLEMENT

 0500∼052F

93

TAGALOG

 1700∼171F

94

HANUNOO

 1720∼173F

95

BUHID

 1740∼175F

96

TAGBANWA

 1760∼177F

97

MISCELLANEOUS MATHEMATICAL SYMBOLS-A

 27C0∼27EF *

98

SUPPLEMENTAL ARROWS-A

 27F0∼27FF *

99

SUPPLEMENTAL ARROWS-B

 2900∼297F *

100

MISCELLANEOUS MATHEMATICAL SYMBOLS-B

 2980∼29FF *

101

SUPPLEMENTAL MATHEMATICAL OPERATORS

 2A00∼2AFF *

102

KATAKANA PHONETIC EXTENSIONS

 31F0∼31FF *

103

VARIATION SELECTORS

 FE00∼FE0F *

104

LTR ALPHABETIC PRESENTATION FORMS

 FB00∼FB1C

105

RTL ALPHABETIC PRESENTATION FORMS

 FB1D∼FB4F

106

LIMBU

 1900∼194F

107

TAI LE

 1950∼197F

108

KHMER SYMBOLS

 19E0∼19FF *

109

PHONETIC EXTENSIONS

 1D00∼1D7F *

110

MISCELLANEOUS SYMBOLS AND ARROWS

 2B00∼2BFF

111

YIJING HEXAGRAM SYMBOLS

 4DC0∼4DFF *

112

ARABIC SUPPLEMENT

 0750∼077F *

113

ETHIOPIC SUPPLEMENT

 1380∼139F

114

NEW TAI LUE

 1980∼19DF

115

BUGINESE

 1A00∼1A1F

116

PHONETIC EXTENSIONS SUPPLEMENT

 1D80∼1DBF *

117

COMBINING DIACRITICAL MARKS SUPPLEMENT

 1DC0∼1DFF

118

GLAGOLITIC

 2C00∼2C5F

119

COPTIC

 03E2∼03EF

2C80∼2CFF

120

GEORGIAN SUPPLEMENT

 2D00∼2D2F

121

TIFINAGH

 2D30∼2D7F

122

ETHIOPIC EXTENDED

 2D80∼2DDF

123

SUPPLEMENTAL PUNCTUATION

 2E00∼2E7F

124

CJK STROKES

 31C0∼31EF

125

MODIFIER TONE LETTERS

 A700∼A71F *

126

SYLOTI NAGRI

 A800∼A82F

127

VERTICAL FORMS

 FE10∼FE1F

128

NKO

 07C0∼07FF

129

BALINESE

 1B00∼1B7F

130

LATIN EXTENDED-C

 2C60∼2C7F *

131

LATIN EXTENDED-D

 A720∼A7FF

132

PHAGS-PA

 A840∼A87F

133

SUNDANESE

 1B80∼1BBF *

134

LEPCHA

 1C00∼1C4F

135

OL CHIKI

 1C50∼1C7F *

136

VAI

 A500∼A63F

137

SAURASHTRA

 A880∼A8DF

138

KAYAH LI

 A900∼A92F *

139

REJANG

 A930∼A95F

140

CYRILLIC EXTENDED-A

 2DE0∼2DFF *

141

CYRILLIC EXTENDED-B

 A640∼A69F

142

CHAM

 AA00∼AA5F

143

TAI THAM

 1A20∼1AAF

144

HANGUL JAMO EXTENDED-A

 A960∼A97F


57

X 0221

:2014 (ISO/IEC 10646:2012)

145

TAI VIET

 AA80∼AADF

146

HANGUL JAMO EXTENDED-B

 D7B0∼D7FF

147

SAMARITAN

 0800∼083F

148

UNIFIED CANADIAN ABORIGINAL SYLLABICS EXTENDED

 18B0∼18FF

149

VEDIC EXTENSIONS

 1CD0∼1CFF

150

LISU

 A4D0∼A4FF *

151

BAMUM

 A6A0∼A6FF

152

COMMON INDIC NUMBER FORMS

 A830∼A83F

153

DEVANAGARI EXTENDED

 A8E0∼A8FF

154

JAVANESE

 A980∼A9DF

155

MYANMAR EXTENDED-A

 AA60∼AA7F

156

MEETEI MAYEK

 ABC0∼ABFF

157

MANDAIC

 0840∼085F

158

BATAK

 1BC0∼1BFF

159

ETHIOPIC EXTENDED-A

 AB00∼AB2F

160

ARABIC EXTENDED-A

 08A0∼08FF

161

SUNDANESE SUPPLEMENT

 1CC0∼1CCF

162

MEETEI MAYEK EXTENSIONS

 AAE0∼AAFF

1001

OLD ITALIC

 10300∼1032F

1002

GOTHIC

 10330∼1034F

1003

DESERET

 10400∼1044F *

1004

BYZANTINE MUSICAL SYMBOLS

 1D000∼1D0FF

1005

MUSICAL SYMBOLS

 1D100∼1D1FF

1006

MATHEMATICAL ALPHANUMERIC SYMBOLS

 1D400∼1D7FF

1007

LINEAR B SYLLABARY

 10000∼1007F

1008

LINEAR B IDEOGRAMS

 10080∼100FF

1009

AEGEAN NUMBERS

 10100∼1013F

1010

UGARITIC

 10380∼1039F

1011

SHAVIAN

 10450∼1047F *

1012

OSMANYA

 10480∼104AF

1013

CYPRIOT SYLLABARY

 10800∼1083F

1014

TAI XUAN JING SYMBOLS

 1D300∼1D35F

1015

ANCIENT GREEK NUMBERS

 10140∼1018F

1016

OLD PERSIAN

 103A0∼103DF

1017

KHAROSHTHI

 10A00∼10A5F

1018

ANCIENT GREEK MUSICAL NOTATION

 1D200∼1D24F

1019

PHOENICIAN

 10900∼1091F

1020

CUNEIFORM

 12000∼123FF

1021

CUNEIFORM NUMBERS AND PUNCTUATION

 12400∼1247F

1022

COUNTING ROD NUMERALS

 1D360∼1D37F

1023

PHAISTOS DISC

 101D0∼101FF

1024

LYCIAN

 10280∼1029F

1025

CARIAN

 102A0∼102DF

1026

LYDIAN

 10920∼1093F

1027

ANCIENT SYMBOLS

 10190∼101CF

1028

MAHJONG TILES

 1F000∼1F02F

1029

DOMINO TILES

 1F030∼1F09F

1030

AVESTAN

 10B00∼10B3F

1031

EGYPTIAN HIEROGLYPHS

 13000∼1342F

1032

IMPERIAL ARAMAIC

 10840∼1085F

1033

OLD SOUTH ARABIAN

 10A60∼10A7F

1034

INSCRIPTIONAL PARTHIAN

 10B40∼10B5F

1035

INSCRIPTIONAL PAHLAVI

 10B60∼10B7F

1036

OLD TURKIC

 10C00∼10C4F

1037

RUMI NUMERAL SYMBOLS

 10E60∼10E7F

1038

KAITHI

 11080∼110CF


58

X 0221

:2014 (ISO/IEC 10646:2012)

   

1039

ENCLOSED ALPHANUMERIC SUPPLEMENT

 1F100∼1F1FF

1040

ENCLOSED IDEOGRAPHIC SUPPLEMENT

 1F200∼1F2FF

1041

BRAHMI

 11000∼1107F

1042

KANA SUPPLEMENT

 1B000∼1B0FF

1043

BAMUM SUPPLEMENT

 16800∼16A3F

1044

PLAYING CARDS

 1F0A0∼1F0FF

1045

MISCELLANEOUS SYMBOLS AND PICTOGRAPHS

 1F300∼1F5FF

1046

EMOTICONS

 1F600∼1F64F

1047

TRANSPORT AND MAP SYMBOLS

 1F680∼1F6FF

1048

ALCHEMICAL SYMBOLS

 1F700∼1F77F

1049

MEROITIC HIEROGLYPHS

 10980∼1099F *

1050

MEROITIC CURSIVE

 109A0∼109FF

1051

SORA SOMPENG

 110D0∼110FF

1052

CHAKMA

 11100∼1114F

1053

SHARADA

 11180∼111DF

1054

TAKRI

 11680∼116CF

1055

MIAO

 16F00∼16F9F

1056

ARABIC MATHEMATICAL ALPHABETIC SYMBOLS

 1EE00∼1EEFF

2001

CJK UNIFIED IDEOGRAPHS EXTENSION B

 20000∼2A6DF

2002

CJK COMPATIBILITY IDEOGRAPHS SUPPLEMENT

 2F800∼2FA1F

2003

CJK UNIFIED IDEOGRAPHS EXTENSION C

 2A700∼2B73F

2004

CJK UNIFIED IDEOGRAPHS EXTENSION D

 2B740∼2B81F

3001

TAGS

 E0000∼E007F

3003

VARIATION SELECTORS SUPPLEMENT

 E0100∼E01EF *

次の組は,代替書式及び用字に特有の書式で使用する文字を規定する(

附属書 参照)。

200

ZERO-WIDTH BOUNDARY INDICATORS

 200B∼200D

FEFF

201

FORMAT SEPARATORS

 2028∼2029

202

BI-DIRECTIONAL FORMAT MARKS

 200E∼200F

203

BI-DIRECTIONAL FORMAT EMBEDDINGS

 202A∼202E

204

HANGUL FILL CHARACTERS

 115F∼1160

3164,FFA0

205

CHARACTER SHAPING SELECTORS

 206A∼206D

206

NUMERIC SHAPE SELECTORS

 206E∼206F

207

IDEOGRAPHIC DESCRIPTION CHARACTERS

 2FF0∼2FFF

208

CONTROL CHARACTERS

 0000∼001F

007F∼009F

3002

ALTERNATE FORMAT CHARACTERS

 E0000∼E0FFF

次の組は,この規格の対応国際規格の以前の版が発行された時点での UCS 全体を表す組である。

299

(この組番号は,使用しない。A.3.2 を参照。

301

BMP-AMD.7

A.3.1

を参照。*

302

BMP SECOND EDITION

A.3.3

を参照。*

303

UNICODE 3.1

A.6.1

を参照。*

304

UNICODE 3.2

A.6.2

を参照。*

305

UNICODE 4.0

A.6.3

を参照。*

306

UNICODE 4.1

A.6.4

を参照。*

307

UNICODE 5.0

A.6.5

を参照。*

308

UNICODE 5.1

A.6.6

を参照。*

309

UNICODE 5.2

A.6.7

を参照。*

311

UNICODE 6.0

A.6.8

を参照。*

312

UNICODE 6.1

A.6.9

を参照。*

340

COMBINED FIRST EDITION

A.3.4

を参照。*

10646

UNICODE

 0000∼FDCF

FDF0∼FFFD 
10000∼1FFFD


59

X 0221

:2014 (ISO/IEC 10646:2012)

20000∼2FFFD 
30000∼3FFFD 
40000∼4FFFD 
50000∼5FFFD 
60000∼6FFFD 
70000∼7FFFD 
80000∼8FFFD 
90000∼9FFFD 
A0000∼AFFFD 
B0000∼BFFFD 
C0000∼CFFFD 
D0000∼DFFFD 
E0000∼EFFFD 
F0000∼FFFFD 
100000∼10FFFD

注記 1  組 UNICODE は,この規格が現在符号化している全ての文字を包含する。

次の組は,漢字だけを含む。

370

IICORE

A.4.1

を参照。*

371

JIS2004 IDEOGRAPHICS EXTENSION

A.4.2

を参照。*

372

JAPANESE IDEOGRAPHICS SUPPLEMENT

A.4.3

を参照。*

380

CJK UNIFIED IDEOGRAPHS-2001

 3400∼4DB5

4E00∼9FA5 
FA0E∼FA0F 
FA11 
FA13∼FA14 
FA1F,FA21 
FA23∼FA24 
FA27∼FA29 
20000∼2A6D6 *

381

CJK COMPATIBILITY IDEOGRAPHS-2001

 F900∼FA0D

FA10,FA12 
FA15∼FA1E 
FA20,FA22 
FA25∼FA26 
FA2A∼FA6A 
2F800∼2FA1D *

382

CJK UNIFIED IDEOGRAPHS-2005

組 380 
9FA6∼9FBB *

383

CJK COMPATIBILITY IDEOGRAPHS-2005

組 381 
FA70∼FAD9 *

384

CJK UNIFIED IDEOGRAPHS-2007

組 382 
9FBC∼9FC3 *

385

CJK UNIFIED IDEOGRAPHS-2008

組 384 
9FC4∼9FC6 
2A700∼2B734 *

386

CJK COMPATIBILITY IDEOGRAPHS-2008

組 383 
FA6B∼FA6D *

387

CJK UNIFIED IDEOGRAPHS-2009

組 385 
9FC7∼9FCB 
2B740∼2B81D *

その他の組(拡張組を含む。

)を,次に規定する。

270

COMBINING CHARACTERS

 BMP にある結合文字(4.14 参照)。

271

(この組番号は,使用しない。

注記 を参照。)

281

MES-1

A.5.1

を参照。*

282

MES-2

A.5.2

を参照。*

283

MODERN EUROPEAN SCRIPTS

A.5.3

を参照。*


60

X 0221

:2014 (ISO/IEC 10646:2012)

   

284

CONTEMPORARY LITHUANIAN LETTERS

A.5.4

を参照。*

285

BASIC JAPANESE

A.5.5

を参照。*

286

JAPANESE NON IDEOGRAPHICS EXTENSION

A.5.6

を参照。*

287

COMMON JAPANESE

A.5.7

を参照。*

288

MULTILINGUAL LATIN SUBSET

A.5.8

を参照。*

300

BMP

 0000∼D7FF

E000∼FFFD

400

[この組番号は,使用しない(

注記 参照)。]

401

PRIVATE USE PLANES-0F-10

面 0F∼10

500

[この組番号は,使用しない(

注記 参照)。]

1000

SMP

 10000∼1FFFD

1900

SMP COMBINING CHARACTERS

 SMP にある結合文字(4.14 参照)。

2000

SIP

 20000∼2FFFD

3000

SSP

 E0000∼EFFFD

上に定義した特定の組を組み合わせた組を,次に規定する。

63

ALPHABETIC PRESENTATION FORMS

組 104∼105

250

GENERAL FORMAT CHARACTERS

組 200∼203

251

SCRIPT-SPECIFIC FORMAT CHARACTERS

組 204∼206

4000

UCS PART-2

組 1000,2000,3000

注記 2  番号 57∼59 の組は,ISO/IEC 10646-1 の最初の版で規定されていたが,その後,削除された。

番号 400 及び 500 の組は,ISO/IEC 10646-1 の最初の版及び第 2 版で規定されていたが,そ

の後,削除された。番号 271 の組は,この規格の最初の版で規定されていたが,その後,削

除された。

注記 3  上に示した組の名前で使われる主要な語(キーワード)を,アルファベット順に,次に列挙

する。各語の行には,組の名前がその語を含む組番号を全て示す。ただし,これらの語は,

用字の名前など,特定の属性をもつ文字を見つけ出すことができるような組全てへの完全な

相互参照となるものではない。これらの語の多くは,組の中の文字の属性を識別するが,そ

の属性をもつ文字の中には,他の,その語の行に番号が現れない組に入れたものもある。

Aegean numbers

1009

Alphabetic 63 
Alphanumeric 43 
Ancient Greek

1015,1018

Arabic 14,15,64,68,112,160,1056 
Armenian 11 
Arrows 38,98,99,110 
Avestan 1030 
Balinese 129 
Bamum 151,1043 
Batak 158 
Bengali 17 
Bidirectional 202,203 
Block elements

45

BMP 300∼302 (299) 
Box drawing

44

Bopomofo 52 
Brahmi 1041 
Braille patterns

80

Buginese 115 
Buhid 95 
Byzantine musical symbols

1004

Canadian Aboriginal

74,148

Carian 1025 
Chakma 1052 
Cham 142 
Cherokee 75


61

X 0221

:2014 (ISO/IEC 10646:2012)

CJK 49,54∼56,60,62,66,78,81,124,2001,2002 
Combining 7,35,65,117,270,271 
Compatibility 53,56,62,66 
Control pictures

41

Coptic 9,119 
Counting Rod numerals

1022

Cuneiform 1020,1021 
Currency 34 
Cypriot syllabary

1013

Cyrillic 10,92,140,141 
Deseret 1003 
Devanagari 16,153 
Diacritical marks

7,35,117

Dingbats 48 
Enclosed 43,55 
Egyptian hieroglyphs

1031

Ethiopic 73,113,122,159 
Format 201∼203,250,251 
Fullwidth 69 
Game tiles

1028,1029

Geometric shapes

46

Georgian 27,28,120 
Glagolitic 118 
Gothic 1002 
Greek 8,9,31 
Gujarati 19 
Gurmukhi 18 
Half (marks, width)

65,69

Hangul 29,53,71,144,146,204 
Hanunoo 94 
Hebrew 12,13 
Hiragana 50,1042 
Ideographs 60,62,81,207,380,381 
Imperial Aramaic

1032

Inscriptional Pahlavi

1035

Inscriptional Parthian

1034

IPA extensions

5

Jamo 29,53,144,146 
Javanese 154 
Kaithi 1038 
Kangxi 78 
Kannada 23 
Katakana 51,102,1042 
Kayah Li

138

Kharoshthi 1017 
Khmer 88,108 
Lao 26 
Latin 1∼4,30,130,131 
Lepcha 134 
Letter 36,55,1039,1040 
Limbu 106 
Linear B ideograms

1008

Linear B syllabary

1007

Lisu 150 
Lycian 1024 
Lydian 1026 
Malayalam 24 
Mandaic 157 
Mathematical alphanumeric symbols

1006,1056

Mathematical operators

39,101

Mathematical symbols

97,100

Meetei Mayek

156,162


62

X 0221

:2014 (ISO/IEC 10646:2012)

   

Meroitic 1049,1050 
MES 281,282 
Miao 1055 
Mongolian 89 
Months 55 
Musical notation

1018

Musical symbols

1004,1005

Myanmar 87,90,155 
New Tai Lue

114

NKo 128 
Number 37,152,1009,1015 
Ogham 82 
Ol Chiki

135

Old Italic

1001

Old Persian

1016

Old South Arabian

1033

Old Turkic

1036

Optical character recognition

42

Oriya 20 
Osmanya 1012 
Phags-pa 132 
Phaistos Disc

1023

Phoenician 1019 
Phonetic extensions

109,116

Presentation forms

63,64,68,104,105

Private use

61,401

Punctuation 32,49,123 
Radicals 77∼79 
Rejang 139 
Rumi numeral symbols

1037

Runic 83 
Samaritan 147 
Saurashtra 137 
Shape, shaping

205,206

Sharada 1053 
Shavian 1011 
Sinhala 84 
Small form

67

Sora Sompeng

1051

Spacing modifier

6,125

Specials 70 
Strokes 124 
Subscripts, superscripts

33

Sundanese 133,161 
Syllables, syllabics

71,74,76

Syloti Nagri

126

Symbols 9,34∼36,47,49,97,100,1027,1044∼1048 
Syriac 85 
Tagalog 93 
Tagbanwa 96 
Tags 3001 
Tai Tham

143

Tai Viet

145

Tai Xuan Jing symbols

1014

Tail Le

107

Takri 1054 
Tamil 21 
Technical 40 
Telugu 22 
Thaana 86 
Thai 25 
Tibetan 72,91 
Tifinagh 121


63

X 0221

:2014 (ISO/IEC 10646:2012)

Ugaritic 1010 
Unicode 303∼310,10646 
Vai 136 
Variation selectors

103,3003

Vedic 149 
Vertical form

127

Yi 76,77 
Yijing hexagram symbols

111

Zero-width 200

A.2 

ブロックの一覧 

A.2.1 BMP

のブロック 

次のブロックは,BMP で規定される。次は,符号位置の順に並べている。

ブロックの名前

から  まで

[日本語による通用名称(参考)

BASIC LATIN

 0020∼007E

(基本ラテン文字)

LATIN-1 SUPPLEMENT

 00A0∼00FF

(ラテン 1 補助)

LATIN EXTENDED-A

 0100∼017F

(ラテン文字拡張 A)

LATIN EXTENDED-B

 0180∼024F

(ラテン文字拡張 B)

IPA (INTERNATIONAL PHONETIC ALPHABET) EXTENSIONS 

0250∼02AF

(IPA 拡張)

SPACING MODIFIER LETTERS

 02B0∼02FF

(前進を伴う修飾文字)

COMBINING DIACRITICAL MARKS   

0300∼036F

[ダイアクリティカルマーク(合成可能)

GREEK AND COPTIC

 0370∼03FF

(ギリシア文字及びコプト文字)

CYRILLIC

 0400∼04FF

(キリル文字)

CYRILLIC SUPPLEMENT

 0500∼052F

(キリル文字補助)

ARMENIAN

 0530∼058F

(アルメニア文字)

HEBREW

 0590∼05FF

(ヘブライ文字)

ARABIC

 0600∼06FF

(アラビア文字)

SYRIAC

 0700∼074F

(シリア文字)

ARABIC SUPPLEMENT

 0750∼077F

(アラビア文字補助)

THAANA

 0780∼07BF

(ターナ文字)

NKO

 07C0∼07FF

(ンコ文字)

SAMARITAN

 0800∼083F

(サマリア文字)

MANDAIC

 0840∼085F

(マンダ文字)

ARABIC EXTENDED-A

 08A0∼08FF

(アラビア文字拡張 A)

DEVANAGARI

 0900∼097F

(デーヴァナーガリー文字)

BENGALI

 0980∼09FF

(ベンガル文字)

GURMUKHI

 0A00∼0A7F

(グルムキー文字)

GUJARATI

 0A80∼0AFF

(グジャラート文字)

ORIYA

 0B00∼0B7F

(オリヤー文字)

TAMIL

 0B80∼0BFF

(タミル文字)

TELUGU

 0C00∼0C7F

(テルグ文字)

KANNADA

 0C80∼0CFF

(カンナダ文字)

MALAYALAM

 0D00∼0D7F

(マラヤーラム文字)

SINHALA

 0D80∼0DFF

(シンハラ文字)

THAI

 0E00∼0E7F

(タイ文字)

LAO

 0E80∼0EFF

(ラオス文字)

TIBETAN

 0F00∼0FFF

(チベット文字)

MYANMAR

 1000∼109F

(ビルマ文字)

GEORGIAN

 10A0∼10FF

(グルジア文字)

HANGUL JAMO

 1100∼11FF

(ハングル字母)

ETHIOPIC

 1200∼137F

(エチオピア文字)

ETHIOPIC SUPPLEMENT

 1380∼139F

(エチオピア文字補助)

CHEROKEE

 13A0∼13FF

(チェロキー文字)


64

X 0221

:2014 (ISO/IEC 10646:2012)

   

UNIFIED CANADIAN ABORIGINAL SYLLABICS 

1400∼167F

(統合カナダ先住民音節)

OGHAM

 1680∼169F

(オガム文字)

RUNIC

 16A0∼16FF

(ルーン文字)

TAGALOG

 1700∼171F

(タガログ文字)

HANUNOO

 1720∼173F

(ハヌノオ文字)

BUHID

 1740∼175F

(ブヒッド文字)

TAGBANWA

 1760∼177F

(タグバヌア文字)

KHMER

 1780∼17FF

(クメール文字)

MONGOLIAN

 1800∼18AF

(モンゴル文字)

UNIFIED CANADIAN ABORIGINAL SYLLABICS EXTENDED 

18B0∼18FF

(統合カナダ先住民音節拡張)

LIMBU

 1900∼194F

(リンブ文字)

TAI LE

 1950∼197F

(タイ  ロ文字)

NEW TAI LUE

 1980∼19DF

(新タイ  ロ文字)

KHMER SYMBOLS

 19E0∼19FF

(クメール文字用記号)

BUGINESE

 1A00∼1A1F

(ブギス文字)

TAI THAM

 1A20∼1AAF   (タイタム文字)

BALINESE

 1B00∼1B7F

(バリ文字)

SUNDANESE

 1B80∼1BBF

(スンダ文字)

BATAK

 1BC0∼1BFF

(バタク文字)

LEPCHA

 1C00∼1C4F

(レプチャ文字)

OL CHIKI

 1C50∼1C7F

(オルチキ文字)

SUNDANESE SUPPLEMENT

 1CC0∼1CCF   (スンダ文字補助)

VEDIC EXTENSIONS

 1CD0∼1CFF

(ヴェーダ用拡張)

PHONETIC EXTENSIONS

 1D00∼1D7F

(音声記号拡張)

PHONETIC EXTENSIONS SUPPLEMENT 

1D80∼1DBF

(音声記号拡張補助)

COMBINING DIACRITICAL MARKS SUPPLEMENT 

1DC0∼1DFF

[ダイアクリティカルマーク(合成可能)補助]

LATIN EXTENDED ADDITIONAL

 1E00∼1EFF

(ラテン文字拡張追加)

GREEK EXTENDED

 1F00∼1FFF

(ギリシア文字拡張)

GENERAL PUNCTUATION

 2000∼206F

(一般句読点)

SUPERSCRIPTS AND SUBSCRIPTS 

2070∼209F

(上付き・下付き)

CURRENCY SYMBOLS

 20A0∼20CF

(通貨記号)

COMBINING DIACRITICAL MARKS FOR SYMBOLS

20D0∼20FF

[記号用ダイアクリティカルマーク(合成可能)

LETTERLIKE SYMBOLS

 2100∼214F

(文字様記号)

NUMBER FORMS

 2150∼218F

(数字に準じるもの)

ARROWS

 2190∼21FF

(矢印)

MATHEMATICAL OPERATORS

 2200∼22FF

(数学記号)

MISCELLANEOUS TECHNICAL

 2300∼23FF

(その他の技術用記号)

CONTROL PICTURES

 2400∼243F

(制御機能用記号)

OPTICAL CHARACTER RECOGNITION 

2440∼245F

(光学的文字認識,OCR)

ENCLOSED ALPHANUMERICS

 2460∼24FF

(囲み英数字)

BOX DRAWING

 2500∼257F

(けい線素辺)

BLOCK ELEMENTS

 2580∼259F

(ブロック要素)

GEOMETRIC SHAPES

 25A0∼25FF

(幾何学模様)

MISCELLANEOUS SYMBOLS

 2600∼26FF

(その他の記号)

DINGBATS

 2700∼27BF

(装飾記号)

MISCELLANEOUS MATHEMATICAL SYMBOLS-A 

27C0∼27EF

(その他の数学記号 A)

SUPPLEMENTAL ARROWS-A

 27F0∼27FF

(補助矢印 A)

BRAILLE PATTERNS

 2800∼28FF

(点字図形)

SUPPLEMENTAL ARROWS-B

 2900∼297F

(補助矢印 B)

MISCELLANEOUS MATHEMATICAL SYMBOLS-B 


65

X 0221

:2014 (ISO/IEC 10646:2012)

2980∼29FF

(その他の数学記号 B)

SUPPLEMENTAL MATHEMATICAL OPERATORS 

2A00∼2AFF

(補助数学記号)

MISCELLANEOUS SYMBOLS AND ARROWS 

2B00∼2BFF

(その他の記号及び矢印)

GLAGOLITIC

 2C00∼2C5F

(グラゴル文字)

LATIN EXTENDED-C

 2C60∼2C7F

(ラテン文字拡張 C)

COPTIC

 2C80∼2CFF

(コプト文字)

GEORGIAN SUPPLEMENT

 2D00∼2D2F

(グルジア文字補助)

TIFINAGH

 2D30∼2D7F

(ティフナグ文字)

ETHIOPIC EXTENDED

 2D80∼2DDF

(エチオピア文字拡張)

CYRILLIC EXTENDED-A

 2DE0∼2DFF

(キリル文字拡張 A)

SUPPLEMENTAL PUNCTUATION

 2E00∼2E7F

(補助句読点)

CJK RADICALS SUPPLEMENT

 2E80∼2EFF

(CJK 部首補助)

KANGXI RADICALS

 2F00∼2FDF

(康熙部首)

IDEOGRAPHIC DESCRIPTION CHARACTERS 

2FF0∼2FFF

(漢字構成記述文字,IDC)

CJK SYMBOLS AND PUNCTUATION 

3000∼303F

(CJK の記号及び句読点)

HIRAGANA

 3040∼309F

(平仮名)

KATAKANA

 30A0∼30FF

(片仮名)

BOPOMOFO

 3100∼312F

(注音字母)

HANGUL COMPATIBILITY JAMO

 3130∼318F

(ハングル互換字母)

KANBUN

 (CJK miscellaneous)

3190∼319F

[漢文用記号(その他の CJK 文字)

BOPOMOFO EXTENDED

 31A0∼31BF

(注音字母拡張)

CJK STROKES

 31C0∼31EF

(CJK の筆画)

KATAKANA PHONETIC EXTENSIONS 

31F0∼31FF

(片仮名拡張)

ENCLOSED CJK LETTERS AND MONTHS 

3200∼32FF

(囲み CJK 文字・月)

CJK COMPATIBILITY

 3300∼33FF

(CJK 互換用文字)

CJK UNIFIED IDEOGRAPHS EXTENSION A 

3400∼4DBF

(CJK 統合漢字拡張 A)

YIJING HEXAGRAM SYMBOLS

 4DC0∼4DFF

(易経記号)

CJK UNIFIED IDEOGRAPHS

 4E00∼9FFF

(CJK 統合漢字)

YI SYLLABLES

 A000∼A48F

(イ文字)

YI RADICALS

 A490∼A4CF

(イ文字部首)

LISU

 A4D0∼A4FF   (リス文字)

VAI

 A500∼A63F

(ヴァイ文字)

CYRILLIC EXTENDED-B

 A640∼A69F

(キリル文字拡張 B)

BAMUM

 A6A0∼A6FF   (バムン文字)

MODIFIER TONE LETTERS

 A700∼A71F

(声調修飾文字)

LATIN EXTENDED-D

 A720∼A7FF

(ラテン文字拡張 D)

SYLOTI NAGRI

 A800∼A82F

(シロティナーガリー文字)

COMMON INDIC NUMBER FORMS

 A830∼A83F

(インド慣用数量記号)

PHAGS-PA

 A840∼A87F

(パスパ文字)

SAURASHTRA

 A880∼A8DF   (サウラーシュトラ文字)

DEVANAGARI EXTENDED

 A8E0∼A8FF

(デーヴァナーガリー文字拡張)

KAYAH LI

 A900∼A92F

(カヤー文字)

REJANG

 A930∼A95F

(レジャン文字)

HANGUL JAMO EXTENDED-A

 A960∼A97F

(ハングル字母拡張 A)

JAVANESE

 A980∼A9DF   (ジャワ文字)

CHAM

 AA00∼AA5F   (チャム文字)

MYANMAR EXTENDED-A

 AA60∼AA7F

(ビルマ文字拡張 A)

TAI VIET

 AA80∼AADF   (タイヴィエト文字)

MEETEI MAYEK EXTENSIONS

 AAE0∼AAFF   (メイテイ文字拡張)

ETHIOPIC EXTENDED-A

 AB00∼AB2F

(エチオピア文字拡張 A)

MEETEI MAYEK

 ABC0∼ABFF   (メイテイ文字)


66

X 0221

:2014 (ISO/IEC 10646:2012)

   

HANGUL SYLLABLES

 AC00∼D7A3

(ハングル音節文字)

HANGUL JAMO EXTENDED-B

 D7B0∼D7FF

(ハングル字母拡張 B)

PRIVATE USE AREA

 E000∼F8FF

(私用領域)

CJK COMPATIBILITY IDEOGRAPHS 

F900∼FAFF

(CJK 互換漢字)

ALPHABETIC PRESENTATION FORMS 

FB00∼FB4F

(アルファベット表示形)

ARABIC PRESENTATION FORMS-A 

FB50∼FDFF

(アラビア表示形 A)

VARIATION SELECTORS

 FE00∼FE0F

(字形選択子)

VERTICAL FORMS

 FE10∼FE1F

(縦書き形)

COMBINING HALF MARKS

 FE20∼FE2F

[半記号(合成可能)

CJK COMPATIBILITY FORMS

 FE30∼FE4F

(CJK 互換形)

SMALL FORM VARIANTS

 FE50∼FE6F

(小字形)

ARABIC PRESENTATION FORMS-B 

FE70∼FEFE

(アラビア表示形 B)

HALFWIDTH AND FULLWIDTH FORMS 

FF00∼FFEF

(半角・全角形)

SPECIALS

 FFF0∼FFFD

(特殊用途文字)

A.2.2 SMP

のブロック 

次のブロックは,SMP で規定される。次は,符号位置の順に並べている。

ブロックの名前

から  まで

[日本語による通用名称(参考)

LINEAR B SYLLABARY

 10000∼1007F

(線文字 B 音節文字)

LINEAR B IDEOGRAMS

 10080∼100FF

(線文字 B 表意文字)

AEGEAN NUMBERS

 10100∼1013F

(エーゲ数字)

ANCIENT GREEK NUMBERS

 10140∼1018F

(古代ギリシア数字)

ANCIENT SYMBOLS

 10190∼101CF   (古代記号)

PHAISTOS DISC

 101D0∼101FF   (ファイストスの円盤文字)

LYCIAN

 10280∼1029F   (リュキア文字)

CARIAN

 102A0∼102DF   (カリア文字)

OLD ITALIC

 10300∼1032F

(古代イタリア文字)

GOTHIC

 10330∼1034F

(ゴート文字)

UGARITIC

 10380∼1039F

(ウガリト文字)

OLD PERSIAN

 103A0∼103DF  (古代ペルシャ文字)

DESERET

 10400∼1044F

(デザレット文字)

SHAVIAN

 10450∼1047F

(ショー文字)

OSMANYA

 10480∼104AF

(オスマニア文字)

CYPRIOT SYLLABARY

 10800∼1083F

(キプロス音節文字)

IMPERIAL ARAMAIC

 10840∼1085F   (帝国アラム文字)

PHOENICIAN

 10900∼1091F

(フェニキア文字)

LYDIAN

 10920∼1093F   (リュディア文字)

MEROITIC HIEROGLYPHS

 10980∼1099F   (メロエ文字楷書体)

MEROITIC CURSIVE

 109A0∼109FF   (メロエ文字草書体)

KHAROSHTHI

 10A00∼10A5F  (カローシュティー文字)

OLD SOUTH ARABIAN

 10A60∼10A7F   (古代南アラビア文字)

AVESTAN

 10B00∼10B3F   (アヴェスタ文字)

INSCRIPTIONAL PARTHIAN

 10B40∼10B5F   (碑文パルティア文字)

INSCRIPTIONAL PAHLAVI

 10B60∼10B7F   (碑文パフラヴィ文字)

OLD TURKIC

 10C00∼10C4F   (突厥文字)

RUMI NUMERAL SYMBOLS

 10E60∼10E7F   (ルミ数字記号)

BRAHMI

 11000∼1107F   (ブラーフミー文字)

KAITHI

 11080∼110CF   (カイティー文字)

SORA SOMPENG

 110D0∼110FF   (ソラングソンペング文字)

CHAKMA

 11100∼1114F

(チャクマ文字)

SHARADA

 11180∼111DF   (シャーラダー文字)

TAKRI

 11680∼116CF   (タークリー文字)

CUNEIFORM

 12000∼123FF

(くさび形文字)

CUNEIFORM NUMBERS AND PUNCTUATION 


67

X 0221

:2014 (ISO/IEC 10646:2012)

12400∼1247F

(くさび形文字の数字及び句読点)

EGYPTIAN HIEROGLYPHS

 13000∼1342F   (エジプト聖刻文字)

BAMUM SUPPLEMENT

 16800∼16A3F   (バムン文字補助)

MIAO

 16F00∼16F9F   (ミャオ文字)

KANA SUPPLEMENT

 1B000∼1B0FF   (仮名補助)

BYZANTINE MUSICAL SYMBOLS

 1D000∼1D0FF  (ビザンチン音楽記号)

MUSICAL SYMBOLS

 1D100∼1D1FF  (音楽記号)

ANCIENT GREEK MUSICAL NOTATION 

1D200∼1D24F  (古代ギリシア音符記号)

TAI XUAN JING SYMBOLS

 1D300∼1D35F  (太玄経記号)

COUNTING ROD NUMERALS

 1D360∼1D37F  (算木用数字)

MATHEMATICAL ALPHANUMERIC SYMBOLS 

1D400∼1D7FF  (数学用英数字記号)

ARABIC MATHEMATICAL ALPHABETICAL SYMBOLS 

1EE00∼1EEFF  (アラビア数学記号)

MAHJONG TILES

 1F000∼1F02F

(マージャン記号)

DOMINO TILES

 1F030∼1F09F

(ドミノ記号)

PLAYING CARDS

 1F0A0∼1F0FF

(トランプ記号)

ENCLOSED ALPHANUMERIC SUPPLEMENT 

1F100∼1F1FF

(囲み英数字補助)

ENCLOSED IDEOGRAPHIC SUPPLEMENT 

1F200∼1F2FF   (囲み漢字補助)

MISCELLANEOUS SYMBOLS AND PICTOGRAPHS 

1F300∼1F5FF   (その他の記号及び絵記号)

EMOTICONS

 1F600∼1F64F

(顔文字)

TRANSPORT AND MAP SYMBOLS

 1F680∼1F6FF

(交通及び地図記号)

ALCHEMICAL SYMBOLS

 1F700∼1F77F

(錬金術記号)

A.2.3 SIP

のブロック 

次のブロックは,SIP で規定される。次は,符号位置の順に並べている。

ブロックの名前

から  まで

[日本語による通用名称(参考)

CJK UNIFIED IDEOGRAPHS EXTENSION B 

20000∼2A6DF  (CJK 統合漢字拡張 B)

CJK UNIFIED IDEOGRAPHS EXTENSION C 

2A700∼2B73F

(CJK 統合漢字拡張 C)

CJK UNIFIED IDEOGRAPHS EXTENSION D 

2B740∼2B81F

(CJK 統合漢字拡張 D)

CJK COMPATIBILITY IDEOGRAPHS SUPPLEMENT 

2F800∼2FA1F

(CJK 互換漢字補助)

A.2.4 SSP

のブロック 

次のブロックは,SSP で規定される。次は,符号位置の順に並べている。

ブロックの名前

から  まで

[日本語による通用名称(参考)

TAGS

 E0000∼E007F

(タグ)

VARIATION SELECTORS SUPPLEMENT 

E0100∼E01EF

(字形選択子補助)

A.3 BMP

全体の確定組(ユニコードの組を除く。) 

次に示す確定組(4.26 参照)は,この規格の以前の版が発行された時点での UCS の割当て済み文字全て

を含む。ユニコードの組は,A.1 に示す。

A.3.1 301 

BMP-AMD.7 

組番号 301 の確定組 BMP-AMD.7 は,次のとおり規定する。これは,ISO/IEC 10646-1 の最初の版に,国

際規格の

追補 までの変更だけを適用した結果の BMP に含まれていた符号化文字だけからなる。したが

って,この組のレパートリは,それ以降の変更によって新しい文字が BMP に加えられても,変更の対象


68

X 0221

:2014 (ISO/IEC 10646:2012)

   

にならない。

組 301 BMP-AMD.7 は,

次のそれぞれの区又は隣接した区の列で示す符号位置の範囲によって規定する。

面 00

区の中の値

00 20∼7E,A0∼FF 
01 00∼F5,FA∼FF 
02 00∼17,50∼A8,B0∼DE,E0∼E9 
03 00∼45,60∼61,74∼75,7A,7E,84∼8A,8C,8E∼A1,A3∼CE,D0∼D6,DA,DC,DE,

E0,E2∼F3

04 01∼0C,0E∼4F,51∼5C,5E∼86,90∼C4,C7∼C8,CB∼CC,D0∼EB,EE∼F5,F8∼F9 
05 31∼56,59∼5F,61∼87,89,91∼A1,A3∼B9,BB∼C4,D0∼EA,F0∼F4 
06 0C,1B,1F,21∼3A,40∼52,60∼6D,70∼B7,BA∼BE,C0∼CE,D0∼ED,F0∼F9 
09 01∼03,05∼39,3C∼4D,50∼54,58∼70,81∼83,85∼8C,8F∼90,93∼A8,AA,B0,B2,

B6∼B9,BC,BE∼C4,C7∼C8,CB∼CD,D7,DC∼DD,DF∼E3,E6∼FA

0A 02,05∼0A,0F∼10,13∼28,2A∼30,32∼33,35∼36,38∼39,3C,3E∼42,47∼48,4B∼

4D,59∼5C,5E,66∼74,81∼83,85∼8B,8D,8F∼91,93∼A8,AA∼B0,B2∼B3,B5∼
B9,BC∼C5,C7∼C9,CB∼CD,D0,E0,E6∼EF

0B 01∼03,05∼0C,0F∼10,13∼28,2A∼30,32∼33,36∼39,3C∼43,47∼48,4B∼4D,56∼

57,5C∼5D,5F∼61,66∼70,82∼83,85∼8A,8E∼90,92∼95,99∼9A,9C,9E∼9F,A3
∼A4,A8∼AA,AE∼B5,B7∼B9,BE∼C2,C6∼C8,CA∼CD,D7,E7∼F2

0C 01∼03,05∼0C,0E∼10,12∼28,2A∼33,35∼39,3E∼44,46∼48,4A∼4D,55∼56,60

∼61,66∼6F,82∼83,85∼8C,8E∼90,92∼A8,AA∼B3,B5∼B9,BE∼C4,C6∼C8,CA
∼CD,D5∼D6,DE,E0∼E1,E6∼EF

0D 02∼03,05∼0C,0E∼10,12∼28,2A∼39,3E∼43,46∼48,4A∼4D,57,60∼61,66∼6F 
0E 01∼3A,3F∼5B,81∼82,84,87∼88,8A,8D,94∼97,99∼9F,A1∼A3,A5,A7,AA∼

AB,AD∼B9,BB∼BD,C0∼C4,C6,C8∼CD,D0∼D9,DC∼DD

0F 00∼47,49∼69,71∼8B,90∼95,97,99∼AD,B1∼B7,B9 
10 A0∼C5,D0∼F6,FB 
11 00∼59,5F∼A2,A8∼F9 
1E 00∼9B,A0∼F9 
1F 00∼15,18∼1D,20∼45,48∼4D,50∼57,59,5B,5D,5F∼7D,80∼B4,B6∼C4,C6∼D3,

D6∼DB,DD∼EF,F2∼F4,F6∼FE

20 00∼2E,30∼46,6A∼70,74∼8E,A0∼AB,D0∼E1 
21 00∼38,53∼82,90∼EA 
22 00∼F1 
23 00,02∼7A 
24 00∼24,40∼4A,60∼EA 
25 00∼95,A0∼EF 
26 00∼13,1A∼6F 
27 01∼04,06∼09,0C∼27,29∼4B,4D,4F∼52,56,58∼5E,61∼67,76∼94,98∼AF,B1

∼BE

30 00∼37,3F,41∼94,99∼9E,A1∼FE 
31 05∼2C,31∼8E,90∼9F 
32 00∼1C,20∼43,60∼7B,7F∼B0,C0∼CB,D0∼FE 
33 00∼76,7B∼DD,E0∼FE 
4E∼9F 4E00∼9FA5 
AC∼D7 AC00∼D7A3 
E0∼F8 E000∼F8FF 
F9∼FA F900∼FA2D 
FB 00∼06,13∼17,1E∼36,38∼3C,3E,40∼41,43∼44,46∼B1,D3∼FF 
FC 00∼FF 
FD 00∼3F,50∼8F,92∼C7,F0∼FB 
FE 20∼23,30∼44,49∼52,54∼66,68∼6B,70∼72,74,76∼FC,FF 
FF 01∼5E,61∼BE,C2∼C7,CA∼CF,D2∼D7,DA∼DC,E0∼E6,E8∼EE,FD


69

X 0221

:2014 (ISO/IEC 10646:2012)

A.3.2 

299 BMP FIRST EDITION 

組番号 299 の確定組 BMP FIRST EDITION は,ISO/IEC 10646-1 の最初の版の BMP に含まれていた符

号化文字の全てを識別するために保留されている。この組は,今では,この規格に適合するものではない。

注記  組 299 BMP FIRST EDITION の定義は,次に示す二つの変更を除いて,組 301 BMP-AMD.7 

規定と同じであった。

次のとおり,対応する区の内容を置き換える。

区の中の値

05 31∼56,59∼5F,61∼87,89,B0∼B9,BB∼C3,D0∼EA,F0∼F4 
0F

(該当する位置なし)

1E 00∼9A,A0∼F9 
20 00∼2E,30∼46,6A∼70,74∼8E,A0∼AA,D0∼E1 
AC∼D7

(該当する位置なし)

ISO/IEC 10646-1

の最初の版以降にこの規格から削除した符号化文字が含まれていた三つの

組(57∼59)に対応する符号の範囲に関連して次の区の範囲を含める。

区の中の値

34∼4D 3400∼4DFF

A.3.3 

302 BMP SECOND EDITION 

組番号 302 の確定組 BMP SECOND EDITION は,ISO/IEC 10646-1 の第 2 版の BMP に含まれる符号化

文字だけからなる。この組のレパートリは,それ以降の変更によって新しい文字が BMP に追加されても,

変更の対象にならない。

組 302 BMP SECOND EDITION は,次の,それぞれの区又は隣接した区の列によって示す符号位置の範

囲によって規定する。

面 00

区の中の値

00 20∼7E,A0∼FF 
01 00∼FF 
02 00∼1F,22∼33,50∼AD,B0∼EE 
03 00∼4E,60∼62,74∼75,7A,7E,84∼8A,8C,8E∼A1,A3∼CE,D0∼D7,DA∼F3 
04 00∼86,88∼89,8C∼C4,C7∼C8,CB∼CC,D0∼F5,F8∼F9 
05 31∼56,59∼5F,61∼87,89∼8A,91∼A1,A3∼B9,BB∼C4,D0∼EA,F0∼F4 
06 0C,1B,1F,21∼3A,40∼55,60∼6D,70∼ED,F0∼FE 
07 00∼0D,0F∼2C,30∼4A,80∼B0 
09 01∼03,05∼39,3C∼4D,50∼54,58∼70,81∼83,85∼8C,8F∼90,93∼A8,AA∼B0,B2,

B6∼B9,BC,BE∼C4,C7∼C8,CB∼CD,D7,DC∼DD,DF∼E3,E6∼FA

0A 02,05∼0A,0F∼10,13∼28,2A∼30,32∼33,35∼36,38∼39,3C,3E∼42,47∼48,4B∼

4D,59∼5C,5E,66∼74,81∼83,85∼8B,8D,8F∼91,93∼A8,AA∼B0,B2∼B3,B5∼
B9,BC∼C5,C7∼C9,CB∼CD,D0,E0,E6∼EF

0B 01∼03,05∼0C,0F∼10,13∼28,2A∼30,32∼33,36∼39,3C∼43,47∼48,4B∼4D,56∼

57,5C∼5D,5F∼61,66∼70,82∼83,85∼8A,8E∼90,92∼25,99∼9A,9C,9E∼9F,A3
∼A4,A8∼AA,AE∼B5,B7∼B9,BE∼C2,C6∼C8,CA∼CD,D7,E7∼F2

0C 01∼03,05∼0C,0E∼10,12∼28,2A∼33,35∼39,3E∼44,46∼48,4A∼4D,55∼56,60

∼61,66∼6F,82∼83,85∼8C,8E∼90,92∼A8,AA∼B3,B5∼B9,BE∼C4,C6∼C8,CA
∼CD,D5∼D6,DE,E0∼E1,E6∼EF

0D 02∼03,05∼0C,0E∼10,12∼28,2A∼39,3E∼43,46∼48,4A∼4D,57,60∼61,66∼6F,

82∼83,85∼96,9A∼B1,B3∼BB,BD,C0∼C6,CA,CF∼D4,D6,D8∼DF,F2∼F4

0E 01∼3A,3F∼5B,81∼82,84,87∼88,8A,8D,94∼97,99∼9F,A1∼A3,A5,A7,AA∼

AB,AD∼B9,BB∼BD,C0∼C4,C6,C8∼CD,D0∼D9,DC∼DD

0F 00∼47,49∼6A,71∼8B,90∼97,99∼BC,BE∼CC,CF 
10 00∼21,23∼27,29∼2A,2C∼32,36∼39,40∼59,A0∼C5,D0∼F6,FB 
11 00∼59,5F∼A2,A8∼F9 
12 20∼26,28∼46,48,4A∼4D,50∼56,58,5A∼5D,60∼86,88,8A∼8D,90∼AE,B0,B2


70

X 0221

:2014 (ISO/IEC 10646:2012)

   

∼B5,B8∼BE,C0,C2∼C5,C8∼CE,D0∼D6,D8∼EE,F0∼FF

13 00∼0E,10,12∼15,18∼1E,20∼46,48∼5A,61∼7C,A0∼F4 
14∼15 1401∼15FF 
16 00∼76,80∼9C,A0∼F0 
17 80∼DC,E0∼E9 
18 00∼0E,10∼19,20∼77,80∼A9 
1E 00∼9B,A0∼F9 
1F 00∼15,18∼1D,20∼45,48∼4D,50∼57,59,5B,5D,5F∼7D,80∼B4,B6∼C4,C6∼D3,

D6∼DB,DD∼EF,F2∼F4,F6∼FE

20 00∼46,48∼4D,6A∼70,74∼8E,A0∼AF,D0∼E3 
21 00∼3A,53∼83,90∼F3 
22 00∼F1 
23 00∼7B,7D∼9A 
24 00∼26,40∼4A,60∼EA 
25 00∼95,A0∼F7 
26 00∼13,19∼71 
27 01∼04,06∼09,0C∼27,29∼4B,4D,4F∼52,56,58∼5E,61∼67,76∼94,98∼AF,B1

∼BE

28 00∼FF 
2E 80∼99,9B∼F3 
2F 00∼D5,F0∼FB 
30 00∼3A,3E∼3F,41∼94,99∼9E,A1∼FE 
31 05∼2C,31∼8E,90∼B7 
32 00∼1C,20∼43,60∼7B,7F∼B0,C0∼CB,D0∼FE 
33 00∼76,7B∼DD,E0∼FE 
34∼4D 3400∼4DB5 
4E∼9F 4E00∼9FA5 
A0∼A3 A000∼A3FF 
A4 00∼8C,90∼A1,A4∼B3,B5∼C0,C2∼C4,C6 
AC∼D7 AC00∼D7A3 
E0∼F8 E000∼F8FF 
F9∼FA F900∼FA2D 
FB 00∼06,13∼17,1D∼36,38∼3C,3E,40∼41,43∼44,46∼B1,D3∼FF 
FC 00∼FF 
FD 00∼3F,50∼8F,92∼C7,F0∼FB 
FE 20∼23,30∼44,49∼52,54∼66,68∼6B,70∼72,74,76∼FC,FF 
FF 01∼5E,61∼BE,C2∼C7,CA∼CF,D2∼D7,DA∼DC,E0∼E6,E8∼EE,F9∼FD

A.3.4 

340 COMBINED FIRST EDITION 

組番号 340 の確定組 COMBINED FIRST EDITION は,次のとおり規定する。組 340 は,この規格の対

応国際規格の最初の版である ISO/IEC 10646:2003 に含まれていた符号化文字だけを含み,A.1 及び A.3 

示す幾つかの組と幾つかの符号位置の範囲とからなる。この組を,面ごとに次に示す。

面 00

組番号

名前

302

BMP SECOND EDITION

98

SUPPLEMENTAL ARROWS-A

99

SUPPLEMENTAL ARROWS-B

100

MISCELLANEOUS MATHEMATICAL SYMBOLS-B

101

SUPPLEMENTAL MATHEMATICAL OPERATORS

102

KATAKANA PHONETIC EXTENSIONS

103

VARIATION SELECTORS

108

KHMER SYMBOLS

111

YIJING HEXAGRAM SYMBOLS

区の中の値

02 20∼21,34∼36,AE∼AF,EF∼FF 
03 4F∼57,5D∼5F,63∼6F,D8∼D9,F4∼FB 
04 8A∼8B,C5∼C6,C9∼CA,CD∼CE


71

X 0221

:2014 (ISO/IEC 10646:2012)

05 00∼0F 
06 00∼03,0D∼15,56∼58,6E∼6F,EE∼EF,FF 
07 2D∼2F,4D∼4F,B1 
09 04,BD 
0A 01,03,8C,E1∼E3,F1 
0B 35,71,F3∼FA 
0C BC∼BD 
10 F7∼F8 
17 00∼0C,0E∼14,20∼36,40∼53,60∼6C,6E∼70,72∼73,DD,F0∼F9 
19 00∼1C,20∼2B,30∼3B,40,44∼4F,50∼6D,70∼74 
1D 00∼6B 
20 47,4E∼54,57,5F∼63,71,B0∼B1,E4∼EA 
21 3B,3D∼4B,F4∼FF 
22 F2∼FF 
23 7C,9B∼D0 
24 EB∼FF 
25 96∼9F,F8∼FF 
26 14∼17,72∼7D,80∼91,A0∼A1 
27 68∼75,D0∼EB 
2B 00∼0D 
30 3B∼3D,95∼96,9F∼A0,FF 
32 1D∼1E,50∼5F,7C∼7D,B1∼BF,CC∼CF 
33 77∼7A,DE∼DF,FF 
A4 A2∼A3,B4,C1,C5 
FA 30∼6A 
FD FC∼FD 
FE 45∼48,73 
FF 5F∼60

面 01

組番号

名前

1003

DESERET

1011

SHAVIAN

区の中の値

00 00∼0B,0D∼26,28∼3A,3C∼3D,3F∼4D,50∼5D,80∼FA 
01 00∼02,07∼33,37∼3F 
03 80∼9D,9F 
04 80∼9D,A0∼A9 
08 00∼05,08,0A∼35,37∼38,3C,3F 
D0 00∼F5 
D1 00∼26,2A∼DD 
D3 00∼56 
D4 00∼54,56∼9C,9E∼9F,A2,A5∼A6,A9∼AC,AE∼B9,BB,BD∼C3,C5∼FF 
D5 00∼05,07∼0A,0D∼14,16∼1C,1E∼39,3B∼3E,40∼44,46,4A∼50,52∼FF 
D6 00∼A3,A8∼FF 
D7 00∼C9,CE∼FF

面 02

区の中の値

00∼A6 0000∼A6D6 
F8∼FA F800∼FA1D

面 0E

組番号

名前

3003

VARIATION SELECTORS SUPPLEMENT

区の中の値

00 01,20∼7F

面 0F

区の中の値


72

X 0221

:2014 (ISO/IEC 10646:2012)

   

00∼FF 0000∼FFFD

面 10

区の中の値

00∼FF 0000∼FFFD

A.4 CJK

の組 

A.4.1 370 

IICORE 

組番号 370 の確定組 IICORE は,組 CJK UNIFIED IDEOGRAPHS-2001 の,国際的な中核となる部分

集合である。

注記 1  文字数(9 810 字)が多く符号位置の範囲が不連続なので,この組は,符号位置の一覧を文章

中に列挙するのではなく添付ファイルによって規定する。

添付ファイルは,テキストファイルであり,ISO/IEC 646 の IRV の文字及び行末を表す LINE FEED 

使用する。ファイルの先頭の 11 行は,ヘッダであり,その後に IICORE の文字と同数の行が続く。各行

は,次の固定長の項目からなる。

−  項目 1 は,BMP 又は SIP の符号位置を,

(0hhhh)又は(2hhhh)の形式で示す。項目 1 は,規定とす

る。

−  項目 2 は,

原典 G の漢字の用途の識別子である

(G0a)

(G1a)

(G3a)

(G5a)

(G7a)

(G8a)

(G9a)

又は(GEa)のいずれかを示す。項目 2 は,参考とする。

−  項目 3 は,原典 T の漢字の用途の識別子である(T1a)

(T2a)

(T3a)

(T4a)

(T5a)又は(TFa)の

いずれかを示す。項目 3 は,参考とする。

−  項目 4 は,原典 J の漢字の用途の識別子である(J1A)を示す。項目 4 は,参考とする。

−  項目 5 は,原典 H の漢字の用途の識別子である(H1a)を示す。項目 5 は,参考とする。

−  項目 6 は,原典 K の漢字の用途の識別子である(K0a)

(K1a)

(K2a)又は(K3a)のいずれかを示

す。項目 6 は,参考とする。

−  項目 7 は,原典 M[マカオ(澳門)特別行政区に対応する。

]の漢字の用途の識別子である(M1a)を

示す。項目 7 は,参考とする。

−  項目 8 は,原典 KP の漢字の用途の識別子である(P0a)を示す。項目 8 は,参考とする。

−  項目 9 は,一般性の分類を A,B 又は C によって示す(C が最も一般性が低い。

。項目 9 は,参考と

する。

ここに,

“h”は,16 進数の 1 桁を表し,

“a”は,

“A”∼“G”の 1 文字を表す。括弧に囲まれた英大文

字及び数字は,ここに示したとおりに現れる。

注記 2  ここで,用途とは,それぞれの原典(G,T,J,H,K,M 又は KP)の文脈において IICORE

の個々の文字の利用及び優先の度合いを示す。用途の識別を,箇条 23 が規定する全ての CJK

統合漢字に対する識別を確立するための CJK 統合漢字の原典参照と混同しないように注意す

る。

参照ファイルは,添付ファイル“IICORE.txt”とする。

注記 3  (対応国際規格の注記 は,この規格では該当しないため不採用とした。)

A.4.2 

371 JIS2004 IDEOGRAPHICS EXTENSION 

組番号 371 の確定組 JIS2004 IDEOGRAPHICS EXTENSION(JIS2004 拡張漢字集合)は,JIS X 0213:2004

の第 3 水準及び第 4 水準漢字からなる。


73

X 0221

:2014 (ISO/IEC 10646:2012)

注記 1  文字数(3 695 字)が多く符号位置の範囲が不連続なので,この組は,符号位置の一覧を文章

中に列挙するのではなく添付ファイルによって規定する。

添付ファイルは,テキストファイルであり,ISO/IEC 646 の IRV の文字及び行末を表す LINE FEED 

使用する。ファイルの先頭の 3 行は,ヘッダであり,その後にこの組の文字と同数の行が続く。各行は,

次の固定長の項目からなる。

− BMP 又は SIP の符号位置を,

(0hhhh)又は(2hhhh)の形式で示す。この項目は,規定とする。

ここに,

“h”は,16 進数の 1 桁を表す。括弧に囲まれた数字は,ここに示したとおりに現れる。

参照ファイルは,添付ファイル“JIEx.txt”とする。

注記 2  (対応国際規格の注記 は,この規格では該当しないため不採用とした。)

A.4.3 

372 JAPANESE IDEOGRAPHICS SUPPLEMENT 

組番号 372 の確定組 JAPANESE IDEOGRAPHICS SUPPLEMENT(補助漢字集合)は,JIS X 0212:1990

の全ての漢字からなる。組 372 は,5 801 文字を含む。

注記  組 371 と組 372 とは,2 742 文字を共有している。

この組の符号位置は,CJK 統合漢字の原典参照ファイル(CJKU_SR.txt)において J1 で識別される原典

J の漢字全てとする(23.1 参照)。

A.5 

その他の組 

A.5.1

A.5.8 では,利用者コミュニティの参照の用を満たすための組を規定する。文字は,異なる書記

系から選ばれていたり,異なる面に符号化されていたりする。リトアニア,日本,及び欧州全体の利用者

コミュニティの組を含む。

注記  略語 MES は,多言語欧州部分集合(Multilingual European Subset)を意味する。

A.5.1 281 

MES-1 

組番号 281 の確定組 MES-1 は,それぞれの区に対する符号位置の範囲によって次のとおり規定する。

区の中の値

00 20∼7E,A0∼FF 
01 00∼13,16∼2B,2E∼4D,50∼7E 
02 C7,D8∼DB,DD 
20 15,18∼19,1C∼1D,AC 
21 22,26,5B∼5E,90∼93 
26 6A

A.5.2 282 

MES-2 

組番号 282 の確定組 MES-2 は,それぞれの区に対する符号位置の範囲によって次のとおり規定する。

区の中の値

00 20∼7E,A0∼FF 
01 00∼7F,8F,92,B7,DE∼EF,FA∼FF 
02 18∼1B,1E∼1F,59,7C,92,BB∼BD,C6∼C7,C9,D8∼DD,EE 
03 74∼75,7A,7E,84∼8A,8C,8E∼A1,A3∼CE,D7,DA∼E1 
04 00∼5F,90∼C4,C7∼C8,CB∼CC,D0∼EB,EE∼F5,F8∼F9 
1E 02∼03,0A∼0B,1E∼1F,40∼41,56∼57,60∼61,6A∼6B,80∼85,9B,F2∼F3 
1F 00∼15,18∼1D,20∼45,48∼4D,50∼57,59,5B,5D,5F∼7D,80∼B4,B6∼C4,C6∼D3,

D6∼DB,DD∼EF,F2∼F4,F6∼FE

20 13∼15,17∼1E,20∼22,26,30,32∼33,39∼3A,3C,3E,44,4A,7F,82,A3∼A4,A7,

AC,AF

21 05,16,22,26,5B∼5E,90∼95,A8 
22 00,02∼03,06,08∼09,0F,11∼12,19∼1A,1E∼1F,27∼2B,48,59,60∼61,64∼65,

82∼83,95,97


74

X 0221

:2014 (ISO/IEC 10646:2012)

   

23 02,10,20∼21,29∼2A 
25 00,02,0C,10,14,18,1C,24,2C,34,3C,50∼6C,80,84,88,8C,90∼93,A0,AC,

B2,BA,BC,C4,CA∼CB,D8,D9

26 3A∼3C,40,42,60,63,65∼66,6A∼6B 
FB 01∼02 
FF FD

A.5.3 

283 MODERN EUROPEAN SCRIPTS 

組番号 283 の組 MODERN EUROPEAN SCRIPTS(現代ヨーロッパの用字)は,次に示す組の全体とする。

組番号

名前

1

BASIC LATIN

2

LATIN-1 SUPPLEMENT

3

LATIN EXTENDED-A

4

LATIN EXTENDED-B

5

IPA EXTENSIONS

6

SPACING MODIFIER LETTERS

7

COMBINING DIACRITICAL MARKS

8

BASIC GREEK

9

GREEK SYMBOLS AND COPTIC

10

CYRILLIC

11

ARMENIAN

27

BASIC GEORGIAN

30

LATIN EXTENDED ADDITIONAL

31

GREEK EXTENDED

32

GENERAL PUNCTUATION

33

SUPERSCRIPTS AND SUBSCRIPTS

34

CURRENCY SYMBOLS

35

COMBINING DIACRITICAL MARKS FOR SYMBOLS

36

LETTERLIKE SYMBOLS

37

NUMBER FORMS

38

ARROWS

39

MATHEMATICAL OPERATORS

40

MISCELLANEOUS TECHNICAL

42

OPTICAL CHARACTER RECOGNITION

44

BOX DRAWING

45

BLOCK ELEMENTS

46

GEOMETRIC SHAPES

47

MISCELLANEOUS SYMBOLS

65

COMBINING HALF MARKS

70

SPECIALS

92

CYRILLIC SUPPLEMENT

104

LTR ALPHABETIC PRESENTATION FORMS

A.5.4 

284 CONTEMPORARY LITHUANIAN LETTERS 

組番号 284 の確定組である拡張組 CONTEMPORARY LITHUANIAN LETTERS(現代リトアニア文字)を,

次のように定める。

面 00

区の中の値

00 41∼50,52∼56,59∼5A,61∼70,72∼76,79∼7A,C0∼C1,C3,C8∼C9,CC∼CD,D1∼

D3,D5,D9∼DA,DD,E0∼E1,E3,E8∼E9,F1∼F3,F5,F9∼FA,FD

01 04∼05,0C∼0D,16∼19,28,2E∼2F,60∼61,68∼6B,72∼73,7D∼7E 
1E BC∼BD,F8∼F9

UCS 列識別子

 <0104,

0301>,<0105, 0301>,<0104, 0303>,<0105, 0303>,<0118, 0301>,<0119, 0301>,<0118, 0303>,

<0119, 0303>,<0116, 0301>,<0117, 0301>,<0116, 0303>,<0117, 0303>,<0069, 0307, 0300>,<0069, 
0307, 0301>,<0069, 0307, 0303>,<012E, 0301>,<012F, 0307, 0301>,<012E, 0303>,<012F, 0307, 
0303>,<004A, 0303>,<006A, 0307, 0303>,<004C, 0303>,<006C, 0303>,<004D, 0303>,<006D,


75

X 0221

:2014 (ISO/IEC 10646:2012)

0303>,<0052, 0303>,<0072, 0303>,<0172, 0301>,<0173, 0301>,<0172, 0303>,<0173, 0303>,
<016A, 0301>,<016B, 0301>,<016A, 0303>,<016B, 0303>

A.5.5 285 

BASIC 

JAPANESE 

組番号 285 の確定組 BASIC JAPANESE(基本日本文字集合)は,日本の文字の基本的な部分集合であ

る。これに含まれる 6 884 文字は,次のとおりである。

− CJK 統合漢字の原典参照ファイル(CJKU_SR.txt)において,J0 で識別される原典 J の漢字全て(23.1

参照)

−  次に示す符号位置の範囲。

面 00

区の中の値

00 20∼7E,A2,A3,A5,A7∼A8,AC,B0∼B1,B4,B6,D7,F7 
03 91∼A1,A3∼A9,B1∼C1,C3∼C9 
04 01,10∼4F,51 
20 10,14,16,18∼19,1C∼1D,20∼21,25∼26,30,32∼33,3B,3E 
21 03,2B,90∼93,D2,D4 
22 00,02∼03,07∼08,0B,12,1A,1D∼1E,20,27∼2C,34∼35,3D,52,60∼61,66∼67,

6A∼6B,82∼83,86∼87,A5

23 12 
25 00∼03,0C,0F∼10,13∼14,17∼18,1B∼1D,20,23∼25,28,2B∼2C,2F∼30,33∼34,

37∼38,3B∼3C,3F,42,4B,A0∼A1,B2∼B3,BC∼BD,C6∼C7,CB,CE∼CF,EF

26 05∼06,40,42,6A,6D,6F 
30 00∼03,05∼15,1C,41∼93,9B∼9E,A1∼F6,FB∼FE

A.5.6 

286 JAPANESE NON IDEOGRAPHICS EXTENSION 

組番号 286 の確定組 JAPANESE NON IDEOGRAPHICS EXTENSION(拡張非漢字集合)は,日本の文字

の部分集合である。これは,組 285 BASIC JAPANESE 又は組 287 COMMON JAPANESE のいずれかと組み

合わせて,JIS X 0213 の非漢字のレパートリを補完する。組 286 は,631 文字を含み,次に示す符号位置

の範囲からなる。

面 00

区の中の値

00 A0∼A1,A4,A6,A9∼AB,AD∼AF,B2∼B3,B7∼D6,D8∼F6,F8∼FF 
01 00∼09,0C∼0F,11∼13,18∼1D,24∼25,27,2A∼2B,34∼35,39∼3A,3D∼3E,41∼44,

47∼48,4B∼4D,50∼55,58∼65,6A∼71,79∼7E,93,C2,CD∼CE,D0∼D2,D4,D6,
D8,DA,DC,F8∼F9,FD

02 50∼5A,5C,5E∼61,64∼68,6C∼73,75,79∼7B,7D∼7E,81∼84,88∼8E,90∼92,94

∼95,98,9D,A1∼A2,C7∼C8,CC,D0∼D1,D8∼D9,DB,DD∼DE,E5∼E9

03 00∼04,06,08,0B∼0C,0F,18∼1A,1C∼20,24∼25,29∼2A,2C,2F∼30,34,39∼3D,

61,C2

1E 3E∼3F 
1F 70∼73 
20 13,22,3C,3F,42,47∼49,51,AC 
21 0F,13,16,21,27,35,53∼55,60∼6B,70∼7B,94,96∼99,C4,E6∼E9 
22 05,09,13,1F,25∼26,2E,43,45,48,62,76∼77,84∼85,8A∼8B,95∼97,BF,DA

∼DB

23 05∼06,18,BE∼CC,CE 
24 23,60∼73,D0∼E9,EB∼FE 
25 B1,B6∼B7,C0∼C1,C9,D0∼D3,E6 
26 00∼03,0E,16∼17,1E,60∼69,6B∼6C,6E 
27 13,56,76∼7F 
29 34∼35,BF,FA∼FB 
30 16∼19,1D,1F∼20,33∼35,3B∼3D,94∼96,9A,9F∼A0,F7∼FA,FF 
31 F0∼FF 
32 31∼32,39,51∼5F,A4∼A8,B1∼BF,D0∼E3,E5,E9,EC∼ED,FA


76

X 0221

:2014 (ISO/IEC 10646:2012)

   

33 03,0D,14,18,22∼23,26∼27,2B,36,3B,49∼4A,4D,51,57,7B∼7E,8E∼8F,9C

∼9E,A1,C4,CB,CD

FE 45∼46 
FF 5F∼60

A.5.7 

287 COMMON JAPANESE 

組番号 287 の確定組 COMMON JAPANESE(通用日本文字集合)は,日本の文字の基本的な部分集合であ

って,7 493 文字を含む。A.5.5 に規定する一つの確定組と符号位置の範囲とからなる。

面 00

組番号

名前

285

BASIC JAPANESE

面 00

区の中の値

20 15 
21 16,21,60∼69,70∼79 
22 11,1F,25,2E,BF 
24 60∼73 
30 1D,1F 
32 31∼32,39,A4∼A8 
33 03,0D,14,18,22∼23,26∼27,2B,36,3B,49∼4A,4D,51,57,7B∼7E,8E∼8F,9C

∼9E,A1,C4,CD

4E 28,E1,FC 
4F 00,03,39,56,8A,92,94,9A,C9,CD,FF 
50 1E,22,40,42,46,70,94,D8,F4 
51 4A,64,9D,BE,EC 
52 15,9C,A6,AF,C0,DB 
53 00,07,24,72,93,B2,DD 
54 8A,9C,A9,FF 
55 86 
57 59,65,AC,C7∼C8 
58 9E,B2 
59 0B,53,5B,5D,63,A4,BA 
5B 56,C0,D8,EC 
5C 1E,A6,BA,F5 
5D 27,42,53,6D,B8∼B9,D0 
5F 21,34,45,67,B7,DE 
60 5D,85,8A,D5,DE,F2 
61 11,20,30,37,98 
62 13,A6 
63 F5 
64 60,9D,CE 
65 4E 
66 00,09,15,1E,24,2E,31,3B,57,59,65,73,99,A0,B2,BF,FA∼FB 
67 0E,66,BB,C0 
68 01,44,52,C8,CF 
69 68,98,E2 
6A 30,46,6B,73,7E,E2,E4 
6B D6 
6C 3F,5C,6F,86,DA 
6D 04,6F,87,96,AC,CF,F2,F8,FC 
6E 27,39,3C,5C,BF 
6F 88,B5,F5 
70 05,07,28,85,AB,BB 
71 04,0F,46∼47,5C,C1,FE 
72 B1,BE 
73 24,77,BD,C9,D2,D6,E3,F5 
74 07,26,29∼2A,2E,62,89,9F


77

X 0221

:2014 (ISO/IEC 10646:2012)

75 01,2F,6F 
76 82,9B∼9C,9E,A6 
77 46 
78 21,4E,64,7A 
79 30,94,9B 
7A D1,E7,EB 
7B 9E 
7D 48,5C,A0,B7,D6 
7E 52,8A 
7F 47,A1 
83 01,62,7F,C7,F6 
84 48,B4,DC 
85 53,59,6B,B0 
88 07,F5 
89 1C 
8A 12,37,79,A7,BE,DF,F6 
8B 53,7F 
8C F0,F4 
8D 12,76 
8E CF 
90 67,DE 
91 15,27,D7,DA,DE,E4∼E5,ED∼EE 
92 06,0A,10,39∼3A,3C,40,4E,51,59,67,77∼78,88,A7,D0,D3,D5,D7,D9,E0,

E7,F9,FB,FF

93 02,1D∼1E,21,25,48,57,70,A4,C6,DE,F8 
94 31,45,48 
95 92 
96 9D,AF 
97 33,3B,43,4D,4F,51,55 
98 57,65 
99 27,9E 
9A 4E,D9,DC 
9B 72,75,8F,B1,BB 
9C 00 
9D 6B,70 
9E 19,D1 
F9 29,DC 
FA 0E∼2D 
FF 01∼5E,61∼9F,E0∼E5

A.5.8 

288 MULTILINGUAL LATIN SUBSET 

組番号 288 の確定組 MULTILINGUAL LATIN SUBSET(多言語ラテン文字部分集合)は,国際的に利用

するラテン文字の部分集合である。これは,それぞれの区に対する符号位置の範囲によって次のとおり規

定する。

面 00

区の中の値

00 20∼7E,A0∼FF 
01 00∼80,8F,97,9A∼9B,9D∼A1,AF∼B0,B5∼B7,CD∼DC,DE∼F0,F4∼F5,F8∼FF 
02 00∼1B,1E∼20,22∼23,26∼33,3A∼3E,41∼44,46∼49,4C∼4F,59,68,72,75,7C,

89,92,94,B7,B9∼BC,BE∼C1,C7∼C8,CC∼CD,D8∼DB,DD

03 00∼04,06∼11,13,15,1B,23∼29,2D∼2E,31∼32,35,38,44,47∼48,5C∼61 
1D 7D,CD 
1E 00∼19,1C∼2B,2E∼73,76∼99,9B,9E,A0∼F9 
20 0C,11,13∼15,18∼1A,1C∼1E,26,2F,32∼33,39∼3A,4A,A5,AC 
21 22,26,4D,5B∼5E,90∼93,9A∼9B 
22 12,15,60,64∼65,6E∼71 
23 00


78

X 0221

:2014 (ISO/IEC 10646:2012)

   

26 6A 
2C 63,65∼66 
A7 88,8B∼8C

A.6 

ユニコードの組 

A.6.1

A.6.9 に示す組は,ユニコード標準の様々な版に相当する。ユニコードの組は,BMP の文字と追

加面の文字とを含む。

注記  ユニコード標準の第 2.0 版は,組 301 に相当する。ユニコード標準の第 2.1 版では,組 301 に

20AC EURO SIGN 及び FFFC OBJECT REPLACEMENT CHARACTER の符号位置が加わる。ユニ

コード標準の第 3.0 版は,組 302 に相当する。

A.6.1 

303 UNICODE 3.1 

組番号 303 の確定組 UNICODE 3.1 は,A.3 で規定する組と幾つかの符号位置の範囲とからなる。この

組を,面ごとに次に示す。

面 00

組番号

名前

302

BMP SECOND EDITION

区の中の値

03 F4

F5 

面 01

区の中の値

03 00∼1E,20∼23,30∼4A 
04 00∼25,28∼4D 
D0 00∼F5 
D1 00∼26,2A∼DD 
D4 00∼54,56∼9C,9E∼9F,A2,A5∼A6,A9∼AC,AE∼B9,BB,BD∼C0,C2∼C3,C5∼FF 
D5 00∼05,07∼0A,0D∼14,16∼1C,1E∼39,3B∼3E,40∼44,46,4A∼50,52∼FF 
D6 00∼A3,A8∼FF 
D7 00∼C9,CE∼FF

面 02

区の中の値

00∼A6 0000∼A6D6 
F8∼FA F800∼FA1D

面 0E

区の中の値

00 01,20∼7F

面 0F

区の中の値

00∼FF 0000∼FFFD

面 10

区の中の値

00∼FF 0000∼FFFD

A.6.2 

304 UNICODE 3.2 

組番号 304 の確定組 UNICODE 3.2 は,A.1 で規定する組と幾つかの符号位置の範囲とからなる。この

組を,面ごとに次に示す。

面 00∼10

組番号

名前

303

UNICODE 3.1

面 00


79

X 0221

:2014 (ISO/IEC 10646:2012)

組番号

名前

98

SUPPLEMENTAL ARROWS-A

99

SUPPLEMENTAL ARROWS-B

100

MISCELLANEOUS MATHEMATICAL SYMBOLS-B

101

SUPPLEMENTAL MATHEMATICAL OPERATORS

102

KATAKANA PHONETIC EXTENSIONS

103

VARIATION SELECTORS

区の中の値

02 20 
03 4F,63∼6F,D8∼D9,F6 
04 8A∼8B,C5∼C6,C9∼CA,CD∼CE 
05 00∼0F 
06 6E∼6F 
07 B1 
10 F7∼F8 
17 00∼0C,0E∼14,20∼36,40∼53,60∼6C,6E∼70,72∼73 
20 47,4E∼52,57,5F∼63,71,B0∼B1,E4∼EA 
21 3D∼4B,F4∼FF 
22 F2∼FF 
23 7C,9B∼CE 
24 EB∼FE 
25 96∼9F,F8∼FF 
26 16∼17,72∼7D,80∼89 
27 68∼75,D0∼EB 
30 3B∼3D,95∼96,9F∼A0,FF 
32 51∼5F,B1∼BF 
A4 A2∼A3,B4,C1,C5 
FA 30∼6A 
FE 45∼46,73 
FF 5F∼60

A.6.3 

305 UNICODE 4.0 

組番号 305 の確定組 UNICODE 4.0 は,確定組 340 COMBINED FIRST EDITION と同一とする。

A.6.4 

306 UNICODE 4.1 

組番号 306 の確定組 UNICODE 4.1 は,A.1 で規定する確定組と幾つかの符号位置の範囲とからなる。

この組を,面ごとに次に示す。

面 00∼10

組番号

名前

305

UNICODE 4.0

面 00

区の中の値

02 37∼41 
03 58∼5C,FC∼FF 
04 F6∼F7 
05 A2,C5∼C7 
06 0B,1E,59∼5E 
07 50∼6D 
09 7D,CE 
0B B6,E6,0F,D0∼D1 
10 F9∼FA,FC 
12 07,47,87,AF,CF,EF 
13 0F,1F,47,5F∼60,80∼99 
19 80∼A9,B0∼C9,D0∼D9,DE∼DF 
1A 00∼1B,1E∼1F,1D,6C∼C3 
20 55∼56,58∼5E,90∼94,B2∼B5,EB 
21 3C,4C


80

X 0221

:2014 (ISO/IEC 10646:2012)

   

23 D1∼DB 
26 18,7E∼7F,92∼9C,A2∼B1 
27 C0∼C6 
2B 0E∼13 
2C 00∼2E,30∼5E,80∼EA,F9∼FF 
2D 00∼25,30∼65,6F,80∼96,A0∼A6,A8∼AE,B0∼B6,B8∼BE,C0∼C6,C8∼CE,D0∼

D6,D8∼DE

2E 00∼17,1C∼1D 
31 C0∼CF 
32 7E 
9F A6∼BB 
A7 00∼16 
A8 00∼2B 
FA 70∼D9 
FE 10∼19

面 01

区の中の値

01 40∼8A 
03 A0∼C3,C8∼D5 
0A 00∼03,05∼06,0C∼13,15∼17,19∼33,38∼3A,3F∼47,50∼58 
D2 00∼45 
D6 A4∼A5

A.6.5 

307 UNICODE 5.0 

組番号 307 の確定組 UNICODE 5.0 は,A.1 で規定する確定組と幾つかの符号位置の範囲とからなる。

この組を,面ごとに次に示す。

面 00∼10

組番号

名前

306

UNICODE 4.1

面 00

区の中の値

02 42∼4F 
03 7B∼7D 
04 CF,FA∼FF 
05 10∼13,BA 
07 C0∼FA 
0C E2∼E3,F1∼F2 
1B 00∼4B,50∼7C 
1D C4∼CA,FE∼FF 
20 EC∼EF 
21 4D∼4E,84 
23 DC∼E7 
26 B2 
27 C7∼CA 
2B 14∼1A,20∼23 
2C 60∼6C,74∼77 
A7 17∼1A,20∼21 
A8 40∼77

面 01

区の中の値

09 00∼19,1F 
20∼22 00∼FF 
23 00∼6E 
24 00∼62,70∼73 
D3 60∼71 
D7 CA∼CB


81

X 0221

:2014 (ISO/IEC 10646:2012)

A.6.6 

308 UNICODE 5.1 

組番号 308 の確定組 UNICODE 5.1 を,面ごとに次に示す。

面 00

区の中の値

00 20∼7E,A0∼FF 
01∼02 0100∼02FF 
03 00∼77,7A∼7E,84∼8A,8C,8E∼A1,A3∼FF 
04 00∼FF 
05 00∼23,31∼56,59∼5F,61∼87,89∼8A,91∼C7,D0∼EA,F0∼F4 
06 00∼03,06∼1B,1E∼1F,21∼5E,60∼FF 
07 00∼0D,0F∼4A,4D∼B1,C0∼FA 
09 01∼39,3C∼4D,50∼54,58∼72,7B∼7F,81∼83,85∼8C,8F∼90,93∼A8,AA∼B0,B2,

B6∼B9,BC∼C4,C7∼C8,CB∼CE,D7,DC∼DD,DF∼E3,E6∼FA

0A 01∼03,05∼0A,0F∼10,13∼28,2A∼30,32∼33,35∼36,38∼39,3C,3E∼42,47∼48,

4B∼4D,51,59∼5C,5E,66∼75,81∼83,85∼8D,8F∼91,93∼A8,AA∼B0,B2∼B3,B5
∼B9,BC∼C5,C7∼C9,CB∼CD,D0,E0∼E3,E6∼EF,F1

0B 01∼03,05∼0C,0F∼10,13∼28,2A∼30,32∼33,35∼39,3C∼44,47∼48,4B∼4D,56∼

57,5C∼5D,5F∼63,66∼71,82∼83,85∼8A,8E∼90,92∼95,99∼9A,9C,9E∼9F,A3
∼A4,A8∼AA,AE∼B9,BE∼C2,C6∼C8,CA∼CD,D0,D7,E6∼FA

0C 01∼03,05∼0C,0E∼10,12∼28,2A∼33,35∼39,3D∼44,46∼48,4A∼4D,55∼56,58

∼59,60∼63,66∼6F,78∼7F,82∼83,85∼8C,8E∼90,92∼A8,AA∼B3,B5∼B9,BC∼
C4,C6∼C8,CA∼CD,D5∼D6,DE,E0∼E3,E6∼EF,F1∼F2

0D 02∼03,05∼0C,0E∼10,12∼28,2A∼39,3D∼44,46∼48,4A∼4D,57,60∼63,66∼75,

79∼7F,82∼83,85∼96,9A∼B1,B3∼BB,BD,C0∼C6,CA,CF∼D4,D6,D8∼DF,F2
∼F4

0E 01∼3A,3F∼5B,81∼82,84,87∼88,8A,8D,94∼97,99∼9F,A1∼A3,A5,A7,AA∼

A8,AD∼B9,BB∼BD,C0∼C4,C6,C8∼CD,D0∼D9,DC∼DD

0F 00∼47,49∼6C,71∼8B,90∼97,99∼BC,BE∼CC,CE∼D4 
10 00∼99,9E∼C5,D0∼FC 
11 00∼59,5F∼A2,A8∼F9 
12 00∼48,4A∼4D,50∼56,58,5A∼5D,60∼88,8A∼8D,90∼B0,B2∼B5,B8∼BE,C0,

C2∼C5,C8∼D6,D8∼FF

13 00∼10,12∼15,18∼5A,5F∼7C,80∼99,A0∼F4 
14∼15 1401∼15FF 
16 00∼76,80∼9C,A0∼F0 
17 00∼0C,0E∼14,20∼36,40∼53,60∼6C,6E∼70,72∼73,80∼DD,E0∼E9,F0∼F9 
18 00∼0E,10∼19,20∼77,80∼AA 
19 00∼1C,20∼2B,30∼3B,40,44∼6D,70∼74,80∼A9,B0∼C9,D0∼D9,DE∼FF 
1A 00∼1B,1E∼1F 
1B 00∼4B,50∼7C,80∼AA,AE∼B9 
1C 00∼37,3B∼49,4D∼7F 
1D 00∼E6,FE∼FF 
1E 00∼FF 
1F 00∼15,18∼1D,20∼45,48∼4D,50∼57,59,5B,5D,5F∼7D,80∼B4,B6∼C4,C6∼D3,

D6∼DB,DD∼EF,F2∼F4,F6∼FE

20 00∼64,6A∼71,74∼8E,90∼94,A0∼B5,D0∼F0 
21 00∼4F,53∼88,90∼FF 
22 00∼FF 
23 00∼E7 
24 00∼26,40∼4A,60∼FF 
25 00∼FF 
26 00∼9D,A0∼BC,C0∼C3 
27 01∼04,06∼09,0C∼27,29∼4B,4D,4F∼52,56,58∼5E,61∼94,98∼AF,B1∼BE,C0

∼CA,CC,D0∼FF

28∼2A 2800∼2AFF 
2B 00∼4C,50∼54


82

X 0221

:2014 (ISO/IEC 10646:2012)

   

2C 00∼2E,30∼5E,60∼6F,71∼7D,80∼EA,F9∼FF 
2D 00∼25,30∼65,6F,80∼96,A0∼A6,A8∼AE,B0∼B6,B8∼BE,C0∼C6,C8∼CE,D0∼

D6,D8∼DE,E0∼FF

2E 00∼30,80∼99,9B∼F3 
2F 00∼D5,F0∼FB 
30 00∼3F,41∼96,99∼FF 
31 05∼2D,31∼8E,90∼B7,C0∼E3,F0∼FF 
32 00∼1E,20∼43,50∼FE 
33 00∼FF 
34∼4C 3400∼4CFF 
4D 00∼B5,C0∼FF 
4E∼9F 4E00∼9FC3 
A0∼A3 A000∼A3FF 
A4 00∼8C,90∼C6 
A5 00∼FF 
A6 00∼2B,40∼5F,62∼73,7C∼97 
A7 00∼8C,FB∼FF 
A8 00∼2B,40∼77,80∼C4,CE∼D9 
A9 00∼53,5F 
AA 00∼36,40∼4D,50∼59,5C∼5F 
AC∼D7 AC00∼D7A3 
E0∼F8 E000∼F8FF 
F9 00∼FF 
FA 00∼2D,30∼6A,70∼D9 
FB 00∼06,13∼17,1D∼36,38∼3C,3E,40∼41,43∼44,46∼B1,D3∼FF 
FC 00∼FF 
FD 00∼3F,50∼8F,92∼C7,F0∼FD 
FE 00∼19,20∼26,30∼52,54∼66,68∼6B,70∼74,76∼FC,FF 
FF 01∼BE,C2∼C7,CA∼CF,D2∼D7,DA∼DC,E0∼E6,E8∼EE,F9∼FD

面 01

区の中の値

00 00∼0B,0D∼26,28∼3A,3C∼3D,3F∼4D,50∼5D,80∼FA 
01 00∼02,07∼33,37∼8A,90∼9B,D0∼FD 
02 80∼9C,A0∼D0 
03 00∼1E,20∼23,30∼4A,80∼9D,9F∼C3,C8∼D5 
04 00∼9D,A0∼A9 
08 00∼05,08,0A∼35,37∼38,3C,3F 
09 00∼19,1F∼39,3F 
0A 00∼03,05∼06,0C∼13,15∼17,19∼33,38∼3A,3F∼47,50∼58 
20∼22 2000∼22FF 
23 00∼6E 
24 00∼62,70∼73 
D0 00∼F5 
D1 00∼26,29∼DD 
D2 00∼45 
D3 00∼56,60∼71 
D4 00∼54,56∼9C,9E∼9F,A2,A5∼A6,A9∼AC,AE∼B9,BB,BD∼C3,C5∼FF 
D5 00∼05,07∼0A,0D∼14,16∼1C,1E∼39,3B∼3E,40∼44,46,4A∼50,52∼FF 
D6 00∼A5,A8∼FF 
D7 00∼CB,CE∼FF 
F0 00∼2B,30∼93

面 02

区の中の値

00∼A6 0000∼A6D6 
F8∼FA F800∼FA1D

面 0E


83

X 0221

:2014 (ISO/IEC 10646:2012)

区の中の値

00 01,20∼7F 
01 00∼EF

面 0F

区の中の値

00∼FF 0000∼FFFD

面 10

区の中の値

00∼FF 0000∼FFFD

注記  組 308  UNICODE 5.1 は,A.1 に示す別の確定組と幾つかの符号位置の範囲とで示すこともで

きる。

面 00∼10

組番号

名前

308

UNICODE 5.0

面 00

区の中の値

03 70∼73,76∼77,CF 
04 87 
05 14∼23 
06 06∼0A,16∼1A,3B∼3F 
07 6E∼7F 
09 71∼72 
0A 51,75 
0B 44,62∼63,D0 
0C 3D,58∼59,62∼63,78∼7F 
0D 3D,44,62∼63,70∼75,79∼7F 
0F 6B∼6C,CE,D2∼D4 
10 22,28,2B,33∼35,3A∼3F,5A∼8A 
18 AA 
1B 80∼AA,AE∼B9 
1C 00∼37,3B∼49,4D∼7F 
1D CB∼E6 
1E 9C∼9F,FA∼FF 
20 64,F0 
21 4F,85∼88 
26 9D,B3∼BC,C0∼C3 
27 CC,EC∼EF 
2B 1B∼1F,24∼4C,50∼54 
2C 6D∼6F,71∼73,78∼7D 
2D E0∼FF 
2E 18∼1B,1E∼30 
31 2D,D0∼E3 
9F BC∼C3 
A5 00∼FF 
A6 00∼2B,40∼5F,62∼73,7C∼97 
A7 1B∼1F,22∼8C,FB∼FF 
A8 80∼C4,CE∼D9 
A9 00∼53,5F 
AA 00∼36,40∼4D,50∼59,5C∼5F 
FE 24∼26

面 01

区の中の値

01 90∼9B,D0∼FD 
02 80∼9C,A0∼D0 
09 20∼39,3F


84

X 0221

:2014 (ISO/IEC 10646:2012)

   

D1 29 
F0 00∼2B,30∼93

A.6.7 

309 UNICODE 5.2 

組番号 309 の確定組 UNICODE 5.2 を,面ごとに次に示す。

面 00

区の中の値

00 20∼7E,A0∼FF 
01∼02 0100∼02FF 
03 00∼77,7A∼7E,84∼8A,8C,8E∼A1,A3∼FF 
04 00∼FF 
05 00∼25,31∼56,59∼5F,61∼87,89∼8A,91∼C7,D0∼EA,F0∼F4 
06 00∼03,06∼1B,1E∼1F,21∼5E,60∼FF 
07 00∼0D,0F∼4A,4D∼B1,C0∼FA 
08 00∼2D,30∼3E 
09 00∼39,3C∼4E,50∼55,58∼72,79∼7F,81∼83,85∼8C,8F∼90,93∼A8,AA∼B0,B2,

B6∼B9,BC∼C4,C7∼C8,CB∼CE,D7,DC∼DD,DF∼E3,E6∼FB

0A 01∼03,05∼0A,0F∼10,13∼28,2A∼30,32∼33,35∼36,38∼39,3C,3E∼42,47∼48,

4B∼4D,51,59∼5C,5E,66∼75,81∼83,85∼8D,8F∼91,93∼A8,AA∼B0,B2∼B3,B5
∼B9,BC∼C5,C7∼C9,CB∼CD,D0,E0∼E3,E6∼EF,F1

0B 01∼03,05∼0C,0F∼10,13∼28,2A∼30,32∼33,35∼39,3C∼44,47∼48,4B∼4D,56∼

57,5C∼5D,5F∼63,66∼71,82∼83,85∼8A,8E∼90,92∼95,99∼9A,9C,9E∼9F,A3
∼A4,A8∼AA,AE∼B9,BE∼C2,C6∼C8,CA∼CD,D0,D7,E6∼FA

0C 01∼03,05∼0C,0E∼10,12∼28,2A∼33,35∼39,3D∼44,46∼48,4A∼4D,55∼56,58

∼59,60∼63,66∼6F,78∼7F,82∼83,85∼8C,8E∼90,92∼A8,AA∼B3,B5∼B9,BC∼
C4,C6∼C8,CA∼CD,D5∼D6,DE,E0∼E3,E6∼EF,F1∼F2

0D 02∼03,05∼0C,0E∼10,12∼28,2A∼39,3D∼44,46∼48,4A∼4D,57,60∼63,66∼75,

79∼7F,82∼83,85∼96,9A∼B1,B3∼BB,BD,C0∼C6,CA,CF∼D4,D6,D8∼DF,F2
∼F4

0E 01∼3A,3F∼5B,81∼82,84,87∼88,8A,8D,94∼97,99∼9F,A1∼A3,A5,A7,AA∼

A8,AD∼B9,BB∼BD,C0∼C4,C6,C8∼CD,D0∼D9,DC∼DD

0F 00∼47,49∼6C,71∼8B,90∼97,99∼BC,BE∼CC,CE∼D8 
10 00∼C5,D0∼FC 
11 00∼FF 
12 00∼48,4A∼4D,50∼56,58,5A∼5D,60∼88,8A∼8D,90∼B0,B2∼B5,B8∼BE,C0,

C2∼C5,C8∼D6,D8∼FF

13 00∼10,12∼15,18∼5A,5F∼7C,80∼99,A0∼F4 
14∼15 1400∼15FF 
16 00∼9C,A0∼F0 
17 00∼0C,0E∼14,20∼36,40∼53,60∼6C,6E∼70,72∼73,80∼DD,E0∼E9,F0∼F9 
18 00∼0E,10∼19,20∼77,80∼AA,B0∼F5 
19 00∼1C,20∼2B,30∼3B,40,44∼6D,70∼74,80∼AB,B0∼C9,D0∼DA,DE∼FF 
1A 00∼1B,1E∼5E,60∼7C,7F∼89,90∼99,A0∼AD 
1B 00∼4B,50∼7C,80∼AA,AE∼B9 
1C 00∼37,3B∼49,4D∼7F,D0∼F2 
1D 00∼E6,FD∼FF 
1E 00∼FF 
1F 00∼15,18∼1D,20∼45,48∼4D,50∼57,59,5B,5D,5F∼7D,80∼B4,B6∼C4,C6∼D3,

D6∼DB,DD∼EF,F2∼F4,F6∼FE

20 00∼64,6A∼71,74∼8E,90∼94,A0∼B8,D0∼F0 
21 00∼89,90∼FF 
22 00∼FF 
23 00∼E8 
24 00∼26,40∼4A,60∼FF 
25 00∼FF 
26 00∼CD,CF∼E1,E3,E8∼FF 
27 01∼04,06∼09,0C∼27,29∼4B,4D,4F∼52,56∼5E,61∼94,98∼AF,B1∼BE,C0∼CA,


85

X 0221

:2014 (ISO/IEC 10646:2012)

CC,D0∼FF

28∼2A 2800∼2AFF 
2B 00∼4C,50∼59 
2C 00∼2E,30∼5E,60∼7F,80∼F1,F9∼FF 
2D 00∼25,30∼65,6F,80∼96,A0∼A6,A8∼AE,B0∼B6,B8∼BE,C0∼C6,C8∼CE,D0∼

D6,D8∼DE,E0∼FF

2E 00∼31,80∼99,9B∼F3 
2F 00∼D5,F0∼FB 
30 00∼3F,41∼96,99∼FF 
31 05∼2D,31∼8E,90∼B7,C0∼E3,F0∼FF 
32 00∼1E,20∼FE 
33 00∼FF 
34∼4C 3400∼4CFF 
4D 00∼B5,C0∼FF 
4E∼9F 4E00∼9FC6 
A0∼A3 A000∼A3FF 
A4 00∼8C,90∼C6,D0∼FF 
A5 00∼FF 
A6 00∼2B,40∼5F,62∼73,7C∼97,A0∼F7 
A7 00∼8C,FB∼FF 
A8 00∼2B,30∼39,40∼77,80∼C4,CE∼D9,E0∼FB 
A9 00∼53,5F∼7C,80∼CD,CF∼D9,DE∼DF 
AA 00∼36,40∼4D,50∼59,5C∼7B,80∼C2,DB∼DF 
AB C0∼ED,F0∼F9 
AC∼D6 AC00∼D6FF 
D7 00∼A3,B0∼C6,CB∼FB 
E0∼F8 E000∼F8FF 
F9 00∼FF 
FA 00∼2D,30∼6D,70∼D9 
FB 00∼06,13∼17,1D∼36,38∼3C,3E,40∼41,43∼44,46∼B1,D3∼FF 
FC 00∼FF 
FD 00∼3F,50∼8F,92∼C7,F0∼FD 
FE 00∼19,20∼26,30∼52,54∼66,68∼6B,70∼74,76∼FC,FF 
FF 01∼BE,C2∼C7,CA∼CF,D2∼D7,DA∼DC,E0∼E6,E8∼EE,F9∼FD

面 01

区の中の値

00 00∼0B,0D∼26,28∼3A,3C∼3D,3F∼4D,50∼5D,80∼FA 
01 00∼02,07∼33,37∼8A,90∼9B,D0∼FD 
02 80∼9C,A0∼D0 
03 00∼1E,20∼23,30∼4A,80∼9D,9F∼C3,C8∼D5 
04 00∼9D,A0∼A9 
08 00∼05,08,0A∼35,37∼38,3C,3F∼55,57∼5F 
09 00∼1B,1F∼39,3F 
0A 00∼03,05∼06,0C∼13,15∼17,19∼33,38∼3A,3F∼47,50∼58,60∼7F 
0B 00∼35,39∼55,58∼72,78∼7F 
0C 00∼48 
0E 60∼7E 
10 80∼C1 
20∼22 2000∼22FF 
23 00∼6E 
24 00∼62,70∼73 
30∼34 3000∼342E 
D0 00∼F5 
D1 00∼26,29∼DD 
D2 00∼45 
D3 00∼56,60∼71 
D4 00∼54,56∼9C,9E∼9F,A2,A5∼A6,A9∼AC,AE∼B9,BB,BD∼C3,C5∼FF


86

X 0221

:2014 (ISO/IEC 10646:2012)

   

D5 00∼05,07∼0A,0D∼14,16∼1C,1E∼39,3B∼3E,40∼44,46,4A∼50,52∼FF 
D6 00∼A5,A8∼FF 
D7 00∼CB,CE∼FF 
F0 00∼2B,30∼93 
F1 00∼0A,10∼2E,31,3D,3F,42,46,4A∼4E,57,5F,79,7B∼7C,7F,8A∼8D,90 
F2 00,10∼31,40∼48

面 02

区の中の値

00∼A6 0000∼A6D6 
A7∼B7 A700∼B734 
F8∼FA F800∼FA1D

面 0E

区の中の値

00 01,20∼7F 
01 00∼EF

面 0F

区の中の値

00∼FF 0000∼FFFD

面 10

区の中の値

00∼FF 0000∼FFFD

注記  組番号 309 の組 UNICODE 5.2 は,A.1 に示す別の確定組と幾つかの符号位置の範囲とで示す

こともできる。

面 00∼10

組番号

名前

308

UNICODE 5.1

面 00

区の中の値

05 24∼25 
08 00∼2D,30∼3E 
09 00,4E,55,79∼7A,FB 
0F D5∼D8 
10 9A∼9D 
11 5A∼5E,A3∼A7,FA∼FF 
14 00 
16 77∼7F 
18 B0∼F5 
19 AA∼AB,DA 
1A 20∼5E,60∼7C,7F∼89,90∼99,A0∼AD 
1C D0∼F2 
1D FD 
20 B6∼B8 
21 50∼52,89 
23 E8 
26 9E∼9F,BD∼BF,C4∼CD,CF∼E1,E3,E8∼FF 
27 57 
2B 55∼59 
2C 70,7E∼7F,EB∼F1 
2D E0∼FF 
2E 31 
32 44∼4F 
9F C4∼C6 
A4 D0∼FF 
A6 A0∼F7 
A8 30∼39,E0∼FB


87

X 0221

:2014 (ISO/IEC 10646:2012)

A9 60∼7C,80∼CD,CF∼D9,DE∼DF 
AA 60∼7B,80∼C2,DB∼DF 
AB C0∼ED,F0∼F9 
D7 B0∼C6,CB∼FB 
FA 6B∼6D

面 01

区の中の値

08 40∼55,57∼5F 
09 1A∼1B 
0A 60∼7F 
0B 00∼35,39∼55,58∼72,78∼7F 
0C 00∼48 
0E 60∼7E 
10 80∼C1 
30∼34 3000∼342E 
F1 00∼0A,10∼2E,31,3D,3F,42,46,4A∼4E,57,5F,79,7B∼7C,7F,8A∼

8D,90

F2 00,10∼31,40∼48

面 02

区の中の値

A7∼B7 A700∼B734

A.6.8 

310 UNICODE 6.0 

組番号 310 の組 UNICODE 6.0 を,面ごとに次に示す。

面 00

区の中の値

00 20∼7E,A0∼FF 
01∼02 0100∼02FF 
03 00∼77,7A∼7E,84∼8A,8C,8E∼A1,A3∼FF 
04 00∼FF 
05 00∼27,31∼56,59∼5F,61∼87,89∼8A,91∼C7,D0∼EA,F0∼F4 
06 00∼03,06∼1B,1E∼FF 
07 00∼0D,0F∼4A,4D∼B1,C0∼FA 
08 00∼2D,30∼3E,40∼5B,5E 
09 00∼77,79∼7F,81∼83,85∼8C,8F∼90,93∼A8,AA∼B0,B2,B6∼B9,BC∼C4,C7∼

C8,CB∼CE,D7,DC∼DD,DF∼E3,E6∼FB

0A 01∼03,05∼0A,0F∼10,13∼28,2A∼30,32∼33,35∼36,38∼39,3C,3E∼42,47∼48,

4B∼4D,51,59∼5C,5E,66∼75,81∼83,85∼8D,8F∼91,93∼A8,AA∼B0,B2∼B3,B5
∼B9,BC∼C5,C7∼C9,CB∼CD,D0,E0∼E3,E6∼EF,F1

0B 01∼03,05∼0C,0F∼10,13∼28,2A∼30,32∼33,35∼39,3C∼44,47∼48,4B∼4D,56∼

57,5C∼5D,5F∼63,66∼77,82∼83,85∼8A,8E∼90,92∼95,99∼9A,9C,9E∼9F,A3
∼A4,A8∼AA,AE∼B9,BE∼C2,C6∼C8,CA∼CD,D0,D7,E6∼FA

0C 01∼03,05∼0C,0E∼10,12∼28,2A∼33,35∼39,3D∼44,46∼48,4A∼4D,55∼56,58

∼59,60∼63,66∼6F,78∼7F,82∼83,85∼8C,8E∼90,92∼A8,AA∼B3,B5∼B9,BC∼
C4,C6∼C8,CA∼CD,D5∼D6,DE,E0∼E3,E6∼EF,F1∼F2

0D 02∼03,05∼0C,0E∼10,12∼3A,3D∼44,46∼48,4A∼4E,57,60∼63,66∼75,79∼7F,

82∼83,85∼96,9A∼B1,B3∼BB,BD,C0∼C6,CA,CF∼D4,D6,D8∼DF,F2∼F4

0E 01∼3A,3F∼5B,81∼82,84,87∼88,8A,8D,94∼97,99∼9F,A1∼A3,A5,A7,AA∼

A8,AD∼B9,BB∼BD,C0∼C4,C6,C8∼CD,D0∼D9,DC∼DD

0F 00∼47,49∼6C,71∼97,99∼BC,BE∼CC,CE∼DA 
10 00∼C5,D0∼FC 
11 00∼FF 
12 00∼48,4A∼4D,50∼56,58,5A∼5D,60∼88,8A∼8D,90∼B0,B2∼B5,B8∼BE,C0,

C2∼C5,C8∼D6,D8∼FF

13 00∼10,12∼15,18∼5A,5D∼7C,80∼99,A0∼F4 
14∼15 1400∼15FF


88

X 0221

:2014 (ISO/IEC 10646:2012)

   

16 00∼9C,A0∼F0 
17 00∼0C,0E∼14,20∼36,40∼53,60∼6C,6E∼70,72∼73,80∼DD,E0∼E9,F0∼F9 
18 00∼0E,10∼19,20∼77,80∼AA,B0∼F5 
19 00∼1C,20∼2B,30∼3B,40,44∼6D,70∼74,80∼AB,B0∼C9,D0∼DA,DE∼FF 
1A 00∼1B,1E∼5E,60∼7C,7F∼89,90∼99,A0∼AD 
1B 00∼4B,50∼7C,80∼AA,AE∼B9,C0∼F3,FC∼FF 
1C 00∼37,3B∼49,4D∼7F,D0∼F2 
1D 00∼E6,FC∼FF 
1E 00∼FF 
1F 00∼15,18∼1D,20∼45,48∼4D,50∼57,59,5B,5D,5F∼7D,80∼B4,B6∼C4,C6∼D3,

D6∼DB,DD∼EF,F2∼F4,F6∼FE

20 00∼64,6A∼71,74∼8E,90∼9C,A0∼B9,D0∼F0 
21 00∼89,90∼FF 
22 00∼FF 
23 00∼F3 
24 00∼26,40∼4A,60∼FF 
25 00∼FF 
26 00∼FF 
27 01∼CA,CC,CE∼FF 
28∼2A 2800∼2AFF 
2B 00∼4C,50∼59 
2C 00∼2E,30∼5E,60∼7F,80∼F1,F9∼FF 
2D 00∼25,30∼65,6F∼70,7F∼96,A0∼A6,A8∼AE,B0∼B6,B8∼BE,C0∼C6,C8∼CE,

D0∼D6,D8∼DE,E0∼FF

2E 00∼31,80∼99,9B∼F3 
2F 00∼D5,F0∼FB 
30 00∼3F,41∼96,99∼FF 
31 05∼2D,31∼8E,90∼BA,C0∼E3,F0∼FF 
32 00∼1E,20∼FE 
33 00∼FF 
34∼4C 3400∼4CFF 
4D 00∼B5,C0∼FF 
4E∼9F 4E00∼9FCB 
A0∼A3 A000∼A3FF 
A4 00∼8C,90∼C6,D0∼FF 
A5 00∼FF 
A6 00∼2B,40∼73,7C∼97,A0∼F7 
A7 00∼8E,90∼91A0∼A9,FA∼FF 
A8 00∼2B,30∼39,40∼77,80∼C4,CE∼D9,E0∼FB 
A9 00∼53,5F∼7C,80∼CD,CF∼D9,DE∼DF 
AA 00∼36,40∼4D,50∼59,5C∼7B,80∼C2,DB∼DF 
AB 01∼06,09∼0E,11∼16,20∼26,28∼2E,C0∼ED,F0∼F9 
AC∼D6 AC00∼D6FF 
D7 00∼A3,B0∼C6,CB∼FB 
E0∼F8 E000∼F8FF 
F9 00∼FF 
FA 00∼2D,30∼6D,70∼D9 
FB 00∼06,13∼17,1D∼36,38∼3C,3E,40∼41,43∼44,46∼C1,D3∼FF 
FC 00∼FF 
FD 00∼3F,50∼8F,92∼C7,F0∼FD 
FE 00∼19,20∼26,30∼52,54∼66,68∼6B,70∼74,76∼FC,FF 
FF 01∼BE,C2∼C7,CA∼CF,D2∼D7,DA∼DC,E0∼E6,E8∼EE,F9∼FD

面 01

区の中の値

00 00∼0B,0D∼26,28∼3A,3C∼3D,3F∼4D,50∼5D,80∼FA 
01 00∼02,07∼33,37∼8A,90∼9B,D0∼FD 
02 80∼9C,A0∼D0


89

X 0221

:2014 (ISO/IEC 10646:2012)

03 00∼1E,20∼23,30∼4A,80∼9D,9F∼C3,C8∼D5 
04 00∼9D,A0∼A9 
08 00∼05,08,0A∼35,37∼38,3C,3F∼55,57∼5F 
09 00∼1B,1F∼39,3F 
0A 00∼03,05∼06,0C∼13,15∼17,19∼33,38∼3A,3F∼47,50∼58,60∼7F 
0B 00∼35,39∼55,58∼72,78∼7F 
0C 00∼48 
0E 60∼7E 
10 00∼4D,52∼6F,80∼C1 
20∼22 2000∼22FF 
23 00∼6E 
24 00∼62,70∼73 
30∼34 3000∼342E 
68∼6A 6800∼6A38 
B0 00∼01 
D0 00∼F5 
D1 00∼26,29∼DD 
D2 00∼45 
D3 00∼56,60∼71 
D4 00∼54,56∼9C,9E∼9F,A2,A5∼A6,A9∼AC,AE∼B9,BB,BD∼C3,C5∼FF 
D5 00∼05,07∼0A,0D∼14,16∼1C,1E∼39,3B∼3E,40∼44,46,4A∼50,52∼FF 
D6 00∼A5,A8∼FF 
D7 00∼CB,CE∼FF 
F0 00∼2B,30∼93,A0∼AE,B1∼BE,C1∼CF,D1∼DF 
F1 00∼0A,10∼2E,30∼69,70∼8E,90∼9A,E6∼FF 
F2 00∼02,10∼3A,40∼48,50∼51 
F3 00∼20,30∼35,37∼7C,80∼93,A0∼C4,C6∼CA,E0∼F0 
F4 00∼3E,40,42∼F7,F9∼FC 
F5 00∼3D,50∼67,FB∼FF 
F6 01∼10,12∼14,16,18,1A,1C∼1E,20∼25,28∼2B,2D,30∼33,35∼40,45∼4F,80∼

C5

F7 00∼73

面 02

区の中の値

00∼A6 0000∼A6D6 
A7∼B6 A700∼B6FF 
B7 00∼34,40∼FF 
B8 00∼1D 
F8∼FA F800∼FA1D

面 0E

区の中の値

00 01,20∼7F 
01 00∼EF

面 0F

区の中の値

00∼FF 0000∼FFFD

面 10

区の中の値

00∼FF 0000∼FFFD

注記  組 310  UNICODE 6.0 は,A.1 に示す別の確定組と幾つかの符号位置の範囲とで示すこともで

きる。組 UNICODE 6.0 は,この規格のこの版で追加された 20B9 INDIAN RUPEE SIGN を含

む。

面 00∼10

組番号

名前


90

X 0221

:2014 (ISO/IEC 10646:2012)

   

309

UNICODE 5.2

面 00

区の中の値

05 26∼27 
08 40∼5B,5E 
09 3A∼3B,4F,56∼57,73∼77 
0B 72∼77 
0D 29,3A,4E 
0F 8C∼8F,D9∼DA 
13 5D∼5E 
1B C0∼F3,FC∼FF 
1D FC 
20 B9 
23 E9∼F3 
26 CE,E2,E4∼E7 
27 05,0A∼0B,28,4C,4E,53∼55,5F∼60,95∼97,B0,BF,CE,CF 
2D 70,7F 
30 97 
31 B8∼BA 
9F C7∼CB 
A6 60∼61 
A7 8D∼8E,90∼91,A0∼A9,FA 
AB 01∼06,09∼0E,11∼16,20∼26,28∼2E 
FB B2∼C1

面 01

区の中の値

10 00∼4D,52∼6F 
68∼6A 6800∼6A38 
B0 00∼01 
F0 A0∼AE,B1∼BE,C1∼CF,D1∼DF 
F1 30,32∼3C,3E,40∼41,43∼45,47∼49,4F∼56,58∼5E,60∼69,70∼78,7A,

7D∼7E,80∼89,8E∼8F,91∼9A,E6∼FF

F2 01∼02,32∼3A,50∼51 
F3 00∼20,30∼35,37∼7C,80∼93,A0∼C4,C6∼CA,E0∼F0 
F4 00∼3E,40,42∼F7,F9∼FC 
F5 00∼3D,50∼67,FB∼FF 
F6 01∼10,12∼14,16,18,1A,1C∼1E,20∼25,28∼2B,2D,30∼33,35∼40,45

∼4F,80∼C5

F7 00∼73

面 02

区の中の値

B7 40∼FF 
B8 00∼1D

A.6.9 311 

UNICODE 

6.1 

組番号 311 の組 UNICODE 6.1 を,面ごとに次に示す。

面 00

区の中の値

00 20∼7E,A0∼FF 
01∼02 0100∼02FF 
03 00∼77,7A∼7E,84∼8A,8C,8E∼A1,A3∼FF 
04 00∼FF 
05 00∼27,31∼56,59∼5F,61∼87,89∼8A,8F,91∼C7,D0∼EA,F0∼F4 
06 00∼04,06∼1B,1E∼FF 
07 00∼0D,0F∼4A,4D∼B1,C0∼FA


91

X 0221

:2014 (ISO/IEC 10646:2012)

08 00∼2D,30∼3E,40∼5B,5E,A0,A2∼AC,E4∼FE 
09 00∼77,79∼7F,81∼83,85∼8C,8F∼90,93∼A8,AA∼B0,B2,B6∼B9,BC∼C4,C7∼

C8,CB∼CE,D7,DC∼DD,DF∼E3,E6∼FB

0A 01∼03,05∼0A,0F∼10,13∼28,2A∼30,32∼33,35∼36,38∼39,3C,3E∼42,47∼48,

4B∼4D,51,59∼5C,5E,66∼75,81∼83,85∼8D,8F∼91,93∼A8,AA∼B0,B2∼B3,B5
∼B9,BC∼C5,C7∼C9,CB∼CD,D0,E0∼E3,E6∼F1

0B 01∼03,05∼0C,0F∼10,13∼28,2A∼30,32∼33,35∼39,3C∼44,47∼48,4B∼4D,56∼

57,5C∼5D,5F∼63,66∼77,82∼83,85∼8A,8E∼90,92∼95,99∼9A,9C,9E∼9F,A3
∼A4,A8∼AA,AE∼B9,BE∼C2,C6∼C8,CA∼CD,D0,D7,E6∼FA

0C 01∼03,05∼0C,0E∼10,12∼28,2A∼33,35∼39,3D∼44,46∼48,4A∼4D,55∼56,58

∼59,60∼63,66∼6F,78∼7F,82∼83,85∼8C,8E∼90,92∼A8,AA∼B3,B5∼B9,BC∼
C4,C6∼C8,CA∼CD,D5∼D6,DE,E0∼E3,E6∼EF,F1∼F2

0D 02∼03,05∼0C,0E∼10,12∼3A,3D∼44,46∼48,4A∼4E,57,60∼63,66∼75,79∼7F,

82∼83,85∼96,9A∼B1,B3∼BB,BD,C0∼C6,CA,CF∼D4,D6,D8∼DF,F2∼F4

0E 01∼3A,3F∼5B,81∼82,84,87∼88,8A,8D,94∼97,99∼9F,A1∼A3,A5,A7,AA∼

A8,AD∼B9,BB∼BD,C0∼C4,C6,C8∼CD,D0∼D9,DC∼DF

0F 00∼47,49∼6C,71∼97,99∼BC,BE∼CC,CE∼DA 
10 00∼C5,C7,CD,D0∼FF 
11 00∼FF 
12 00∼48,4A∼4D,50∼56,58,5A∼5D,60∼88,8A∼8D,90∼B0,B2∼B5,B8∼BE,C0,

C2∼C5,C8∼D6,D8∼FF

13 00∼10,12∼15,18∼5A,5D∼7C,80∼99,A0∼F4 
14∼15 1400∼15FF 
16 00∼9C,A0∼F0 
17 00∼0C,0E∼14,20∼36,40∼53,60∼6C,6E∼70,72∼73,80∼DD,E0∼E9,F0∼F9 
18 00∼0E,10∼19,20∼77,80∼AA,B0∼F5 
19 00∼1C,20∼2B,30∼3B,40,44∼6D,70∼74,80∼AB,B0∼C9,D0∼DA,DE∼FF 
1A 00∼1B,1E∼5E,60∼7C,7F∼89,90∼99,A0∼AD 
1B 00∼4B,50∼7C,80∼F3,FC∼FF 
1C 00∼37,3B∼49,4D∼7F,C0∼C7,D0∼F6 
1D 00∼E6,FC∼FF 
1E 00∼FF 
1F 00∼15,18∼1D,20∼45,48∼4D,50∼57,59,5B,5D,5F∼7D,80∼B4,B6∼C4,C6∼D3,

D6∼DB,DD∼EF,F2∼F4,F6∼FE

20 00∼64,6A∼71,74∼8E,90∼9C,A0∼B9,D0∼F0 
21 00∼89,90∼FF 
22 00∼FF 
23 00∼F3 
24 00∼26,40∼4A,60∼FF 
25 00∼FF 
26 00∼FF 
27 01∼FF 
28∼2A 2800∼2AFF 
2B 00∼4C,50∼59 
2C 00∼2E,30∼5E,60∼7F,80∼F3,F9∼FF 
2D 00∼25,27,2D,30∼67,6F∼70,7F∼96,A0∼A6,A8∼AE,B0∼B6,B8∼BE,C0∼C6,

C8∼CE,D0∼D6,D8∼DE,E0∼FF

2E 00∼3B,80∼99,9B∼F3 
2F 00∼D5,F0∼FB 
30 00∼3F,41∼96,99∼FF 
31 05∼2D,31∼8E,90∼BA,C0∼E3,F0∼FF 
32 00∼1E,20∼FE 
33 00∼FF 
34∼4C 3400∼4CFF 
4D 00∼B5,C0∼FF 
4E∼9F 4E00∼9FCC 
A0∼A3 A000∼A3FF 
A4 00∼8C,90∼C6,D0∼FF


92

X 0221

:2014 (ISO/IEC 10646:2012)

   

A5 00∼FF 
A6 00∼2B,40∼97,9F∼F7 
A7 00∼8E,90∼93,A0∼AA,F8∼FF 
A8 00∼2B,30∼39,40∼77,80∼C4,CE∼D9,E0∼FB 
A9 00∼53,5F∼7C,80∼CD,CF∼D9,DE∼DF 
AA 00∼36,40∼4D,50∼59,5C∼7B,80∼C2,DB∼F6 
AB 01∼06,09∼0E,11∼16,20∼26,28∼2E,C0∼ED,F0∼F9 
AC∼D6 AC00∼D6FF 
D7 00∼A3,B0∼C6,CB∼FB 
E0∼F8 E000∼F8FF 
F9 00∼FF 
FA 00∼6D,70∼D9 
FB 00∼06,13∼17,1D∼36,38∼3C,3E,40∼41,43∼44,46∼C1,D3∼FF 
FC 00∼FF 
FD 00∼3F,50∼8F,92∼C7,F0∼FD 
FE 00∼19,20∼26,30∼52,54∼66,68∼6B,70∼74,76∼FC,FF 
FF 01∼BE,C2∼C7,CA∼CF,D2∼D7,DA∼DC,E0∼E6,E8∼EE,F9∼FD

面 01

区の中の値

00 00∼0B,0D∼26,28∼3A,3C∼3D,3F∼4D,50∼5D,80∼FA 
01 00∼02,07∼33,37∼8A,90∼9B,D0∼FD 
02 80∼9C,A0∼D0 
03 00∼1E,20∼23,30∼4A,80∼9D,9F∼C3,C8∼D5 
04 00∼9D,A0∼A9 
08 00∼05,08,0A∼35,37∼38,3C,3F∼55,57∼5F 
09 00∼1B,1F∼39,3F,80∼B7,BE∼BF 
0A 00∼03,05∼06,0C∼13,15∼17,19∼33,38∼3A,3F∼47,50∼58,60∼7F 
0B 00∼35,39∼55,58∼72,78∼7F 
0C 00∼48 
0E 60∼7E 
10 00∼4D,52∼6F,80∼C1,D0∼E8,F0∼F9 
11 00∼34,36∼43,80∼C8,D0∼D9 
16 80∼B7,C0∼C9 
20∼22 2000∼22FF 
23 00∼6E 
24 00∼62,70∼73 
30∼34 3000∼342E 
68∼6A 6800∼6A38 
6F 00∼44,50∼7E,8F∼9F 
B0 00∼01 
D0 00∼F5 
D1 00∼26,29∼DD 
D2 00∼45 
D3 00∼56,60∼71 
D4 00∼54,56∼9C,9E∼9F,A2,A5∼A6,A9∼AC,AE∼B9,BB,BD∼C3,C5∼FF 
D5 00∼05,07∼0A,0D∼14,16∼1C,1E∼39,3B∼3E,40∼44,46,4A∼50,52∼FF 
D6 00∼A5,A8∼FF 
D7 00∼CB,CE∼FF 
EE 00∼03,05∼1F,21∼22,24,27,29∼32,34∼37,39,3B,42,47,49,4B,4D∼4F,51∼

52,54,57,59,5B,5D,5F,61∼62,64,67∼6A,6C∼72,74∼77,79∼7C,7E,80∼89,
8B∼9B,A1∼A3,A5∼A9,AB∼BB,F0∼F1

F0 00∼2B,30∼93,A0∼AE,B1∼BE,C1∼CF,D1∼DF 
F1 00∼0A,10∼2E,30∼6B,70∼8E,90∼9A,E6∼FF 
F2 00∼02,10∼3A,40∼48,50∼51 
F3 00∼20,30∼35,37∼7C,80∼93,A0∼C4,C6∼CA,E0∼F0 
F4 00∼3E,40,42∼F7,F9∼FC 
F5 00∼3D,40∼43,50∼67,FB∼FF


93

X 0221

:2014 (ISO/IEC 10646:2012)

F6 00∼40,45∼4F,80∼C5 
F7 00∼73

面 02

区の中の値

00∼A6 0000∼A6D6 
A7∼B6 A700∼B6FF 
B7 00∼34,40∼FF 
B8 00∼1D 
F8∼FA F800∼FA1D

面 0E

区の中の値

00 01,20∼7F 
01 00∼EF

面 0F

区の中の値

00∼FF 0000∼FFFD

面 10

区の中の値

00∼FF 0000∼FFFD

注記  組 311 UNICODE 6.1 は,A.1 に示す別の確定組と幾つかの符号位置の範囲とで示すこともでき

る。

面 00∼10

組番号

名前

310

UNICODE 6.0

面 00

区の中の値

05 8F 
06 04 
08 A0,A2∼AC,E4∼FE 
0A F0 
0E DE∼DF 
10 C7,CD,FD∼FF 
1B AB∼AD,BA∼BF 
1C C0∼C7,F3∼F6 
27 CB,CD 
2C F2∼F3 
2D 27,2D,66∼67 
2E 32∼3B 
9F CC 
A6 74∼7B,9F 
A7 92∼93,AA,F8∼F9 
AA E0∼F6 
FA 2E∼2F

面 01

区の中の値

09 80∼B7,BE∼BF 
10 D0∼E8,F0∼F9 
11 00∼34,36∼43,80∼C8,D0∼D9 
16 80∼B7,C0∼C9 
6F 00∼44,50∼7E,8F∼9F 
EE 00∼03,05∼1F,21∼22,24,27,29∼32,34∼37,39,3B,42,47,49,4B,4D

∼4F,51∼52,54,57,59,5B,5D,5F,61∼62,64,67∼6A,6C∼72,74∼77,
79∼7C,7E,80∼89,8B∼9B,A1∼A3,A5∼A9,AB∼BB,F0∼F1

F1 6A∼6B


94

X 0221

:2014 (ISO/IEC 10646:2012)

   

F5 40∼43 
F6 00,11,15,17,19,1B,1F,26∼27,2C,2E∼2F,34


95

X 0221

:2014 (ISO/IEC 10646:2012)

附属書 B

(規定)

結合文字一覧

注記  この規格の以前の版でこの附属書に記載していた内容は,文字の種類による形式的な定義に変

更した(4.14 参照)


96

X 0221

:2014 (ISO/IEC 10646:2012)

   

附属書 C 
(規定)

面 01∼面 10 の UCS 変換形式(UTF-16)

注記  この規格の以前の版でこの附属書に記載していた内容は,本文に記載した。UTF-16 の符号化形

式については,箇条 を参照。UTF-16 の符号化方式については,箇条 10 を参照。


97

X 0221

:2014 (ISO/IEC 10646:2012)

附属書 D 
(規定)

UCS

変換形式 8(UTF-8)

注記  この規格の以前の版でこの附属書に記載していた内容は,本文に記載した。UTF-8 の符号化形

式については,箇条 を参照。UTF-8 の符号化方式については,箇条 10 を参照。


98

X 0221

:2014 (ISO/IEC 10646:2012)

   

附属書 E

(規定)

双方向文脈での鏡像文字

注記  この規格の以前の版でこの附属書に記載していた内容は,文字の種類による形式的な鏡像文字

の定義に変更した(15.1 参照)


99

X 0221

:2014 (ISO/IEC 10646:2012)

附属書 F

(参考) 
書式文字

書式文字と呼ぶ特別な種類の文字がある。その主要な用途は,周囲の文字の配置又は処理に影響を与え

ることである。少数の例外を除いて,書式文字は,印字可能な図形文字をもたない。符号表中では,空白

の文字と同様の点線の長方形で囲って示している。

多くの書式文字の機能は,符号単位列の正しい表示を示すことにある。表示以外のテキストの処理(例

えば,分類及び探索)では,F.1.1 で説明する ZWJ 及び ZWNJ を除く書式文字は,それを除いてしまうこと

によって,無視できる。書式文字は,JIS X 0211 の双方向性制御機能とともに使うことを意図していない。

F.1 

一般書式文字 

F.1.1 

幅 の境界表示子 

次の 4 文字は,両隣の文字を語の境界又はハイフンの境界で区切るかどうかを示すのに使う。これらの

幅 0 の境界表示子は,それ自身の通常の表現では幅をもたない。

SOFT HYPHEN

(00AD)

SOFT HYPHENSHY)は,語の途中で改行するのにふさわしい候補を示す書

式文字である。行を SOFT HYPHEN によって示される位置で改行する場合,辞書の参照などのような他の

仕組みによって語の途中で改行したかのように改行するとよい。言語及びその語に応じて,語の途中の改

行の可視的な結果は,異なってもよい。例えば,次のような結果としてもよい。

−  語が分割されたことを表す図形記号を挿入し,その図形記号の直後で改行を行う。

−  語が分割されたことを表す図形記号を挿入し,その図形記号の直後で改行し,分割された語の一部の

つづりを変更する。

−  視覚上の変更を行わず,単に SOFT HYPHEN の位置で改行する。

何かの図形記号を挿入する場合,状況に応じて最適な様々な形,例えば,HYPHEN(2010)

(ハイフン)

ARMENIAN HYPHEN

(058A)

(アルメニア文字用ハイフン)又は MONGOLIAN TODO SOFT HYPHEN(1806)

(モンゴルトド文字用ハイフン)の形としてもよい。

明示的な改行の位置の指定を含むテキストを語の途中での改行を含めて符号化する場合,

言語に応じて,

HYPHEN

ARMENIAN HYPHEN 及び MONGOLIAN TODO SOFT HYPHEN などの文字を用いてもよい。

語の途中の改行が可能な位置を符号化する目的で(例えば,

“tug{00AD}gumi”のように)符号単位列に

SOFT HYPHEN

を挿入しても,文字の表示は変わらない。語の途中の改行を含む強制的な改行を符号化す

る文字を含む符号単位列を符号化する場合,テキストの列の文字による表現は,

(例えば,

“/”が改行を意

味するものとして,

“tugg{2010}”/“gumi”とするような)語の途中の改行による一切の変更を反映しな

ければならない。

注記 1  ここに,{00AD}及び{2010}という表記法は,符号位置 00AD 及び 2010 を符号単位列中に含

めることを示す。ただし,

“{”及び“}”は,符号単位列の一部ではない。

ZERO WIDTH SPACE

(200B)

:この文字は,SPACE(スペース)と同様に語の境界を示すが,SPACE

と異なり表示幅をもたない。例えば,この文字は,語を区切るのに可視的な間隔を使用しないタイ語の語

の境界を示すのに使える。

WORD JOINER

(2060)及び ZERO WIDTH NO-BREAK SPACE(FEFF)

:これらの文字は,NO-BREAK 


100

X 0221

:2014 (ISO/IEC 10646:2012)

   

SPACE

(ノーブレークスペース)と同様に語の境界がないことを示すが,NO-BREAK SPACE と異なり表

示幅をもたない。例えば,これらの文字は,テキスト“base+delta”の 4 番目の文字の後に挿入し,

“e”と

“+”との間に語の区切りがあってはならないことを示す。

注記 2  ZERO WIDTH NO-BREAK SPACE を“印”(しるし)に使う方法は,箇条 10 参照。

次の 2 文字は,表示するときに,隣接する文字と接合するかどうかを示すのに使う[続け書き接合子

(cursive joiner)という。

ZERO WIDTH NON-JOINER

(200C)

:この文字は,通常,続け書き文字形として続ける隣接する文字

を,続け書き接合で続けないことを示す。例えば,ARABIC LETTER NOON(アラビア文字ヌーン)と ARABIC 

LETTER MEEM

(アラビア文字ミーム)との間の ZERO WIDTH NON-JOINER は,この二つの文字を通常

の続け書き接合で表示しないことを示す。

注記 2A  ZERO WIDTH NON-JOINER の略号として ZWNJ を用いることがある。

ZERO WIDTH JOINER

(200D)

:この文字は,通常,続け書き文字形として続けない隣接する文字を,

続け書き接合で続けた形で表現することを示す。例えば,SPACE の後に ARABIC LETTER BEH(アラビ

ア文字ベー)が続き,その後に SPACE が続く文では,ZERO WIDTH JOINER は,ARABIC LETTER BEH

の最終形を表示するために,最初の文字と 2 番目の文字との間に挿入できる。

注記 2B  ZERO WIDTH JOINER の略号として ZWJ を用いることがある。

F.1.2 

書式分離子 

次の 2 文字は,行間又は段落間の書式上の境界を示すのに使う。

LINE SEPARATOR

(2028)

:この文字は,どこから新しい行を始めるかを示すのに使う。すなわち,テ

キストは次の行に続くが,新しい段落は始めないときに使う。例えば,段落間の行あけ又は段落の字下げ

は,適用されないと考えられる。

PARAGRAPH SEPARATOR

(2029)

:この文字は,どこから新しい段落を始めるかを示す。例えば,テ

キストは,次の行に続き,段落間の行あけ又は段落の字下げを適用すると考えられる。

F.1.3 

双方向テキストの書式付け 

ここで示す文字は,双方向テキストの書式付けに使う。部分集合の仕様にこれらの文字が入っている場

合には,右から左へ書く文字を含むテキストは,暗黙的な双方向性アルゴリズムで表示される。

暗黙的なアルゴリズムでは,テキストの水平行に文字を正しい順序で表示するために,文字の方向性の

特性を使う。

次の 2 文字は,文字の順序付けに影響を及ぼすという意味で,右から左へ書く文字又は左から右へ書く

文字と全く同じように働く書式文字とする[双方向性書式マーク(bi-directional format mark)という。

これらの文字は,可視的な表現をもたず,文脈にも影響しない。

これらの文字は,その作用範囲がより局所的であり,明示的な埋込み文字又は上書き文字の利用よりも

便利なことがある。

LEFT-TO-RIGHT MARK

(200E)

:双方向性の書式付けにおいて,この文字は,左から右へ書く文字(例

えば,LATIN SMALL LETTER A)のように働く。

RIGHT-TO-LEFT MARK

(200F)

:双方向性の書式付けにおいて,この文字は,右から左へ書く文字(例

えば,ARABIC LETTER NOON)のように働く。

次の 5 文字は,テキストの一部を挿入部分として扱い,かつ,その部分に特定の順序付けがなければな

らないことを示す[双方向性書式挿入子(bi-directional format embedding)という。

。例えば,アラビア語

の文章の途中にある英語の引用には,挿入された左から右へ書く文字列としてマークを付けることができ


101

X 0221

:2014 (ISO/IEC 10646:2012)

る。

これらの書式文字は,

ブロックの入れ子を作る。

ブロックの開始

(プッシュ)

は,

“埋込み文字

(embedding

character)”及び“上書き文字(override character)”が示す。ブロックの終了(ポップ)は,“挿入終了文字

(pop character)

”が示す。

埋込み文字と上書き文字との機能は,非常に似ている。主な違いは,埋込み文字がテキストの暗黙的な

方向性を指定するのに対して,上書き文字は,テキストの明示的な方向性を指定することにある。テキス

トが明示的な方向をもつ場合,通常の文字の方向性の特性が無視され,テキスト全体が上書き文字で定ま

る方向をもつとみなす。

LEFT-TO-RIGHT EMBEDDING

(202A)

:この文字は,左から右への暗黙的な方向性をもつ挿入の開始

を示すのに使う。

RIGHT-TO-LEFT EMBEDDING

(202B)

:この文字は,右から左への暗黙的な方向性をもつ挿入の開始

を示すのに使う。

LEFT-TO-RIGHT OVERRIDE

(202D)

:この文字は,左から右への明示的な方向性をもつ挿入の開始を

示すのに使う。

RIGHT-TO-LEFT OVERRIDE

(202E)

:この文字は,右から左への明示的な方向性をもつ挿入の開始を

示すのに使う。

POP DIRECTIONAL FORMATTING

(202C)

:この文字は,上の四つの文字で開始された暗黙的又は明

示的な方向性をもつ挿入の終了を示すのに使う。

F.2 

用字特有の書式文字 

F.2.1 

クメール内在母音文字 

次の文字の使用は,推奨されない。これらは,現在は使用されないモデルにおいて,音声学的な違いを

表現するのに使われる。

KHMER VOWEL INHERENT AQ

(17B4)

KHMER VOWEL INHERENT AA

(17B5)

F.2.2 

対称入替え様式文字 

次の文字は,箇条 15 に示す左向き用及び右向き用と対をなす鏡像文字の種類と一緒に使う。次の書式文

字は,文字の名前中にある LEFT(左)又は RIGHT(右)という語をそれぞれ“開き”又は“閉じ”と解

釈するかどうかを示すのに使う。これらの文字は,入れ子とはならない。

実装上の既定状態は,上位のプロトコル又は JIS X 0211 のような規格で設定してもよい。このようなプ

ロトコルがない場合,既定状態は,ACTIVATE SYMMETRIC SWAPPING によって設定される状態とする。

INHIBIT SYMMETRIC SWAPPING

( 206A ): こ の 文字 と( 存 在す るな ら ば) 後続 の ACTIVATE 

SYMMETRIC SWAPPING

書式文字との間では,箇条 15 に示す鏡像文字は,

“左”及び“右”として解釈さ

れ,表される。箇条 15 で示された処理は,行わない。

ACTIVATE SYMMETRIC SWAPPING

(206B):この文字と(存在するならば)後続の INHIBIT 

SYMMETRIC SWAPPING

書式文字との間では,箇条 15 に示す鏡像文字は,箇条 15 で示されたとおり“開

き”及び“閉じ”の文字として解釈され,表される。

F.2.3 

アラビア文字の字形選択子 

次の文字,すなわち,アラビア文字の字形選択子は,アラビア文字の表示形と一緒に使う。表示処理の

間,ある文字は,続け書き接合又は合字で互いに続けてもよい。字形選択子は,この表示の効果を出すた

めに使用する字形決定処理を活性化するか又は抑制するかを示すのに使う。これらの文字は,入れ子とは


102

X 0221

:2014 (ISO/IEC 10646:2012)

   

ならない。

INHIBIT ARABIC FORM SHAPING

(206C)

:この字形選択子と(存在するならば)後続の ACTIVATE 

ARABIC FORM SHAPING

書式文字との間では,字形決定処理は,抑制される。アラビア文字の表示形は,

字形を変更することなく表示される。これを既定状態とする。

ACTIVATE ARABIC FORM SHAPING

(206D)

:この字形選択子と(存在するならば)後続の INHIBIT 

ARABIC FORM SHAPING

書式文字との間では,アラビア文字の表示形は,字形決定処理で字形を変更し

て表示される。

注記  これらの字形選択子は,表示形ではない文字には影響を与えない。特に,0600∼06FF にある通

常の形のアラビア文字は,常に字形変更の対象となっており,これらの書式文字の影響を受け

ない。

F.2.4 

数字の字形選択子 

次の文字は,0030∼0039 にある数字を表すときの形を選択できるようにする。これらの文字は,入れ子

とはならない。

NATIONAL DIGIT SHAPES

(206E)

:この文字と(存在するならば)後続の NOMINAL DIGIT SHAPES

書式文字との間では,0030∼0039 にある数字は,合意によって定められたとおりに,国で使う数字(national

digit)の形で表される。例えば,これらを 0660∼0669 にあるアラビア語の数字の形で表示できる。

NOMINAL DIGIT SHAPES

(206F)

:この文字と(存在するならば)後続の NATIONAL DIGIT SHAPES

書式文字との間では,0030∼0039 にある数字は,符号表に示されたとおりの形で表される。これを既定状

態とする。

F.3 

行間注釈文字(Interlinear annotation character 

次の文字は,ある識別された文字列[注釈文字列(annotation string)という。

]が,他の識別された文字

列[基底文字列(base string)という。

]の注釈を提供すると考えられることを示すために使う。

INTERLINEAR ANNOTATION ANCHOR

(FFF9)

:この文字は,基底文字列の開始位置を示す。

INTERLINEAR ANNOTATION SEPARATOR

(FFFA)

:この文字は,基底文字列の終了位置及び注釈文

字列の開始位置を示す。

INTERLINEAR ANNOTATION TERMINATOR

(FFFB)

:この文字は,注釈文字列の終了位置を示す。

注釈文字列と基底文字列との関係は,送信装置の利用者と受信装置の利用者との合意によって,定義さ

れる。例えば,基底文字列が可視的に表示される場合,注釈文字列は,基底文字列と異なる行の基底文字

列に近い位置に表示してもよい。

処理によって行間注釈文字を除いてしまう場合は,INTERLINEAR ANNOTATION SEPARATOR 

INTERLINEAR ANNOTATION TERMINATOR

との間の全ての文字も,一緒に除去することが望ましい。

F.4 

限定性書式文字 

次の 7 文字は,続く文字の並びを限定する。

0600

ARABIC NUMBER SIGN

0601

ARABIC SIGN SANAH

0602

ARABIC FOOTNOTE MARKER

0603

ARABIC SIGN SAFHA

06DD

ARABIC END OF AYAH

070F

SYRIAC ABBREVIATION MARK

110BD

KAITHI NUMBER SIGN


103

X 0221

:2014 (ISO/IEC 10646:2012)

これらの文字は,続く数字(及び若干のその他の文字)の並びに対して,ユニコード標準 6.0 版(

附属

書 参照)が ARABIC END OF AYAH の振る舞いとして規定するとおりに働く。

F.5 

連結作用素 

これらの書式文字は,数式中で区切りの文字もスペースも無しに並ぶことのある文字の区切りとして用

いる。

FUNCTION APPLICATION

(2061)

:この文字は,関数の適用を示す。

INVISIBLE TIMES

(2062)

:この文字は,乗算を示す。

INVISIBLE SEPARATOR

(2063)

:この文字は,隣接する数学記号がリストを形成することを示す。例

えば,複数の添え字の間に見える COMMA を置かないときに用いる。

INVISIBLE PLUS

(2064)

:この文字は,加算を示す。

F.6 

西洋音楽記号 

この規格は,

音楽の楽譜又は音程の符号化の完全な手段を規定しない。

その種の要件を満たすためには,

この規格が規定する文字の符号化の規則に加えて,

他の事柄を記述する追加の階層が必要である。

しかし,

追加の階層を用いなくても,この規格が規定する文字は,一般的な音楽に関するテキスト記述において簡

単に音楽に言及するための記号として用いることができる。

音楽の記法では,音価の短い音符をまとめる連こう(桁)が多用される。書式文字 1D173  MUSICAL 

SYMBOL BEGIN BEAM

[音楽記号連こう(桁)開始]及び 1D174 MUSICAL SYMBOL END BEAM[音楽記

号連こう(桁)終了]を用いて,連こう(桁)によるまとまりの範囲を示すことができる。特別な場合,

連こう(桁)の端が閉じないことがある。連こう(桁)の端に符幹が付かないことを示すために,いわゆ

る“透明音符”

[すなわち,MUSICAL SYMBOL NULL NOTEHEAD(音楽記号空白符頭)

]を用いることが

できる。

これと同様に,他の接続構造を表現するための別の書式文字を用意してある。次の文字は,この種の働

きをもつ。

− 1D175

MUSICAL SYMBOL BEGIN TIE

(音楽記号タイ開始)

− 1D176

MUSICAL SYMBOL END TIE

(音楽記号タイ終了)

− 1D177

MUSICAL SYMBOL BEGIN SLUR

(音楽記号スラー開始)

− 1D178

MUSICAL SYMBOL END SLUR

(音楽記号スラー終了)

− 1D179

MUSICAL SYMBOL BEGIN PHRASE

(音楽記号楽句開始)

− 1D17A

MUSICAL SYMBOL END PHRASE

(音楽記号楽句終了)

これらの対になる文字は,完全な音楽の記法において,音符及び楽句のまとまり又は配置を変更する。

音楽の一部分がプレーンテキストの一部に書かれたり描かれたりする場合,特別なソフトウェアが利用で

きないときには,開始及び終了を示す書式文字の対を括弧のように描いたり無視したりしてもよい。洗練

された組込み手続は,対になる書式文字を可能な限界まで解釈し,実際に備える制御能力を用いて,タイ,

スラー,連こう(桁)及び楽句を適切に描いてもよい。

最大の柔軟性のために,音楽記号の文字集合は,特定の音価の音符として前もって合成された図形記号

をもつ文字と,完全な音符を組み立てる場合の基本要素としての図形記号をもつ文字との双方を含む。音

楽記号は,至る所で使われるので,主として利用者の便宜のために,前もって合成された図形記号をもつ

文字を用意してある。


104

X 0221

:2014 (ISO/IEC 10646:2012)

   

符号化の点では,便利ではないが,様々な符頭,符幹及び符尾並びに演奏指示の記号を組み合わせて音

符を構成する手段が,複雑な楽譜を扱う完全な実装に必要となる。この用法の例として,アメリカ式の特

別な形の音符及び現代打楽器曲の表記法がある。例えば,次のような用法がある。

MUSICAL SYMBOL SQUARE NOTEHEAD BLACK

と MUSICAL SYMBOL COMBINING STEM との組合せ。

MUSICAL SYMBOL X NOTEHEAD

と MUSICAL SYMBOL COMBINING STEM との組合せ。

付点及び演奏指示記号は,前もって合成された図形記号をもつ文字と組み合わせることもできるし,基

本要素から組み立てた音符と組み合わせることもできる。

さらに,

付点及び演奏指示記号は,

一つの完全な音符の形を表すために必要に応じて繰り返してもよい。

例えば,次のような用法がある。

MUSICAL SYMBOL EIGHTH NOTE

と MUSICAL SYMBOL COMBINING AUGMENTATION DOT と MUSICAL 

SYMBOL COMBINING AUGMENTATION DOT

と MUSICAL SYMBOL COMBINING ACCENT との組合せ。

F.7 

タグ文字による言語のタグ付け 

タグ文字は,テキストの属性を,テキストの文字列の一つの位置又は範囲に関連付けることを目的とす

る。特定のタグの値は,通常は,テキストの内容の一部とはみなさない。例えば,テキストの一部分に適

用される言語又はフォントの標識として用いることができる。その用途以外では,タグ文字は,無視して

もよい。

タグ文字は,プレーンテキストに埋め込まなければならない何らかの ASCII(ISO/IEC 646 の IRV のこ

とをいう。

)に基づくタグ付けの体系において文字列を書き下すために用いることができる。タグ文字は,

符号の値が工夫されているので容易に識別でき,タグ文字の利用には,負担がかからない。タグ文字は,

タグの値を表現することだけが可能であって,テキストの内容自体を表すことはできない。

文字を,タグ文字と同様の関連付け機能を備える明示的なマーク付けを含んだプロトコル又は構文の文

脈で使う場合は,これらのプロトコルに従ってタグ文字を取り除き無視してもよい。

例えば,SGML 又は XML では,明示的な言語のマーク付けが規定されている。そこで,LANGUAGE TAG

(E0001)

(言語タグ)及び他のタグ文字は,SGML 又は XML では,言語の標識として使わない方がよい。

ユニコードのウェブサイト(http://www.unicode.org/reports/)から入手できる“Unicode in XML and other

Markup Languages”(ユニコード技術報告書 UTR #20)という技術報告書をユニコードコンソーシアム及び
W3C が共同で執筆したが,この技術報告書には,SGML 又は XML では,タグ文字を使用しない方がよい

ことが詳細に書かれている。

TAGS

(タグ)ブロックは,97 個のタグ専用の文字を含み,BASIC LATIN(基本ラテン文字)ブロック

に含まれる図形文字の複製[これは,BASIC LATIN ブロックの文字の名前に語“TAG

(タグ)を前置し

た名前の文字であり,符号位置 E0020∼E007E にある。

]と,言語のタグを識別する文字である LANGUAGE 

TAG

(言語タグ)及びタグを取り消す文字である CANCEL TAG(取消しタグ)とからなる。

タグ識別文字は,異なる種類のタグを識別するための仕組みとして用いる。タグ識別文字によって,二

つ以上の種類のタグをプレーンテキストに埋め込んで共存させることが可能になり,かつ,あるタグが別

のタグと直接連続した場合のタグの切れ目の問題も解決する。現時点では,言語のタグという一つのタグ

の種類だけを規定しているが,将来異なるタグ識別文字を符号化することになれば,異なる種類のタグを

用いることもできるようになる。

F.7.1 

タグ文字を埋め込む構文 

プレーンテキストに ASCII から導出された任意のタグを埋め込むためには,適切なタグ識別文字を前置


105

X 0221

:2014 (ISO/IEC 10646:2012)

し,埋め込むタグをタグ文字によって単純に書き下す。その文字列を直接テキストに埋め込む。

タグには,終わりを表す文字が必要ない。一つのタグは,特殊用途面の文字でない最初の文字に出会う

か又は次のタグ識別文字に出会うかのいずれかによって終わる。

タグの引数は,タグ文字によってだけ符号化できる。その他の文字は,タグの引数を表現するためには

適切ではない。

F.7.2 

タグの範囲及び入れ子 

タグの値は,テキストにタグが埋め込まれた位置から次のいずれかの位置まで続く。

−  符号単位列の終わりの位置。

−  タグが CANCEL TAG 文字によって明示的に取り消された位置。

同じ種類のタグは,入れ子にならない。例えば,既に言語のタグ付けが行われているテキストに続けて,

新しく埋め込まれた言語のタグが現れたならば,続くテキストに対するタグの値が新しいタグによって指

定されたタグの値に単純に変わる。

F.7.3 

タグの値の取消し 

CANCEL TAG

(取消しタグ)文字は,特にタグの値を取り消すために用意されている。例えば,言語タ

グを取り消すには,LANGUAGE TAG(言語タグ)文字が CANCEL TAG 文字の前になければならない。

直前にタグ識別文字がない CANCEL TAG 文字は,定義されているかもしれない任意のタグの値を取り消

すために用いる。

CANCEL TAG

文字の主な機能は,文字列の境目を越えて不適切なタグの値を広げてしまうことなく,複

数の文字列を,タグの内容を気にせずに連結するような操作を可能にすることである。

F.7.4 

言語のタグ 

言語のタグは,誰でも関心があり,言語のタグのプロトコルとしての利用は,高度の相互運用性がある。

例えば,日本語を表す言語のタグを埋め込むためには,タグ文字を次のように用いることができる。

E0001 E006A E0061

ここで,第 1 の値は,LANGUAGE TAG(言語タグ)文字の符号の値であり,第 2 の値は,TAG LATIN SMALL 

LETTER J

に対応する値であり,かつ,第 3 の値は,TAG LATIN SMALL LETTER A に対応する値であ

る。

“ja”という列は,JIS X 0412 群(対応国際規格:ISO 639 群)において,日本語を表す 2 文字コード

である。


106

X 0221

:2014 (ISO/IEC 10646:2012)

   

附属書 G 
(参考)

文字の名前のアルファベット順一覧

文字の名前のアルファベット順一覧を,機械可読形式の添付ファイルによって示す。添付ファイルは,

テキストファイルであり,ISO/IEC 646 の IRV の文字及び行末を表す LINE FEED を使用する。ファイル

の先頭の 4 行は,ヘッダであり,その後にハングル音節文字及び漢字(すなわち,HANGUL SYLLABLES

CJK UNIFIED IDEOGRAPHS

CJK UNIFIED IDEOGRAPHS EXTENSION ACJK UNIFIED IDEOGRAPHS 

EXTENSION B

CJK UNIFIED IDEOGRAPHS EXTENSION CCJK UNIFIED IDEOGRAPHS EXTENSION 

D

CJK COMPATIBILITY IDEOGRAPHS 及び CJK COMPATIBILITY IDEOGRAPHS SUPPLEMENT のブロ

ックの文字)を除く全てのこの規格の文字の名前を連ねる。

添付ファイルの,ヘッダより後の部分の形式は,次による。第 1∼第 5 オクテットは,UCS-4 の値を 5

桁に省略したものとする。第 6 オクテットは,文字 TAB とする。第 7 オクテットから行末までは,文字の

名前とする。

参照ファイルは,添付ファイル“Allnames.txt”とする。

注記 1  (対応国際規格での注記 は,この規格では該当しないため不採用とした。)

注記 2  添付ファイルは,この規格を機械可読形式で入手したものだけが利用できる。しかし,この

ファイルを印刷して利用することもできる。


107

X 0221

:2014 (ISO/IEC 10646:2012)

附属書 H 
(参考)

UCS

を識別するための“印”(しるし)の使用

注記  この規格の以前の版でこの附属書に記載していた内容は,本文に記載した(箇条 10 参照)。


108

X 0221

:2014 (ISO/IEC 10646:2012)

   

附属書 I

(参考)

漢字構成記述文字

漢字構成記述文字(Ideographic Description Character,以下 IDC という。)は,漢字構成記述文字列

(Ideographic Description Sequence,以下 IDS という。

)を作り出すため,他の図形文字の列とともに使われ

る図形文字である。この種の文字列は,この規格で規定されていない漢字のような文字(ideographic

character)を記述する目的で使ってもよい。

IDS は,一つの漢字を抽象字形で記述する。合成された一つの文字と解釈するものではなく,何らかの

特定の表示方法を意図するものでもない。

注記 IDS は,文字ではなく,この規格のレパートリの構成単位ではない。

I.1 

漢字構成記述文字列の構文 

IDS は,一つの IDC から始まり,一定の数の記述構成要素(description component,以下 DC という。)

が後に続く。DC は,次のいずれかであってよい。

−  符号化された漢字。

−  符号化された部首。

−  別の IDS。

注記 1  これは,ある IDS が,他の IDS に入れ子として含まれてもよいことを示す。

各 IDC は,次に示す四つの特性をもつ。これを

表 I.1 にまとめて示す。

−  その IDC で始まる IDS で使われる DC の数。

−  その略号の定義。

−  対応する IDS の構文。

−  抽象字形として記述された漢字を可視化で表現したときの,各 DC の相対位置。

それぞれの IDC から始まる IDS の構文は,

表 I.1 の“IDS の略号及び構文”の欄で,その IDC の略号(例

えば,IDC-LTR)と,それに続く規定の数の DC,すなわち,

(D

1

 D

2

)又は(D

1

 D

2

 D

3

)とによって示す。

注記 2  一つの IDS の長さは,16 文字以下に制限する。また,一つの IDS の中では,一つの IDC 文

字の任意の二つの使用の間に,6 個を超える漢字及び/又は部首が現れてはならない。

注記 2A  注記 の制限は,この規格の対応国際規格の次の版までに廃止される予定である。つまり,

この規格の将来の版では,IDS の長さに何ら制限がなく,二つの IDC の間に任意に多くの漢

字及び/又は部首が現れてもよいことになる。また,DC として,この規格が許している三

つに加え,私用文字が追加される予定もある。

I.2 

個々の漢字構成記述文字の定義 

IDEOGRAPHIC DESCRIPTION CHARACTER LEFT TO RIGHT

(2FF0)

この文字によって記述される IDS は,D

1

が左に,D

2

が右に位置する,漢字の抽象字形を記述する。

IDEOGRAPHIC DESCRIPTION CHARACTER ABOVE TO BELOW

(2FF1)

この文字によって記述される IDS は,D

1

が D

2

の上に位置する,漢字の抽象字形を記述する。

IDEOGRAPHIC DESCRIPTION CHARACTER LEFT TO MIDDLE AND RIGHT

(2FF2)


109

X 0221

:2014 (ISO/IEC 10646:2012)

この文字によって記述される IDS は,D

1

が D

2

の左に,さらに,その D

2

が D

3

の左に位置する,漢字の

抽象字形を記述する。

IDEOGRAPHIC DESCRIPTION CHARACTER ABOVE TO MIDDLE AND BELOW

(2FF3)

この文字によって記述される IDS は,D

1

が D

2

の上に,さらに,その D

2

が D

3

の上に位置する,漢字の

抽象字形を記述する。

IDEOGRAPHIC DESCRIPTION CHARACTER FULL SURROUND

(2FF4)

この文字によって記述される IDS は,D

1

が D

2

を囲む,漢字の抽象字形を記述する。

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM ABOVE

(2FF5)

この文字によって記述される IDS は,D

1

が D

2

を上及び両側から囲む,漢字の抽象字形を記述する。

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM BELOW

(2FF6)

この文字によって記述される IDS は,D

1

が D

2

を下及び両側から囲む,漢字の抽象字形を記述する。

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM LEFT

(2FF7)

この文字によって記述される IDS は,D

1

が D

2

を左及び上下から囲む,漢字の抽象字形を記述する。

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM UPPER LEFT

(2FF8)

この文字によって記述される IDS は,D

1

が D

2

の左上に位置し,左及び上の一部を囲む,漢字の抽象字

形を記述する。

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM UPPER RIGHT

(2FF9)

この文字によって記述される IDS は,D

1

が D

2

の右上に位置し,右及び上の一部を囲む,漢字の抽象字

形を記述する。

IDEOGRAPHIC DESCRIPTION CHARACTER SURROUND FROM LOWER LEFT

(2FFA)

この文字によって記述される IDS は,D

1

が D

2

の左下に位置し,左及び下の一部を囲む,漢字の抽象字

形を記述する。

IDEOGRAPHIC DESCRIPTION CHARACTER OVERLAID

(2FFB)

この文字によって記述される IDS は,D

1

と D

2

とが互いに重なり合う,漢字の抽象字形を記述する。


110

X 0221

:2014 (ISO/IEC 10646:2012)

   

表 I.1−漢字構成記述文字の属性

文字の名前 DC 数

IDS の略号

及び構文

DC の

相対位置

IDS の例 IDS が表す

ものの例

IDEOGRAPHIC DESCRIPTION 

CHARACTER LEFT TO RIGHT 

2

IDC-LTR

 D

1

 D

2

IDEOGRAPHIC DESCRIPTION 

CHARACTER ABOVE TO BELOW 

2

IDC-ATB

 D

1

 D

2

IDEOGRAPHIC DESCRIPTION 

CHARACTER LEFT TO MIDDLE AND 

RIGHT 

3

IDC-LMR

 D

1

 D

2

 D

3

IDEOGRAPHIC DESCRIPTION 

CHARACTER ABOVE TO MIDDLE AND 

BELOW 

3

IDC-AMB

 D

1

 D

2

 D

3

IDEOGRAPHIC DESCRIPTION 

CHARACTER FULL SURROUND 

2

IDC-FSD

 D

1

 D

2

IDEOGRAPHIC DESCRIPTION 

CHARACTER SURROUND FROM ABOVE 

2

IDC-SAV

 D

1

 D

2

IDEOGRAPHIC DESCRIPTION 

CHARACTER SURROUND FROM BELOW 

2

IDC-SBL

 D

1

 D

2

IDEOGRAPHIC DESCRIPTION 

CHARACTER SURROUND FROM LEFT 

2

IDC-SLT

 D

1

 D

2

IDEOGRAPHIC DESCRIPTION 

CHARACTER SURROUND FROM UPPER 

LEFT 

2

IDC-SUL

 D

1

 D

2

IDEOGRAPHIC DESCRIPTION 

CHARACTER SURROUND FROM UPPER 

RIGHT 

2

IDC-SUR

 D

1

 D

2

IDEOGRAPHIC DESCRIPTION 

CHARACTER SURROUND FROM LOWER 

LEFT 

2

IDC-SLL

 D

1

 D

2

IDEOGRAPHIC DESCRIPTION 

CHARACTER OVERLAID 

2

IDC-OVL

 D

1

 D

2

*

注*

IDC-OVL

では,D

1

と D

2

とは,互いに重なり合う。この図は,D

1

が左上,D

2

が右下という意味ではない。


111

X 0221

:2014 (ISO/IEC 10646:2012)

附属書 J

(参考)

内部記憶機能をもつ送受信兼用装置に対する推奨

この附属書は,受信した符号単位列を後続の再転送のために記憶しておける装置で,広く使われている

クラスのものに適用できる。

この附属書は,受信した符号単位列とその再転送との間で,情報の損失が最少になるように意図して推

奨するものである。

このクラスの装置は,

2.3

に示した受信装置部分と送信装置部分との両方をもち,

受信した符号単位列を,

その中に表現されている対応する文字を利用者が修正し又は修正せずに,再転送のために記憶できる。こ

のクラスの装置について,ここでは,2 種類の異なる方法を推奨する。

a)

完全な再転送機能をもつ受信装置  送信装置部分は,受信装置部分が識別できる部分集合外の符号化

表現も含め,受信した文字の符号化表現を,利用者が修正しない限りそのまま再転送する。

b)

部分集合の再転送機能をもつ受信装置  送信装置部分は,その受信装置部分に採用された部分集合の

文字の符号化表現だけを再転送できる。


112

X 0221

:2014 (ISO/IEC 10646:2012)

   

附属書 K

(参考)

オクテット値表現の記法

この規格のオクテット値の表現は,

箇条 12 を除き,

JIS X 0202

JIS X 0211

及び ISO/IEC 8859

(Information

technology−8-bit single-byte coded graphic character sets)群のような他の符号化文字集合の規格と異なる。

この附属書は,両者の記法間の関係を明確にする。

この規格では,オクテット値を表す記法は,z としている。ここに,z は,00∼FF の範囲にある 16 進数

である。例えば,JIS X 0202 の文字 ESCAPEESC)は,この規格では 1B で表現される。

他の符号化文字集合の規格では,オクテット値を表す記法は,x/y としている。ここに,x 及び y は,00

∼15 の範囲にある二つの 10 進数である。x/y 形式の記法とオクテット値との間の対応は,次のとおりであ

る。

−  x は,ビット 8,ビット 7,ビット 6 及びビット 5 で表現される数であって,これらのビットには,そ

れぞれ 8,4,2 及び 1 の重みを与える。

−  y は,ビット 4,ビット 3,ビット 2 及びビット 1 で表現される数であって,これらのビットには,そ

れぞれ 8,4,2 及び 1 の重みを与える。

例えば,JIS X 0202 の文字 ESC は,01/11 で表現される。

このように,JIS X 0202(及び他の符号化文字集合の規格)のオクテット値の記法は,x 及び y の値を

16 進表記に変換することによって,この規格のオクテット値の記法に変換できる。例えば,04/15 は,4F

と同値である。


113

X 0221

:2014 (ISO/IEC 10646:2012)

附属書 L

(参考)

文字の名前付け指針

この規格の箇条 24 では,名前の編成及び名前の一意性についての規則を規定している。箇条 24 の規則

は,ISO/IEC 646ISO/IEC 6937ISO/IEC 8859ISO/IEC 10367 などの他の情報技術の符号化文字集合規

格でも用いる。

注記  JIS X 0201JIS X 0208JIS X 0213 などの規格でも用いる。

この附属書では,名前を作り出す場合の追加の指針を示す。

この附属書で示す指針は,CJK 統合漢字及びハングル音節文字の名前には適用しない。CJK 統合漢字及

びハングル音節文字の名前は,それぞれ,24.6 及び 24.7 で規定する規則を用いて編成する。

指針 1

名前は,できる限り通常的に使われる意味を表す(例えば,文字の名前として PLUS SIGN 又はブロッ

ク名 BENGALI

幾つかの文字の名前など,ある種の名前は,使用法ではなく形によってもよい(例えば,文字の名前と

して UPWARDS ARROW

名前は,指針 4 の場合を除いて,ものの特質若しくは属性を識別すること,又は言語的特徴についての

情報を提供することを意図しない。

指針 2

略号は,ラテン大文字の A∼Z 及び数字からなり,名前と関連させる。

略号は,既に使用が定着していて,かつ,明確化のために必要なものの名前に用いる。例えば,制御機

能の名前は,略号と結びついている。

名前

略号

LOCKING-SHIFT TWO RIGHT

LS2R

SOFT HYPHEN

SHY

INTERNATIONAL PHONETIC ALPHABET

IPA

注記  JIS X 0211 では,モードの名前にも略号を適用している。

指針 3

文字の名前及び名前付き USI の名前は,数字を英単語として書き下すことが適切でないときに限って,

数字の文字 0∼9 を含んでよい。

注記  例えば,位置 201A の文字の名前は,SINGLE LOW-9 QUOTATION MARK(下 9 形引用符)で

ある。文字の形状を明らかにするために,数字 9 の記号がこの名前に含まれているが,数値に

意味は,ない。

指針 4

文字の名前及び名前付き USI の名前は,次に示す区分に属する語のうちで適用可能なものの集合から構

成し,次に示す順序で並べる。例外は,指針 9∼11 による。必要ならば,一層の明確化のために,語 WITH

及び AND を含めてもよい。

1

用字


114

X 0221

:2014 (ISO/IEC 10646:2012)

   

2

大文字・小文字

3

種類

4

言語

5

属性

6

意味

7

マーク(複数でもよい。

8

修飾子

この語の例を次に示す。

用字 Latin,Cyrillic,Arabic

大文字・小文字 capital,small

種類 letter,ligature,digit

言語 Ukrainian

属性 final,sharp,subscript,vulgar

意味

通常の名前,アルファベットの名前

マーク acute,ogonek,ring above,diaeresis

修飾子 sign,symbol

名前の例を次に示す。

1

LATIN

2

 CAPITAL

3

LETTER

6

 A

WITH

7

 ACUTE

3

DIGIT

6

 FIVE

5

LEFT

5

 CURLY

6

BRACKET

注記 ligature は,二つ以上の異なる図形記号が単一の図形記号として可視化された図形記号である。

一つの文字が一つの基底文字部と複数個のマークとから構成される文字の名前に関しては,名前中のこ

れらの順序は,マークが基底文字部に対して相対的に位置決めされる順序とする。すなわち,昇順にとら

れる文字の上に置くマークから始まり,その後に降順にとられる文字の下に置くマークが続くか,又はそ

の逆(文字の下に置くマークから始まり,その後に文字の上に置くマークが続く。

)とする。

一つの基底文字部と複数個のマークとから構成される名前付き USI に関しては,個々の名前をそれらが

符号化される順に記述する。

  LATIN CAPITAL LETTER O WITH CIRCUMFLEX AND DOT BELOW

LATIN CAPITAL LETTER C WITH CEDILLA AND ACUTE

LATIN CAPITAL LETTER U WITH OGONEK AND ACUTE

指針 5

ラテンの用字の文字は,名前の中では,基本図形記号(A,B,C など)によって表現する。他の用字の

文字は,最初に刊行された国際規格の言語からの転写で表現する。

例  K  LATIN CAPITAL LETTER K

Ю  CYRILLIC CAPITAL LETTER YU

指針 6

与えられた用字の文字が複数の言語で使われている場合,言語名は,使わない。しかし,曖昧さが生じ

る場合は,この限りではない。

例  И  CYRILLIC CAPITAL LETTER I


115

X 0221

:2014 (ISO/IEC 10646:2012)

I  CYRILLIC CAPITAL LETTER BYELORUSSIAN-UKRAINIAN I

指針 7

複数個の用字の構成要素となっている文字は,形が同じでも異なるものとみなし,異なる名前をもつ。

例  A  LATIN CAPITAL LETTER A

A  GREEK CAPITAL LETTER ALPHA

A  CYRILLIC CAPITAL LETTER A

指針 8

可能ならば,名前付き USI の名前は,その構成要素の名前の要素を,重複を無視して連結することによ

って構成する。この手順によって既に存在する名前が得られたならば,その名前は,文字の名前及び名前

付き USI の名前の中での一意性を保証するために適切に修正する。一層の明確化のために,語 WITH 及び

AND

を含めてもよい。

指針 9

例えば,物理量の単位に関連する図形記号のように,他の用字の中で独立して使われる一つの用字の文

字は,それ本来の用字の文字と異なる文字とみなす。

例  μ  MICRO SIGN

指針 10

幾つかの文字は,1 語又は 2 語からなる伝統的な名前をもっている。これを変えることは,意図しない。

例  ’  APOSTROPHE

:  COLON

@  COMMERCIAL AT

_  LOW LINE

∼  TILDE

指針 11

与えられた用字の文字(句読点のことが多い。

)が他の用字で異なる用法で使われる場合がある。この場

合,最も一般的に使われる慣習的な名前を,その文字に与える。その用字名の後に慣習名をその用字で書

き直したものを続けて注釈として文字一覧表に付けてもよい。


116

X 0221

:2014 (ISO/IEC 10646:2012)

   

附属書 M

(参考)

文字の出所

この符号化文字集合を作成するに当たって,幾つかの原典及び寄書を使用した。分野ごとに,最初に国

家規格及び国際規格を示し,その後に関連する参考文献を示す。

General

ISO international register of character sets to be used with escape sequences. (registration procedure ISO 

2375:1985) .

ISO 8879:1986, Information processing

−Text and office systems−Standard Generalized Markup Language

(SGML).

ISO/IEC TR 15285:1998, Information technology

−An operational model for characters and glyphs.

JIS X 0201:1976

情報交換用符号  (Code for Information Interchange).

Allworth, Edward. Nationalities of the Soviet East: Publications and Writing Systems. New York, London,

Columbia University Press, 1971. ISBN 0-231-03274-9.

Barry, Randall K. 1997. ALA-LC romanization tables: transliteration schemes for non-Roman scripts. Washington,

DC: Library of Congress Cataloging Distribution Service. ISBN 0-8444-0940-5

Daniels, Peter T., and William Bright, eds. 1996. The world's writing systems. New York; Oxford: Oxford

University Press. ISBN 0-19-507993-0

Diringer, David. 1996. The alphabet: a key to the history of mankind. New Delhi: Munshiram Manoharlal. ISBN

81-215-0780-0

Faulmann, Carl. 1990 (1880). Das Buch der Schrift. Frankfurt am Main: Eichborn. ISBN 3-8218-1720-8

Haarmann, Harald. 1990. Universalgeschichte der Schrift. Frankfurt/Main; New York: Campus. ISBN

3-593-34346-0

Imprimerie Nationale. 1990. Les caractères de l'Imprimerie nationale. Paris: Imprimerie nationale Éditions. ISBN

2-11-081085-8

Jensen, Hans. 1969. Die Schrift in Vergangenheit und Gegenwart. 3., neubearbeitete und erweiterte Auflage.

Berlin: VEB Deutscher Verlag der Wissenschaften.

Knuth, Donald E. The TeXbook. – 19th. printing, rev, – Reading, MA : Addison-Wesley, 1990.

Nakanishi, Akira. 1990. Writing systems of the world: alphabets, syllabaries, pictograms. Rutland, VT: Charles E.

Tuttle. ISBN 0-8048-1654-9

Shepherd, Walter. Shepherd's glossary of graphic signs and symbols. Compiled and classified for ready reference.

– New York : Dover Publications, [1971].

The Unicode Consortium The Unicode Standard. Worldwide Character Encoding Version 1.0, Volume One. –

Reading, MA : Addison-Wesley, 1991.

The Unicode Consortium The Unicode Standard, Version 2.0. Reading, MA: Addison-Wesley, 1996. ISBN

0-201-48345-9


117

X 0221

:2014 (ISO/IEC 10646:2012)

The Unicode Consortium The Unicode Standard, Version 3.0. Reading, MA: Addison-Wesley Developer's Press,

2000. ISBN 0-201-61633-5

The Unicode Consortium The Unicode standard, Version 4.0. Reading, MA: Addison-Wesley Developer's Press,

2003. ISBN 0-321-18578-1

The Unicode Consortium The Unicode Standard, Version 5.0. Reading, MA: Addison-Wesley Developer’s Press,

2007. ISBN 0-321-48091-0

The Unicode Consortium. The Unicode Standard, Version 6.0. Mountain View, CA: The Unicode Consortium,

2011. ISBN 978-1-936213-01-6 http://www.unicode.org/versions/Unicode6.0.0/

Arabic

ISO 233:1984, Documentation

−Transliteration of Arabic characters into Latin characters.

ISO/IEC 8859, Information technology

−8-bit single-byte coded graphic character sets Part 6: Latin/Arabic

alphabet (1999)

ISO 9036:1987, Information processing

−Arabic 7-bit coded character set for information interchange.

ASMO 449-1982 Arab Organization for Standardization and Metrology. Data processing

−7-bit coded character

set for information interchange.

Avestan

Geldner, Karl F. Avesta: The Sacred Books of the Parsis. Stuttgart: W. Kohlhammerm, 1880. Reprinted, with an

introduction in Persian by Dr. Jaleh Amouzgar. Tehran: Asatir, 2003. ISBN 964-331-126-0.

Hoffmann, Karl, and B. Forssman. Avestische Laut- und Flexionslehre. Innsbruck: Innsbrucker Beiträge zur

Sprachwissenschaft, 1996. ISBN 3851246527.

Oryan, Said. Pahlavi-Pazand Glossary: Farhang  \  Pahlavi. Tehran: Research Institute for Islamic Culture and Art,

1999 (1377 AP). (Language and Literature, 4). ISBN 964-471-414-8.

Reichelt, Hans. Avesta Reader: An Approach to the Zoroaster’s Gathas and New Avestan Texts. Translated and

annotated with Persian translation of hymns and texts by Jalil Doostkhah. Tehran: Qoqnoos Publishing, 2004 (1383 
AP). ISBN 964-311-473-2.

Balinese

Medra, Nengah. Pedoman Pasang Aksara Bali. Denpasar: Dinas Kebudayaan Propinsi Bali, 2003.

Menaka, Made. Kamus Kawi Bali / olih, made Menaka. Singaraja: Yayasan Kawi Sastra Mandala, 1990.

Simpen, I Wayan. Pasang Aksara Bali. Denpasar: Upada Sastra, 1992.

Bamum

Dugast, J., and M. D. W. Jeffreys. L’écriture des bamum: sa naissance, son évolution, sa valeur phonétique, son

utilisation. Mémoires de l’Institut Français d’Afrique Noire, Centre du Cameroun, 1950.

Nchare, Oumarou. The Writing of King Njoya: Genesis, Evolution, Use. Foumban: Palais des Rois Bamoun,

Maison de la Culture, [s.d.].

Schmitt, Alfred. Die Bamum-Schrift. Band I: Text. Wiesbaden: Harrassowitz, 1963.

Braille


118

X 0221

:2014 (ISO/IEC 10646:2012)

   

ISO 11548-1:2001. Communication aids for blind persons – identifiers, names and assignation to coded character

sets for 8-dot Braille characters – Part 1: General guidelines for Braille identifiers and shift marks.

Canadian Aboriginal Syllabics

Canadian Aboriginal Syllabic Encoding Committee. Repertoire of Unified Canadian Aboriginal Syllabics

Proposed for Inclusion into ISO/IEC 10646: International Standard Universal Multi-Octet Coded Character Set. 
[Canada]: CASEC [1994]

Carian

Adiego, Ignacio-Javier. The Carian Language. Leiden; Boston: Brill, 2007.

Melchert, H. Craig. “Carian.” In The Cambridge Encyclopedia of the World’s Ancient Languages, edited by Roger

Woodard, 609–613. Cambridge: Cambridge University Press, 2004. ISBN-13: 978-0521562560.

Cham

Aymonier, Étienne, and Antoine Cabaton. Dictionnaire Čam-Français. Paris, 1906.

Bùi Khánh Thế. Từ diên Chǎm-Việt: Inālang cam-biet đam. [Hồ Chí Minh]: Nhà xuất ban Khoa Học Xã Hội,

1995.

Kōno Rokurō, Chino Eiichi, and Nishida Tatsuo. The Sanseido Encyclopaedia of Linguistics. Volume 7: Scripts

and Writing Systems of the World [Gengogaku dai ziten (bekkan) sekai mozi ziten]. Tokyo: Sanseido Press, 2001. 
ISBN 4-385-15177-6.

注記 0A  これは,次の文献である。河野六郎・千野栄一・西田龍雄  世界文字辞典  東京  三省堂出

版  2001  言語学大辞典別巻  ISBN 4-385-15177-6。

Cherokee

Alexander, J. T. A Dictionary of the Cherokee Indian Language. [Sperry, Oklahoma?]: Published by the author,

1971.

Holmes, Ruth Bradley. Beginning Cherokee, by Ruth Bradley Holmes and Betty Sharp Smith. 2nd ed. Norman:

University of Oklahoma Press, 1977. ISBN 0-8061-1464-9.

New Echota Letters: Contributions of Samuel A. Worcester to the Cherokee Phoenix, edited by Jack Frederick

Kilpatrick and Anna Gritts Kilpatrick. Dallas: Southern Methodist University Press, [s.d.]. Includes reprint of an 
article by S. A. Worcester, which appeared in the Cherokee Phoenix, Feb. 21, 1828.

CJK Ideographs

GB2312-80 Code of Chinese Graphic Character Set for Information Interchange: Jishu Biaozhun Chubanshe

(Technical Standards Publishing).

GBK (Guo Biao Kuo) Han character internal code extension specification: Jishu Biaozhun Chubanshe (Technical

Standards Publishing, Beijing)

JIS X 0208:1990

情 報 交 換 用 漢 字 符 号  (Code of the Japanese Graphic Character Set for Information

Interchange).

JIS X 0212:1990

情報交換用漢字符号−補助漢字  (Code of the supplementary Japanese graphic character set

for information interchange).

JIS X 0213:2000 7

ビット及び 8 ビットの 2 バイト情報交換用符号化拡張漢字集合 (7-bit and 8-bit double

byte coded extended KANJI sets for information interchange), 2000-01-20.


119

X 0221

:2014 (ISO/IEC 10646:2012)

KS X 1001:2004 (formerly KS C 5601-1992) Korean Industrial Standards Association. Code for Information

Interchange (Hangeul and Hanja) (Jeongbo gyohwanyong buhogye).

ANSI Z39.64-1989 American National Standards Institute. East Asian character code for bibliographic use.

Mandarin Promotion Council, Ministry of Education, Taiwan. Shiangtu yuyan biauyin fuhau shoutse (The

Handbook of Taiwan Languages Phonetic Alphabet). 1999.

Shinmura, Izuru. Kojien – Dai 4-han. – Tokyo : Iwanami Shoten, Heisei 3[1991]

注記 0B  これは,次の文献である。新村出  広辞苑  第 4 版  東京  岩波書店  1991。

注記 CJK 統合漢字の原典については,箇条 23 を参照。

Coptic

Browne, Gerald M. Old Nubian Grammar. München: Lincom Europa, 2002. (Languages of the world: Materials,

330). ISBN 3-89586-893-0 (pbk.).

Kasser, Rodolphe. “La ‘Genève 1986’: une nouvelle série de caractères typographiques coptes, protocoptes et

vieux-coptes créée à Genève.” Bulletin de la Société d’égyptologie de Genève, 12 (1988): 59–60. ISSN 0255-6286.

Kasser, Rodolphe. “A standard system of Sigla for referring to the dialects of Coptic.” Journal of Coptic Studies, 1

(1990): 141–151. ISSN 1016-5584.

Cypriot

“Linear B and Cypriot”を参照。

Cyrillic

ISO/IEC 8859, Information technology

−8-bit single-byte coded graphic character sets Part 5: Latin/Cyrillic

alphabet (1999)

ISO 5427:1984, Extension of the Cyrillic alphabet coded character set for bibliographic information interchange.

ISO 10754:1984, Information and documentation – Extension of the Cyrillic alphabet coded character set for

non-Slavic languages for bibliographic information interchange.

Deseret

Encyclopedia of Mormonism, entry for “Deseret Alphabet.” New York: Macmillan, 1992. ISBN 0-02-904040-X.

Ivins, Stanley S. “The Deseret Alphabet” Utah Humanities Review 1 (1947): 223-39.

Monson, Samuel C. Representative American Phonetic Alphabets. New York: 1954. Ph.D. dissertation—Columbia

University.

Egyptian Hieroglyphic

Allen, James P. Middle Egyptian: An Introduction to the Language and Culture of Hieroglyphs. Cambridge:

Cambridge University Press, 1999. ISBN 0-521-77483-7.

Gardiner, Alan H. Catalogue of the Egyptian Hieroglyphic Printing Type, from Matrices Owned and Controlled by

Dr. Alan H. Gardiner, in Two Sizes, 18 Point, 12 Point with Intermediate Forms. Oxford: Oxford University Press, 
1928.

Gardiner, Alan H. “Additions to the New Hieroglyphic Fount (1928).” The Journal of Egyptian Archaeology, 15

(1929): 95. ISSN 0307 5133.


120

X 0221

:2014 (ISO/IEC 10646:2012)

   

Gardiner, Alan H. “Additions to the New Hieroglyphic Fount (1931).” The Journal of Egyptian Archaeology, 17

(1931): 245–247. ISSN 0307 5133.

Gardiner, Alan H. Supplement to the Catalogue of the Egyptian Hieroglyphic Printing Type, Showing Acquisitions

to December 1953. Oxford: Oxford University Press, 1953.

Gardiner, Alan H. Egyptian Grammar: Being an Introduction to the Study of Hieroglyphs. 3rd edition. London:

Oxford University Press, 1957. ISBN 0-900416-35-1.

Ethiopic

Armbruster, Carl Hubert. Initia Amharica: an Introduction to Spoken Amharic. Cambridge, Cambridge University

Press, 1908-20.

Launhardt, Johannes. Guide to Learning the Oromo (Galla) Language. Addis Ababa, Launhardt [1973?]

Leslau, Wolf. Amharic Textbook. Weisbaden, Harrassowitz; Berkeley, University of California Press, 1968.

Glagolitic

ISO 6861, Information and documentation

−Glagolitic alphabet coded character set for bibliographic information

interchange.

Glagolitica: zum Ursprung der slavischen Schriftkultur, herausgegeben von Heinz Miklas, unter der Mitarbeit von

Sylvia Richter und Velizar Sadovski. Wien: Verlag der Österreichischen Akademie der Wissenschaften, 2000. 
(Schriften der Balkan-Kommission, Philologische Abteilung, 41). ISBN 3-7001-2895-9.

Khaburgaev, Georgii Aleksandrovich. Staroslavianskii iazyk. Izd. 2-e, perer. i dop. Moskva: Prosveshchenie, 1986.

Žubrinic, Darko. Hrvatska glagoljica: biti pismen—biti svoj. Zagreb: Hrvatsko književno društvo sv. Jeronima (sv.

Cirila i Metoda): Element, 1996. ISBN 953-6111-35-7.

Gothic

Ebbinghaus, Ernst. “The Gothic Alphabet.” In The World’s Writing Systems, edited by Peter T. Daniels and

William Bright. New York: Oxford University Press, 1996. ISBN 0-19-507993-0.

Fairbanks, Sydney, and F. P. Magoun Jr. 1940. ‘On writing and printing Gothic’, in Speculum 15:313-16.

Greek

ISO 5428:1984, Greek alphabet coded character set for bibliographic information interchange.

ISO/IEC 8859, Information technology

−8-bit single-byte coded graphic character sets Part 7: Latin/Greek

alphabet (1999)

Greek Editorial Marks

Austin, Colin. Comicorum Graecorum Fragmenta in Papyris Reperta, ed. Colinus Austin. Berolini [Berlin], Novi

Eboraci [New York]: de Gruyter, 1973, p. 29. ISBN 3110024012.

Homer. Iliad. Homeri Ilias, edidit Thomas W. Allen. 3 vols. Oxonii [Oxford]: e typographeo Clarendoniano

[Clarendon Press], 1931, vol. 2: pp. 39, 234.

The Oxyrhynchus Papyri, Part XV, edited with translations and notes by Bernard P. Grenfell and Arthur S. Hunt.

London: Egypt Exploration Society, 1921, p. 56. (Egypt Exploration Society, Graeco-Roman Memoirs, 18).

Hebrew


121

X 0221

:2014 (ISO/IEC 10646:2012)

ISO/IEC 8859, Information technology

−8-bit single-byte coded graphic character sets Part 8: Latin/Hebrew

alphabet (1999)

ISO 8957:1996, Information and documentation

−Hebrew alphabet coded character sets for bibliographic

information interchange.

SI 1311.1 – 1996: Standards Institution of Israel. Information technology. ISO 8 bit coded character set with

Hebrew points.

SI 1311.2 – 1996, The Standards Institution of Israel. Information Technology. ISO 8-bit coded character set for

information interchange with Hebrew points and cantillation marks.

Imperial Aramaic

Driver, G. R. Semitic Writing from Pictograph to Alphabet. 3rd ed. by S. A. Hopkins. London: Oxford University

Press for the British Academy, 1976. ISBN 9780197259177.

Lidzbarski, Mark. Handbuch der nordsemitischen Epigraphik nebst ausgewählten Inschriften. Hildesheim: Georg

Olms Verlagsbuchhandlung, 1962. Reprint of 1898 edition.

Naveh, Joseph. Early History of the Alphabet: An Introduction to West Semitic Epigraphy and Palaeography.

Jerusalem: Magnes Press, the Hebrew University, 1987. ISBN 965-223-436-2.

Porten, Bezalel, and Ada Yardeni. Textbook of Aramaic Documents from Ancient Egypt. 4 vols. Jerusalem:

Hebrew University, 1986–1999. ISBN 9652220752 (v. 1), 9653500031 (v. 2), 9653500147 (v. 3), 9653500899 (v. 4).

Rosenthal, Franz. A Grammar of Biblical Aramaic. 7th rev. ed. Wiesbaden: Harrassowitz, 2006. ISBN

3-447-05251-1.

Inscriptional Parthian and Inscriptional Pahlavi

Akbarzādeh, Dāriyūš. Katibe-hā-ye Pahlavi-ye Aškāni (Pārti) = Parthian Inscriptions. Vol. 2. Tehran: Pazineh

Press, 2002 (1381 AP). ISBN 964-5722-74-8.

Akbarzādeh, Dāriyūš. Katibe-hā-ye Pahlavi: sang-negāre, sekke, mohr, asar-e mohr, zarfnebešte = Pahlavi

Inscriptions: Inscriptions, Coins, Seals, Sealing Impression. Vol. I. Tehran: Pazineh Press, 2003 (1382 AP). ISBN 
964-5722-44-6.

Nyberg, Henrik Samuel. A Manual of Pahlavi. 2 vols. Wiesbaden: Harrassowitz, 1964–1974. ISBN

9783447015806 (vol. 2). Reprinted: Tehran: Asatir, 2003. ISBN 964-331-132-5, 964-331-131-7.

Oryan, Saeed. Rahnmā-ye katibe-hā-ye Irāni-ye miyāne Pahlavi-Pārti = Manual of Middle Iranian Inscriptions

(Parthian-Pahlavi). Tehran: Iranian Cultural Heritage Organization, 2003 (1382 AP). ISBN 964-7483-71-6.

Rezai Baghbidi, Hassan. Dastur-e Zabān-e Pārti (Pahlavi-e Aškāni) = A Grammar of Parthian (Arsacid Pahlavi).

Iranian Academy of Persian Language and Literature, 2002 (1381 AP). ISBN 964-7531-05-2.

Indian scripts

IS 13194:1991 Bureau of Indian Standards Indian script code for information interchange

−ISCII

LTD 37(1610)-1988 Indian standard code for information interchange.

International Phonetic Alphabet

Esling, John. Computer coding of the IPA: supplementary report. Journal of the International Phonetic Association,

20:1 (1990), p. 22-26.

International Phonetic Association. The IPA 1989 Kiel Convention Workgroup 9 report: Computer Coding of IPA

Symbols and Computer Representation of Individual Languages. Journal of the International Phon. Assoc., 19:2


122

X 0221

:2014 (ISO/IEC 10646:2012)

   

(1989), p. 81-82.

International Phonetic Association. Handbook of the International Phonetic Association: A Guide to the Use of the

International Phonetic Alphabet. Cambridge: Cambridge University Press, 1999. ISBN 0-521-65236-7; 
0-521-63751-1 (pbk.).

International Phonetic Association. http://www2.arts.gla.ac.uk/IPA/ipa.html.

Journal of the International Phonetic Association, 24:2 (1994), 95–98, and 25:1 (1995), 21.

Pullum, Geoffrey K. Remarks on the 1989 revision of the International Phonetic Alphabet. Journal of the

International Phonetic Association, 20:1 (1990), p. 33-40.

Pullum, Geoffrey K., and William A. Ladusaw. Phonetic Symbol Guide. 2nd ed. Chicago: University of Chicago

Press, 1996. ISBN 0-226-68535-7; 0-226-68536-5 (pbk.).

Wells, John Christopher. Accents of English. Cambridge, New York: Cambridge University Press, 1982. Vol. 1:

Introduction. ISBN 0-521-22919-7; ISBN 0-521-29719-2 (pbk.); vol. 2: The British Isles. ISBN 0-521-24224-X, 
ISBN 0-521-28540-2 (pbk.); vol. 3: Beyond the British Isles. ISBN 0-521- 24225-8, ISBN 0-521-28541-0 (pbk.).

Javanese

Bohatta, Hanns. Praktische Grammatik der javanischen Sprache, mit Lesestücken, einem javanisch-deutschen und

deutsch-javanischen Wörterbuch. Wien, Pest, Leipzig: Hartleben, [1892]. (Kunst der Polyglottie, 39).

Rochadi GK, R. H., and R. L. Sadeli Erawan BK. Cacarakan aksara Sunda. Bandung: Harisma, 1984.

Roorda, T. Javaansche grammatica, benevens een leesboek tot oefening in de javaansche taal. Amsterdam:

Johannes Müller, 1855.

Walbeehm, A. H. J. G. Javaansche spraakkunst: schrift, uitspraak, taalsoorten en woordafleiding. Leiden: E. J. Brill,

1905.

Kaithi

Bihar High Court of Judicature. Selection of Hindusthani Documents from the Courts of Bihar, compiled by S. K.

Das. Patna, Bihar: Superintendent, Government Printing, 1939.

Grierson, George A. A Handbook to the Kaithi Character. 2nd rev. ed. Calcutta: Thacker, Spink & Co., 1899.

Revised edition of A Kaithi Handbook, 1881.

King, Christopher R. One Language, Two Scripts: The Hindi Movement in Nineteenth Century North India.

Bombay: Oxford University Press, 1994.

Kayah Li

Bennett, J. Fraser. Kayah Li Script: A Brief Description. Urbana-Champaign: University of Illinois, 1993.

Karenni Literature Department. Ka

1

ya

3

lhi

1

-Ku

3

la

3

 Nghôchozha

3

: The Modern Western Kayah Li-English Lexicon.

[Chiang Mai]: Payap University, 1994. [without tones = Kayalhi-Kula Nghôchozha]

Solnit, David B. Eastern Kayah Li: Grammar, Texts, Glossary. Honolulu: University of Hawai‘i Press, 1997. ISBN

0-8248-1743-5.

Kharoshthi

Glass, Andrew. A Preliminary Study of Kharosthi Manuscript Paleography. 2000. Thesis (M.A.), University of

Washington, 2000.


123

X 0221

:2014 (ISO/IEC 10646:2012)

Glass, Andrew. “KharoDEhG Manuscripts: A Window on GandhFran Buddhism.” Nagoya Studies in Indian

Culture and Buddhism, 24 (2004): 129–152. ISSN 0285-7154.

Salomon, Richard. Ancient Buddhist Scrolls from GandhZra: The British Library Kharosthi Fragments. Seattle:

University of Washington Press; London: British Library, 1999. ISBN 029597768X; 0295977698 (pbk).

Latin

ISO/IEC 646:1991, Information technology

−ISO 7-bit coded character set for information interchange.

ISO 5426:1983, Extension of the Latin alphabet coded character set for bibliographic information interchange.

ISO 6438:1983, Documentation

−African coded character set for bibliographic information interchange.

ISO 6937:1994, Information technology

−Coded graphic character set for text communication−Latin alphabet.

ISO/IEC 8859, Information technology

−8-bit single-byte coded graphic character sets

Part 1: Latin alphabet No. 1 (1998).

Part 2: Latin alphabet No. 2 (1999).

Part 3: Latin alphabet No. 3 (1999).

Part 4: Latin alphabet No. 4 (1998).

Part 9: Latin alphabet No. 5 (1999)

Part 10: Latin alphabet No. 6 (1998).

ISO/IEC 10367:1991, Information technology

−Standardized coded graphic character sets for use in 8-bit codes.

ANSI X3.4-1986 American National Standards Institute. Coded character set

−7-bit American national standard

code.

ANSI Z39.47-1985 American National Standards Institute. Extended Latin alphabet coded character set for

bibliographic use.

LVS 18-92 Latvian National Centre for Standardization and Metrology Libiesu kodu tabula ar 191 simbolu.

Kuruch, Rimma Dmitrievna. Saamsko-russkiy slovar'. Moskva: Russkiy iazyk. 1985

Lepcha

Mainwaring, G. B. A Grammar of the Rong (Lepcha) Language as it Exists in the Dorjeling and Sikim Hills.

Delhi: Daya Publishing House, 1985 (1876).

Plaisier, H. “A Brief Introduction to Lepcha Orthography and Literature.” Bulletin of Tibetology 41:1 (2005),

7–24.

Plaisier H. A Grammar of Lepcha. Leiden: Brill, 2007. (Brill’s Tibetan Studies Library, Languages of the Greater

Himalayan Region 5).

Limbu

Bairagi Kaila, ed. Limbu-Nepali-Angreji śabdakoś. [Limbu-Nepali-English Dictionary.] Kathmandu: Royal Nepal


124

X 0221

:2014 (ISO/IEC 10646:2012)

   

Academy, [in press.]

Cemjonga, Imana Simha. Yakthun-Pene-Mikphula Pancheka. = Limbu-Nepali-Angareji śabdakoś. =

Limbu-Nepali-English Dictionary. [Lekhaka] Imanasimha Cemajon. [Kathamandu]: Nepala Ekedemi [2018 vi., i.e., 
1962]

Driem, George van. A Grammar of Limbu. Berlin, New York: Mouton de Gruyter, 1987. (Mouton grammar library,

4.) ISBN 0-89925-345-8. Appendix: Anthology of Kiranti scripts, pp. 550–558.

Shafer, Robert. Introduction to Sino-Tibetan. Wiesbaden: Harrassowitz, 1966–1974.

Sprigg, R. K. “Limbu Books in the Kiranti Script.” In International Congress of Orientalists (24th: 1957: Munich).

Akten des Vierundzwanzigsten Internationalen Orientalisten-Kongresses München 28. August bis 4. September 1957, 
hrsg. von Herbert Franke. Wiesbaden: Deutsche Morgenländische Gesellschaft, in Kommission bei Franz Steiner 
Verlag, 1959.

Sprigg, R. K. [Review of van Driem (1987)]. Bulletin of the School of Oriental and African Studies, University of

London, 52 (1989):1.163–165.

Subba, B. B. Limbu, Nepali, English Dictionary. Gangtok: Text Book Unit, Directorate of Education, Govt. of

Sikkim, 1979 [i.e. 1980]. Cover title: Yakthun-Pene-Mikphula-panchekva.

Subba, B. B. Yakthuŋ huɁsiŋlam (“Limbu self-teaching method”) = Limbu akṣar gāiḍ (“Limbu letter guide”).

Gangtok: Kwality Stores, 1991?

Yoṅhāṅ, Khel Rāj. Limbū Nepālī śabdakoś. [Lalitpur]: 2052 B.S. [i.e. 1995].

Linear B and Cypriot

Bennett, Emmett L. “Aegean Scripts.” In The World’s Writing Systems, edited by Peter T. Daniels and William

Bright. New York: Oxford University Press, 1996. ISBN 0-19-507993-0.

Chadwick, John. The Decipherment of Linear B. 2nd ed. London: Cambridge University Press., 1967 [i.e. 1968].

Chadwick, John. Linear B and Related Scripts. Berkeley: University of California Press; [London]: British

Museum, 1987. (Reading the Past, v. 1.) ISBN 0-520-06019-9.

Hooker, J. T. Linear B: An Introduction. Bristol: Bristol Classical Press, 1980. ISBN 0-906515-69-6. Cor-rected

printing published 1983. ISBN 0-906515-69-6; 0-906515-62-9 (pbk.).

International Colloquium on Mycenaean Studies (3rd: 1961: Racine, WI). Mycenaean Studies: Proceedings of the

Third International Colloquium for Mycenaean Studies held at “Wingspread,” 4–8 September 1961, edited by 
Emmett L. Bennett, Jr. Madison: University of Wisconsin Press, 1964.

Masson, Olivier. Les Inscriptions chypriotes syllabiques: recueil critique et commenté. Réimpr. augm. Paris: E. de

Boccard, 1983.

Sampson, Geoffrey. Writing Systems: A Linguistic Introduction. Stanford, CA: Stanford University Press, 1985.

ISBN 0-8047-1254-9. Also published: London, Hutchinson. ISBN 0-09-156980-X; 0-09-173051-1 (pbk.).

Ventris, Michael. Documents in Mycenaean Greek. 1st ed. by Michael Ventris and John Chadwick with a foreword

by Alan J. B. Wace. 2nd ed. by John Chadwick. Cambridge: Cambridge University Press, 1973. ISBN 
0-521-08558-6.

Lisu

Bya, Yuliya. Li-su Tho Uh Ba Pa Pha Tso So Du (Lisu Alphabet Primer). Chiang Mai: Christian Literature

Fellowship, 2000.

Xu, Lin, Yuzhang Mu, and Xingzhi Gai, eds. Lisuyu Jianzhi (A Sketch of the Lisu Language). Beijing: The Ethnic


125

X 0221

:2014 (ISO/IEC 10646:2012)

Publishing House, 1986. (Chinese Minority Language Sketch Series.)

Yunnan Minority Language Commission, and Weixi Culture and Education Bureau, eds. Li-su Tho Uh Tso So Du

(Lisu Primer). Kunming: Yunnan Nationality Publishing House, 1981.

Zhu, Faqing. Li-su Be Xuh Ngo Bae Khuh Tae Du Ra (Small Lisu-Chinese Dictionary). Dehong: Dehong

Nationality Publishing House, 1984.

Lycian

Carruba, O. “La scrittura licia.” Annali della scuola normale superiore di Pisa, classe di letter e filosofia. 3rd series.

8 (1978):849–867.

Melchert, H. Craig. “Lycian.” In The Cambridge Encyclopedia of the World’s Ancient Languages, edited by Roger

Woodard, 591–600. Cambridge: Cambridge University Press, 2004. ISBN-13: 978-0521562560.

Lydian

Gérard, Raphaël. Phonétique et morphologie de la langue lydienne. Louvain-la-Neuve: Peeters, 2005.

Gusmani, Roberto. Lydisches Wörterbuch mit grammatischer Skizze und Inschriftensammlung. Heidelberg: Carl

Winter, 1964.

Melchert, H. Craig. “Lydian.” In The Cambridge Encyclopedia of the World’s Ancient Languages, edited by Roger

Woodard, 601–608. Cambridge: Cambridge University Press, 2004. ISBN-13: 978-0521562560.

Mandaic

Daniels, “Aramaic Scripts for Aramaic Languages,” in Daniels & Bright, eds., The World’s Writing Systems,

Oxford University Press, 1996, pp. 511-513 “Mandaic.”

Häberl, “Iranian Scripts for Aramaic Languages: The Origin of the Mandaic Script,” Bulletin of the American

Schools of Oriental Research, No. 341 (Feb., 2006), pp. 53-62.

Coulmas, The Blackwell Encyclopedia of Writing Systems, Blackwell 1999, p. 320 “Mandean script.”

Mathematical Symbols

ISO 6862, Information and documentation

−Mathematical coded character set for bibliographic information

interchange.

ANSI Y10.20-1988 American National Standards Institute. Mathematic signs and symbols for use in physical

sciences and technology.

Mathematical Markup Language (MathML) Version 2.0. (W3C Recommendation 21 February 2001). Editors:

David Carlisle, Patrick Ion, Robert Miner, [and] Nico Poppolier. Latest version: http://www.w3.org/TR/MathML2/

Selby, Samuel M. Standard mathematical tables. – 16th ed. – Cleveland, OH : Chemical Rubber Co., 1968.

Shepherd, Walter.

STIPub Consortium. STIX (Scientific and Technical Information Exchange) Project. http://www.ams.org/STIX/

Swanson, Ellen. Mathematics into Type. Updated ed. by Arlene O’Sean and Antoinette Schleyer. Providence, RI:

American Mathematical Society, 1999. ISBN 0-8218-1961-5.

Meetei Mayek

Chelliah, Shobhana L. A Grammar of Meithei. Berlin and New York: Mouton de Gruyter, 1997. ISBN

978-3-11-014321-8.


126

X 0221

:2014 (ISO/IEC 10646:2012)

   

Debendra Singh, N. Evolution of Manipuri Script. [Imphal]: Manipur University, Centre for Manipuri Studies,

1990. (Research Report, 5).

Musical Symbols

ELOT 1373. The Greek Byzantine Musical Notation System. Athens, 1997 (ΣΕΠ ΕΛΟΤ 1373: 1997).

Catholic Church. Graduale Sacrosanctae Romanae Ecclesiae de Tempore et de Sanctis SS. D. N. Pii X. Pontificis

Maximi. Parisiis: Desclée, 1961. (Graduale Romanum, no. 696.)

Gazimihal, Mahmut R. Anadolu türküleri ve mûsikî istikbâlimiz [by] Mahmut Ragip. [Istanbul]: Mârifet Matbaasi,

1928.

Heussenstamm, George. Norton Manual of Music Notation. New York: W.W. Norton, 1987. ISBN 0-393-95526-5

(pbk.).

Kennedy, Michael. Oxford Dictionary of Music. Oxford, New York: Oxford University Press, 1985. ISBN

0-19-311333-3. Second ed. published 1994. ISBN 0-19-869162-9.

New Encyclopedia Britannica. 15th ed. Entry for “Music.”

The New Harvard Dictionary of Music, edited by Don Michael Randel. Cambridge, MA: Belknap Press of

Harvard University Press, 1986. ISBN 0-674-61525-5.

Ottman, Robert W. Elementary Harmony: Theory and Practice. 2nd ed. Englewood Cliffs, NJ: Prentice-Hall, 1970.

ISBN 0-13-257451-9. Fifth ed. published 1998. ISBN 0-13-281610-5.

Rastall, Richard. The Notation of Western Music: An Introduction. London: Dent, 1983. ISBN 0-460-04205-X.

Also published: New York: St. Martin’s Press, 1982. ISBN 0-312-57963-2.

Read, Gardner. Music Notation: A Manual of Modern Practice. Boston: Allyn and Bacon, 1964.

Stone, Kurt. Music Notation in the Twentieth Century: A Practical Guidebook. New York: W.W. Norton, 1980.

ISBN 0-393-95053-0.

Understanding Music with AI: Perspectives on Music Cognition, edited by Mira Balaban, Kemal Ebcioglu, and

Otto Laske. Cambridge, MA: MIT Press; Menlo Park, CA: AAAI Press, 1992. ISBN 0-262-52170-9.

Myanmar

Mranmā–Aṅglip abhidhān = Myanmar–English Dictionary. Rankun: Dept. of Myanmar Language Commission,

Ministry of Education, Union of Myanmar, 1993. Compiled and edited by the Myanmar Language Commission.

Mranmā  cālui:poṅg:satpui kyam: nhaṅ. khwaithā:. [Rankun]: 1996. Translated title: Myanmar orthography

treatise.

Okell, John. 1971. A guide to the romanization of Burmese. (James G. Forlang Fund; 27) London: Royal Asiatic

Society of Great Britain and Ireland.

Roop, D. Haigh. An Introduction to the Burmese Writing System. [Honolulu]: Center for Southeast Asian Studies,

University of Hawaii at Manoa, 1997. (Southeast Asia Paper, 11). Originally published: New Haven: Yale University 
Press, 1972. (Yale linguistic series). ISBN 0-300-01528-3.

N'Ko

Kanté, Souleymane. Méthode pratique d’écriture n’ko, 1961. Kankan, Guinea: Association de traditherapeutes et

pharmacologues, 1995.

N’Ko: The Common Language of Mandens. www.nkoinstitute.com


127

X 0221

:2014 (ISO/IEC 10646:2012)

N’Ko: The Mandingo Language Site. www.kanjamadi.com

Ogham

I. S. 434:1999, Information Technology

− 8-bit single-byte graphic coded character set for Ogham =

Teicneolaíocht Eolais−Tacar carachtar grafach Oghaim códaithe go haonbheartach le 8 ngiotán. National Standards 
Authority of Ireland.

McManus, Damian. A Guide to Ogam. Maynooth: An Sagart, 1991. (Maynooth monographs, 4). ISBN

1-87068-417-6.

Ol Chiki

Hembram, S. M., et al. Adibasi Ol script = at’ip’asi al ciki. Calcutta: Adibasi Socio-Educational & Cultural

Association, 1972.

Murmu, Raghunath. Ranaṛ: A Santali Grammar in Santali. Singhbhum, Bihar: Adibasi Socio-Educational &

Cultural Association, 1972.

Zide, Norman. “Scripts for Munda languages.” In The World’s Writing Systems, edited by Peter T. Daniels and

William Bright. New York; Oxford: Oxford University Press, 1996. ISBN 0-19-507993-0.

Old Italic

Bonfante, Larissa. “The Scripts of Italy.” In The World’s Writing Systems, edited by Peter T. Daniels and William

Bright. New York: Oxford University Press, 1996. ISBN 0-19-507993-0.

Cristofani, Mauro. “L’alfabeto etrusco.” In Lingue e dialetti dell’Italia antica, a cura di Aldo Larosdocimi. Roma:

Biblioteca di storia patria, a cura dell’ Ente per la diffusione e l’educazione storia, 1978. (Popoli e civiltà dell’Italia 
antica, VI.)

Gordon, Arthur E. Illustrated Introduction to Latin Epigraphy. Berkeley: University of California Press, 1983.

ISBN 0-520-03898-3.

Marinetti, Anna. Le iscrizione sudpicene. I. Testi. Firenze: Olschki, 1985. ISBN 88-222-3331-X (v. 1).

Parlangèli, Oronzo. Studi Messapici. Milano: Istituto lombardo di scienze e lettere, 1960.

Old Persian

Schmitt, Rüdiger. The Bisitun Inscriptions of Darius the Great, Old Persian Text. London, School of Oriental and

African Studies, 1991 (Corpus Inscriptionum Iranicarum, Part I: Inscriptions of ancient Iran, v.1, Text 1). ISBN 
0-7286-0181-8.

Schweiger, Günter. Kritische Neuedition der achaemenidischen Keilinschriften. Taimering: Schweiger

VWT-Verlag, 1998. (Studien zur Iranistik). ISBN 3-934548-00-8.

Old South Arabian

Nebes, Norbert, and Peter Stein. “Ancient South Arabian.” In The Cambridge Encyclopedia of the World’s

Ancient Languages, edited by Roger D. Woodard. 454–487. Cambridge University Press, 2004. ISBN-13: 
978-0521562560.

Ryckmans, J. “Origin and Evolution of South Arabian Minuscule Writing on Wood (1).” Arabian Archaeology and

Epigraphy 12 (2001): 223–235. ISSN 0905-7196.

Smithsonian Institution. “Written in Stone: Inscriptions from the National Museum of Saudi Arabic.”

http://www.mnh.si.edu/epigraphy/figs-stones/x-large/color_xl_jpeg/fig02.jpg


128

X 0221

:2014 (ISO/IEC 10646:2012)

   

Stein, Peter. “The Ancient South Arabian Minuscule Inscriptions on Wood: A New Genre of Pre-Islamic

Epigraphy.” Jaarbericht van het Vooraziatisch-Egyptisch Genootschap “Ex Oriente Lux”, 39 (2005): 181–199. ISSN 
0075-2118.

Old Turkic

Erdal, Marcel. A Grammar of Old Turkic. Leiden & Boston: Brill, 2004. ISBN 9004102949.

Scharlipp, Wolfgang Ekkehard. Eski Türk run yazitlarina giri!: ders kitabi = An Introduction to the Old Turkish

Runic Inscriptions: A Textbook in English and Turkish. Engelschoff: Auf dem Ruffel, 2000. ISBN 3-933847-00-X.

von Gabain, A. Alttürkische Grammatik mit Bibliographie, Lesestücken und Wörterverzeichnis, auch Neutürkisch.

Leipzig: Harrassowitz, 1941. (Porta Linguarum Orientalium, 23).

Osmanya

Afkeenna iyo fartiisa: buug koowaad. Xamar: Goosanka afka iyo suugaanta Soomaalida, 1971. Translated title:

Our language and its handwriting: book one.

Cerulli, Enrico. “Tentativo indigeno di formare un alfabeta somalo.” Oriente moderno, 12 (1932): 212–213. ISSN

0030-5472.

Gaur, Albertine. A History of Writing. London: British Library, 1992. ISBN 0-7123-0270-0. Also published: Rev.

ed. New York: Cross River Press, 1992. ISBN 1-558-59358-6.

Gregersen, Edgar A. Language in Africa: An Introductory Survey. New York: Gordon and Breach, 1977. (Library

of Anthropology). ISBN: 0-677-04380-5; 0-677-04385-6 (pbk.).

Maino, Mario. “L’alfabeta ‘Osmania’ in Somalia.” Rassegna di studi etiopici, 10 (1951): 108–121. ISSN

0390-3699.

Nakanishi, Akira. Writing Systems of the World: Alphabets, Syllabaries, Pictograms. Rutland, VT: Tuttle, 1980.

ISBN 0-8048-1293-4; 0-8048-1654-9 (pbk.). Revised translation of Sekai no moji.

Phags-pa

Luo, Changpei. Basibazi yu Yuandai Hanyu [ziliao huibian] / Luo Changpei, Cai Meibiao bian zhu. Beijing:

Kexue chubanshe, 1959.

Poppe, Nikolai Nikolaevich. The Mongolian Monuments in hP’ags-pa Script. Translated and edited by John R.

Krueger. 2nd ed. Wiesbaden: Harrassowitz, 1957. (Göttinger asiatische Forschungen, 8).

Zhaonasitu. Menggu ziyun jiaoben / Zhaonasitu, Yang Naisi bian zhu. [Beijing]: Min zu chu ban she, 1987. Author

Zhaonasitu also known as Jagunasutu or Junast.

Philippines Scripts

Doctrina Christiana: The First Book Printed in the Philippines, Manila 1593. A facsimile of the copy in the

Lessing J. Rosenwald Collection, with an introductory essay by Edwin Wolf II. Washington, DC: Library of 
Congress, 1947.

Kuipers, Joel C., and Ray McDermott. “Insular Southeast Asian Scripts.” In The World’s Writing Systems. Edited

by Peter T. Daniels and William Bright. New York: Oxford University Press, 1996. ISBN 0-19-507993-0.

Santos, Hector. The Living Scripts. Los Angeles: Sushi Dog Graphics, 1995. (Ancient Philippine scripts series, 2).

User’s guide accompanying Computer Fonts, Living Scripts software.

Santos, Hector. Our Living Scripts. January 31, 1997. http://www.bibingka.com/dahon/living/living.htm Part of

his A Philippine Leaf.


129

X 0221

:2014 (ISO/IEC 10646:2012)

Santos, Hector. The Tagalog Script. Los Angeles: Sushi Dog Graphics, 1994. (Ancient Philippine scripts series, 1).

User’s guide accompanying Tagalog Script Fonts software.

Santos, Hector. The Tagalog Script. October 26, 1996. http://www.bibingka.com/dahon/tagalog/tagalog.htm Part

of his A Philippine Leaf.

Phoenician

Branden, Albertus van den. Grammaire phénicienne. Beyrouth: Librairie du Liban, 1969. (Bibliothèque de

l’Université Saint-Esprit, 2).

McCarter, P. Kyle. The Antiquity of the Greek Alphabet and the Early Phoenician Scripts. Missoula, MT:

Published by Scholars Press for Harvard Semitic Museum, 1975. (Harvard Semitic Monographs; 9.) ISBN 
0-89130-066-X.

Noldeke, Theodor. Beiträge zur semitischen Sprachwissenschaft. Strassburg: Karl J. Trübner, 1904. Reprinted as:

vol. 1 of Beiträge und Neue Beiträge zur semitischen Sprachwissenschaft: achtzehn Aufsätze und Studien. 
Amsterdam: APA-Philo Press, [1982]. Also published on microfiche by the American Theological Library 
Association.

Powell, Barry B. Homer and the Origin of the Greek Alphabet. Cambridge, New York: Cambridge University

Press, 1991. ISBN 0-521-37157-0. Reprinted, 1996. ISBN 0-521-58907-X (pbk).

Rejang

Jaspan, M. A. Folk Literature of South Sumatra: Redjang Ka-Ga-Nga Texts. Canberra: Australian National

University, 1964.

Runic

Benneth, Solbritt, Jonas Ferenius, Helmer Gustavson, & Marit Åhlén. 1994. Runmärkt: från brev till klotter.

Runorna under medeltiden. [Stockholm]: Carlsson Bokförlag. ISBN 91-7798-877-9

Derolez, René. 1954. Runica manuscripta: the English tradition. (Rijksuniversiteit te Gent: Werken uitgegeven

door de Faculteit van de Wijsbegeerte en Letteren; 118e aflevering) Brugge: De Tempel.

Friesen, Otto von. Runorna. Stockholm, A. Bonnier [1933]. (Nordisk kultur, 6).

Haugen, Einar Ingvald. The Scandinavian Languages: An Introduction to Their History. London: Faber, 1976.

ISBN 0-571-10423-1. Also published: Cambridge, MA: Harvard University Press, 1976. ISBN 0-674-79002-2.

Musset, Lucien. Introduction à la runologie. Paris: Aubier-Montaigne, 1965.

Page, Raymond Ian. Runes. Berkeley: University of California Press; [London]: British Museum, 1987. (Reading

the Past). ISBN 0-520-06114-4. British Museum Publications edition has ISBN 0-7141-8065-3.

Samaritan

Ben-Hayyam, Ze’ev. A Grammar of Samaritan Hebrew, Based on the Recitation of the Law in Comparison with

the Tiberian and other Jewish Traditions. Jerusalem: Hebrew University Magnes Press, 2000. ISBN 1-57506-047-7.

Macuch, Rudolf. Grammatik des samaritanischan Hebräisch. Berlin: Walter de Gruyter, 1969. ISBN

9783110083767.

Murtonen, A. Materials for a Non-Masoretic Hebrew Grammar III: A Grammar of the Samaritan Dialect of

Hebrew. Helsinki: Societas Orientalis Fennica, 1964. (Studia Orientalia, 29).

Saurashtra


130

X 0221

:2014 (ISO/IEC 10646:2012)

   

Norihiko Učida. Language of the Saurashtrans in Tirupati. 2nd revised ed. Bangalore: Mahalaxmi Enterprises,

1991. (In Latin script.)

Norihiko Učida. Saurashtra-English Dictionary. Wiesbaden: Harrassowitz, 1990. ISBN 3447030550. (In Latin

script.)

Shavian

ConScript Unicode Registry [by] John Cowan and Michael Everson. “E700–E72F Shavian.” Included in the

ConScript Registry (http://www.evertype.com/standards/csur/index.html) in 1997. Shavian was withdrawn from the 
ConScript Registry in 2001, because of its addition to the Unicode Standard and ISO/IEC 10646.

Crystal, David. The Cambridge Encyclopedia of Language. Cambridge, New York: Cambridge University Press,

1987. ISBN 0-521-26438-3. 2nd ed. Cambridge, New York: Cambridge University Press, 1997. ISBN 
0-521-55050-5; 0-521-55967-7.

DeMeyere, Ross. About Shavian. 1997. http://www.demeyere.com/Shavian/info.html.

Shaw, George Bernard. Androcles and the Lion: An Old Fable Renovated, by Bernard Shaw, with a Parallel Text

in Shaw’s Alphabet to Be Read in Conjunction Showing Its Economies in Writing and Reading. Harmondsworth: 
Penguin Books, 1962.

Sinhala

SLS 1134:1996 Sri Lanka Standards Institution Sinhala character code for information interchange.

Gunasekara, Abraham Mendis. A comprehensive grammar of the Sinhalese language. New Delhi: Asian

Educational Services, 1986(Reprint of 1891 edition).

Sundanese

Baidillah, Idin, Cucu Komara, and Deuis Fitni. Ngalagena: Panglengkep Pangajaran Aksara Sunda pikeun Murid

Sakola Dasar/Dikdas 9 Taun. [Bandung]: CV Walatra, [2002].

Hardjasaputra, A. Sobana, Tedi Permadi, Undang A. Darsa, and Edi S. Ekadjati. Rancangan Pembakuan Aksara

Sunda. Bandung, 1998.

Symbols (Miscellaneous)

ISO 2033:1983, Information processing

−Coding of machine readable characters (MICR and OCR).

ISO 2047:1975, Information processing

−Graphical representations for the control characters of the 7-bit coded

character set.

ISO/IEC 9995-7:1994, Information technology – Keyboard layouts for text and office systems – Part 7: Symbols

used to represent functions.

ANSI X3.32-1973 American National Standards Institute. American national standard graphic representation of

the control characters of American national standard code for information interchange.

ANSI Y14.5M-1982 American National Standard. Engineering drawings and related document practices,

dimensioning and tolerances.

Syriac

Kefarnissy, Paul. Grammaire de la langue araméenne syriaque. Beyrouth, 1962.

Nöldeke, Theodor. Compendious Syriac Grammar. With a table of characters by Julius Euting. Translated from the

2nd and improved German ed., by James A. Crichton. London: Williams & Norgate, 1904. Reprinted: Tel Aviv: Zion


131

X 0221

:2014 (ISO/IEC 10646:2012)

Pub. Co. [1970].

Robinson, Theodore Henry. Paradigms and Exercises in Syriac Grammar. 4th ed. Rev. by L. H. Brockington.

Oxford: Clarendon Press; New York: Oxford University Press, 1962. ISBN 0-19-815416-X, 0-19-815458-5 (pbk.).

Tai Le

Coulmas, Florian. The Blackwell Encyclopedia of Writing Systems. Oxford, Cambridge: Blackwell, 1996. ISBN

0-631-19446-0. Dehong writing, pp. 118–119.

Lá ai

2

 maɯ

3

 lá ai

2

 ka va

3

 mi

2

 tse

2

 laɯ ya pa me na

4

 ka na: tá va ʔá na kó ma

6

 sá na

2

 teh ma

6

. Yina

5

lána

5

 mina

5

su

4

su

4

pána

2

se

3

 (Yunnan minzu chubanshe). 1988. ISBN 7-5367-1100-4.

Tsa va

4

 má

3

 hó va

3

: la ta

6

 mé

2

 sá ai

3

 seh va

2

 xo ŋa

3

. Yina

5

lána

5

 mina

5

su

4

 su

4

pána

2

se

3

 (Yunnan minzu chubanshe).

1997. ISBN 7-5367-1455-6.

Tai Tham

Peltier, Anatole-Roger. 1996. Lanna Reader. Chiang Mai: Wat Tha Kradas.

Kasēm Siriratphiriya, and Mahāwitthayālai Sukhōthaithammāthirāt. Tūa Mueang: kānrīan phāsā  Lānnā phān

khrōngsāng kham. Nonthaburī: Rōngphim Mahāwitthayālai Sukhōthaithammāthirāt, 2548 [2005]. ISBN 
974-9942-00-0.

Rungrueangsri, Udom. 2004. Pacanānukrom Lānnā-Thai: Chabaph maefāhluang. ISBN 974-685-175-9.

Baephryar phāsā Lānnā. ISBN 974-386-044-4.

Thaana

Geiger, Wilhelm. Maldivian Linguistic Studies. New Delhi: Asian Educational Services, 1996. ISBN

81-206-1201-9. Originally published: Colombo: H. C. Cottle, Govt. Printer, 1919.

Maniku, Hassan Ahmed. Say It in Maldivian (Dhivehi), [by] H. A. Maniku [and] J. B. Disanayaka. Colombo:

Lake House Investments, 1990.

Tibetan

Beyer, Stephen V. The classical Tibetan language. State University of New York. ISBN 0-7914-1099-4

Ugaritic

O’Connor, M. “Epigraphic Semitic Scripts.” In The World’s Writing Systems, edited by Peter T. Daniels and

William Bright. New York: Oxford University Press, 1996. ISBN 0-19-507993-0.

Walker, C. B. F. Cuneiform. London: British Museum Press, 1987. (Reading the Past, v. 3.) ISBN 0-7141-8059-9.

University of California Press edition has ISBN 0-520-06115-2 (pbk.).

Thai

TIS 620-2533 Thai Industrial Standard for Thai Character Code for Computer. (1990)

Vai

Dalby, David. “A Survey of the Indigenous Scripts of Liberia and Sierra Leone: Vai, Mende, Loma, Kpelle and

Bassa.” African Language Studies 8 (1967):1-51.

Kandakai, Zuke, et al. Vai kpolo saikilamaa mɛ = The Standard Vai Script. Monrovia: University of Liberia


132

X 0221

:2014 (ISO/IEC 10646:2012)

   

African Studies Program, 1962.

Massaquoi, Momolu. “The Vai People and Their Syllabic Writing.” Journal of the Royal African Society 10.40,

July (1911), 459-466.

Singler, John. “Scripts of West Africa.” In The World’s Writing Systems, edited by Peter T. Daniels and William

Bright. New York: Oxford University Press, 1996. ISBN 0-19-507993-0.

Stewart, Gail, and P. E. H. Hair. “A Bibliography of the Vai Language and Script.” Journal of West African

Languages 6.2 (1969), 124.

Yi

GB13134: Xinxi jiaohuanyong yiwen bianma zifuji (Yi coded character set for information interchange),

[prepared by] Sichuansheng minzushiwu weiyuanhui. Beijing, Jishu Biaozhun Chubanshe (Technical Standards 
Press), 1991. (GB 13134-1991).

Nuo-su bbur-ma shep jie zzit. = Yi wen jian zi ben. Chengdu: Sichuan minzu chubanshe, 1984.

Nip huo bbur-ma ssix jie. = Yi Han zidian. Chengdu: Sichuan minzu chubanshe, 1990. ISBN 7-5409-0128-4.


133

X 0221

:2014 (ISO/IEC 10646:2012)

附属書 N 
(参考)

文字レパートリに対する外部参照

N.1 

文字レパートリ及びその符号化の参照方法 

プログラム言語及びそれ以外のデータオブジェクトの構文を定義する方法では,通常,この規格で規定

するものの中から特定の文字レパートリを宣言することが必要になる。さらに,このレパートリに適用可

能な符号化表現のうち対応する符号化表現を宣言する必要がある場合もある。

この規格に従った文字レパートリに対しては,そのレパートリの厳密な宣言の中に次のパラメタを含め

るのがよい。

−  この規格の識別

−  レパートリの採用した部分集合,一つ以上の組番号で識別されるもの

−  符号単位列の内容の定義

−  採用した符号化形式(UTF-8,UTF-16 又は UTF-32)

データオブジェクトの構文定義に現在一般的に使われている方法の一つが,JIS X 5605 群[情報技術−

抽象構文記法 1(ASN.1)仕様]

(対応国際規格:ISO/IEC 8824 群)に規定された抽象構文記法 1(ASN.1)

である。これに対応する符号化表現は,JIS X 5606 群(情報技術−ASN.1 符号化規則)

(対応国際規格:

ISO/IEC 8825

群)に規定されている。この方法を使う場合の文字レパートリ及び符号化を参照する形式を,

次に示す。

N.2 ASN.1

文字抽象構文の識別 

この規格に従って識別されたレパートリの文字で構成される全ての文字列の集合は,JIS X 5605 群の用

語では,

“文字抽象構文”として定義される。個々の文字抽象構文に対して,ASN.1 を使ったときにその構

文を参照できるように,対応するオブジェクト識別子の値が定義される。

JIS X 5605-1

附属書 B(オブジェクト識別子構成要素値の ISO による割当て)に,ISO の規格で規定

されたオブジェクトに対するオブジェクト識別子値の形式が規定されている。この識別子では,この規格

の機能及び任意選択機能を識別するために,弧“10646”及び弧“0”に数字(弧)を続ける方法を用いる。

注記 1  弧“0”は,ISO/IEC 10646-1 及び ISO/IEC 10646-2 を識別するために過去に使われた弧“1”

及び弧“2”を埋め合わせるために用いる。弧“1”及び弧“2”を用いてはならない。

この“0”に続く最初の弧は,符号単位列の内容の定義を識別し,level-3 (3)(実装水準 3)として参照さ

れる。

注記 2  この規格では,符号単位列の内容に対してただ一つの定義を与える。その定義は,この規格

の以前の版で実装水準 3 と呼ばれていたものである。

その次に続く弧は,次のレパートリの部分集合のいずれかを識別する。

− all

(0)

全ての組

− collections

(1) 指定した組

弧 (0) は,この規格で規定した文字の全てからなる組を識別する。この弧に続く弧は,ない。

注記 3  この組は,私用群及び私用面も含む。したがって,完全には定義できない。その使用につい

ては,事前の合意が必要である。


134

X 0221

:2014 (ISO/IEC 10646:2012)

   

弧 (1) には一つの弧又は弧の列が続く。それぞれの弧は,

附属書 の組番号とし,昇順に並べる。この

列は,その列に現れる組番号の複数の組からなる部分集合を識別する。

注記 4  例として,組 BASIC LATIN,組 LATIN-1 SUPPLEMENT 及び組 MATHEMATICAL OPERATORS

からなる部分集合のオブジェクト識別子を,次に示す。

{iso standard 10646 (0) level-3 (3) collections (1) 1 2 39}

さらに,JIS X 5605-1 は,オブジェクト識別子値に対応するオブジェクト記述子を規定している。制約

されないレパートリに対して,対応するオブジェクト記述子は,次のとおりとする。

3 0 : "ISO 10646 level-3 unrestricted"

組の名前“xxx”をもつ単一の組に対しては,次のとおりとする。

3 1 : "ISO 10646 level-3 xxx"

m1,m2,…の組番号をもつ一つ以上の組からなるレパートリに対しては,次のとおりとする。

3 1 : "ISO 10646 level-3 collections m1, m2, m3, .. "

注記 5  スペースは,全て 1 個のスペース(single space)である。

N.3 ASN.1

文字転送構文の識別 

この規格に従った文字からなる文字列の符号化方法は,JIS X 5605 群の用語では,

“文字転送構文”とし

て定義される。個々の文字転送構文に対して,ASN.1 を使ったときにその構文を参照できるように,対応

するオブジェクト識別子の値が定義される。

JIS X 5605-1

附属書 B(オブジェクト識別子構成要素値の ISO による割当て)に従ったオブジェクト

識別子では,この国際規格で規定する符号化表現を識別するために,弧“10646”及び弧“0”に数字(弧)

を続ける方法を用いる。

この“0”に続く最初の弧は,次のとおりとする。

− transfer-syntaxes

(0)

転送構文

その次に続く弧は,符号化形式を識別し,次のいずれかとする。

− four-octet-form

(4)

UTF-32 符号化形式

− utf16-form

(5)

UTF-16 符号化形式

− utf8-form

(8)

UTF-8 符号化形式

注記 1 UTF-32 符号化形式のオブジェクト識別子の例を,次に示す。

{iso standard 10646 (0) transfer-syntaxes (0) four-octet-form (4)}

次のオブジェクト識別子は,有効な形式であるが,現在は,使用を禁止する。

{iso standard 10646 (1) transfer-syntaxes (0) four-octet-form (4)}

注記 2  この規格の以前の版では two-octet-BMP-form (2)を規定していたが,現在は,使用を禁止する。

対応するオブジェクト記述子は,次のとおりとする。

−  "ISO 10646 form 4"

−  "ISO 10646 utf-16"

−  "ISO 10646 utf-8"

注記 3  この規格の以前の版ではオブジェクト識別子"ISO 10646 form 2"を規定していたが,現在は,

使用を禁止する。


135

X 0221

:2014 (ISO/IEC 10646:2012)

附属書 P

(参考)

CJK

統合漢字に関する追加情報

この附属書は,CJK 統合漢字に関する追加情報を示す。

注記  この規格の以前の版では,この附属書に全ての文字に対する追加情報を記述していた。この規

格においては,そうした情報のほとんどは,符号表に含まれている。CJK 統合漢字の符号表は,

名前の一覧を含まないため,それらの文字の情報は,この附属書に残してある。

この附属書の各項目は,符号位置の後に文字の名前を記載したものを並べ,その次に関連する追加情報

を続ける。項目は,符号位置の昇順に並べている。

9FB9

  CJK UNIFIED IDEOGRAPH-9FB9

9FBA

  CJK UNIFIED IDEOGRAPH-9FBA

9FBB

  CJK UNIFIED IDEOGRAPH-9FBB

これらの三つの文字は,漢字の特定の位置の構成要素を表すために用いることを意図している。これら

の文字と同じ構造の漢字だが特定の位置に用いる意図ではないものを,それぞれ 20509,2099D 及び 470C

に符号化している。


136

X 0221

:2014 (ISO/IEC 10646:2012)

   

附属書 Q 
(参考)

ハングル音節文字の符号対応表

注記  この規格の以前の版では,この附属書は,JIS X 0221:1995 が規定していたハングル音節文字(及

び符号位置)と,その後変更した符号位置(この規格が規定する符号位置と同一)との対応表

を示していた。


137

X 0221

:2014 (ISO/IEC 10646:2012)

附属書 R 
(参考)

ハングル音節文字の名前

この附属書では,ハングル音節文字の名前及び追加情報を添付ファイルによって示す。

添付ファイルは,テキストファイルであり,ISO/IEC 646 の IRV の文字及び行末を表す LINE FEED 

使用する。ファイルの先頭の 5 行は,ヘッダであり,その後に全てのハングル音節文字を続ける。行は,

次に示す形式である。

−  第 1∼4 オクテットは,符号位置を 16 進数によって示す。

−  第 5 オクテットは,SPACE(スペース)とする。

−  第 6 オクテットから行の終わりまでは,ハングル音節文字の名前を括弧に囲んだ注記とともに示す。

ハングル音節文字の名前は,添付ファイル“HangulSy.txt”による。

注記  (対応国際規格の注記は,この規格では該当しないため不採用とした。)


138

X 0221

:2014 (ISO/IEC 10646:2012)

   

附属書 S

(参考)

漢字の統合及び配列の手順

この規格の CJK 統合漢字の図形文字の組は,箇条 31 で規定する。これらは,広範な国家規格及び団体

規格の符号化文字集合(原典という。

)に収容された多数の漢字を基にしている。

この附属書は,この規格の漢字が,どのような統合手順を適用して,原典から引き出されたかを記述し

ている。また,この規格の漢字が,どのように一連の符号位置に配列されるかをも記述している。

CJK 統合漢字の原典参照は,箇条 23 に示す。

この規格では,統合手順を,原典グループの符号から取り出した漢字に対して適用する。この手順では,

二つ以上の原典グループから取り出した単一の漢字を関連付け,

この規格で単一の符号位置を割り当てる。

関連付けは,次の手順によって行う。ここでは,漢字をこのように関連付けることを,

“統合(unified)

という。

注記  この統合手順は,次の漢字のような文字の組には適用しない。

−  CJK RADICALS SUPPLEMENT(2E80∼2EFF)

−  KANGXI RADICALS(2F00∼2FDF)

−  CJK COMPATIBILITY IDEOGRAPHS(F900∼FAFF。ただし,FA0E,FA0F,FA11,FA13,

FA14,FA1F,FA21,FA23,FA24 及び FA27∼FA29 を除く。)

−  CJK COMPATIBILITY IDEOGRAPHS SUPPLEMENT(2F800∼2FA1F)

S.1 

統合手順 

S.1.1 

統合の範囲 

歴史的由来から関連しないとみなされる漢字[非同系文字(non-cognate character)

]は,統合しない。

注記  上の例の二つの漢字の形の違いは,下部横線の長さである。これは,本来の字形の違いと考え

られる。さらに,これらの漢字は,異なる意味をもつ。最初の漢字の意味は,

“兵士”であり,

2 番目の漢字の意味は,“土又は土地”である。

異なる原典から取り出した漢字の関連付けは,次の分類システムに従って,字形が十分に似ているとき

に行う。

S.1.2 2

階層分類 

分類の 2 階層システムを用いて,抽象字形の相違と,特定の書体で定まる実字形の相違とを,区別する。

ある漢字の異体字のうち,統合できないものは,抽象字形の相違として識別する。

S.1.3 

手順 

二つの漢字が,同一の抽象字形をもつのか,異なる抽象字形をもつのかを決定するために,統合手順を

用いる。統合手順は,次の順序で示す二つの段階で適用する。

a)

部分字形(component)の構造の把握。

b)

部分字形の特徴の抽出。


139

X 0221

:2014 (ISO/IEC 10646:2012)

S.1.3.1 

部分字形の構造の把握 

手順の第 1 段階では,各漢字の部分字形の構造を考察する。漢字の部分字形は,点画の幾何学的な組合

せである。同じ部分字形の集まりから,別の漢字が構成されることがある。複数の部分字形を組み合わせ

ることで,入り組んだ構造の新たな部分字形を作ることができる。このことから,一つの漢字は,部分字

形の木構造として捉えられる。ここで,最上位の節点は,その漢字そのものであり,最下位の節点は,点

画である。これを

図 S.1 に示す。

図 S.1−部分字形の構造

S.1.3.2 

部分字形及び特徴抽出 

手順の第 2 段階では,

図 S.2 に示すように,二つの漢字の対応する節点に位置付けられた部分字形を最

上位から比較する。

図 S.2−部分字形の最も顕著な節点

比較する漢字の,次の特徴を考察する。

a)

部分字形の数。

b)

漢字の全体の中での,部分字形の配置位置。

c)

対応する部分字形の構造。

比較される漢字について,上記の a)c)のうち一つ以上の特徴が異なれば,それらの漢字は,抽象字形

の相違とみなし,統合しない。

漢字の,a)c)の全ての特徴が同じならば,それらの漢字は,同じ抽象字形をもつとみなし,統合する。

S.1.4 

抽象字形相違の例 

S.1.3.2

の a)c)から導出される規則を説明するため,抽象字形の相違によって非統合となる漢字の代表

的な例を S.1.4.1S.1.4.3 に示す。

S.1.4.1 

部分字形の数の相違 

次の例は,S.1.3.2 の a)の規則を説明する。それぞれの対の二つの漢字は,異なる数の部分字形をもつ。

S.1.4.2 

部分字形の配置位置の相違 

次の例は,S.1.3.2 の b)の規則を説明する。それぞれの対の二つの漢字は,同じ数の部分字形をもつが,

部分字形の配置位置が異なる。


140

X 0221

:2014 (ISO/IEC 10646:2012)

   

漢字が横に並ぶ部分字形をもつとき,左側部分字形の最後の画が右側部分字形の下部に及んでいるかど

うかの違いは,次の U+34F3 の例に示すように分離符号化の根拠にはならない。

S.1.4.3 

部分字形の種類の相違 

次の例は,S.1.3.2 の c)の規則を説明する。それぞれの対の二つの漢字は,一つ以上の部分字形が異なる。

S.1.5 

実字形の相違 

S.1.2

で説明した分類を説明するため,統合する漢字の代表的な例を次に示す。次の各グループの二つ又

は三つの漢字又は部分字形は,実字形の相違をもつが,同じ抽象字形とみなし,その字形の文字又はその

字形を部分字形としてもつ漢字は,統合する。この相違は,次の例によって,分類される。

これらの相違は,次の例に示すように,更に分類される。

a)

点画の方向の相違

b)

点画が出る・出ない(抜ける・抜けない)

c)

部分字形・点画が付く・付かない

d)

画線の出方の相違

e)

画線の折れ曲がり方の相違

f)

ハネの有無

g)

起筆の相違

h)

屋根の相違

i)

重要でない点画の追加又は削除

j)

a)

i)の組合せ


141

X 0221

:2014 (ISO/IEC 10646:2012)

k)

その他

注記  各グループに示された部分字形には,更に複雑な漢字の部分字形として使われたときには統合

されるが,単体の漢字としては,原規格分離漢字の取扱規則などの他の理由によって統合され

ないものがある。

統合した漢字の実字形の相違は,箇条 31 の符号表の各符号位置の,対応する原典の欄に示す。

S.1.6 

原規格分離漢字の取扱規則(source separation rule 

複数の符号変換の段階を経たデータの完全性[

“往復の保全性”

(round-trip integrity)ともいう。

]を確保

するため,

次に示す各原典グループのいずれか一つの中で分離して符号化されている漢字は,

統合しない。

注記 0A  これを原規格分離漢字の取扱規則という。

原典 グループ  GB 2312-80,GB 12345-90,GB 7589-87*,GB 7590-87*,GB 8565-88*,現代漢語通

用字表*

原典 グループ  TCA-CNS 11643-1986/第 1 面,TCA-CNS 11643-1986/第 2 面,TCA-CNS 11643-1986/

第 14 面*

原典 グループ  JIS X 0208:1990,JIS X 0212:1990

原典 グループ  KS X 1001:2004(KS C 5601-1989 であったもの),KS X 1002:2001(KS C 5657-1991

であったもの)

注記 1  規格の参照番号の後の“*”は,その規格に含まれる漢字のうち幾つかが,統合漢字集合に含

まれていないことを示す。

しかしながら,一つの原典グループに属する二つの規格(例えば,GB 2312-80 及び GB 12345-90)で符

号化されている幾つかの漢字は,原典グループから漢字を収集する手順において統合されている。

注記 1A  ここで“原典”としているものは,箇条 23 で“原典”としているものとは,一致しない。そ

れは,原規格分離漢字の取扱規則の適用の対象となる“原典”が,この規格の最初の版に含

まれていたものに限定されるのに対して,箇条 23 の“原典”は,その後追加されたものを含

むためである。

ここで示した原規格分離漢字の取扱規則は,BMP の CJK UNIFIED IDEOGRAPHS ブロックに対してだ

け適用する。

注記 2 CJK 互換漢字は,原規格分離漢字の取扱規則によく似た規則によって作成された。しかし,

CJK 互換漢字では,似た漢字は,一つの CJK 統合漢字と一つ以上の CJK 互換漢字との組合

せとした。

原規格分離漢字の取扱規則では,

全ての似た漢字を異なる CJK 統合漢字とみなす。

S.2 

配列手順 

S.2.1 

配列の概要 

この規格の箇条 31 の符号表で,CJK UNIFIED IDEOGRAPHS の配列は,次の辞書における漢字の並び

順を基にしている。


142

X 0221

:2014 (ISO/IEC 10646:2012)

   

優先順位

辞書

1

康熙字典(Kangxi Dictionary)

北京第 7 版

2

大漢和辞典(Daikanwa Jiten)

第 9 版

3

漢語大字典(Hanyu Dazidian)

第 1 版

4

大字源(Daejaweon)

第 1 版

辞書は,上の表に示す優先順位で使用する。優先順位 1 が最優先である。漢字が,ある辞書で見つかっ

たならば,それよりも優先順位の低い辞書は,考察しない。

S.2.2 

手順 

S.2.2.1 

辞書にある漢字 

a)

ある漢字が,康熙字典にある場合,康熙字典の順序に従って符号表に位置付ける。

b)

ある漢字が,康熙字典になく大漢和辞典にある場合,大漢和辞典でその文字よりも前に記載された文

字で,康熙字典にも記載のある文字のうち,最も近くにある文字の属する部首画数グループの末尾に

位置付ける(康熙字典の部首画数グループの最後に位置付け,康熙字典及び大漢和辞典にある漢字に

続けて配列する。

c)

ある漢字が,康熙字典及び大漢和辞典のいずれにもない場合,漢語大字典及び大字源を同様の手順で

参照する。

S.2.2.2 

辞書にない漢字 

ある漢字が,四つのどの辞書にもない場合,部首画数グループの末尾に(辞書にある漢字よりも後に)

位置付け,同じ部首画数の下に配列する。

S.3 

原規格分離漢字の例 

次に示す漢字の対(又は三つ組み)は,S.1 に示した統合規則の例外である。これらは,S.1.6 に示した

原規格分離漢字の取扱規則によって,統合しない。

注記  原規格分離漢字の取扱規則の適用の対象となった,特定の原典グループについては,それぞれ

の漢字の対(又は三つ組み)の右側に,文字(G,J,K 又は T)で示す。文字に対応する原典

グループは,この附属書の最初に示す。

T

 4E1F  4E22

   GT

 4E48  5E7A

   GTJ

 4E89  722D

J

4EDE4EED

T

 4F75  5002

T

 4FA3  4FB6

   TJK

4FC1 4FE3

T

4FDE 516A

T

 4FF1  5036

T

 5024  503C

T

 5077  5078

   TJ

507D 50DE

T

 514C  5151

   TJ

 514E  5154

T

 5156  5157

   TJ

518A 518C

G

 51C0  51C8

T

 51E2  51E3

   TJ

 5203  5204

   TJ

520A 520B


143

X 0221

:2014 (ISO/IEC 10646:2012)

T

 5220  522A

T

 5225  522B

   TJ

 5238  52B5

T

 5239  524E

T

 524F  5259

T

525D 5265

J

 5292  5294

T

52FB 5300

T

 5355  5358

   TK

 5373  537D

   TJ

 5377  5DFB

   GT

 53C1  53C2

T

 53C3  53C4

T

 5415  5442

T

 541E  5451

 TJ

 5433  5434  5449

T

 5436  5450

T

 543F  544A

T

 5527  559E

T

55A9 55BB

T

 5618  5653

   GTJ

 568F  5694

T

 56EF  56FD

   TJ

 5708  570F

T

 570E  5713

T

 5716  5717

T

 5759  5DE0

J

57D2 57D3

T

 5848  588D

   TJ

 5861  586B

T

 5897  589E

   GTJ

58EE 58EF

T

58FD 5900

T

 5910  657B

   GTJ

 5932  672C

J

 5965  5967

 TJ

 5968  596C  734E

   GT

 5986  599D

T

598D 59F8

T

59CD 59D7

   GT

59EB 59EC

  T

5A1B 5A2F  5A31

T

5A55 5AAB

T

5A7E 5AAE

   TK

5AAA5ABC

T

5AAF 5B00

T

5B0E 5B14

   GT

 5B24  5B37

T

 5B73  5B76

T

5BAB5BAE

T

5BDB5BEC

T

5BDC5BE7

   GTJ

5BDD5BE2

J

 5C02  5C08

   GTJ

 5C06  5C07

T

 5C13  5C14

T

 5C19  5C1A

T

5C2A 5C2B

T

 5C36  5C37

T

5C4F 5C5B

   GT

5CE5 5D22

T

5DD35DD4

T

 5E21  5E32

   TJ

 5E2F  5E36


144

X 0221

:2014 (ISO/IEC 10646:2012)

   

T

 5E76  5E77

T

5EC4 5ECF

T

 5F11  5F12

T

 5F37  5F3A

T

 5F39  5F3E

   TJ

 5F50  5F51

T

 5F54  5F55

T

 5F59  5F5A

J

5F5B 5F5C

T

5F5D 5F5E

T

 5F65  5F66

T

5FB3 5FB7

T

5FB4 5FB5

   TJ

 6075  60E0

T

 6085  60A6

T

 609E  60AE

T

 60B3  60EA

T

 6120  614D

   TJ

 613C  614E

   GT

 6229  622C

T

 622F  6231

  T

 6236  6237  6238

T

 623B  623E

T

 629B  62CB

   TJ

 629C  62D4

T

 6329  635D

 TJ

 633F  63D2  63F7

   TJ

 634F  63D1

   TJ

 635C  641C

T

 63B2  63ED

 TJ

 63FA  6416  6447

T

 63FE  6435

   TJ

 6483  64CA

T

 654E  6559

T

 6553  655A

T

 65E2  65E3

T

 6602  663B

T

665A 6669

T

66A8 66C1

J

66FD 66FE

T

 67B4  67FA

T

 67E5  67FB

T

 67F5  6805

T

 68B2  68C1

T

 6961  6986

T

 6982  69EA

T

 6985  69B2

T

699D 6A27

J

 69C7  69D9

   TJ

69D8 6A23

T

6A2A6A6B

T

 6B65  6B69

T

 6B72  6B73

T

6B7F 6B81

   GTJ

6BBB6BBC

T

6BC0 6BC1

T

6BCE6BCF

T

 6C32  6C33

T

6C5A 6C61

   TJ

 6C92  6CA1

   TJ

6D44 6DE8

T

6D89 6E09

T

6D97 6D9A

T

6D99 6DDA


145

X 0221

:2014 (ISO/IEC 10646:2012)

T

6DE5 6E0C

T

6DF8 6E05

T

 6E07  6E34

T

 6E29  6EAB

T

 6E88  6F59

T

 6E89  6F11

T

6EDA6EFE

   GTJK

6F5B 6FF3

T

 7028  702C

   GTJ

70BA 7232

   GTJK

712D 7162

J

 7155  7199

T

 7174  7185

   GT

 72B6  72C0

   TJ

 7464  7476

T

 74F6  7501

T

 7522  7523

J

 75E9  7626

T

76A1 76A5

   TJ

 771E  771F

   TJK

 773E  8846

T

 7814  784F

   TJ

 797F  7984

T

79BF 79C3

T

7A05 7A0E

   TJ

7A42 7A57

   GJ

7B5D 7B8F

T

7BB3 7C08

T

7BE1 7C12

T

7CA4 7CB5

T

7D55 7D76

T

7DA07DD1

T

7DD27DD6

T

7DE3 7E01

T

7DFC 7E15

T

 7E48  7E66

   TJ

7FAE 7FB9

T

 7FF6  7FFA

T

80FC 8141

T

 812B  8131

T

817D 8183

   GT

 8203  8204

   TJ

820D 820E

J

 8216  8217

   TJ

 8358  838A

   TJ

83D1 8458

T

 8480  8495

   GJ

 848B  8523

T

848D 853F

T

 8570  8580

T

85AB 85B0

T

 85F4  860A

T

865A 865B

T

86FB 8715

   TJK

 885B  885E

   TK

 886E  889E

   GJK

 88C5  88DD

T

8A2E 8A7D

T

8AAA8AAC

   TJ

8ACC8AEB

J

 8B20  8B21

T

8C5C 8C63

   TJ

8D70 8D71

T

8EFF 8F27


146

X 0221

:2014 (ISO/IEC 10646:2012)

   

J

8F1C 8F3A

T

8F3C 8F40

T

8FBE 8FD6

   TJ

 8FF8  902C

J

 9059  9065

T

90A2 90C9

T

90CE 90DE

  T

 90F7  9109  9115

T

 9196  919E

J

91A4 91AC

T

 9203  9292

T

 92B3  92ED

T

 9304  9332

   TK

 932C  934A

   TJ

93AD 93AE

T

 95B1  95B2

G

 9667  9689

T

 9751  9752

   GTJ

 9759  975C

J

976D 9771

T

 9839  983D

   TJ

 984F  9854

J

985A 985B

J

98EE 98F2

   TJ

 9905  9920

   TJK

 99B1  99C4

   TK

 99E2  9A08

T

9AA99AAB

T

9AD89AD9

   TJ

9AEA9AEE

T

9B2C 9B2D

   TJ

9C1B 9C2E

T

9CEF 9CF3

J

9D87 9DAB

J

9DC6 9DCF

T

9EAA9EAB

T

9EBC9EBD

T

9EC3 9EC4

T

9ED1 9ED2

S.4 

非統合の例 

S.1

に記述した統合手順に従って,次に示す漢字の対(又は三つ組み)は,統合しない。非統合の理由

は,各対(又は三つ組み)の右側に示した参照によって示す。

“非同系”は,S.1.1 を参照。

注記  この例での非統合の理由は,S.1.6 に記述した原規格分離漢字の取扱規則とは,異なるものであ

る。

非同系

 5191  80C4

   S.1.4.3

 51B2  6C96

   S.1.4.3

 51B3  6C7A

   S.1.4.3

 51B5  6CC1

   S.1.4.3

 579B  579C

   S.1.4.2

5B7C 5B7D

   S.1.4.3

5BF3 5BF6

   S.1.4.1

 5EF0  5EF3

   S.1.4.1

61D0 61F7

   S.1.4.3

 6560  656A

非同系

 670C  80A6

非同系

 670F  80D0

非同系

 6710  80CA

非同系

 6713  8101

非同系

 6718  8127

非同系

 6723  81A7


147

X 0221

:2014 (ISO/IEC 10646:2012)

   S.1.4.3

 6735  6736

   S.1.4.3

 7054  7067

   S.1.4.3

7A32 7A3B

   S.1.4.3

 7FF1  7FF6

 S.1.4.3

 8007  8008  8009

 S.1.4.1

 8074  807C  807D

   S.1.4.2

 8346  834A

   S.1.4.3

8EB1 8EB2


148

X 0221

:2014 (ISO/IEC 10646:2012)

   

附属書 T

(参考)

タグ文字による言語のタグ付け

注記  この規格の以前の版でこの附属書に記載していた内容は,F.7 に記載した。


149

X 0221

:2014 (ISO/IEC 10646:2012)

附属書 U 
(参考)

識別子用の文字

UCS の実装者が判断する一般的な課題に,構文解析又は字句解析での識別子の条件がある。それぞれの

プログラム言語の標準は,それ特有の識別子の構文を規定している。プログラム言語が異なれば,ASCII

ISO/IEC 646 の IRV のことをいう。

)の範囲の幾つかの文字(例えば,

“$”

“@”

“#”及び“_”

)の識

別子での使用の扱いが異なる。どの文字を構文上の区切りとし,どの文字を識別子として許すか,大文字

と小文字とで対になっている文字を同一視するかどうか,正規化を行うかどうか,などの様々な要素が,

特定のプログラム言語における識別の目的にふさわしい文字の集合の規定に関与する。

ユニコードコンソーシアムは,ユニコード附属書 UAX #31“Identifier and Pattern Syntax”という文書を

出版することで,UCS の文字に基づく構文解析での扱いの標準化に寄与している。識別子での使用にふさ

わしい UCS の文字の一覧を決定するときには,この UAX #31 の仕様を参考にするとよい。UAX #31 は,

http://www.unicode.org/reports/tr31/  として参照できる。


150

X 0221

:2014 (ISO/IEC 10646:2012)

   

附属書 JA

(参考)

日本文字部分レパートリ

序文

この附属書は,六つの日本文字部分レパートリを参考として示すものであって,規定の一部ではない。

JA.1 

日本文字部分レパートリ 

六つの日本文字部分レパートリは,次の a)f)のとおりとする。

a)  BASIC JAPANESE

  BASIC JAPANESE(基本日本文字集合)は,組番号 285 の組とする(A.5.5 参照)

これは,JIS X 0201ISO/IEC 646 の IRV 及び JIS X 0208 に相当する基本部分集合である。含まれる

文字の符号位置を,添付ファイル“BasicJ.txt”に参考として示す。

b)  JIS2004 IDEOGRAPHICS EXTENSION

  JIS2004 IDEOGRAPHICS EXTENSION(JIS2004 拡張漢字

集合)は,組番号 371 の組とする(A.4.2 参照)

。これは,JIS X 0213 の第 3 水準及び第 4 水準漢字部

分に相当する拡張用の部分集合である。含まれる文字の符号位置を,添付ファイル“JIExt.txt”に参考

として示す。

c)

JAPANESE IDEOGRAPHICS SUPPLEMENT

  JAPANESE IDEOGRAPHICS SUPPLEMENT(補助漢字

集合)は,組番号 372 の組とする(A.4.3 参照)

。これは,JIS X 0212 の漢字部分に相当する拡張用の

部分集合である。含まれる文字の符号位置を,添付ファイル“JISup.txt”に参考として示す。

d)  JAPANESE NON IDEOGRAPHICS EXTENSION

  JAPANESE NON IDEOGRAPHICS EXTENSION(拡

張非漢字集合)は,組番号 286 の組とする(A.5.6 参照)

。これは,JIS X 0213 の非漢字部分(ただし,

JIS X 0208

にも含まれるものを除く。

)に相当する拡張用の部分集合である。含まれる文字の符号位置

を,添付ファイル“JNIExt.txt”に参考として示す。

e)

COMMON JAPANESE

  COMMON JAPANESE(通用日本文字集合)は,組番号 287 の組とする(A.5.7

参照)

。これは,a)に示した BASIC JAPANESE に,日本で広く用いられている拡張を加えた部分集合

である。含まれる文字の符号位置を,添付ファイル“CommonJ.txt”に参考として示す。

f)

JAPANESE NON IDEOGRAPHICS SUPPLEMENT

  JAPANESE NON IDEOGRAPHICS SUPPLEMENT

(追加非漢字集合)は,d)に示した JAPANESE NON IDEOGRAPHICS EXTENSION を含み,JIS X 0212

で規定された漢字以外の文字(すなわち,

“特殊文字”及び“アルファベット”

)並びに JIS X 0201

JIS X 0208

及び JIS X 0212 に含まれない文字のうち日本語文書で用いられる追加的な記号類からなる。

含まれる文字を,添付ファイル“JNIExt2.txt”に示す。

JA.2 

部分レパートリの組合せ 

日本文字部分レパートリのうち,BASIC JAPANESE 及び COMMON JAPANESE は,それぞれを単独で又

は他の日本文字部分レパートリと組み合わせて用いることを意図している。他の四つのレパートリは,単

独で用いることを意図していない。意図する組合せは,次のとおりである。

−  BASIC JAPANESE 及び JIS2004 IDEOGRAPHICS EXTENSION の組合せ。

−  BASIC JAPANESEJIS2004 IDEOGRAPHICS EXTENSION 及び JAPANESE NON IDEOGRAPHICS 

EXTENSION

の組合せ。


151

X 0221

:2014 (ISO/IEC 10646:2012)

−  BASIC JAPANESE 及び JAPANESE IDEOGRAPHICS SUPPLEMENT の組合せ。

−  COMMON JAPANESE 及び JIS2004 IDEOGRAPHICS EXTENSION の組合せ。

−  COMMON JAPANESEJIS2004 IDEOGRAPHICS EXTENSION 及び JAPANESE NON IDEOGRAPHICS 

EXTENSION

の組合せ。

−  COMMON JAPANESE 及び JAPANESE IDEOGRAPHICS SUPPLEMENT の組合せ。

JA.3 

適合性 

この附属書に示す日本文字部分レパートリのうち,BASIC JAPANESEJIS2004 IDEOGRAPHICS 

EXTENSION

JAPANESE IDEOGRAPHICS SUPPLEMENTJAPANESE NON IDEOGRAPHICS EXTENSION

及び COMMON JAPANESE は,この規格が規定する組である。これら五つの日本文字部分レパートリのいず

れか一つ以上の組合せを部分集合とする適合性の主張は,選択部分集合への適合性の主張の方法によるの

がよい(8.2 参照)

JAPANESE NON IDEOGRAPHICS SUPPLEMENT

は,この規格が規定する組ではない。JAPANESE NON 

IDEOGRAPHICS SUPPLEMENT

を含む部分集合への適合性の主張は,制限部分集合への適合性の主張の方

法による(8.1 参照)