2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
日本工業規格 JIS
X 4061-1996
日本語文字列照合順番
Collation of japanese character string
1. 適用範囲 この規格は,日本語を主とする表記に用いられる文字列を含むレコードの照合順番を規定
する。このため,文字列の順序関係を定める照合規則を規定し,その照合規則のレコードヘの適用の仕方
である照合方法を規定する。
この規格で規定する照合順番は,次の三つとする(参考1.参照)。
(1) 単純照合
(2) 読み・表記照合
(3) 代表読み照合
この規格は,辞書の項目,データベースの索引,書籍の索引,用語集,人名録などのように,各項目に
施されている読み,その項目自体の表記などに基づいて項目を照合・整列する際などに適用する。
この規格は,文字に基づいて規定するもので,その文字の見掛け上の属性には関与しない(参考2.参照)。
文字の符号化は,処理系定義とする(6.2参照)。
この規格は,外国語文字列の照合順番は規定しない。ただし,本来外国語を表記する文字又は記号であ
っても,日本語を主とする表記の一部分として扱われる場合に限って,この規格を適用してもよい(参考
3.及び参考4.参照)。
備考1. 外国語文字列の照合順番は,それぞれの言語を対象とする規格に従うのが望ましい。ただし,
それらの規格が存在しないか又は存在が分からない場合には,その外国語文字列にも便宜的
にこの規格を適用してもよい。
2. この規格の引用規格を,次に示す。
JIS X 0208 情報交換用漢字符号
JIS X 0221 国際符号化文字集合 (UCS) −第1部 体系及び基本多言語面
参考1. 単純照合及び読み・表記照合は一般に五十音順と呼ばれるものに対応し,代表読み照合は一
般に電話帳順と呼ばれるものに対応している。
2. 文字の見掛け上の属性には,例えば,文字の大きさ,フォントの種類,強調の有無,色など
がある。
3. 本来外国語の文字が日本語を主とする表記に用いられる場合には,例えば,ローマ字による
日本語の表記(例 Kyoto,tsunami),略語(例 JIS,FDDI,CD-ROM),学術・技術上の記
号及び呼称(例 π,λ計算),日本文中に引用する外国語の語句(例 identity,virtual function),
外国語の固有名詞(例 Carlos Kleiber)などがある。
4. 日本語を主とする表記以外で用いられる場合とは,例えば,キリールアルファベットがロシ
ア語文章の表記に用いられる場合,漢字が中国語文章の表記に用いられる場合,音符が楽譜
の表記に用いられる場合などである。
2
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
2. 用語の定義 この規格で用いる用語の定義は,次のとおりとする。
(1) 順序 二つの項目についての前,後ろ又は同順位の関係。
備考 この規格の中では,順序を示すために次の略記法を用いることがある。
A<B: AはBより前の順序と評価する。
A>B: AはBより後ろの順序と評価する。
A=B: AとBとが同順位の順序と評価する。
(2) 整列 すべての要素に順番を与えること。
(3) 照合順番 照合方法に基づいて決めたレコードの順番。
(4) 照合する 照合順番を決めること。
(5) 照合キー 照合順番を決めるための直接の評価の対象となる文字列。
(6) 照合規則 二つの文字列を評価して,その順序を結果として返す手続。
(7) 照合方法 レコード中の読み列,表記列など,一つ以上の文字列を照合キーとして,照合規則を適用
し,レコードの順番を決定する手続。
(8) 照合属性 文字列の順序を評価するために用いる文字の属性。
(9) 基底文字 文字集合の各文字に対して,その文字集合の中からあらかじめ定める文字。
(10) 基底文字列 文字列の各文字を対応する基底文字に置き換えて生成した文字列。
(11) 文字クラス 文字集合の部分集合。
(12) 表記列 表記に用いられる文字列そのもの。
(13) 読み列 表記列とは別に専ら照合キーとして与えられる文字列。
備考 読み列の文字種は問わない(平仮名・片仮名以外であってもよい。)。
参考 読み列に相当するものとしては,データベース,書籍などの索引用項目の読み仮名・ルビの文
字列などがある。
一般に,読み列は表記列の読みを与える文字列であるが,この規格では,読み列という用語
を,表記列とは別に照合キーとして用いられる文字列の意味で用いる。
(14) 分節 代表読み照合において,代表読みを決めることができるように表記列と読み列を相互に対応さ
せて区切ること,又はそのように区切られた,表記列及び読み列の部分文字列。
例1. 表記列が1字ごとに分節されており,読み列がそれぞれに対応して分節されている例。
はやし
林−だ田,さん三−がつ
月
例2. 2字以上の表記列の全体に読み列が与えられ,それ以上には分節されていない例。
はやし
林
だ田,きさらぎ
如月(熟字訓)
(15) 熟字訓 2字以上からなる表記列であって,与えられる読み列を表記列との対応を保ちつつ分節する
場合に,それより短く分節できないもの。
備考 必ずしも訓でないものであっても,便宜上,この規格では熟字訓と呼ぶ。
例
きさらぎ
如月,こぶし
辛夷,いがらし
五十嵐,キセル
煙管,イチョウ
銀杏
(16) 代表読み 分節の表記列とそれに対応する読み列の先頭字とから一意に決まる文字列であって,照合
キーとして用いられるもの。
(17) 代表読み辞書 与えられた分節の表記列及び読み列の先頭字に対して代表読みを与える対照表。
3. 照合のモデル
3
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
3.1
照合方法及び照合規則 二つのレコードの照合順番は,適用する照合方法の選択及びその照合方法
において適用する照合規則の組合せによって決まる。
3.1.1
照合方法における照合の手順 照合方法は,複数の段階からなり,次の手順による。
(1) それぞれの段階に応じて,一つの照合キーを定める。
(2) その照合キーを,その段階に指定された照合規則で評価する。
(3) この段階で前又は後ろと評価できた場合は,それを照合結果とする。
(4) 評価が同順位になった場合は,次の段階があればそれへ進み,なければ同順位を照合結果とする。
3.1.2
照合方法における照合キーの選定 照合方法において照合キーとして用いる文字列は,次のいずれ
かとする。
(1) 表記に用いられる文字列そのもの(表記列)
(2) 専ら照合キーとしてあらかじめ与えられる文字列(読み列)
(3) 表記列,読み列及び(辞書など)ほかの情報を用いて,照合方法が新たに照合キーとして作り出す文
字列(代表読み)
3.2. 日本語文字列の照合方法 この規格は,日本語文字列について,単純照合,読み・表記照合及び代
表読み照合の三つの照合方法を規定する。
(1) 単純照合 与えられた文字列をそのまま照合キーとする照合方法。
(2) 読み・表記照合 与えられた読み列及び表記列を照合キーとする照合方法。
(3) 代表読み照合 読み列,表記列及びそれらに基づいて定まる代表読みを照合キーとする照合方法。
備考1. 代表読みは,読み列及び表記列が適切に分節されて与えられているとき定まる。
2. 読み列及び表記列が分節されていないときは,読み列全体及び表記列全体をそれぞれ一つの
分節とみなして代表読み照合を適用する。
この規格では,更に代表読み辞書の有無によって,次の二つの照合方法に分ける。
(a) 基本代表読み照合 代表読み辞書がある場合
(b) 簡易代表読み照合 代表読み辞書がない場合
日本語文字列照合処理系への表記列及び読み列の渡し方,並びに代表読みを定める方法については,規
定しない。
参考 ここでいう代表読みを定める方法とは,例えば,代表読み辞書のもち方,検索方法などである。
3.3
日本語文字列の照合規則 この規格では,照合キーとして与えられた文字列について,次の二つの
照合規則を規定する。
(1) 基本照合規則 この照合規則は,与えられた文字列から基底文字列を生成して評価し,同順位となる
場合は更に照合属性を評価し,順序を返す。
(2) 簡易照合規則 この照合規則は,与えられた文字列から基底文字列を生成して評価し,順序を返す。
参考 簡易照合規則では,照合属性を参照しないので,照合属性だけが異なる文字列は,同順位とな
る。
4. 照合規則
4.1
基本照合規則 基本照合規則は,次の手順によって二つの文字列を評価する。
(1) 基底文字列を作成し,評価する。
(a) 文字列に基づき基底文字列を作成する。
元の文字列の各字に対応する基底文字を用いて,基底文字列を作成する。
4
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
(b) 基底文字列の各字を4.3で定義する文字クラスの順番及び4.4で定義する文字クラス内の順番によっ
て評価し,前又は後ろと評価できた場合は,それを結果とする。
どちらかの基底文字列に照合すべき文字がなくなった場合は,文字がなくなったほうを前,文字
が残っているほうを後ろの順序とする。
(c) 前又は後ろと評価できないまま両方の基底文字列に照合すべき文字がなくなった場合は,この段階
では同順位とする。
(2) (1)の段階で同順位となった場合は,照合属性を評価する。
(a) (1)で基底文字列を作成する元となった文字列の各字について,次のとおりに照合属性を評価する。
評価する文字の文字クラスが異なる場合は,4.3で定義する文字クラスの順番によって評価し,そ
れを結果とする。
当該文字に照合属性が指定されている場合は,その属性によって評価し,前又は後ろと評価でき
た場合は,それを結果とする。照合属性が複数指定されているときは,指定された属性の順に従っ
て,結果が出るまで評価を続ける。
どちらかの文字列に照合すべき文字がなくなった場合は,文字がなくなったほうを前,文字が残
っているほうを後ろの順序とする。
文字に照合属性が指定されていない場合は,この段階では同順位とする。
(b) 前又は後ろと評価できないまま両方の文字列に照合属性を評価すべき文字がなくなった場合は,同
順位とする。
4.2
簡易照合規則 簡易照合規則は,基本照合規則(1)までの手順とし,照合属性の評価は行わない。
4.3
文字クラス及びその順番 この規格で扱う文字は,それぞれ,表1又は処理系定義の文字クラスの
うち,いずれか一つの文字クラスに属する。
文字クラスの順番は,表1の番号順とし,文字クラス内での各文字の順番は,4.4による。
処理系が定義する文字及び文字クラスの順番については,4.5による。
表1 文字クラス
番号
文字クラス
1
スペース
2
記述記号
3
括弧記号
4
学術記号
5
一般記号
6
単位記号
7
アラビア数字
8
欧字記号
9
ラテンアルファベット
10
仮名
11
漢字
12
げた記号
4.3.1
文字クラスに属さない文字の扱い 表1又は処理系定義のいずれの文字クラスにも属さない文字
は,照合に当たっては無視する。
備考 ここでいう無視とは,あたかもその文字が文字列内に存在しないかのように処理を進めること
をいう。以下この規格で“直前の文字”,“先頭の文字”などと文字位置を表現する場合にも,
これらの無視しなければならない文字は含まないものとする。
5
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
例 与えられた文字列が“△あい△う”(無視しなければならない文字をここでは△で示す。)のとき,
この文字列の“先頭の文字”は“あ”であり,“う”の“直前の文字”は“い”である。
処理系が独自に追加しない場合,例えば,次のような文字は,表1の文字クラスに属さない。
例1. 独立の濁点,半濁点
例2. 独立のアキュートアクセントなどのダイアクリティカルマーク
例3. けい線素片,(単独の)合成用丸
例4. 4.4.2〜4.4.6に規定する記号類以外の記号(著作権記号,校正記号など)
例5. 4.4.8及び4.4.9に規定するギリシア,キリール及びラテンアルファベットを除くアルファベット
文字(アキュートアクセント付きアルファベット,エスツェット,アレフなど)
4.4
文字クラスの定義,クラス内での順番及び照合属性 各文字クラスに属する文字,その文字クラス
内での文字の順番,基底文字及び照合属性は,4.4.1〜4.4.12のとおりとする。
なお,各文字の名前を附属書に規定する。すべての図形文字は,ここで規定する名前によって一意に識
別される。
4.4.1
スペース 表2に示す1字は,スペース文字クラスに属し,照合属性はない。基底文字は,その文
字自身とする。
表2 スペース
番号 文字
日本語名称*
1
(SP)
スペース
注*
この欄は,便宜上,JS X
0208の日本語名称を使用し
ている。以下の表に現れる
日本語名称の欄についても
同様である。
4.4.2
記述記号 表3に示す20字は,記述記号文字クラスに属し,照合属性はない。各文字の基底文字
はその文字自身とし,その順番は番号欄のとおりとする。
表3 記述記号
番号 文字 日本語名称
番号 文字 日本語名称
1
、
読点
11
_
アンダーライン
2
。
句点
12
−
ダッシュ(全角)
3
,
コンマ
13
-
ハイフン(四分)
4
.
ピリオド
14
/
斜線
5
・
中点
15
\
逆斜線
6
:
コロン
16
〜
波ダッシュ
7
;
セミコロン
17
‖
双柱
8
?
疑問符
18
|
縦線
9
!
感嘆符
19
…
三点リーダ
10
̅
オーバーライン
20
‥
二点リーダ.
4.4.3
括弧記号 表4に示す22字は,括弧記号文字クラスに属し,照合属性はない。各文字の基底文字
はその文字自身とし,その順番は番号欄のとおりとする。
6
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
表4 括弧記号
番号 文字 日本語名称
番号 文字 日本語名称
1
ʻ
左シングル引用符
12
}
終わり波括弧
2
ʼ
右シングル引用符
13
〈
始め山括弧
3
“
左ダブル引用符
14
〉
終わり山括弧
4
”
右ダブル引用符
15
《
始め二重山括弧
5
(
始め丸括弧
16
》
終わり二重山括弧
6
)
終わり丸括弧
17
「
始めかぎ括弧
7
〔
始めきっ(亀)甲括弧
18
」
終わりかぎ括弧
8
〕
終わりきっ(亀)甲括弧 19
『
始め二重かぎ括弧
9
[
始め角括弧
20
』
終わり二重かぎ括弧
10
]
終わり角括弧
21
【
始めすみ付き括弧
11
{
始め波括弧
22
】
終わりすみ付き括弧
4.4.4
学術記号 表5に示す45字は,学術記号文字クラスに属し,照合属性はない。各文字の基底文字
はその文字自身とし,その順番は番号欄のとおりとする。
表5 学術記号
番号 文字 日本語名称
番号 文字 日本語名称
1
+
正符号,加算記号
24
⌒
弧
2
−
負符号,減算記号
25
≡
常に等しい,合同
3
±
正又は負符号,加減算
記号
26
∽
相似
4
×
乗算記号
27
∈
属する
5
÷
除算記号
28
∋
元として含む
6
=
等号
29
⊆
部分集合
7
≠
等号否定
30
⊇
部分集合(逆方向)
8
<
不等号(より小)
31
⊂
真部分集合
9
>
不等号(より大)
32
⊃
真部分集合(逆方向)
10
≦
より小さいか又は等し
い
33
∪
合併集合
11
≧
より大きいか又は等し
い
34
∩
共通集合
12
≒
ほとんど等しい
35
∧
及び(合接)
13
《
非常に小さい
36
∨
又は(離接)
14
》
非常に大きい
37
¬
否定
15
∝
比例
38
⇒
ならば(含意)
16
∞
無限大
39
⇔
同値
17
∂
デル
40
∀
すべての(普遍限定子)
18
▽
ナブラ
41
∃
存在する(存在限定子)
19
√
根号
42
∴
ゆえに
20
∫
積分記号
43
∵
なぜならば
21
∬
二重積分記号
44
♂
雄記号
22
∠
角
45
♀
雌記号
23
⊥
垂直
4.4.5
一般記号 表6に示す30字は,一般記号文字クラスに属し,照合属性はない。各文字の基底文字
はその文字自身とし,その順番は番号欄のとおりとする。
7
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
表6 一般記号
番号 文字 日本語名称
番号 文字 日本語名称
1
#
番号記号,井げた
16
◆
黒ひし形
2
&
アンパサンド
17
□
四角
3
*
星印,アステリスク
18
■
黒四角
4
@
単価記号
19
△
三角
5
§
節記号
20
▲
黒三角
6
¶
段落記号
21
▽
逆三角
7
※
米印
22
▼
逆黒三角
8
†
ダガー
23
〒
郵便記号
9
‡
ダブルダガー
24
→
右向矢印
10
☆
白星
25
←
左向矢印
11
★
黒星
26
↑
上向矢印
12
○
丸印,白丸
27
↓
下向矢印
13
●
黒丸
28
♯
シャープ
14
◎
二重丸
29
♭
フラット
15
◇
ひし形
30
♪
音符
4.4.6
単位記号 表7に示す11字は,単位記号文字クラスに属し,照合属性はない。各文字の基底文字
はその文字自身とし,その順番は番号欄のとおりとする。
表7 単位記号
番号 文字 日本語名称
番号 文字 日本語名称
1
゚
度
7
¢
セント記号
2
′
分
8
£
ポンド記号
3
″
秒
9
%
パーセント
4
℃
セ氏度記号
10
‰
パーミル
5
¥
円記号
11
Å
オングストローム
6
$
ドル記号
4.4.7
アラビア数字 次に示す10字は,アラビア数字文字クラスに属し,照合属性はない。各文字の基
底文字はその文字自身とし,その順番は次に示した順とする。
アラビア数字:0123456789
4.4.8
欧字記号 次に示す114字は,欧字記号文字クラスに属し,照合属性はない。各文字の基底文字は
その文字自身とし,その順番は次に示した順とする。
ギリシア文字: α β γ δ ε ζ η θ ι κ λ μ ν ξ o π ρ σ τ υ φ κ ψ ω
Α Β Γ ∆ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω
キリール文字: а б в г д е ё ж з и й к л м н о п р с т у ф х ц ч ш щ ъ ы ь э ю я
А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я
4.4.9
ラテンアルファベット 表8に示す72文字は,ラテンアルファベット文字クラスに属し,照合属
性は,“ダイアクリティカルマーク”及び“大小”の二つとする。各文字の照合属性の値は,照合属性欄に
示すとおりとする。
8
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
表8 ラテンアルファベット
文字
照合属性
ダイアクリティカルマーク
大小
a b c d e f g h i j k l m
ダイアクリティカルマークなし
小文字
n o p q r s t u v w x y z
ā ī ū ē ō
マクロン付き
小文字
â î û ê ô
サーカムフレックスアクセント付き
小文字
A B C D E F G H I J K L M
ダイアクリティカルマークなし
大文字
N O P Q R S T U V W X Y Z
Ā Ī Ū Ē Ō
マクロン付き
大文字
Â Î Û Ê Ô
サーカムフレックスアクセント付き
大文字
備考 マクロン付き文字及びサーカムフレックスアクセント付き文字をそれぞれ処理の
対象に含めるか否かは,処理系定義とする(6.2参照)。
参考 マクロン付き文字及びサーカムフレックスアクセント付き文字は,ローマ字長音
表記で用いられる文字である。
4.4.9.1
基底文字 ラテンアルファベットの基底文字は,表9に示すとおりとし,その順番は番号欄に示
すとおりとする。
表9 ラテンアルファベットの基底文字
番号 文字
基底文字
番号 文字
基底文字
1
a A ā Ā â Â
a
14
n N
n
2
b B
b
15
o O ō Ō ô Ô
o
3
c C
c
16
p P
p
4
d D
d
17
q Q
q
5
e E ē Ē ê Ê
e
18
r R
r
6
f F
f
19
s S
s
7
g G
g
20
t T
t
8
h H
h
21
u U
u
9
i I ī Ī î Î
i
22
v V
v
10
j J
j
23
w W
w
11
k K
k
24
x X
x
12
l L
l
25
y Y
y
13
m M
m
26
z Z
z
4.4.9.2
照合属性の評価 ラテンアルファベットの照合属性は,次の属性の順に評価する。
(1) 第1照合属性(ダイアクリティカルマーク)
ダイアクリテイカルマークなし<マクロン付き<サーカムフレックスアクセント付き
(2) 第2照合属性(大小)
小文字<大文字
4.4.10 仮名 表10に示す174文字は,仮名文字クラスに属し,照合属性は,“清濁“,“記号種別”及び
“仮名種別”の三つとする。各文字の照合属性の値は,照合属性欄に示すとおりとする。
9
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
表10 仮名
文字
照合属性
清濁
記号種別
仮名種別
あいうえおかきくけこさしすせそたちつてと
清音
大文字
平仮名
なにぬねのはひふへほまみむめもやゆよ
らりるれろわゐゑをん
がぎぐげござじずぜぞだぢづでどばびぶべぼ
濁音
大文字
平仮名
ぱぴぷぺぽ
半濁音
大文字
平仮名
ぁぃぅぇぉっゃゅょゎ
清音
小文字
平仮名
ゝ
清音
繰返し記号
平仮名
ゞ
濁音
繰返し記号
平仮名
アイウエオカキクケコサシスセソタチツテト
清音
大文字
片仮名
ナニヌネノハヒフヘホマミムメモヤユヨ
ラリルレロワヰヱヲン
ヴガギグゲゴザジズゼゾダヂヅデドバビブベボ
濁音
大文字
片仮名
パピプペポ
半濁音
大文字
片仮名
ァィゥェォヵヶッャュョヮ
清音
小文字
片仮名
ヽ
清音
繰返し記号
片仮名
ヾ
濁音
繰返し記号
片仮名
ー
清音
長音記号
片仮名
参考1. “ヶ”は本来は漢字であるが,JIS X 0208が片仮名の種として定義しているので,片
仮名に含める。
2. “ー”(長音記号)は,便宜上,片仮名・清音とする。
4.4.10.1 基底文字 仮名の基底文字及び基底文字への置換えは,次による。
(1) 仮名の基底文字は表11のとおりとし,その順番は番号欄に示すとおりとする。
表11 仮名の基底文字
番号 文字
基底
文字
番号 文字
基底
文字
番号 文字
基底
文字
1
ぁあァア
あ
18
っつづッツヅ つ
35
もモ
も
2
ぃいィイ
い
19
てでテデ
て
36
ゃやャヤ
や
3
ぅうゥウヴ
う
20
とどトド
と
37
ゅゆュユ
ゆ
4
ぇえェエ
え
21
なナ
な
38
ょよョヨ
よ
5
ぉおォオ
お
22
にニ
に
39
らラ
ら
6
かがヵカガ
か
23
ぬヌ
ぬ
40
りリ
り
7
きぎキギ
き
24
ねネ
ね
41
るル
る
8
くぐクグ
く
25
のノ
の
42
れレ
れ
9
けげヶケゲ
け
26
はばぱハバパ は
43
ろロ
ろ
10
こごコゴ
こ
27
ひびぴヒビピ ひ
44
ゎわヮワ
わ
11
さざサザ
さ
28
ふぶぷフブプ ふ
45
ゐヰ
ゐ
12
しじシジ
し
29
へべぺヘベペ へ
46
ゑヱ
ゑ
13
すずスズ
す
30
ほぼぽホボポ ほ
47
をヲ
を
14
せぜセゼ
せ
31
まマ
ま
48
んン
ん
15
そぞソゾ
そ
32
みミ
み
49
ゝゞヽヾ
ゝ
16
ただタダ
た
33
むム
む
50
ー
ー
17
ちぢチヂ
ち
34
めメ
め
(2) (1)の置換えを行った後,基底文字“ー”(長音記号)は,表12によって置き換える。すなわち,直前
の基底文字の母音(又は“ん”)を示す文字に置き換える。
これ以外の場合,すなわち,直前の文字がない場合又は直前の文字の基底文字が表12にない場合は,
10
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
置き換えない。
表12 基底文字“ー”(長音記号)の置換え
直前の基底文字
置換え基底文字
あかさたなはまやらわ
あ
いきしちにひみりゐ
い
うくすつぬふむゆる
う
えけせてねへめれゑ
え
おこそとのほもよろを
お
ん
ん
(3) (2)までの置換えを行った後,基底文字“ゝ”(繰返し記号)は,直前に基底文字があり,それが基底
文字“ゝ”(繰返し記号)でも基底文字“ー”(長音記号)でもない場合,直前の基底文字に置き換え
る。
直前の文字がない場合は,置き換えない。
4.4.10.2 照合属性の評価 仮名の照合属性は,次の属性の順に評価する。
(1) 第1照合属性(清濁)
清音文字<濁音文字<半濁音文字
(2) 第2照合属性(記号種別)
長音記号<小文字<繰返し記号<大文字
(3) 第3照合属性(仮名種別)
平仮名<片仮名
4.4.11 漢字 漢字文字クラスは,次の三つのうちのいずれか一つとする。漢字文字クラスに属する文字に
は照合属性はなく,各文字の基底文字はその文字自身とする。
備考 処理系は,どの漢字文字クラスを選択したかを,文書に明示しなければならない(6.2参照)。
(1) 最小漢字文字クラス このクラスの漢字は表13の5字とし,その順番は番号欄のとおりとする。
表13 最小漢字文字クラス
番号 文字 日本語名称
1
〃
同じく記号
2
仝
同上記号
3
々
繰返し記号
4
〆
しめ
5
〇
漢数字ゼロ
備考 いかなる処理系定義の漢字文字クラスにも,最小漢字文字クラスの5字は含まれなければなら
ない。
参考 “〆”は本来は仮名合成字であるが,実際の“〆切”,“〆て”などの用例は,漢字の一種とし
て扱うほうがより適切であるので,漢字文字クラスに含める。
(2) 基本漢字文字クラス このクラスの漢字は,最小漢字文字クラスの5字をその順番で含み,その後ろ
にJIS X 0208に定義される漢字6355字をその区点番号の順番で並べたものとする。
(3) 拡張漢字文字クラス このクラスの漢字は,最小漢字文字クラスの5字をその順番で含み,その後ろ
にJIS X 0221の“CJK統合漢字”に定義される漢字から“4EDD仝”を除いた20901字をその符号位
置の順番で並べたものとする。
4.4.12 げた記号 表14に示す1字は,げた記号文字クラスに属し,照合属性はない。基底文字は,その
文字自身とする。
11
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
表14 げた記号
番号 文字 日本語名称
1
〓
げた記号
備考 げた記号文字クラスは,他のいかなる文字クラスよりも順序が更に後ろと評価されることを保
証するためのクラスとして設定されたもので,そのように使用する。
4.5
処理系定義による追加 処理系は,文字,文字クラス,文字の照合属性及び文字の照合属性の値を
追加して定義してもよい。追加する場合は,次による。
備考 処理系は,独自に追加定義した内容を文書に明示しなければならない(6.2参照)。
(1) 文字を追加する場合,次の条件をすべて満たすように追加しなければならない。
(a) 追加する文字は,この規格で規定している文字クラス又は処理系定義の新たな文字クラスのいずれ
かに属さなければならない。
(b) 追加する文字には,基底文字及び照合属性の値を定義しなければならない。照合属性の値の定義と
して“照合属性なし”も含むものとする。
(c) この規格が規定している文字クラスに追加する場合は,規定している文字の相対的な順番を変えな
いようにしたうえで,追加する文字及びその文字の文字クラス内での順番を定義しなければならな
い。
(d) この規格が規定している照合属性をもつ文字クラスに追加する場合は,規定している照合属性のす
べてについて,その属性の値を定義しなければならない。
(e) 新たな文字クラスを追加する場合は,追加する文字クラス及びその文字クラス内での追加する文字
の順番,並びにその文字クラスの順番を定義しなければならない。ただし,この規格が規定してい
る文字クラス及び文字クラスの相対的な順番を変更してはならず,げた記号文字クラスより後ろに
新たな文字クラスを定義してはならない。
(2) この規格が照合属性を規定している文字クラスに照合属性を追加する場合,又は照合属性の値を追加
する場合,次の条件をすべて満たすように追加しなければならない。
(a) 当該文字クラスのすべての文字に,追加する照合属性の値を定めなければならない。
(b) 追加する照合属性に関して,それぞれの照合属性の評価の規則,及びそれらの照合属性を評価する
順番を定めなければならない。
(c) 追加する照合属性の評価の順は,この規格で規定する照合属性の評価の後でなければならない。
(3) この規格が照合属性を規定していない文字クラスに照合属性を与える場合,次の条件をすべて満たす
ように追加しなければならない。
(a) 当該文字クラスのすべての文字に,追加する照合属性の値を定めなければならない。
(b) 当該文字クラスのすべての文字に,基底文字を定義しなければならない。
(c) 追加する照合属性に関して,それぞれの照合属性の評価の規則,及びそれらの照合属性を評価する
順番を定めなければならない。
5. 照合方法
5.1
単純照合 単純照合は,与えられた一つの文字列をそのまま照合キーとし,その照合キーに照合規
則を適用して得られた結果を,照合結果とする。
12
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
例1.
さと<
さど<
さとう<
さどう<
さとうや<
サトー<
さとおや
(里)
(佐渡) (砂糖)
(茶道)
(砂糖屋)
(Satow)
(里親)
例2.
ファール<
ぶあい< ファウル<
ファウル<
ファン< ふあん<
フアン< ぶあん
(foul)
(歩合) (foul)
(foul)
(fan)
(不安)
(Juan)
(撫安)
例3.
しょう<
しよう<
じょう<
じよう<
しょうし<
しょうじ<
しようじ
(商)
(使用)
(乗)
(滋養)
(小史)
(障子)
(使用時)
じょうし< じょうじ< ショー<
ショオ<
ジョー<
じょおう<
ジョージ
(上梓)
(常時)
(show)
(Shaw)
(jaw)
(女王)
(George)
参考1. 例1.〜例3.の括弧の中の語の漢字・アルファベットによる表記は,例を分かりやすくするため
に加えた注記にすぎず,単純照合で実際に参照するのは,上段の文字列だけである。
2. 照合する文字列の文字種に関しての制限はなく,仮名以外であってもよい。
例 おちゃのみず<おんじゅく<お茶の水<お茶ノ水<ごてんば<御宿<御茶ノ水<御殿場
これは,“基本漢字文字クラス”(4.4.11参照)を選択した場合の結果である。
5.2
読み・表記照合 読み・表記照合では,読み列及び表記列が与えられることを前提とする。
読み・表記照合は,次の二つの段階からなり,次の手順で得られた結果を照合結果とする。
(1) 読み列を照合キーとして照合規則で評価する。
(2) (1)の段階で同順位になった場合は,更に表記列を照合キーとして照合規則で評価する。
例 人名の整列
(1) 第1段階 照合キーとして,“おやま”,“こやま”,“おさだ”,“ながた”などの読み列を用い
る。
おさだ
長田<おやま
小山<こじま
児島=こじま
小島=こじま
小嶋<こやま
小山<ながた
永田<ながた
長田
(2) 第2段階 第1段階で同順位になる項目を,更に表記列を照合キーとして照合規則で評価す
る。
児島<
小島
(児<小)
小島<
小嶋
(島<嶋)
永田<
長田
(永<長)
これは,“拡張漢字文字クラス”(4.4.11参照)を選択した場合の結果である。
(3) この結果,次のように照合される。
おさだ
長田<おやま
小山<こじま
児島<こじま
小島<こじま
小嶋<こやま
小山<ながた
永田=ながた
長田
5.3
代表読み照合
5.3.1
基本代表読み照合 基本代表読み照合は,読み列及び表記列が与えられ,それぞれ,代表読みを定
めることが可能なように分節されていることを前提とする。ただし,この分節の方法及び代表読みを定め
る方法は,処理系定義とする(6.2参照)。
基本代表読み照合は,次の段階からなり,次の手順で得られた結果を照合結果とする。
(1) 二つの表記列のそれぞれの先頭字を,4.3の文字クラスの順番に従って評価する。
(2) (1)の段階で同順位になった場合は,二つの表記列中の各分節に対して,分節がある限り,次の(a)及び
(b)の規則を順次適用する。
13
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
一方の表記列に照合すべき分節がなくなった場合は,そのなくなった表記列のほうを,前の順序と
する。
両方の表記列に照合すべき分節がなくなった場合は,この段階では同順位とする。
(a) その分節の表記列及び読み列を用いて代表読み辞書から代表読みを決め,その代表読みを照合キー
として,照合規則で評価する。
備考 同じ漢字であっても,読み列の先頭字が異なれば,別の代表読みをもつことがある。このため,
代表読みの取得には,読み列の先頭字を参照しなければならない。
一方,読み列の先頭字が同じならば,代表読みは当該表記列に対して一意に定まるので,読
み列自体は異なっても代表読みは同一となる。
例
表記列
読み列の例
代表読みの例
安
あ,あん
あ
やす,やすらか
やす
足
あ,あし
あし
そく
そく
た,たり,たる
た
角
かく,かど
かく
つの
つの
勝
かち,かつ
かち
しょう
しょう
この結果
あだち
安達=あんどう
安藤<あだち
足立<かくた
角田=かどた
角田<かつやま
勝山<つのだ
角田<やすだ
安田
のように,先頭字の表記が同じものは一つのところにまとまる。
(b) (a)の段階で同順位になった場合は,その分節の表記列を照合キーとして,照合規則で評価する。
備考1. 第2分節以降についても評価を繰り返すかどうかは,処理系定義とする(6.2参照)。
2. 表記列に対して,文字列変換を行ってもよい。
参考 ここで想定している文字列変換は,新字・旧字・異体字の同一視などのための変換である。
例
さわだ
沢田
→沢(そのまま)
→沢田
さわだ
澤田
→澤(変換)
→沢田
さわしま
沢島
→沢・島(そのまま)
→沢島
さわしま
澤嶋
→澤・嶋(それぞれ変換) →沢島
(3) (2)の段階で同順位となった場合は,読み列を照合キーとして,照合規則で評価する。
(4) (3)の段階で同順位となった場合は,表記列を照合キーとして,照合規則で評価する。
備考 (2)で表記列に対する文字列変換を行った場合でも,その変換を行う前の表記列を評価する。
例
さわしま
沢島<さわしま
沢嶋<さわしま
澤島<さわしま
澤嶋<さわだ
沢田<さわだ
澤田
5.3.2
簡易代表読み照合 簡易代表読み照合は,読み列及び表記列が与えられていることを前提とする。
簡易代表読み照合は,代表読み辞書を必要としない。
参考 簡易代表読み照合は,代表読み辞書を用いるほど大規模な照合を必要としない場合などのため
のものである。
簡易代表読み照合では,5.3.1の基本代表読み照合の手順で照合を進めるが,5.3.1の(2)の段階に限って
は,次のとおりに照合する。
14
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
5.3.1の(2)(a)の段階では,読み列の先頭字を取り出し,それを4.に定める方法で基底文字列に置き換え,
置き換えた結果を代表読みとみなして,照合規則で評価する。
例
表記列
読み列の例
基本代表読みによる
基本代表読みによる
代表読み
代表読みの例
安
あ,あん
あ
あ
やす,やすらか
や
やす
足
あ,あし
あ
あし
そく
そ
そく
た,たり,たる
た
た
角
かく,かど
か
かく
つの
つ
つの
勝
かち,かつ
か
かち
しょう
し
しょう
5.3.1の(2)(b)の段階では,5.3.1の(2)(a)の段階で同順位になった場合は,表記列の先頭字を取り出し,そ
れを照合キーとして,照合規則で評価する。
備考1. 簡易代表読み照合では,評価は第1分節についてだけ行い,第2分節以降について評価を繰り
返さない。
2. 簡易代表読み照合では,表記列に対する文字列変換は行わない。
6. 適合性
6.1
適合性の主張 この規格への適合性を主張する処理系は,次の要件(1)及び(2)を満たさなければなら
ない。
(1) 次に示す照合方法の一つ以上を実装しなければならない。
(a) 単純照合(5.1参照)
(b) 読み・表記照合(5.2参照)
(c) 基本代表読み照合(5.3.1参照)
(d) 簡易代表読み照合(5.3.2参照)
(2) 次に示す照合規則の一つ以上を実装しなければならない。
(a) 基本照合規則(4.1参照)
(b) 簡易照合規則(4.2参照)
備考 処理系は,この規格で規定する照合順番と同じ結果を与えなければならないが,同じ結果を生
成する限り,必ずしもこの規格で規定する手順をそのまま踏まなくてもよい。
6.2
処理系定義項目の明示 この規格への適合性を主張する処理系は,次の項目(1)〜(6)に対する内容を
文書に明示しなければならない。
代表読み照合を実装するときは,次の(7)及び(8)の項目の内容も,文書に明示しなければならない。
(1) 文字の符号化方法(1.参照)
(2) 照合対象文字列の最大有効文字数
(3) 追加する文字クラスの定義及びその順番(4.3及び4.5参照)
(4) 追加する文字の所属文字クラス並びにその文字クラス内での順番及び照合属性(4.4及び4.5参照)
(5) ラテンアルファベットの処理対象として,マクロン付き文字及びサーカムフレックス付き文字を,そ
れぞれ含むか否か(4.4.9参照)
15
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
(6) 選択した漢字文字クラス(4.4.11参照)
(7) 代表読み照合のための分節の方法及び代表読みを定める方法(5.3.1参照)
(8) 基本代表読み照合における第2分節以降についての繰返し処理を行うか否か[5.3.1の(2)参照]
16
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
附属書 各文字クラスの文字の名前
この附属書は,本体4.4で規定している4.4.1〜4.4.12の各文字クラスの文字の名前を規定する。
附属書表1 スペース
番号 文字 日本語名称
名前
1
(SP) スペース
SPACE
附属書表2 記述記号
番号 文字 日本語名称
名前
1
、
読点
IDEOGRAPHIC COMMA
2
。
句点
IDEOGRAPHIC FULL STOP
3
,
コンマ
COMMA
4
.
ピリオド
FULL STOP
5
・
中点
MIDDLE DOT
6
:
コロン
COLON
7
;
セミコロン
SEMICOLON
8
?
疑問符
QUOTATION MARK
9
!
感嘆符
EXCLAMATION MARK
10
̅
オーバーライン
OVERLINE
11
_
アンダーライン
LOWLINE
12
−
ダッシュ(全角)
EM DASH
13
-
ハイフン(四分)
HYPHEN
14
/
斜線
SOLIDUS
15
\
逆斜線
REVERSE SOLIDUS
16
〜
波ダッシュ
WAVE DASH
17
‖
双柱
DOUBLE VERTICAL LINE
18
|
縦線
VERTICAL LINE
19
…
三点リーダ
HORIZONTAL ELLIPSIS
20
‥
二点リーダ
TWO DOT LEADER
附属書表3 括弧記号
番号 文字 日本語名称
名前
1
ʻ
左シングル引用符
LEFT SINGLE QUOTATION MARK
2
'
右シングル引用符
RIGHT SINGLE QUOTATION MARK
3
“
左ダブル引用符
LEFT DOUBLE QUOTATION MARK
4
”
右ダブル引用符
RIGHT DOUBLE QUOTATION MARK
5
(
始め丸括弧
LEFT PARENTHESIS
6
)
終わり丸括弧
RIGHT PARENTHESIS
7
〔
始めきっ(亀)甲括弧
LEFT TORTOISE SHELL BRACKET
8
〕
終わりきっ(亀)甲括弧
RIGHT TORTOISE SHELL BRACKET
9
[
始め角括弧
LEFT SQUARE BRACKET
10
]
終わり角括弧
RIGHT SQUARE BRACKET
11
{
始め波括弧
LEFT CURLY BRACKET
12
}
終わり波括弧
RIGHT CURLY BRACKET
13
〈
始め山括弧
LEFT ANGLE BRACKET
14
〉
終わり山括弧
RIGHT ANGLE BRACKET
15
《
始め二重山括弧
LEFT DOUBLE ANGLE BRACKET
16
》
終わり二重山括弧
RIGHT DOUBLE ANGLE BRACKET
17
「
始めかぎ括弧
LEFT CORNER BRACKET
17
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
番号 文字 日本語名称
名前
18
」
終わりかぎ括弧
RIGHT CORNER BRACKET
19
『
始め二重かぎ括弧
LEFT WHITE CORNER BRACKET
20
』
終わり一重かぎ括弧
RIGHT WHITE CORNER BRACKET
21
【
始めすみ付き括弧
LEFT BLACK LENTICULAR
BRACKET
22
】
終わりすみ付き括弧
RIGHT BLACK LENTICULAR
BRACKET
附属書表4 学術記号
番号 文字 日本語名称
名前
1
+
正符号,加算記号
PLUS SIGN
2
−
負符号,減算記号
MINUS SIGN
3
±
正又は負符号,加減算記号 PLUS-MINUS SIGN
4
×
乗算記号
MULTIPLICATION SIGN
5
÷
除算記号
DIVISION SIGN
6
=
等号
EQUALS SIGN
7
≠
等号否定
NOT EQUAL TO
8
<
不等号(より小)
LESS-THAN SIGN
9
>
不等号(より大)
GREATER-THAN SIGN
10
≦
より小さいか又は等しい
LESS-THAN OVER EQUAL TO
11
≧
より大きいか又は等しい
GREATER-THAN OVER EQUAL TO
12
≒
ほとんど等しい
APPROXIMATELY EQUAL TO OR THE
IMAGE OF
13
《
非常に小さい
MUCH LESS-THAN
14
》
非常に大きい
MUCH GREATER-THAN
15
∝
比例
PROPORTIONAL TO
16
∞
無限大
INFINITY
17
∂
デル
PARTIAL DIFFERENTIAL
18
▽
ナブラ
NABLA
19
√
根号
SQUARE R00T
20
∫
積分記号
INTEGRAL
21
∬
二重積分記号
DOUBLE INTEGRAL
22
∠
角
ANGLE
23
⊥
垂直
UP TACK
24
⌒
弧
ARC
25
≡
常に等しい,合同
IDENTICAL TO
26
∽
相似
REVERSED TILDE
27
∈
属する
ELEMENT OF
28
∋
元として含む
CONTAINS AS MEMBER
29
⊆
部分集合
SUBSET OF OR EQUAL TO
30
⊇
部分集合(逆方向)
SUPERSET OF OR EQUAL TO
31
⊂
真部分集合
SUBSET OF
32
⊃
真部分集合(逆方向)
SUPERSET OF
33
∪
合併集合
UNION
34
∩
共通集合
INTERSECTION
35
∧
及び(合接)
LOGICAL AND
36
∨
又は(離接)
LOGICAL OR
37
¬
否定
NOT SIGN
38
⇒
ならば(含意)
RIGHTWARDS DOUBLE ARROW
39
⇔
同値
LEFT RIGHT DOUBLE ARROW
40
∀
すべての(普遍限定子)
FOR ALL
18
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
番号 文字 日本語名称
名前
41
∃
存在する(存在限定子)
THERE EXISTS
42
∴
ゆえに
THEREFORE
43
∵
なぜならば
BECAUSE
44
♂
雄記号
MALE SIGN
45
♀
雌記号
FEMALE SIGN
附属書表5 一般記号
番号 文字 日本語名称
名前
1
#
番号記号,井げた
NUMBER SIGN
2
&
アンパサンド
AMPERSAND
3
*
星印,アステリスク
ASTERISK
4
@
単価記号
COMMERCIAL AT
5
§
節記号
SECTION SIGN
6
¶
段落記号
PILCROW SIGN
7
※
米印
REFERENCE MARK
8
†
ダガー
DAGGER
9
‡
ダブルダガー
DOUBLE DAGGER
10
☆
白星
WHITE STAR
11
★
黒星
BLACK STAR
12
○
丸印,白丸
WHITE CIRCLE
13
●
黒丸
BLACK CIRCLE
14
◎
二重丸
BULLSEYE
15
◇
ひし形
WHITE DIAMOND
16
◆
黒ひし形
BLACK DIAMOND
17
□
四角
WHITE SQUARE
18
■
黒四角
BLACK SQUARE
19
△
三角
WHITE UP-POINTING TRIANGLE
20
▲
黒三角
BLACK UP-POINTING TRIANGLE
21
▽
逆三角
WHITE DOWN-POINTING TRIANGLE
22
▼
逆黒三角
BLACK DOWN-POINTING TRIANGLE
23
〒
郵便記号
POSTAL MARK
24
→
右向矢印
RIGHTWARDS ARROW
25
←
左向矢印
LEFTWARDS ARROW
26
↑
上向矢印
UPWARDS ARROW
27
↓
下向矢印
DOWNWARDS ARROW
28
♯
シャープ
MUSIC SHARP SIGN
29
♭
フラツト
MUSIC FLAT SIGN
30
♪
音符
EIGHTH NOTE
附属書表6 単位記号
番号 文字 日本語名称
名前
1
。
度
DEGREE SIGN
2
′
分
PRIME
3
″
秒
DOUBLE PRIME
4
℃
セ氏度記号
DEGREE CELSIUS
5
¥
円記号
YEN SIGN
6
$
ドル記号
DOLLAR SIGN
7
¢
セント記号
CENT SIGN
8
£
ポンド記号
POUND SIGN
9
%
パーセント
PERCENT SIGN
10
‰
パーミル
PER MILLE SIGN
19
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
番号 文字 日本語名称
名前
11
Å
オングストローム
ANGSTROM SIGN
附属書表7 アラビア数字
番号 文字 名前
1
0
DIGIT ZERO
2
1
DIGIT ONE
3
2
DIGIT TWO
4
3
DIGIT THREE
5
4
DIGIT FOUR
6
5
DIGIT FIVE
7
6
DIGIT SIX
8
7
DIGIT SEVEN
9
8
DIGIT EIGHT
10
9
DIGIT NINE
附属書表8 欧字記号
番号 文字 名前
1
α
GREEK SMALL LETTER ALPHA
2
β
GREEK SMALL LETTER BETA
3
γ
GREEK SMALL LETTER GAMMA
4
δ
GREEK SMALL LETTER DELTA
5
ε
GREEK SMALL LETTER EPSILON
6
ζ
GREEK SMALL LETTER ZETA
7
η
GREEK SMALL LETTER ETA
8
θ
GREEK SMALL LETTER THETA
9
ι
GREEK SMALL LETTER IOTA
10
κ
GREEK SMALL LETTER KAPPA
11
λ
GREEK SMALL LETTER LAMBDA
12
μ
GREEK SMALL LETTER MU
13
ν
GREEK SMALL LETTER NU
14
ξ
GREEK SMALL LETTER XI
15
ο
GREEK SMALL LETTER OMICRON
16
π
GREEK SMALL LETTER PI
17
ρ
GREEK SMALL LETTER RHO
18
σ
GREEK SMALL LETTER SIGMA
19
τ
GREEK SMALL LETTER TAU
20
υ
GREEK SMALL LETTER UPSILON
21
φ
GREEK SMALL LETTER PHI
22
χ
GREEK SMALL LETTER CHI
23
ψ
GREEK SMALL LETTER PSI
24
ω
GREEK SMALL LETTER OMEGA
25
Α
GREEK CAPITAL LETTER ALPHA
26
Β
GREEK CAPITAL LETTER BETA
27
Γ
GREEK CAPITAL LETTER GAMMA
28
∆
GREEK CAPITAL LETTER DELTA
29
Ε
GREEK CAPITAL LETTER EPSILON
30
Ζ
GREEK CAPITAL LETTER ZETA
31
Η
GREEK CAPITAL LETTER ETA
32
Θ
GREEK CAPITAL LETTER THETA
33
Ι
GREEK CAPITAL LETTER IOTA
34
Κ
GREEK CAPITAL LETTER KAPPA
20
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
番号 文字 名前
35
Λ
GREEK CAPITAL LETTER LAMBDA
36
Μ
GREEK CAPITAL LETTER MU
37
Ν
GREEK CAPITAL LETTER NU
38
Ξ
GREEK CAPITAL LETTER XI
39
Ο
GREEK CAPITAL LETTER OMICRON
40
Π
GREEK CAPITAL LETTER PI
41
Ρ
GREEK CAPITAL LETTER RHO
42
Σ
GREEK CAPITAL LETTER SIGMA
43
Τ
GREEK CAPITAL LETTER TAU
44
Υ
GREEK CAPITAL LETTER UPSILON
45
Φ
GREEK CAPITAL LETTER PHI
46
Χ
GREEK CAPITAL LETTER CHI
47
Ψ
GREEK CAPITAL LETTER PSI
48
Ω
GREEK CAPITAL LETTER OMEGA
49
а
CYRILLIC SMALL LETTER A
50
б
CYRILLIC SMALL LETTER BE
51
в
CYRILLIC SMALL LETTER VE
52
г
CYRILLIC SMALL LETTER GHE
53
д
CYRILLIC SMALL LETTER DE
54
е
CYRILLIC SMALL LETTER IE
55
ё
CYRILLIC SMALL LETTER IO
56
ж
CYRILLIC SMALL LETTER ZHE
57
з
CYRILLIC SMALL LETTER ZE
58
и
CYRILLIC SMALL LETTER I
59
й
CYRILLIC SMALL LETTER SHORT I
60
к
CYRILLIC SMALL LETTER KA
61
л
CYRILLIC SMALL LETTER EL
62
м
CYRILLIC SMALL LETTER EM
63
н
CYRILLIC SMALL LETTER EN
64
о
CYRILLIC SMALL LETTER O
65
п
CYRILLIC SMALL LETTER PE
66
р
CYRILLIC SMALL LETTER ER
67
с
CYRILLIC SMALL LETTER ES
68
т
CYRILLIC SMALL LETTER TE
69
у
CYRILLIC SMALL LETTER U
70
ф
CYRILLIC SMALL LETTER EF
71
х
CYRILLIC SMALL LETTER HA
72
ц
CYRILLIC SMALL LETTER TSE
73
ч
CYRILLIC SMALL LETTER CHE
74
ш
CYRILLIC SMALL LETTER SHA
75
щ
CYRILLIC SMALL LETTER SHCHA
76
ъ
CYRILLIC SMALL LETTER HARD SIGN
77
ы
CYRILLIC SMALL LETTER YERU
78
ь
CYRILLIC SMALL LETTER SOFT SIGN
79
э
CYRILLIC SMALL LETTER E
80
ю
CYRILLIC SMALL LETTER YU
81
я
CYRILLIC SMALL LETTER YA
82
А
CYRILLIC CAPITAL LETTER A
83
Б
CYRILLIC CAPITAL LETTER BE
84
В
CYRILLIC CAPITAL LETTER VE
85
Г
CYRILLIC CAPITAL LETTER GHE
21
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
番号 文字 名前
86
Д
CYRILLIC CAPITAL LETTER DE
87
Е
CYRILLIC CAPITAL LETTER IE
88
Ё
CYRILLIC CAPITAL LETTER IO
89
Ж
CYRILLIC CAPITAL LETTER ZHE
90
З
CYRILLIC CAPITAL LETTER ZE
91
И
CYRILLIC CAPITAL LETTER I
92
Й
CYRILLIC CAPITAL LETTER SHORT I
93
К
CYRILLIC CAPITAL LETTER KA
94
Л
CYRILLIC CAPITAL LETTER EL
95
М
CYRILLIC CAPITAL LETTER EM
96
Н
CYRILLIC CAPITAL LETTER EN
97
О
CYRILLIC CAPITAL LETTER O
98
П
CYRILLIC CAPITAL LETTER PE
99
Р
CYRILLIC CAPlTAL LETTER ER
100
С
CYRILLIC CAPITAL LETTER ES
101
Т
CYRILLIC CAPITAL LETTER TE
102
У
CYRILLIC CAPITAL LETTER U
103
Ф
CYRILLIC CAPITAL LETTER EF
104
Х
CYRILLIC CAPITAL LETTER HA
105
Ц
CYRILLIC CAPITAL LETTER TSE
106
Ч
CYRILLIC CAPITAL LETTER CHE
107
Ш
CYRILLIC CAPITAL LETTER SHA
108
Щ
CYRILLIC CAPITAL LETTER SHCHA
109
Ъ
CYRILLIC CAPITAL LETTER HARD SIGN
110
Ы
CYRILLIC CAPITAL LETTER YERU
111
Ь
CYRILLIC CAPITAL LETTER SOFT SIGN
112
Э
CYRILLIC CAPITAL LETTER E
113
Ю
CYRILLIC CAPITAL LETTER YU
114
Я
CYRILLIC CAPITAL LETTER YA
附属書表9 ラテンアルファベット
番号 文字 名前
1
a
LATIN SMALL LETTER A
1
A
LATIN CAPITAL LETTER A
1
ā
LATIN SMALL LETTER A WITH MACRON
1
Ā
LATIN CAPITAL LETTER A WITH MACRON
1
â
LATIN SMALL LETTER A WITH CIRCUMFLEX
1
Â
LATIN CAPITAL LETTER A WITH CIRCUMFLEX
2
b
LATIN SMALL LETTER B
2
B
LATIN CAPITAL LETTER B
3
c
LATIN SMALL LETTER C
3
C
LATIN CAPITAL LETTER C
4
d
LATIN SMALL LETTER D
4
D
LATIN CAPITAL LETTER D
5
e
LATIN SMALL LETTER E
5
E
LATIN CAPITAL LETTER E
5
ē
LATIN SMALL LETTER E WITH MACRON
5
Ē
LATIN CAPITAL LETTER E WITH MACRON
5
ê
LATIN SMALL LETTER E WITH CIRCUMFLEX
5
Ê
LATIN CAPITAL LETTER E WITH CIRCUMFLEX
6
f
LATIN SMALL LETTER F
22
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
番号 文字 名前
6
F
LATIN CAPITAL LETTER F
7
g
LATIN SMALLLETTER G
7
G
LATIN CAPITAL LETTER G
8
h
LATIN SMALL LETTER H
8
H
LATIN CAPITAL LETTER H
9
i
LATIN SMALL LETTER I
9
I
LATIN CAPITAL LETTER I
9
ī
LATIN SMALL LETTER I WITH MACRON
9
Ī
LATIN CAPITAL LETTER I WITH MACRON
9
î
LATIN SMALL LETTER I WITH CIRCUMFLEX
9
Î
LATIN CAPITAL LETTER I WITH CIRCUMFLEX
10
j
LATIN SMALL LETTER J
10
J
LATIN CAPITAL LETTER J
11
k
LATIN SMALL LETTER K
11
K
LATIN CAPITAL LETTER K
12
l
LATIN SMALL LETTER L
12
L
LATIN CAPITAL LETTER L
13
m
LATIN SMALL LETTER M
13
M
LATIN CAPITALLETTER M
14
n
LATIN SMALL LETTER N
14
N
LATIN CAPITAL LETTER N
15
o
LATIN SMALL LETTER O
15
O
LATIN CAPITAL LETTER O
15
ō
LATIN SMALL LETTER O WITH MACRON
15
Ō
LATIN CAPITAL LETTER O WITH MACRON
15
ô
LATIN SMALL LETTER O WITH CIRCUMFLEX
15
Ô
LATIN CAPITAL LETTER O WITH CIRCUMFLEX
16
p
LATIN SMALL LETTER P
16
P
LATIN CAPITAL LETTER P
17
q
LATIN SMALL LETTER Q
17
Q
LATIN CAPITAL LETTER Q
18
r
LATIN SMALL LETTER R
18
R
LATIN CAPITAL LETTER R
19
s
LATIN SMALL LETTER S
19
S
LATIN CAPITAL LETTER S
20
t
LATIN SMALL LETTER T
20
T
LATIN CAPITAL LETTER T
21
u
LATIN SMALL LETTER U
21
U
LATIN CAPITAL LETTER U
21
ū
LATIN SMALL LETTER U WITH MACRON
21
Ū
LATIN CAPITAL LETTER U WITH MACRON
21
û
LATIN SMALL LETTER U WITH CIRCUMFLEX
21
Û
LATIN CAPITAL LETTER U WITH CIRCUMFLEX
22
v
LATIN SMALL LETTER V
22
V
LATIN CAPITAL LETTER V
23
w
LATIN SMALL LETTER W
23
W
LATIN CAPITAL LETTER W
24
x
LATIN SMALL LETTER X
24
X
LATIN CAPITAL LETTER X
25
y
LATIN SMALL LETTER Y
25
Y
LATIN CAPITAL LETTER Y
23
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
番号 文字 名前
26
z
LATIN SMALL LETTER Z
26
Z
LATIN CAPITAL LETTER Z
附属書表10 仮名
番号 文字 名前
1
ぁ
HIRAGANA LETTER SMALL A
1
あ
HIRAGANA LETTER A
1
ァ
KATAKANA LETTER SMALL A
1
ア
KATAKANA LETTER A
2
ぃ
HIRAGANA LETTER SMALL I
2
い
HIRAGANA LETTER I
2
ィ
KATAKANA LETTER SMALL I
2
イ
KATAKANA LETTER I
3
ぅ
HIRAGANA LETTER SMALL U
3
う
HIRAGANA LETTER U
3
ゥ
KATAKANA LETTER SMALL U
3
ウ
KATAKANA LETTER U
3
ヴ
KATAKANA LETTER VU
4
ぇ
HIRAGANA LETTER SMALL E
4
え
HIRAGANA LETTER E
4
ェ
KATAKANA LETTER SMALL E
4
エ
KATAKANA LETTER E
5
ぉ
HIRAGANA LETTER SMALL O
5
お
HIRAGANA LETTER O
5
ォ
KATAKANA LETTER SMALL O
5
オ
KATAKANA LETTER O
6
か
HIRAGANA LETTER KA
6
が
HIRAGANA LETTER GA
6
ヵ
KATAKANA LETTER SMALL KA
6
カ
KATAKANA LETTER KA
6
ガ
KATAKANA LETTER GA
7
き
HIRAGANA LETTER KI
7
ぎ
HIRAGANA LETTER GI
7
キ
KATAKANA LETTER KI
7
ギ
KATAKANA LETTER GI
8
く
HIRAGANA LETTER KU
8
ぐ
HIRAGANA LETTER GU
8
ク
KATAKANA LETTER KU
8
グ
KATAKANA LETTER GU
9
け
HIRAGANA LETTER KE
9
げ
HIRAGANA LETTER GE
9
ヶ
KATAKANA LETTER SMALL KE
9
ケ
KATAKANA LETTER KE
9
ゲ
KATAKANA LETTER GE
10
こ
HIRAGANA LETTER KO
10
ご
HIRAGANA LETTER GO
10
コ
KATAKANA LETTER KO
10
ゴ
KATAKANA LETTER GO
11
さ
HIRAGANA LETTER SA
11
ざ
HIRAGANA LETTER ZA
11
サ
KATAKANA LETTER SA
24
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
番号 文字 名前
11
ザ
KATAKANA LETTER ZA
12
し
HIRAGANA LETTER SI
12
じ
HIRAGANA LETTER ZI
12
シ
KATAKANA LETTER SI
12
ジ
KATAKANA LETTER ZI
13
す
HIRAGANA LETTER SU
13
ず
HIRAGANA LETTER ZU
13
ス
KATAKANA LETTER SU
13
ズ
KATAKANA LETTER ZU
14
せ
HIRAGANA LETTER SE
14
ぜ
HIRAGANA LETTER ZE
14
セ
KATAKANA LETTER SE
14
ゼ
KATAKANA LETrER ZE
15
そ
HIRAGANA LETTER SO
15
ぞ
HIRAGANA LETTER ZO
15
ソ
KATAKANA LETTER SO
15
ゾ
KATAKANA LETTER ZO
16
た
HIRAGANA LETTER TA
16
だ
HIRAGANA LETTER DA
16
タ
KATAKANA LETTER TA
16
ダ
KATAKANA LETTER DA
17
ち
HIRAGANA LETTER TI
17
ぢ
HIRAGANA LETTER DI
17
チ
KATAKANA LETTER TI
17
ヂ
KATAKANA LETTER DI
18
っ
HIRAGANA LETTER SMALL TU
18
つ
HIRAGANA LETTER TU
18
づ
HIRAGANA LETTER DU
18
ッ
KATAKANA LETTER SMALL TU
18
ツ
KATAKANA LETTER TU
18
ヅ
KATAKANA LETTER DU
19
て
HIRAGANA LETTER TE
19
で
HIRAGANA LETTER DE
19
テ
KATAKANA LETTER TE
19
デ
KATAKANA LETTER DE
20
と
HIRAGANA LETTER TO
20
ど
HIRAGANA LETTER DO
20
ト
KATAKANA LETTER TO
20
ド
KATAKANA LETTER DO
21
な
HIRAGANA LETTER NA
21
ナ
KATAKANA LETTER NA
22
に
HIRAGANA LETTER NI
22
ニ
KATAKANA LETTER NI
23
ぬ
HIRAGANA LETTER NU
23
ヌ
KATAKANA LETTER NU
24
ね
HIRAGANA LETTER NE
24
ネ
KATAKANA LETTER NE
25
の
HIRAGANA LETTER NO
25
ノ
KATAKANA LETTER NO
26
は
HIRAGANA LETTER HA
26
ば
HIRAGANA LETTER BA
25
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
番号 文字 名前
26
ぱ
HIRAGANA LETTER PA
26
ハ
KATAKANA LETTER HA
26
バ
KATAKANA LETTER BA
26
パ
KATAKANA LETTER PA
27
ひ
HIRAGANA LETTER HI
27
び
HIRAGANA LETTER BI
27
ぴ
HIRAGANA LETTER PI
27
ヒ
KATAKANA LETTER HI
27
ビ
KATAKANA LETTER BI
27
ピ
KATAKANA LETTER PI
28
ふ
HIRAGANA LETTER HU
28
ぶ
HIRAGANA LETTER BU
28
ぷ
HIRAGANA LETTER PU
28
フ
KATAKANA LETTER HU
28
ブ
KATAKANA LETTER BU
28
プ
KATAKANA LETTER PU
29
ヘ
HIRAGANA LETTER HE
29
べ
HIRAGANA LETTER BE
29
ぺ
HIRAGANA LETTER PE
29
へ
KATAKANA LETTER HE
29
べ
KATAKANA LETTER BE
29
ぺ
KATAKANA LETTER PE
30
ほ
HIRAGANA LETTER HO
30
ぼ
HIRAGANA LETTER BO
30
ぽ
HIRAGANA LETTER PO
30
ホ
KATAKANA LETTER HO
30
ボ
KATAKANA LETTER BO
30
ポ
KATAKANA LETTER PO
31
ま
HIRAGANA LETTER MA
31
マ
KATAKANA LETTER MA
32
み
HIRAGANA LETTER MI
32
ミ
KATAKANA LETTER MI
33
む
HIRAGANA LETTER MU
33
ム
KATAKANA LETTER MU
34
め
HIRAGANA LETTER ME
34
メ
KATAKANA LETTER ME
35
も
HIRAGANA LETTER MO
35
モ
KATAKANA LETTER MO
36
ゃ
HIRAGANA LETTER SMALL YA
36
や
HIRAGANA LETTER YA
36
ャ
KATAKANA LETTER SMALL YA
36
ヤ
KATAKANA LETTER YA
37
ゅ
HIRAGANA LETTER SMALL YU
37
ゆ
HIRAGANA LETTER YU
37
ュ
KATAKANA LETTER SMALL YU
37
ユ
KATAKANA LETTER YU
38
ょ
HIRAGANA LETTER SMALL YO
38
よ
HIRAGANA LETTER YO
38
ョ
KATAKANA LETTER SMALL YO
38
ヨ
KATAKANA LETTER YO
39
ら
HIRAGANA LETTER RA
26
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
番号 文字 名前
39
ラ
KATAKANA LETTER RA
40
り
HIRAGANA LETTER RI
40
リ
KATAKANA LETTER RI
41
る
HIRAGANA LETTER RU
41
ル
KATAKANA LETTER RU
42
れ
HIRAGANA LETTER RE
42
レ
KATAKANA LETTER RE
43
ろ
HIRAGANA LETTER RO
43
ロ
KATAKANA LETTER RO
44
ゎ
HIRAGANA LETTER SMALL WA
44
わ
HIRAGANA LETTER WA
44
ヮ
KATAKANA LETTER SMALL WA
44
ワ
KATAKANA LETTER WA
45
ゐ
HIRAGANA LETTER WI
45
ヰ
KATAKANA LETTER WI
46
ゑ
HIRAGANA LETTER WE
46
ヱ
KATAKANA LETTER WE
47
を
HIRAGANA LETTER WO
47
ヲ
KATAKANA LETTER WO
48
ん
HIRAGANA LETTER N
48
ン
KATAKANA LETTER N
49
ゝ
HIRAGANA ITERATION MARK
49
ゞ
HIRAGANA VOICED ITERATION MARK
49
ヽ
KATAKANA ITERATION MARK
49
ヾ
KATAKANA VOICED ITERATION MARK
50
ー
KATAKANA−HIRAGANA PROLONGED SOUND MARK
附属書表11 最小漢字文字クラス
番号 文字 日本語名称
名前
1
〃
同じく記号
DITTO MARK
2
仝
同上記号
CJK UNIFIED IDEOGRAPH-4EDD
3
々
繰返し記号
IDEOGRAPHIC ITERATION MARK
4
〆
しめ
IDEOGRAPHIC CLOSING MARK
5
〇
漢数字ゼロ
IDEOGRAPHIC NUMBER ZERO
附属書表12 げた記号
番号 文字 日本語名称
名前
1
〓
げた記号
GETA MARK
27
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
参考1 代表読み照合の具体例
この参考は,本体の5.3代表読み照合に関して,人名などのレコードに対する照合の具体例を示す。こ
の参考は,規定の一部ではない。
1. 代表読み照合の具体例
(1) 第1段階 先頭字の文字クラスの相対的順序による照合
らむだけいさん
λ計算 →
“λ”
じすばんごう
JIS番号 →
“J”
あだち
安達
→
“安”
あんどう
安藤
→
“安”
か さ い
河西
→
“河”
か わ ち
河内
→
“河”
か く た
角田
→
“角”
か ど た
角田
→
“角”
きさらぎ
如月
→
“如”
こうやま
幸山
→
“幸”
こ う ち
河内
→
“河”
さ と う
佐藤
→
“佐”
さ佐わ和だ田 →
“佐”
さきやま
幸山
→
“幸”
さわしま
沢島
→
“沢”
さ わ だ
沢田
→
“沢”
さ わ だ
澤田
→
“澤”
つ ち い
土井
→
“土”
つ ち い
土居
→
“土”
つ ち い
槌井
→
“槌”
つ の だ
角田
→
“角”
ど い
土井
→
“土”
ど い
土居
→
“土”
と き
土岐
→
“土”
と い
戸井
→
“戸”
と だ
戸田
→
“戸”
や す だ
安田
→
“安”
この結果,次のように照合される。
らむだけいさん
λ計算<じすばんごう
JIS番号<その他
この段階では先頭字が漢字表記のレコードはすべて同順位である。
(2) 第2段階
(a) 第2段階の1 先頭分節の代表読みによる照合
28
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
代表読み辞書がある場合(本体の5.3.1)と,辞書がない場合(本体の5.3.2)とでは異なる。
項目
表記列先頭要素
代表読み辞書が
代表読み辞書が
・読み列先頭字
ある場合
ない場合
あだち
安達
安・あ
あ
あ
あんどう
安藤
安・あ
あ
あ
かさい
河西
河・か
か
か
かわち
河内
河・か
か(1)
か
かくた
角田
角・か
かく
か
かどた
角田
角・か
かく(2)
か
きさらぎ
如月
如月・き
きさらぎ
き
こうやま
幸山
幸・こ
こう(4)
こ
こうち
河内
河・こ
こう(3)
こ
さとう
佐藤
佐・さ
さ
さ
さ佐わ和だ田
佐・さ
さ
さ
さきやま
幸山
幸・さ
さき(4)
さ
さわしま
沢島
沢・さ
さわ
さ
さわだ
沢田
沢・さ
さわ
さ
さわだ
澤田
澤・さ
さわ
さ
つちい
土井
土・つ
つち
つ
つちい
土居
土・つ
つち
つ
つちい
槌井
槌・つ
つち
つ
つのだ
角田
角・つ
つの(5)
つ
ど土い井
土・ど
と
ど→と
ど土い居
土・ど
と
ど→と
と土き岐
土・と
と
と
と戸い井
戸・と
と
と
と戸だ田
戸・と
と
と
やすだ
安田
安・や
やす
や
注(1) “かわち
河内”の先頭字の読み列は“かわ”だが同じ“か”で始まる読みに
“かさい
河西”の“か”があるので,代表読みは“か”。
(2) “角田”の先頭字の読み列は“かど”だが,同じ“か”で始まる読み
に“角田”の“かく”があるので,代表読みは“かく”。
(3) “河”の字の代表読みのうち,“か河”は読み列が“か”で始まるもの
の代表読み,“こう河”は読み列が“こ”で始まるものの代表読み。
(4) “幸”の字代表読みのうち,“こう幸”は読み列が“こ”で始まるものの
代表読み、“さち幸”は読み例が“さ”で始まるものの代表読み。
(5) “角”の字の代表読みのうち,“かく角”は読み列が“か”で始まるもの
の代表読み,“つの角”は読み列が“つ”で始まるものの代表読み。
これらのレコードは,次のように照合される。ここで,“<”はこの段階で初めて差が出た項目,“=”
はこの段階のまででは同順位の項目,“,”はこれより前の段階で既に差が出ている項目とし,かっこの中
にこの段階で照合キーを示す。
辞書あり
らむだけいさん
λ計算,
じすばんごう
JIS番号,
あだち
安達(あ)=
あんどう
安藤(あ)<
かさい
河西(か)=
かわち
河内(か)<
かくた
角田(かく)= かどた
角田(かく)< きさらぎ
如月(きさらぎ)< こうやま
幸山(こう)= こうち
河内(こう)< さとう
佐藤(さ)=
さ佐わ和だ田(さ)< さきやま
幸山(さき)= さわしま
沢島(さわ)=
さわだ
沢田(さわ)= さわだ
澤田(さわ)< つちい
土井(つち)=
つちい
土居(つち)= つちい
槌井(つち)< つのだ
角田(つの)<
ど土い井(と)=
ど土い居(と)=
と土き岐(と)=
と戸い井(と)=
と戸だ田(と)<
やすだ
安田(やす)
29
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
辞書なし
らむだけいさん
λ計算,
じすばんごう
JIS番号,
あだち
安達(あ)=
あんどう
安藤(あ)<
かさい
河西(か)=
かわち
河内(か)=
かくた
角田(かく)= かどた
角田(かく)< きさらぎ
如月(きさらぎ)< こうやま
幸山(こう)= こうち
河内(こう)< さとう
佐藤(さ)=
さ佐わ和だ田(さ)= さきやま
幸山(さき)= さわしま
沢島(さわ)=
さわだ
沢田(さわ)= さわだ
澤田(さわ)< つちい
土井(つち)=
つちい
土居(つち)= つちい
槌井(つち)= つのだ
角田(つの)<
ど土い井(と)=
ど土い居(と)=
と土き岐(と)=
と戸い井(と)=
と戸だ田(と)<
やすだ
安田(やす)
(b) 第2段階の2 先頭文節の表記列による照合
辞書あり
らむだけいさん
λ計算,
じすばんごう
JIS番号,
あだち
安達(安)=
あんどう
安藤(安),
かさい
河西(河)=
かわち
河内(河),
かくた
角田(角)=
かどた
角田(角),
きさらぎ
如月(如月),
こうやま
幸山(幸)<
こうち
河内(河),
さとう
佐藤(佐)=
さ佐わ和だ田(佐), さきやま
幸山(幸),
さわしま
沢島(沢)=
さわだ
沢田(沢)=
さわだ
澤田(澤→沢)(6),つちい
土井(土)=
つちい
土居(土)<
つちい
槌井(槌),
つのだ
角田(角),
ど土い井(土)=
ど土い居(土)=
と土き岐(土)<
と戸い井(土)=
と戸だ田(戸),
やすだ
安田(安)
注(6) ここでは“澤”を“沢”に文字変換した例を示す。
辞書なし
らむだけいさん
λ計算,
じすばんごう
JIS番号,
あだち
安達(安)=
あんどう
安藤(安),
かさい
河西(河)=
かわち
河内(河)<
かくた
角田(角)=
かどた
角田(角),
きさらぎ
如月(如月),
こうやま
幸山(幸)<
こうち
河内(河),
さとう
佐藤(佐)=
さ佐わ和だ田(佐)< さきやま
幸山(幸)<
さわしま
沢島(沢)=
さわだ
沢田(沢)<
さわだ
澤田(澤),
つちい
土井(土)=
つちい
土居(土)<
つちい
槌井(槌)<
つのだ
角田(角),
ど土い井(土)=
ど土い居(土)=
と土き岐(土)<
と戸い井(土)=
と戸だ田(戸),
やすだ
安田(安)
備考 この漢字の照合順は,“拡張漢字文字クラス”(本体4.4.11参照)を選択した場合の結果である。
参考 第2段階で2巡目以降を繰り返す例は,この附属書の2.で扱う。
(3) 第3段階 読み列全体の照合
辞書あり
らむだけいさん
λ計算,
じすばんごう
JIS番号,
あだち
安達<
あんどう
安藤,
かさい
河西<
かわち
河内,
かくた
角田<
かどた
角田,
きさらぎ
如月,
こうやま
幸山,
こうち
河内,
さとう
佐藤<
さ佐わ和だ田,
さきやま
幸山,
さわしま
沢島<
さわだ
沢田=
さわだ
澤田,
つちい
土井=
つちい
土居,
つちい
槌井,
つのだ
角田,
ど土い井=
ど土い居<
と土き岐,
と戸い井<
と戸だ田,
やすだ
安田
辞書なし
らむだけいさん
λ計算,
じすばんごう
JIS番号,
あだち
安達<
あんどう
安藤,
かさい
河西<
かわち
河内,
かくた
角田<
かどた
角田,
きさらぎ
如月,
こうやま
幸山,
こうち
河内,
さとう
佐藤<
さ佐わ和だ田,
さきやま
幸山,
さわしま
沢島<
さわだ
沢田,
さわだ
澤田,
つちい
土井=
つちい
土居,
つちい
槌井,
つのだ
角田,
ど土い井=
ど土い居<
と土き岐,
と戸い井<
と戸だ田,
やすだ
安田
(4) 第4段階 元の表記列全体の照合
辞書あり
らむだけいさん
λ計算,
じすばんごう
JIS番号,
あだち
安達,
あんどう
安藤,
かさい
河西,
かわち
河内,
かくた
角田<
かどた
角田,
きさらぎ
如月,
こうやま
幸山,
こうち
河内,
さとう
佐藤<
さ佐わ和だ田,
さきやま
幸山,
さわしま
沢島,
さわだ
沢田<
さわだ
澤田(7),
つちい
土井<
30
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
つちい
土居,
つちい
槌井,
つのだ
角田,
ど土い井<
ど土い居,
と土き岐,
と戸い井,
と戸だ田,
やすだ
安田
注(7) (2)の(b)でここでは“澤”を“沢”に文字変換しているが,この段階では置換前の表記列を照合
する
辞書なし
らむだけいさん
λ計算,
じすばんごう
JIS番号,
あだち
安達,
あんどう
安藤,
かさい
河西,
かわち
河内,
かくた
角田,
かどた
角田,
きさらぎ
如月,
こうやま
幸山,
こうち
河内,
さとう
佐藤<
さ佐わ和だ田,
さきやま
幸山,
さわしま
沢島,
さわだ
沢田<
さわだ
澤田,
つちい
土井<
つちい
土居,
つちい
槌井,
つのだ
角田,
ど土い井<
ど土い居,
と土き岐,
と戸い井,
と戸だ田,
やすだ
安田
備考 この漢字の照合順は,“拡張漢字文字クラス”(本体4.4.11参照)を選択した場合の結果である。
以上の段階を経てなお同順位の項目は,同順位を結果とする。
2. 第2段階の二巡目以降を繰り返す例 第2段階の1巡目[この附属書の1.(2)(b)参照]までで差が出な
い場合は,表記列の次の分節を“先頭分節”とみなして,第2段階の照合手順を(差が出るか要素がなく
なるまで)順次繰り返す。ただし,この2巡目以降の繰返しを省略して,直ちに次の第3段階に進んでも
よい。本体5.3.2の簡易代表読み照合では,この2巡目以降の照合は行わない。
2巡目以降を繰り返した例を示す。
(1) 1巡目
じ自叙=自叙伝=自立=自立心=自律=自律神経=自律神経失調=自律分節<じっ
実権=
実権者=実験=実験室=実験者
(2) 2巡目 第2分節
自じょ叙=自叙伝<自立=自立心<自りつ
律=自律神経=自律神経失調=自律分節,
実けん権=実権者<実験=実験室=実験者
(3) 3巡目 第3分節
自律=自律しん
神経=自律神経失調<自律ぶん
分節,実権<実権しゃ者,実験<
実験しつ
室<実験しゃ
者
参考 第2分節以下を順次“先頭分節”とみなして2巡目,3巡目と照合を繰り返すためには,表記
列と読み列とが対応して分節されていることが必要である。この条件が満たされないときは,
第2分節以降に対応する代表読みが得られないので,直ちに次の段階に進むことになる。
次にこの例を示す。
じっけん
実験,じっけんしつ
実験室,じっけんしゃ
実験者,じっけん
実権,じっけんしゃ
実権者
は,ここまでの(先頭分節だけの)照合では同順位になる。これらがそれぞれ
じっけん
実験
→
実(じっ)験(けん)
じっけんしつ
実験室
→
実(じっ)験(けん)室(しつ)
じっけんしゃ
実験者
→
実(じっ)験(けん)者(しゃ)
じっけん
実権
→
実(じっ)権(けん)
じっけんしゃ
実権者
→
実(じっ)権(けん)者(しゃ)
と,対応する読み列を含めて第2以降の分節も与えられているときは,第2分節以降を順次先頭分
節とみなして,
31
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
実けん験,実けんしつ
験室,実けんしゃ
験者,実けん権,実けんしゃ
権者
の照合(2巡自)に移ってもよい(省略してもよい。)。しかし,これらのレコードの読み列が
実験(じっけん),実験室(じっけんしつ),実験者(じっけんしゃ),
実権(じっけん),実権者(じっけんしゃ)
のように表記列全体に対して与えられ,下位の分節が与えられていないときは,読み列を含めた第
2分節以降への分節が不可能である。この場合,第2分節以降の代表読みによる照合は行うことがで
きないので,直ちに次の第3段階に進む。
関連規格:JIS X 0201 情報交換用符号
JIS X 0212 情報交換用漢字符号−補助漢字
32
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
参考2 適合性試験用データ
この参考は,規格本体に適合している処理系に対する適合性試験用データを示すものであり,規定の一
部ではない。
この規格に適合している照合処理系は,次に示す文字列のリストを任意に並べ替えた入力リストに対し
て,次の順序の整列結果を与える。
備考 次のリストの中には,互いに同順位のレコードはない。
∞ r ∞
シャーレ
でェたァ
ブゥり
∞ R #
シャイ
デぇタぁ
ぷうり
∞ t ∞
シヤィ
デエタア
プウリ
# r ∞
シャレ
ひゆ
ふーりー
# R #
ちょこ
びゅあ
フゥリー
# t %
ちよこ
ぴゅあ
ふゥりィ
# T %
チョコレート
びゅあー
フぅりぃ
8 t ∞
てーた
ビュアー
フウリー
8 T ∞
テータ
ぴゅあー
ふうりぃ
8 t #
テェタ
ピュアー
ブウリイ
8 T #
てえた
ヒュウ
ぷーりー
8 t %
でーた
ヒユウ
ぷゥりイ
8 T %
データ
ビュウア
ぷうりー
8 t 8
デェタ
びゆーあー
プウリイ
8 T 8
でえた
ビューアー
フヽ
ω r ∞
チータg
ビュウアー
ふゞ
Ω R %
テェタG
ひゅん
ぶゝ
r r ∞
てぇたg
ぴゅん
ぶふ
r R ∞
てぇたG
ふーり
ぶフ
R r ∞
てーたー
フーリ
ブふ
R R ∞
テータァ
ふぅリ
ブフ
R T %
てーたあ
ふゥり
ぶゞ
r t 8
テェター
ふゥリ
ぶぷ
t r ∞
てぇたぁ
フウリ
ブぷ
t r 8
てえたー
ぶーり
ぷゝ
T R 8
でーたー
ブーリ
プヽ
t t 8
データァ
ぶぅり
ぷふ
33
X 4061-1996
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
電子文書処理システム標準化調査研究委員会
氏名
所属
(委員長)
斎 藤 信 男
慶応大学環境情報学部
(委員)
池 田 克 夫
京都大学 工学部情報工学教室
大 泊 勝
株式会社NEC総研
奥 村 康
株式会社日経BP社 制作部
小野沢 賢 三
社団法人日本印刷技術協会
桐 谷 俊 雄
社団法人日本事務機械工業会
小 林 茂
日本ユニシス株式会社システムプロダクト本部サーバソフトウェア2部
小 林 龍 生
株式会社ジャストシステムデジタル文化研究所
小 町 祐 史
松下電送株式会社技術研究所
芝 野 耕 司
東京国際大学商学部経営情報学部
瀬戸屋 英 雄
通商産業省工業技術院標準部情報規格課
武 田 博 直
株式会社セガ・エンタープライゼス第5AM研究開発部
田 中 省 三
富士通株式会社企画本部標準推進部
中 島 一 郎
通商産業省機械情報産業局電子機器部
中 原 康
株式会社東芝情報・通信システム技術研究所開発第7部OSA
野 瀬 康 矩
社団法人日本新聞協会技術コンサルタント
深 見 拓 史
凸版印刷株式会社総合研究所画像情報センター
藤 井 照 穂
マイクロソフト株式会社第一研究開発本部
宮 内 久 男
株式会社岩波書店編集部
安 田 寿 明
文教大学情報学部情報システム学科
渡 辺 真 一
大日本印刷株式会社ACS事業部業務企画部
(事務局)
渡 辺 清 次
財団法人日本規格協会情報技術標準化研究センター
電子文書処理システム標準化調査研究委員
WG3 照合順番及び仮名漢字
氏名
所属
(主査)
芝 野 耕 司
東京国際大学商学部経営情報学科
(幹事)
中 原 康
株式会社東芝情報・通信システム技術研究所開発第7部OSA
古 田 哲
お茶の水女子大学国文学科
(委員)
浅 川 泰 彦
日本電気オフィスシステム株式会社システム事業本部第2システム部
荒 武 謙一郎
株式会社管理工学研究所
安 藤 正 樹
マイクロソフト株式会社第一研究開発本部IMEプログラム
伊 勢 浩
読売新聞社制作局制作システム部
小 田 明
日本アイ・ビー・エム株式会社大和研究所ソフトウェア技術推進
小野沢 賢 三
社団法人日本印刷技術協会
久保田 淳 一
松下電器産業株式会社開発本部情報通信研究所
小 林 龍 生
株式会社ジャストシステムデジタル文化研究所
小 山 泰 男
エー・アイ・ソフト株式会社BS事業部
佐 伯 秀 男
日本電信電話株式会社電話帳事業推進部
豊 島 正 之
北海道大学文学部国語学講座
(現東京外国語大学アジアアフリカ言語文化研究所)
中 島 晃
株式会社日立製作所映像メディア研究所第四部48G
荻 原 健
株式会社バックス
半 田 剣 一
工業技術院電子技術総合研究所知能情報部推論研究室
(オブザーバ)
三 吉 秀 夫
株式会社日本電子化辞書研究所第4研究所
森 拓 人
読売新聞社編集局校閲部
(工業技術院)
佐 野 浩 一
通商産業省工業技術院標準部情報規格課
(事務局)
渡 辺 清 次
財団法人日本規格協会情報技術標準化研究センター