2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
日本工業規格 JIS
X 9010-1984
機械読取り可能文字の符号
(OCR及びMICR)
Coding of Machine Readable Characters
(OCR and MICR)
1. 適用範囲 この規格は,光学式文字認識及び磁気インク文字認識の結果認識した文字の符号化表現に
ついて,JIS X 0201(情報交換用符号)及びJIS X 0202(情報交換用符号の拡張法)に基づいて規定する。
対象とする字体は,表1のとおりとする。
表1 対象字体
字体
字形を規定する規格
OCR-A
JIS X 9001[光学式文字認識のための字形(英数字)]
OCR-B
OCR-K
JIS X 9003[光学式文字認識のための字形(片仮名)]
OCR-HN
JIS X 9006[光学式文字認識のための手書き文字(数字)]
OCR-HA
JIS X 9007[光学式文字認識のための手書き文字(英字)]
OCR-HS
JIS X 9008[光学式文字認識のための手書き文字(記号)]
OCR-HK
JIS X 9005[光学式文字認識のための手書き文字(片仮名)]
E13B
JIS X 9002[磁気インキ文字読取用字体及び印字仕様 (E13B)]
備考 この規格は,読取り装置が読み取る文字の範囲を規定するものではない。
引用規格:
JIS X 0201 情報交換用符号
JIS X 0202 情報交換用符号の拡張法
JIS X 0001 情報処理用語
JIS X 9001 光学式文字認識のための字形(英数字)
JIS X 9002 磁気インキ文字読取用字体及び印字仕様 (E13B)
JIS X 9003 光学式文字認識のための字形(片仮名)
JIS X 9005 光学式文字認識のための手書き文字(片仮名)
JIS X 9006 光学式文字認識のための手書き文字(数字)
JIS X 9007 光学式文字認識のための手書き文字(英字)
JIS X 9008 光学式文字認識のための手書き文字(記号)
対応国際規格:
ISO-2033 Information processing−Coding of machine readable characters (MICR and OCR)
2. 用語の意味 この規格で用いる主な用語の意味は,JIS X 0001(情報処理用語)による。
2
X 9010-1984
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
3. 符号 符号は,4.で規定する図形文字集合の中から必要なものを一つ以上選択し,それらの各々をJIS
X 0202に規定するG0集合,G1集合,G2集合又はG3集合のいずれかとして用い,必要な制御機能を5.
及びJIS X 0202に従って追加することにより構成する。
各図形文字集合を指示するためのエスケープシーケンスは,6.で規定する。
符号の単位は,7単位及び8単位とする。
4. 図形文字集合 図形文字集合は,OCR-A図形文字集合,OCR-B基本図形文字集合,OCR-B追加図形
文字集合,OCR-K図形文字集合,OCR手書き文字基本図形文字集合,OCR手書き文字追加図形文字集合,
OCR手書き文字片仮名図形文字集合及びE13B図形文字集合とする。
各図形文字集合は,表2〜9のとおりとする。
なお,表2〜9の空欄は,使用しない。
参考 表2〜9の列2〜7は,JIS X 0202の規定に従って,7単位符号のときは列2〜7に,8単位符号
のときは列02〜07又は列10〜15に対応する。
3
X 9010-1984
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
表2 OCR-A図形文字集合
注(1) 5.5(1)参照。
4
X 9010-1984
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
表3 OCR-B基本図形文字集合
注(2) 5.5(2)参照。
(3) 5.5(3)参照。
5
X 9010-1984
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
表4 OCR-B追加図形文字集合
6
X 9010-1984
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
表5 OCR-K図形文字集合
注(4) 5.8参照。
7
X 9010-1984
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
表6 OCR手書き文字基本図形文字集合
注(5) 5.5(4)参照。
8
X 9010-1984
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
表7 OCR手書き文字追加図形文字集合
9
X 9010-1984
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
表8 OCR手書き文字片仮名図形文字集合
注(6) 5.8(2)参照。
10
X 9010-1984
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
表9 E13B図形文字集合
11
X 9010-1984
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
5. 補足事項
5.1
行末 行末を符号化する必要がある場合,JIS X 0201に規定する制御文字CR及びLFを,この順に
連続させる。
5.2
認識不能文字 何らかの文字が存在することは検知したが,文字集合中の一つの文字として識別で
きない場合,JIS X 0201に規定する制御文字SUBとして符号化する。
5.3
間隔及び空白記号 間隔及び空白記号は,次による。
(1) OCR-A,OCR-B及びOCR-Kにおいて,読取り装置が間隔を認識した場合,JIS X 0201及びJIS X 0202
に規定する文字SPとして符号化する。一つ以上のSPとして符号化してもよい。
(2) OCR-HSにおいて,空白記号はSPとして符号化する。また,記入枠内に何も記録されていないこと
を認識した場合,SPとして符号化してもよいし,無視してもよい。
5.4
抹消記号 抹消記号は,次による。
(1) 字抹消記号 (Character Erase)
OCR-A,OCR-B,OCR-K及びOCR-HSにおいて,字抹消記号を符号化する必要がある場合,JIS X
0201及びJIS X 0202に規定する制御文字DELとして符号化する。
(2) 行抹消記号 (Group Erase)
OCR-A,OCR-B及びOCR-Kにおいて,行抹消記号を符号化する必要がある場合,一つ以上のDEL
として符号化する。
5.5
代替字形 一つの字体において,一つの文字に複数の字形が定義されている場合,それらに対して
同一の符号を割り当てる。この規定は,次のものに適用する。
(1) OCR-Aにおけるピリオド,コンマ,負符号,疑問符及びアポストロフィとそれらの代替字形
(2) OCR-Bにおける英小文字mと変形m
(3) OCR-Bにおける縦線と分離記号
(4) OCR-HSにおける引用符,アポストロフィ,左小括弧及び右小括弧とそれらの代替字形
(5) OCR-HSにおける感嘆符及び疑問符とそれらの点を白丸で置き換えたもの。
備考 (1)〜(3)の字形はJIS X 9001を,(4)及び(5)の字形はJIS X 9008を参照。
5.6
抽象記号つの OCR-Aにおいて,この記号は英大文字Yと紛らわしいので,一般には英大文字と一
緒には使用しない。ただし,両者を正しく認識できる場合には,3.及び4.で規定したように符号化する。
5.7
アンダライン OCR-Bにおいて,アンダラインは,JIS X 9001に規定する不連続アンダラインとす
る。アンダラインは,独立した文字として用いなければならない。他の文字の下側に合成して用いてはな
らない。
連続アンダラインは,JIS X 9001附属書2の規定に従い,この規格の対象としない。
5.8
句読点及び長音記号 句読点及び長音記号は,次による。
(1) OCR-B基本図形文字集合とOCR-K図形文字集合を併用する場合,OCR-K図形文字集合に含まれる句
点,読点及び長音記号は,それぞれOCR-B基本図形文字集合に含まれるピリオド,コンマ及び負符
号と同一字形なので,読取り装置は両者を識別できない。この場合,句点,読点及び長音記号は,そ
れぞれピリオド,コンマ及び負符号として符号化する。
(2) OCR手書き文字基本図形文字集合とOCR手書き文字片仮名図形文字集合を併用する場合,OCR手書
き文字片仮名図形文字集合に含まれる長音記号は,OCR手書き文字基本図形文字集合に含まれる負符
号と同一字形なので,読取り装置は両者を識別できない。この場合,長音記号は,負符号として符号
化する。
12
X 9010-1984
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
6. エスケープシーケンス 4.で規定した各図形文字集合をG0〜G3集合として指示するエスケープシー
ケンスは,表10のとおりとする。
表10 指示エスケープシーケンス
図形文字集合
7単位符号
8単位符号
OCR-A図形文字集合
ESC2/n6/13
ESC02/n06/13
OCR-B基本図形文字集合
ESC2/n6/14
ESC02/n06/14
OCR-B追加図形文字集合
ESC2/n6/15
ESC02/n06/15
OCR-K図形文字集合
ESC2/n4/9
ESC02/n04/9
OCR手書き文字基本図形文字集合
ESC2/n7/0
ESC02/n07/0
OCR手書き文字追加図形文字集合
ESC2/n7/1
ESC02/n07/1
OCR手書き文字片仮名図形文字集合
ESC2/n7/2
ESC02/n07/2
E13B図形文字集合
ESC2/n7/3
ESC02/n07/3
備考 nは,G0,G1,G2及びG3集合に対して,それぞれ8,9,10及び11とす
る。
13
X 9010-1984
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
情報交換用符号の拡張法,光学式文字認識のための
情報交換用符号JIS原案作成委員会構成表
氏名
所属
(委員長)
和 田 英 一
東京大学工学部計数工学科
伊 藤 興史郎
日本電信電話株式会社横須賀電気通信研究所
東 信 弘
国際電信電話株式会社本社機器部
磯 崎 澄
日本電信電話株式会社技術局画像処理担当
伊 東 厚
通商産業省工業技術院標準部電気規格課
大 島 茂
株式会社日立製作所神奈川工場
小 畑 甫
三菱電機株式会社計算機製作所端末装置製造部
加 藤 重 信
日本ユニバック株式会社
神 原 慎 一
日本電信電話株式会社横須賀電気通信研究所
河 本 清 人
日本IBM株式会社六本木事業所
菅 原 淳 夫
財団法人日本規格協会
田 辺 茂 人
日本国有鉄道鉄道技術研究所
中 村 利 武
富士通株式会社情報処理事業本部
永 島 基 恭
日本電信電話株式会社技術局
八 田 敏
沖電気株式会社システム本部
浜 口 芳 夫
日本電気株式会社コンピュータ技術本部
松 井 稔
行政管理庁行政管理局
村 上 恒 夫
バロース株式会社エンジニアリングセンター
吉 田 滋
株式会社東芝人材開発部東芝学園
光学式文字認識のための情報交換用符号
JIS原案作成委員会分科会構成表
氏名
所属
(委員長)
浜 口 芳 夫
日本電気株式会社コンピュータ技術本部
小 畑 甫
三菱電機株式会社計算機製作所端末装置製造部
加 藤 重 信
日本ユニバック株式会社
永 島 基 恭
日本電信電話株式会社技術局
八 田 敏
沖電気株式会社システム本部
村 上 恒 夫
バロース株式会社エンジニアリングセンター