2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
日本工業規格 JIS
X 9009-1991
光学式文字認識のための
手書き文字(平仮名)
Handprinted HIRAGANA characters for
Optical Character Recognition
1. 適用範囲 この規格は,光学式文字認識(以下,OCRという。)に使用する手書き平仮名の字形並び
にこれに関連する横書き及び縦書きの仕様を規定する。
参考 OCRのための手書き漢字の字形及びこれに関連する事項を参考として示す。
2. 用語の定義 この規格で用いる主な用語の定義は,次のとおりとする。
(1) 平仮名 平仮名は,次の85個の文字及び記号とする。“あいうえお かきくけこ さしすせそ たち
つてと なにぬねの はひふへほ まみむめも やゆよ らりるれろ わゐゑをん がぎぐげご ざ
じずぜぞ だぢづでど ばびぶべぼ ぱぴぷぺぽ ぁぃぅぇぉっゃゅょゎ・(句点)、(読点)”
(2) 字形 実際に書かれたり印刷されたりしたときに実現する図形。
(3) 字体 表現された字形の基礎にある文字概念で,個々の文字を識別する要素としての点画,筆画の組
合せ方をいう。すなわち,字体は抽象的なものであり,具体的には字形として表現する。
(4) 線素 個々の字形を構成する一筆で書いた線。
(5) 線幅 線素の幅。
(6) 空げき(隙) 字形を構成する線素の間に保たれるべき有意味の空白。
(7) 突出し 二つの線素が一点で交差又は接触しているとき,基準となる線素に対して交差部から出てい
る線素の一部。
これは,“あ お か き け さ す せ た ち な ぬ ね は ま み む め も や
ゆ よ れ わ を ぁ ゃ ゅ ょ ゎ”の字形に見られる。
(8) はね ある線素の終端部から他の線素への筆順上の移行を示す付加的部分。
これは,“い か ぃ”の字形に見られる。
(9) 短線素 複数個の線素で構成されている字形において,比較的短い線素。
これは,“う え お そ な ふ む や ら ,(読点)ぅぇぉゃ”の字形に見られる。
(10) 微小ループ 同一線素の接続,交差によって生じる微小な閉じた領域。
これは“お す な ぬ ね は ほ ま み む よ る 。(句点)ゐ ゑ ぉ ょ”の字形に
見られる。
(11) 帳票基準辺 機械読取りの際に基準となる辺。横書きの場合は水平に,縦書きの場合は垂直に取る(付
図1参照)。
(12) 記入枠 帳票基準辺に平行及び垂直な線で囲まれた,一つの字形を書く場所を示す長方形の内側(付
2
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
図1参照)。
(13) 記入枠の幅 一つの記入枠を構成する縦線間(内側)の距離(付図1参照)。
(14) 記入枠の高さ 一つの記入枠を構成する横線間(内側)の距離(付図1参照)。
(15) 記入帯 帳票基準辺に平行及び垂直な辺を有する1行中の一組の連続した記入枠をすべて含む最小の
長方形領域。ただし,1行とは,横書きの場合は横方向に,縦書きの場合は縦方向に取る(付図2参
照)。
(16) 行間隔 行方向と直交する方向に隣接する二つの記入枠の中心線間の距離。ただし,中心線は,横書
きの場合は記入枠の垂直辺の垂直二等分線,縦書きの場合は記入枠の水平辺の垂直二等分線とする(付
図1参照)。
(17) 記入枠間余白 一つの記入帯におけるある記入枠の距離。横書きの場合は右端の縦線から次の記入枠
の左端の縦線までの距離。縦書きの場合は下端の横線から次の記入枠の上端の横線までの距離(付図
1参照)。
(18) 文字境界 帳票基準辺に平行又は垂直な辺を有する,一つの字形のすべての線素をその内部に含む最
小の長方形(付図1参照)。
(19) クリアエリア 帳票基準辺に平行又は垂直な辺を有する記入帯及びその周りの余白部を含む長方形領
域(付図2参照)。
(20) ドロップアウトカラー 人間の目には周囲の余白部と明確に区別できるが,OCR装置にはほとんど感
知し得ない色相,彩度及び明度をもった色。
3. 字体の種類及び名称 字体の種類は1種類とし,その名称はOCR−HHとする。
4. 字形 字形は,次のとおりとする。
3
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
5. 記入要領
5.1
一般的記入要領 一つの平仮名は,一つの記入枠内に4.で示された字形で書くものとする。
5.2
空げき(隙) 4.の字形に示されている空げきは,0.5mm以上とする。
また,4.に示されている箇所以外に空げきができるようには書かないものとする。
5.3
突出し,はね及び飾り 4.に示されている箇所以外に余分な突出し,はね及びその他の装飾的な付加
的部分は作らないものとする。
5.4
短線素 短線素は,長さ1.0mm以上とする。
5.5
微小ループ 微小ループは,内径0.5mm以上とする。
5.6
字形の大きさ 文字境界の幅及び高さの許容値は,表1のとおりとする。
4
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
表1 字形の大きさの許容値
字形の種類
い,つ,へ
う,く,し,も,り その他の大文字
幅
3
2W〜W
2
1W〜W
3
2W〜W
高さ
2
1H〜H
3
2H〜H
備考 Hは記入枠の高さ,Wはその幅である。
なお,小文字(ぁぃぅぇぉっゃゅょゎ)については,同一記入帯内に書くべき大文字の大きさの21〜32の
大きさで書くものとする。
5.7
線幅 線幅の許容範囲は,0.25〜0.65mmとする。
6. 記入枠
6.1
最小記入枠 文字の線素間の分離を確実にするため,記入枠の幅の最小値は7mmとし,記入枠の高
さは幅の1.0〜1.4倍とする(付図1参照)。
6.2
記入枠の配置 記入枠間余白の最小値は,1.5mmとする。行間隔は,クリアエリアが他の行の記入
帯に入らないようにとる(付図1参照)。
6.3
分光特性 記入枠は,ドロップアウトカラーで印刷する。
7. 記入帯 記入帯は,記入枠を一まとめにして1行ごとに定めなければならない。ただし,1行を幾つ
かの認識対象平仮名の組に分割して,それぞれ別の記入帯としてもよい。
8. クリアエリア クリアエリアは,次による。
(1) 横書きの場合,クリアエリアの上下の境界と記入帯の上下の境界との垂直距離は4mm以上とし,ク
リアエリアの左右の境界と記入帯の左右の境界との水平距離は6mm以上とする。
(2) 縦書きの場合,クリアエリアの左右の境界と記入帯の左右の境界との水平距離は4mm以上とし,ク
リアエリアの上下の境界と記入帯の上下の境界との垂直距離は6mm以上とする。
(3) クリアエリア内には,記入枠及び認識対象平仮名しか存在してはならない。クリアエリアは,上下左
右に隣接する記入帯のクリアエリアと重なってもよいが,他の記入帯と重なってはならない(付図2
参照)。
備考 ドロップアウトカラーで印刷された文字は,クリアエリア内にあってもよい。
関連規格 JIS X 0208 情報交換用漢字符号
JIS X 9004 光学式文字認識のための印字仕様
JIS X 9005 光学式文字認識のための手書き文字(片仮名)
JIS X 9006 光学式文字認識のための手書き文字(数字)
JIS X 9007 光学式文字認識のための手書き文字(英字)
JIS X 9008 光学式文字認識のための手書き文字(記号)
5
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
付図1 帳票基準辺,記入枠及び文字境界
6
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
付図2 記入帯及びクリアエリア
7
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
参考 光学式文字認識のための手書き文字(漢字)
この参考は,本体の規定に関連する事柄を補足するもので,規定の一部ではない。
1. 適用範囲 この参考は,光学式文字認識に使用する手書き漢字の書体及び一般的な記入要領について
示す。
2. 用語の定義 この参考で用いる主な用語の定義は,本体2.によるほか次による。
(1) 字種 起源を同じくする文字の集合。例えば,数字,英字,平仮名,片仮名,漢字などをいう。
(2) 漢字 主として日本語の自立語を書き表すのに用いる文字。
(3) 書体 文字集合(字種)に対して共通な性格をもつ字形生成上の様式。
(4) 筆画 個々の字形を構成するための,線として表現される基本図形要素。
(5) 点画 極めて短い,図形上で孤立した筆画。点と略称することもある。
(6) かい(楷)書体 点画や筆画を略したり続けたりする字形生成上の流動化を伴わない書体。字ごとに
始めと終わりが明確な筆画や点画を積み重ねて字形を生成する書体。
(7) はらい ある筆画の終端部をゆるやかに伸ばした部分。
(8) かざり ある筆画の端部に追加される付加的部分。
(9) つづけ字 複数個の筆画を連続して書いた文字。
3. 書体 書体は,かい書体を使用する。
4. 記入要領
4.1
一般的記入要領 一つの漢字は一つの記入枠内にかい書体で,次の事項に注意して記入する。
(1) 記入枠をはみだしたり,極端に小さい文字を記入しない。
(2) 線素及び偏・つくりなどのバランスをくずして記入しない。
(3) 水平,垂直斜めの筆画の方向はそれぞれ正しく記入する。更に,文字全体を極端に傾斜させたり,角
を丸めて記入しない。
(4) 筆画は正しい相互関係に注意して記入する。
8
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
(5) 不必要な“はね”や“かざり”をつけない。
また,“はね”や“はらい”が必要な場合でも,極端に大きく記入しない。
(6) 点画は,小さすぎたり,大きすぎたりしない。更に,線はかすれたり,極端に太くしない。
(7) 略字では記入しない。
(8) つづけ字では記入しない。
4.2
類似文字の区別 点画の有無,微小な筆画,類似した筆画の位置などだけが異なる類似文字を区別
できるとともに,くずし書きによる誤認識を生じないように,文字は丁寧に,かつ,他の文字と紛らわし
くならないように明確に記入する。識別が困難になる変形の例を次に示す。
(1) 突出しの有無
9
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
(2) 点画の有無
(3) 筆画の長短
(4) 筆画の傾斜
(5) 筆画の接合の有無,バランス
(6) 部首などの局所微小差
5. 字形
5.1
推奨字形 書体はかい書体を使用するが,第1水準漢字集合(1)については参考付図1に示す字形を
推奨する。
この推奨字形の名称をOCR−HCとする。字形の変形の許容限界は4.による。
注(1) 第1水準漢字集合とは,JIS X 0208(情報交換用漢字符号)の附属書2で規定された16区から47
10
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
区までの漢字2965字をいう。
備考 一般的に用いられる局部的な変形“シ”,“糸”などについても,規格の簡明さを維持する意味
で,推奨字形“シ”,“糸”だけを推奨する。
5.2
略字 略字はこれを定めない。
6. 記入枠 原則として本体6.を準用する。
11
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
参考付図1 推奨字形
12
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
参考付図1(続き)
13
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
参考付図1(続き)
14
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
参考付図1(続き)
15
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
参考付図1(続き)
16
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
参考付図1(続き)
17
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
参考付図1(続き)
18
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
参考付図1(続き)
19
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
参考付図1(続き)
20
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
参考付図1(続き)
21
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
参考付図1(続き)
22
X 9009-1991
2019年7月1日の法改正により名称が変わりました。まえがきを除き,本規格中の「日本工業規格」を「日本産業規格」に読み替えてください。
認識形入力方式専門委員会 構成表
氏名
所属
(委員長)
山 本 和 彦
工業技術院電子技術総合研究所知能情報部
斉 藤 泰 一
工業技術院電子技術総合研究所知能情報部
板 橋 秀 一
筑波大学電子・機械工学系
中 野 康 明
信州大学工学部
藤 本 秀 憲
労働省職業安定局
川 谷 隆 彦
NTTインテリジェントテクノロジ株式会社第2開発部
節 引 政 司
株式会社日立製作所小田原工場
伴 野 浩 三
三菱電機株式会社情報電子研究所
津 雲 淳
日本電気株式会社C&C情報研究所
加 藤 真
日本アイ・ビー・エム株式会社東京基礎研究所
山 下 義 征
沖電気工業株式会社ヒューマンインタフェース研究所
田 中 厚 夫
シャープ株式会社技術本部
大 塚 富士雄
レタリングデザイナー
伊 崎 保 直
富士通株式会社パーソナルシステム事業部
坂 井 邦 夫
株式会社東芝コンピュータ事業部
石 黒 栄 一
株式会社三越建装事業本部
上 田 陸奥夫
情報コンサルタント
安 田 道 夫
OCRスペシャリスト
名 倉 久 能
社団法人日本新聞協会時事通信社
佐 藤 元
株式会社リコー応用技術開発センター
山 下 史 郎
セイコー電子工業株式会社谷津工場
久 貝 正 己
キャノン株式会社インタコネクティビティ開発センター
松 村 博
株式会社メディアドライブ研究所開発部
本 郷 保 夫
富士ファコム制御株式会社
嶋 田 勝 利
三洋電機株式会社コンピュータ事業部
山 田 次 雄
工業技術院標準部情報規格課
(事務局)
水 田 哲 郎
社団法人日本電子工業振興協会基盤技術部