>サイトトップへ >このカテゴリの一覧へ

日本工業規格

JIS

 X

9009

-1991

光学式文字認識のための

手書き文字(平仮名)

Handprinted HIRAGANA characters for

Optical Character Recognition

1.

適用範囲  この規格は,光学式文字認識(以下,OCR という。)に使用する手書き平仮名の字形並び

にこれに関連する横書き及び縦書きの仕様を規定する。

参考 OCR のための手書き漢字の字形及びこれに関連する事項を参考として示す。

2.

用語の定義  この規格で用いる主な用語の定義は,次のとおりとする。

(1)

平仮名  平仮名は,次の 85 個の文字及び記号とする。“あいうえお  かきくけこ  さしすせそ  たち

つてと  なにぬねの  はひふへほ  まみむめも  やゆよ  らりるれろ  わゐゑをん  がぎぐげご  ざ

じずぜぞ  だぢづでど  ばびぶべぼ  ぱぴぷぺぽ  ぁぃぅぇぉっゃゅょゎ・

(句点)

(読点)

(2)

字形  実際に書かれたり印刷されたりしたときに実現する図形。

(3)

字体  表現された字形の基礎にある文字概念で,個々の文字を識別する要素としての点画,筆画の組

合せ方をいう。すなわち,字体は抽象的なものであり,具体的には字形として表現する。

(4)

線素  個々の字形を構成する一筆で書いた線。

(5)

線幅  線素の幅。

(6)

空げき(隙)  字形を構成する線素の間に保たれるべき有意味の空白。

(7)

突出し  二つの線素が一点で交差又は接触しているとき,基準となる線素に対して交差部から出てい

る線素の一部。

これは,

“あ  お  か  き  け  さ  す  せ  た  ち  な  ぬ  ね  は  ま  み  む  め  も  や

ゆ  よ  れ  わ  を  ぁ  ゃ  ゅ  ょ  ゎ”の字形に見られる。

(8)

はね  ある線素の終端部から他の線素への筆順上の移行を示す付加的部分。

これは,

“い  か  ぃ”の字形に見られる。

(9)

短線素  複数個の線素で構成されている字形において,比較的短い線素。

これは,

“う  え  お  そ  な  ふ  む  や  ら  ,

(読点)ぅぇぉゃ”の字形に見られる。

(10)

微小ループ  同一線素の接続,交差によって生じる微小な閉じた領域。

これは“お  す  な  ぬ  ね  は  ほ  ま  み  む  よ  る  。

(句点)ゐ  ゑ  ぉ  ょ”の字形に

見られる。

(11)

帳票基準辺  機械読取りの際に基準となる辺。横書きの場合は水平に,縦書きの場合は垂直に取る(付

図 参照)。

(12)

記入枠  帳票基準辺に平行及び垂直な線で囲まれた,一つの字形を書く場所を示す長方形の内側(付


2

X 9009-1991

図 参照)。

(13)

記入枠の幅  一つの記入枠を構成する縦線間(内側)の距離(付図 参照)。

(14)

記入枠の高さ  一つの記入枠を構成する横線間(内側)の距離(付図 参照)。

(15)

記入帯  帳票基準辺に平行及び垂直な辺を有する 1 行中の一組の連続した記入枠をすべて含む最小の

長方形領域。ただし,1 行とは,横書きの場合は横方向に,縦書きの場合は縦方向に取る(

付図 

照)

(16)

行間隔  行方向と直交する方向に隣接する二つの記入枠の中心線間の距離。ただし,中心線は,横書

きの場合は記入枠の垂直辺の垂直二等分線,

縦書きの場合は記入枠の水平辺の垂直二等分線とする

図 参照)。

(17)

記入枠間余白  一つの記入帯におけるある記入枠の距離。横書きの場合は右端の縦線から次の記入枠

の左端の縦線までの距離。縦書きの場合は下端の横線から次の記入枠の上端の横線までの距離(

付図

1

参照)

(18)

文字境界  帳票基準辺に平行又は垂直な辺を有する,一つの字形のすべての線素をその内部に含む最

小の長方形(

付図 参照)。

(19)

クリアエリア  帳票基準辺に平行又は垂直な辺を有する記入帯及びその周りの余白部を含む長方形領

域(

付図 参照)。

(20)

ドロップアウトカラー  人間の目には周囲の余白部と明確に区別できるが,OCR 装置にはほとんど感

知し得ない色相,彩度及び明度をもった色。

3.

字体の種類及び名称  字体の種類は 1 種類とし,その名称は OCR−HH とする。

4.

字形  字形は,次のとおりとする。


3

X 9009-1991

5.

記入要領

5.1

一般的記入要領  一つの平仮名は,一つの記入枠内に 4.で示された字形で書くものとする。

5.2

空げき(隙)  4.の字形に示されている空げきは,0.5mm 以上とする。

また,4.に示されている箇所以外に空げきができるようには書かないものとする。

5.3

突出し,はね及び飾り  4.に示されている箇所以外に余分な突出し,はね及びその他の装飾的な付加

的部分は作らないものとする。

5.4

短線素  短線素は,長さ 1.0mm 以上とする。

5.5

微小ループ  微小ループは,内径 0.5mm 以上とする。

5.6

字形の大きさ  文字境界の幅及び高さの許容値は,表 のとおりとする。


4

X 9009-1991

表 1  字形の大きさの許容値

字形の種類

い,つ,へ

う,く,し,も,り その他の大文字

3

2

W

W

2

1

W

W

3

2

W

W

高さ

2

1

H

H

3

2

H

H

備考  は記入枠の高さ,はその幅である。

なお,小文字(ぁぃぅぇぉっゃゅょゎ)については,同一記入帯内に書くべき大文字の大きさの

2

1

3

2

大きさで書くものとする。

5.7

線幅  線幅の許容範囲は,0.25∼0.65mm とする。

6.

記入枠

6.1

最小記入枠  文字の線素間の分離を確実にするため,記入枠の幅の最小値は 7mm とし,記入枠の高

さは幅の 1.0∼1.4 倍とする(

付図 参照)。

6.2

記入枠の配置  記入枠間余白の最小値は,1.5mm とする。行間隔は,クリアエリアが他の行の記入

帯に入らないようにとる(

付図 参照)。

6.3

分光特性  記入枠は,ドロップアウトカラーで印刷する。

7.

記入帯  記入帯は,記入枠を一まとめにして 1 行ごとに定めなければならない。ただし,1 行を幾つ

かの認識対象平仮名の組に分割して,それぞれ別の記入帯としてもよい。

8.

クリアエリア  クリアエリアは,次による。

(1)

横書きの場合,クリアエリアの上下の境界と記入帯の上下の境界との垂直距離は 4mm 以上とし,ク

リアエリアの左右の境界と記入帯の左右の境界との水平距離は 6mm 以上とする。

(2)

縦書きの場合,クリアエリアの左右の境界と記入帯の左右の境界との水平距離は 4mm 以上とし,ク

リアエリアの上下の境界と記入帯の上下の境界との垂直距離は 6mm 以上とする。

(3)

クリアエリア内には,記入枠及び認識対象平仮名しか存在してはならない。クリアエリアは,上下左

右に隣接する記入帯のクリアエリアと重なってもよいが,他の記入帯と重なってはならない(

付図 2

参照)

備考  ドロップアウトカラーで印刷された文字は,クリアエリア内にあってもよい。

関連規格  JIS X 0208  情報交換用漢字符号

JIS X 9004

  光学式文字認識のための印字仕様

JIS X 9005

  光学式文字認識のための手書き文字(片仮名)

JIS X 9006

  光学式文字認識のための手書き文字(数字)

JIS X 9007

  光学式文字認識のための手書き文字(英字)

JIS X 9008

  光学式文字認識のための手書き文字(記号)


5

X 9009-1991

付図 1  帳票基準辺,記入枠及び文字境界


6

X 9009-1991

付図 2  記入帯及びクリアエリア


7

X 9009-1991

参考  光学式文字認識のための手書き文字(漢字)

この参考は,本体の規定に関連する事柄を補足するもので,規定の一部ではない。

1.

適用範囲  この参考は,光学式文字認識に使用する手書き漢字の書体及び一般的な記入要領について

示す。

2.

用語の定義  この参考で用いる主な用語の定義は,本体 2.によるほか次による。

(1)

字種  起源を同じくする文字の集合。例えば,数字,英字,平仮名,片仮名,漢字などをいう。

(2)

漢字  主として日本語の自立語を書き表すのに用いる文字。

(3)

書体  文字集合(字種)に対して共通な性格をもつ字形生成上の様式。

(4)

筆画  個々の字形を構成するための,線として表現される基本図形要素。

(5)

点画  極めて短い,図形上で孤立した筆画。点と略称することもある。

(6)

かい(楷)書体  点画や筆画を略したり続けたりする字形生成上の流動化を伴わない書体。字ごとに

始めと終わりが明確な筆画や点画を積み重ねて字形を生成する書体。

(7)

はらい  ある筆画の終端部をゆるやかに伸ばした部分。

(8)

かざり  ある筆画の端部に追加される付加的部分。

(9)

つづけ字  複数個の筆画を連続して書いた文字。

3.

書体  書体は,かい書体を使用する。

4.

記入要領

4.1

一般的記入要領  一つの漢字は一つの記入枠内にかい書体で,次の事項に注意して記入する。

(1)

記入枠をはみだしたり,極端に小さい文字を記入しない。

(2)

線素及び偏・つくりなどのバランスをくずして記入しない。

(3)

水平,垂直斜めの筆画の方向はそれぞれ正しく記入する。更に,文字全体を極端に傾斜させたり,角

を丸めて記入しない。

(4)

筆画は正しい相互関係に注意して記入する。


8

X 9009-1991

(5)

不必要な“はね”や“かざり”をつけない。

また,

“はね”や“はらい”が必要な場合でも,極端に大きく記入しない。

(6)

点画は,小さすぎたり,大きすぎたりしない。更に,線はかすれたり,極端に太くしない。

(7)

略字では記入しない。

(8)

つづけ字では記入しない。

4.2

類似文字の区別  点画の有無,微小な筆画,類似した筆画の位置などだけが異なる類似文字を区別

できるとともに,くずし書きによる誤認識を生じないように,文字は丁寧に,かつ,他の文字と紛らわし

くならないように明確に記入する。識別が困難になる変形の例を次に示す。

(1)

突出しの有無


9

X 9009-1991

(2)

点画の有無

(3)

筆画の長短

(4)

筆画の傾斜

(5)

筆画の接合の有無,バランス

(6)

部首などの局所微小差

5.

字形

5.1

推奨字形  書体はかい書体を使用するが,第 1 水準漢字集合(

1

)

については

参考付図 に示す字形を

推奨する。

この推奨字形の名称を OCR−HC とする。字形の変形の許容限界は 4.による。

(

1

)

第1水準漢字集合とは,JIS X 0208(情報交換用漢字符号)の

附属書2で規定された16区から47


10

X 9009-1991

区までの漢字2965字をいう。

備考  一般的に用いられる局部的な変形“シ”,“糸”などについても,規格の簡明さを維持する意味

で,推奨字形“シ”,“糸”だけを推奨する。

5.2

略字  略字はこれを定めない。

6.

記入枠  原則として本体 6.を準用する。


11

X 9009-1991

参考付図 1  推奨字形


12

X 9009-1991

参考付図 1(続き)


13

X 9009-1991

参考付図 1(続き)


14

X 9009-1991

参考付図 1(続き)


15

X 9009-1991

参考付図 1(続き)


16

X 9009-1991

参考付図 1(続き)


17

X 9009-1991

参考付図 1(続き)


18

X 9009-1991

参考付図 1(続き)


19

X 9009-1991

参考付図 1(続き)


20

X 9009-1991

参考付図 1(続き)


21

X 9009-1991

参考付図 1(続き)


22

X 9009-1991

認識形入力方式専門委員会  構成表

氏名

所属

(委員長)

山  本  和  彦

工業技術院電子技術総合研究所知能情報部

斉  藤  泰  一

工業技術院電子技術総合研究所知能情報部

板  橋  秀  一

筑波大学電子・機械工学系

中  野  康  明

信州大学工学部

藤  本  秀  憲

労働省職業安定局

川  谷  隆  彦

NTT

インテリジェントテクノロジ株式会社第 2 開発部

節  引  政  司

株式会社日立製作所小田原工場

伴  野  浩  三

三菱電機株式会社情報電子研究所

津  雲      淳

日本電気株式会社 C&C 情報研究所

加  藤      真

日本アイ・ビー・エム株式会社東京基礎研究所

山  下  義  征

沖電気工業株式会社ヒューマンインタフェース研究所

田  中  厚  夫

シャープ株式会社技術本部

大  塚  富士雄

レタリングデザイナー

伊  崎  保  直

富士通株式会社パーソナルシステム事業部

坂  井  邦  夫

株式会社東芝コンピュータ事業部

石  黒  栄  一

株式会社三越建装事業本部

上  田  陸奥夫

情報コンサルタント

安  田  道  夫

OCR

スペシャリスト

名  倉  久  能

社団法人日本新聞協会時事通信社

佐  藤      元

株式会社リコー応用技術開発センター

山  下  史  郎

セイコー電子工業株式会社谷津工場

久  貝  正  己

キャノン株式会社インタコネクティビティ開発センター

松  村      博

株式会社メディアドライブ研究所開発部

本  郷  保  夫

富士ファコム制御株式会社

嶋  田  勝  利

三洋電機株式会社コンピュータ事業部

山  田  次  雄

工業技術院標準部情報規格課

(事務局)

水  田  哲  郎

社団法人日本電子工業振興協会基盤技術部