X 9305-1:2018 (ISO/IEC 30122-1:2016)
(1)
目 次
ページ
序文 ··································································································································· 1
1 適用範囲························································································································· 1
2 適合性···························································································································· 1
3 引用規格························································································································· 1
4 用語及び定義 ··················································································································· 2
5 要求事項及び推奨事項 ······································································································· 2
5.1 概要 ···························································································································· 2
5.2 音声命令のデータベース ································································································· 4
参考文献 ····························································································································· 6
X 9305-1:2018 (ISO/IEC 30122-1:2016)
(2)
まえがき
この規格は,工業標準化法第12条第1項の規定に基づき,一般社団法人ビジネス機械・情報システム産
業協会(JBMIA)及び一般財団法人日本規格協会(JSA)から,工業標準原案を具して日本工業規格を制
定すべきとの申出があり,日本工業標準調査会の審議を経て,経済産業大臣が制定した日本工業規格であ
る。
この規格は,著作権法で保護対象となっている著作物である。
この規格の一部が,特許権,出願公開後の特許出願又は実用新案権に抵触する可能性があることに注意
を喚起する。経済産業大臣及び日本工業標準調査会は,このような特許権,出願公開後の特許出願及び実
用新案権に関わる確認について,責任はもたない。
JIS X 9305の規格群には,次に示す部編成がある。
JIS X 9305-1 第1部:枠組及び総則
JIS X 9305-2 第2部:構築及び検査(予定)
JIS X 9305-3 第3部:翻訳及び地域化(予定)
日本工業規格 JIS
X 9305-1:2018
(ISO/IEC 30122-1:2016)
情報技術−ユーザインタフェース−音声命令−
第1部:枠組及び総則
Information technology-User interfaces-Voice commands-
Part 1: Framework and general guidance
序文
この規格は,2016年に第1版として発行されたISO/IEC 30122-1を基に,技術的内容及び構成を変更す
ることなく作成した日本工業規格である。
音声命令は,利用者の言語で音声によって情報通信技術[以下,ICT(Information and Communication
Technology)という。]を用いるシステムを操作するためのものである。この規格で用いる技術は,言語の
ゆらぎ(与えられた言語における異なるアクセント又は発話品質の劣化)をある程度考慮した音声認識に
基づく。また,音声命令は,ICTシステムの操作に手又は指が使えない場面又はときに利用者に恩恵をも
たらす。
1
適用範囲
この規格は,基本的な音声命令のための枠組及び一般指針を定義する。
この規格は,コンピュータ,携帯情報端末(PDA),タブレット,モバイル機器,カーナビゲーションシ
ステム及び事務機をはじめとするICTシステムの使用を容易にするために,限られた個数の音声命令を規
定する枠組を定める。
この規格は,自然言語処理技術による文の認識は含まない。
注記 この規格の対応国際規格及びその対応の程度を表す記号を,次に示す。
ISO/IEC 30122-1:2016,Information technology−User interfaces−Voice commands−Part 1:
Framework and general guidance(IDT)
なお,対応の程度を表す記号“IDT”は,ISO/IEC Guide 21-1に基づき,“一致している”こ
とを示す。
2
適合性
音声命令は,それが箇条5の要求事項を全て満たしているとき,この規格に適合する。
3
引用規格
次に掲げる規格は,この規格に引用されることによって,この規格の規定の一部を構成する。これらの
引用規格は,その最新版(追補を含む。)を適用する。
JIS X 0412-2 言語名コード−第2部:3文字コード
注記 対応国際規格:ISO 639-2,Codes for the representation of names of languages−Part 2: Alpha-3
2
X 9305-1:2018 (ISO/IEC 30122-1:2016)
code
ISO 639-3,Codes for the representation of names of languages−Part 3: Alpha-3 code for comprehensive
coverage of languages
ISO/IEC 30122-2,Information technology−User interfaces−Voice commands−Part 2: Constructing and
testing
ISO/IEC 30122-3,Information technology−User interfaces−Voice commands−Part 3: Translation and
localization
ISO/IEC 30122-4,Information technology−User interfaces−Voice commands−Part 4: Management of voice
command registration
4
用語及び定義
この規格で用いる主な用語及び定義は,JIS X 0412-2,ISO 639-3及びISO/IEC 30122-2によるほか,次
による。
4.1
音声命令(voice command)
ICTシステムを制御するための音声(発話)による指示。
5
要求事項及び推奨事項
5.1
概要
5.1.1
一般事項
この規格の対応国際規格を含む規格群は,四つの部で構成されている。
この規格は,基本的な音声命令のための枠組及び一般指針を提供する。音声命令のための基本的,かつ,
共通な要求事項及び推奨事項を規定する。
ISO/IEC 30122-2は,音声命令,及び音声認識システムのための技術的な基準及び試験方法を規定する。
音声命令は,ICTシステムを操作するために利用者が発話した指示である。ICTシステムは発話された指
示を音声認識技術によって認識し,かつ,識別する。したがって,音声命令の適切性を決定するために,
音声命令の音響特性を考慮するとともに,ICTシステムで使用する音声認識技術の仕様も考慮することが
望ましい。
音声命令は,どの言語でも使用される。言語の違いで生じる音声命令の問題は,音声命令の翻訳及び地
域化の際に考慮することが望ましい。ISO/IEC 30122-3は,音声命令を翻訳及び地域化するための言語的
な要求事項,並びに言語学的観点から見た,音声命令用の単語又は句を決定する手順を規定する。
ISO/IEC 30122-4は,ウェブでアクセス可能な音声命令のデータベース(以下,データベースという。)
として公開される音声命令の集合に適用する,標準化手順,要求事項,及び基準を定義している。これら
は,ISO/IEC専門業務用指針のIEC補足指針の附属書SLに基づいている。また,ISO/IEC 30122-4は,
標準とする音声命令のデータベースへの登録,更新又は廃止のための方法を定義している。
音声命令を使用しようとするシステム又はアプリケーションの開発者は,次の手順に従わなければなら
ない。
− 必要な音声命令を特定する。
− その必要性を満たす音声命令がデータベースに既に登録されているかどうかを調べる。
− その音声命令がデータベースに存在する場合,それを使用する。
3
X 9305-1:2018 (ISO/IEC 30122-1:2016)
− その音声命令が存在しない場合,この規格の指針及びISO/IEC 30122-2に従ってその音声命令を作成
する。
− 全ての音声命令は,翻訳及び地域化について,ISO/IEC 30122-3に適合させる。
− 標準化を望む場合は,ISO/IEC 30122-4で定義している標準化手順に基づいてその音声命令を提案す
る。
5.1.2
属性
この規格で定義する音声命令は次の属性をもつ。
a) 名称 この属性は,音声命令の名前を規定する。名称は,名詞又は名詞句が望ましい。名称は,一意
でなければならない(5.1.4を参照)。複数の名称が必要な場合には,セミコロンで区切らなければな
らない。
注記 名称は,必ずしも音声命令として利用者が発話する単語又は句ではない。
例1 “操作確認”。
例2 “回答;確認”。
b) 機能 この属性は,音声命令の目的又は音声命令を与えたときの実際の動作を規定する。機能は名詞
句で記述する。
例1 “システムが利用者に要求している事項の承認”。
例2 “ICTシステムからの応答への同意”。
c) 命令句 この属性は,ICTシステムを制御するために利用者が発話するものを規定する。命令句は,
一意でなければならない(5.1.4を参照)。
例1 “はい”。
例2 “賛成”。
d) 発音 この属性は,発音の特別な要求事項を規定する。この属性は,適切なマークアップ方法で記載
することが望ましい。発音についての特別な情報がない場合,この属性は空白にしてもよい。
注記 マークアップの適切な方法には,IPA(国際音声記号),SAMPA(Speech Assessment Methods音
声記号)などがある。
例1 命令句が“日本”で,かつ,[nihon] の発音だけが許されている(例えば,[nippon] は,その音
声命令としては無効である。)場合,この属性は,“[nihon]”である。
例2 命令句が“日本”で,かつ,[nihon] 及び [nippon] の両方の発音が許されている場合,この属
性は,“[nihon] [nippon]”である。
e) 注 この属性は追加説明である。注に記載することがない場合,空白にしてもよい。
例 “音声ʻはいʼも参照すること。”。
f)
キーワード この属性は,5.2で規定したデータベースに登録されている音声命令を検索するために利
用者が語句を規定する。キーワードを付与しない場合,空白にしてもよい。
例 “はい,賛成,確認”。
g) リリース日付 この属性は,該当する音声命令がデータベースに登録又は更新された日付である。日
付は協定世界時(UTC+0)で表示しなければならない。
例 “2012-01-31”
h) 版 この属性は,改訂の番号である。これは,1.00で開始し,大規模改訂のとき1ずつ,及び小規模
改訂のとき0.01ずつ増加しなければならない。
例 “1.02”( “.”は小数点)。
4
X 9305-1:2018 (ISO/IEC 30122-1:2016)
i)
履歴 この属性は,改訂の記録である。履歴には過去の版,及び過去の更新のリリース日付を含めて
もよい。過去の改訂が存在しない場合,履歴は空白にしてもよい。
例 “Ver. 1.00: 2011-01-01, Ver. 1.01: 2011-07-01”。
j)
関連するTC又はSC,及び出版物 この属性は,ISO及びIECの技術委員会(TC)及び分科会(SC),
並びに音声命令の標準化を行っている,又はそれに関係しているその他の標準化団体及び出版物を規
定する。出版物は,音声命令を定める公開文書である。
例 “ISO/IEC JTC1/SC35, ISO/IEC xxxxx:2012”。
5.1.3
音声命令の開始及び終了の信号
開始信号は,ICTシステムが音声命令を受け入れられるようにする。
終了信号は,ICTシステムが音声命令の受入れを終了させる。
開始及び終了の信号で,操作対象システムを特定することが望ましい。利用者がシステムの特定を省略
した場合,音声命令を受け入れることができる全てのシステムが操作対象システムとなる。
注記1 開始信号によって,システムは,利用者が発話した単語又は句が,音声命令又は単なる一般
的な発話かどうかを区別できる。
注記2 信号は必ずしも音声とは限らない。信号には,音,ボタンの押下,又はジェスチャが含まれ
る。
注記3 音声命令を受信するシステムが一つだけしか存在しないとき(例えば,自動車内でナビゲー
ションシステムだけが音声命令を受信するとき),利用者は,操作対象システムの特定を省略
する。
例1 “コンピュータ”という発話は,音声命令の開始信号である。
例2 手を3回たた(叩)くことは,音声命令の開始信号である。
例3 “以上”という発話は,音声命令の終了信号である。
例4 ICTシステムは,音声命令の開始信号後8秒間だけ音声命令を受信する。
5.1.4
一意性
異なる機能をもつ任意の二つの音声命令は,同じ名称であってはならない。
異なる機能をもつ任意の二つの音声命令は,同じ命令句であってはならない。
5.1.5
承認のフィードバック
ICTシステムはアクセシブルな方法で,承認又は拒否のフィードバックを利用者に返さなければならな
い。フィードバックによって,個人情報を漏えい(洩)してはならない。
注記 “個人情報”の定義は,JIS Q 15001を参照。
5.2
音声命令のデータベース
5.2.1
音声命令の登録
音声命令は,ISO/IEC 30122-4の手順に従ってデータベースに登録しなければならない。
5.2.2
データベースに登録する音声命令の言語
音声命令は,ISO及びIECの公用語のうち,少なくとも1言語,理想的には2言語でデータベースに登
録しなければならない。データベースは,必要に応じた言語で同じ意味をもつ語句を追加登録するための
枠組みを提供している。
注記1 データベースに標準化された音声命令を登録するためには,ISO/IECの公式言語での命令句
の登録が必須である。データベースは,必要なだけの言語(中国語,英語,フランス語,ド
イツ語,イタリア語,日本語,韓国語,ロシア語など)での同義語を登録することができる。
5
X 9305-1:2018 (ISO/IEC 30122-1:2016)
注記2 翻訳及び地域化の問題は,ISO/IEC 30122-3に記載されている。
5.2.3
データベースの内容
データベースは,次の内容を含まなければならない。
lcは言語コードであり,言語名の3文字コードで示す(JIS X 0412-2及びISO 639-3に従う。)。
注記 2文字コードが存在する場合,それらは必要に応じて二次情報として格納できる。
属性である名称,機能,命令句,発音,注,及びキーワードは,lcを変数とする関数である。変数lcの
値が“eng”(すなわち英語)の場合,これらの関数は具体的な値をもたなければならない。
例 命令句(eng)=“Yes”,命令句(fre)=“Oui”,命令句(ger)=“Ja”,
命令句(jpn)=“はい”,命令句(kor)=“
”,及び命令句(chi)=“
”である。
a) 索引番号 索引番号は,音声命令の一意な一連番号である。
b) ID番号 ID番号は,音声命令を分類して付した一意な番号である。
c) 名称(lc)
d) 機能(lc)
e) 命令句(lc)
f)
発音(lc)
g) 注(lc)
h) キーワード(lc)
i)
リリース日付
j)
版
k) 履歴
l)
関連するTC又はSC,及び出版物
注記 単語又は語句の持続時間は,データベースに登録しない。
5.2.4
データベースの管理
データベース管理の手順は,ISO/IEC 30122-4に適合しなければならない。
6
X 9305-1:2018 (ISO/IEC 30122-1:2016)
参考文献
[1] JIS Z 8524 人間工学−視覚表示装置を用いるオフィス作業−メニュー対話
注記 原国際規格では,ISO 9241-14,Ergonomic requirements for office work with visual display
terminals (VDTs)−Part 14: Menu dialoguesを記載している。
[2] JIS Z 8525 人間工学−視覚表示装置を用いるオフィス作業−コマンド対話
注記 原国際規格では,ISO 9241-15,Ergonomic requirements for office work with visual display
terminals (VDTs)−Part 15: Command dialoguesを記載している。
[3] ISO 9241-143,Ergonomics of human-system interaction−Part 143: Forms
注記 原国際規格では,ISO 9241-17,Ergonomic requirements for office work with visual display
terminals (VDTs)−Part 17: Form filling dialoguesを記載しているが,この規格は2012年に廃止
となっている。
[4] ISO 9241-110,Ergonomics of human-system interaction−Part 110: Dialogue principles
[5] ISO 24610-1,Language resource management−Feature structures−Part 1: Feature structure representation
[6] ISO 24613,Language resource management−Lexical markup framework (LMF)
[7] ISO 24614-1,Language resource management−Word segmentation of written texts−Part 1: Basic concepts
and general principles
[8] ISO 24615-1,Language resource management−Syntactic annotation framework (SynAF)−Part 1: Syntactic
model
[9] ISO/IEC 2382,Information technology−Vocabulary
[10] JIS X 8341-7:2011高齢者・障害者等配慮設計指針−情報通信における機器,ソフトウェア及びサービ
ス−第7部:アクセシビリティ設定
注記 原国際規格では,ISO/IEC 24786:2009,Information technology−User interfaces−Accessible user
interface for accessibility settingsを記載している。
[11] ETSI/ES 202 076 V2.1.1
[12] JEITA IT-4003:2005,Symbols for Japanese speech recognizer (in Japanese)[日本語音声認識用読み記号(日
本語)]
[13] JEITA IT-4005:2008,The Guidelines for performance evaluation of speech recognition engine (in Japanese)
[音声認識エンジン性能評価方法のガイドライン(日本語)]
[14] IPSJ-TS 0011:2005,Guidelines for evaluation of an in-car speech recognition system (in Japanese)[カーナビ
用音声入力の性能評価のためのガイドライン(日本語)]
[15] IPA (INTERNATIONAL PHONETIC ALPHABET) CHART. 2005,the International Phonetic Association
https://www.internationalphoneticassociation.org/content/ipa-chart
[16] DELIVERABLE S.P.E.E.C.O.N. D13: 2001 Functionalities of Speech Driven Interfaces
http://www.speechdat.org/speecon/public̲docs/D13v1.8̲final.doc
[17] JIS Q 15001 個人情報保護マネジメントシステム−要求事項