Z 8101-1
:2015 (ISO 3534-1:2006)
(1)
目 次
ページ
序文
1
適用範囲
2
1
一般統計用語
2
2
確率で用いられる用語
24
附属書 A(参考)記号
51
附属書 B(参考)統計に関するコンセプトダイアグラム
53
附属書 C(参考)確率に関するコンセプトダイアグラム
59
附属書 D(参考)用語の開発に用いた方法論
63
参考文献
67
Z 8101-1
:2015 (ISO 3534-1:2006)
(2)
まえがき
この規格は,工業標準化法第 14 条によって準用する第 12 条第 1 項の規定に基づき,一般財団法人日本
規格協会(JSA)から,工業標準原案を具して日本工業規格を改正すべきとの申出があり,日本工業標準
調査会の審議を経て,経済産業大臣が改正した日本工業規格である。
これによって,JIS Z 8101-1:1999 は改正され,この規格に置き換えられた。
この規格は,著作権法で保護対象となっている著作物である。
この規格の一部が,特許権,出願公開後の特許出願又は実用新案権に抵触する可能性があることに注意
を喚起する。経済産業大臣及び日本工業標準調査会は,このような特許権,出願公開後の特許出願及び実
用新案権に関わる確認について,責任はもたない。
JIS Z 8101
(統計−用語及び記号)の規格群には,次に示す部編成がある。
JIS
Z
8101-1
第 1 部:一般統計用語及び確率で用いられる用語
JIS
Z
8101-2
第 2 部:統計の応用
JIS
Z
8101-3
第 3 部:実験計画法(予定)
日本工業規格
JIS
Z
8101-1
:2015
(ISO 3534-1
:2006
)
統計−用語及び記号−
第 1 部:一般統計用語及び確率で用いられる用語
Statistics-Vocabulary and symbols-Part 1: General statistical terms and
terms used in probability
序文
この規格は,2006 年に第 2 版として発行(及び 2007 年にその修正版として発行)された ISO 3534-1 を
基に,技術的内容及び対応国際規格の構成を変更することなく作成した日本工業規格である。
なお,この規格で点線の下線を施してある参考事項は,対応国際規格にはない事項である。
この規格と JIS Z 8101-2 とは相互に矛盾しないことを意図している。それぞれの規格で用いる数学のレ
ベルは,用語定義が一貫性をもち,正しく簡潔であるために必要な最低限にとどめている。確率及び統計
で用いられる用語に関するこの規格は,基本的であり,その必要性のためやや高度なレベルの数学によっ
て表現されている。統計の応用に関する JIS Z 8101-2 又は他の ISO/TC 69 の規格(及び対応する JIS)の
ユーザがこの規格の用語の定義を参照することを考慮して,用語によってはあまり専門的でない表現で記
述した注記及び例による説明を加えてある。これらの略式の説明は正式な定義の代用にはならないが,実
用的で専門家でない人向けの概念的な規定であり,用語規格の多様なユーザのニーズに応えるであろう。
JIS Z 8101-2
又は JIS Z 8402 の規格群のような規格に普段から接しているような実際的なユーザにとって
は,注記及び例によってこの規格がより理解しやすくなる。
確率及び統計に関して明確で合理性のある完全な用語集は,
統計的方法の規格を開発し,
活用する上で,
不可欠である。
この規格に示された用語の定義は,
統計的な規格の開発者にとって曖昧さをなくすために,
十分に正確で数学的にも洗練されていなければならない。それぞれの応用の領域,前後の関係,及び概念
のより詳細な説明は,当然ではあるが確率及び統計の入門的な教科書にも記述されている。
コンセプトダイアグラムを
附属書(参考)に次のそれぞれの用語のグループについて示した。
1)
一般統計用語(
附属書 B)
2)
確率で用いられる用語(
附属書 C)。
一般統計用語については,6 種類のダイアグラムで,確率で用いられる用語については 4 種類のダイアグ
ラムである。コンセプトの間のつながりを示すために複数のダイアグラムに重複して現れる用語もある。
附属書 D にコンセプトダイアグラム及びその解釈について簡単な説明を記述した。
これらのダイアグラムによって様々な用語の間の関係を図示することが,この規格の今回の改正におい
て役立った。これらのダイアグラムは,この規格を他の言語に翻訳するときにも有用であろう。
この規格の全体に関する注意として,特に断らない限り,用語の定義は 1 次元(1 変量)の場合につい
ての規定である。ここでこのように規定しておくことで,多くの用語の定義で
1
次元の場合である と
記述することを繰り返す必要性を回避した。
2
Z 8101-1
:2015 (ISO 3534-1:2006)
適用範囲
この規格は,他の JIS の作成で用いられる一般統計用語及び確率で用いられる用語について規定する。
さらに,一部の用語について記号も規定する。
用語は,次のように区分する。
a)
一般統計用語(箇条 1)
b)
確率で用いられる用語(箇条 2)
附属書 A に,この規格で用いることが推奨されている記号を示す。
附属書 B 及び附属書 C に,この規格の見出し語をその関係によって配置したコンセプトダイアグラムを
示す。
注記 この規格の対応国際規格及びその対応の程度を表す記号を,次に示す。
ISO 3534-1:2006
,Statistics−Vocabulary and symbols−Part 1: General statistical terms and terms used
in probability
(IDT)
なお,対応の程度を表す記号
IDT
は,ISO/IEC Guide 21-1 に基づき, 一致している
こ
とを示す。
1
一般統計用語
1.1
母集団 ぼしゅうだん(population)
検討の対象となるアイテムの全体。
注記 1 母集団は,実在して有限な場合,実在して無限の場合,又は完全に仮想的な場合がある。特
に,標本調査では,しばしば
有限母集団
という用語が用いられる。同様に,連続的なも
のからのサンプリングでは 無限母集団 という用語が用いられる。箇条 2 では,母集団は,
確率に関する文脈で,
標本空間(2.1)として扱われる。
注記 2 母集団を仮想的に考えることによって,様々な仮定のもとでまだとられていないデータの性
質を検討することができる。したがって,母集団を仮想的に考えることは,統計調査の計画
の段階,特に,適切なサンプルサイズの決定に有用である。仮想的な母集団は,有限でも無
限でもよい。仮想的な母集団は,推測統計では特に有用な概念であり,統計を用いる研究に
おいて証拠の強さを評価するときに役立つ。
注記 3 母集団の性質を記述することによって,調査研究の状況を説明することができる。例えば,
もし,三つの村が人口学的な研究又は健康に関する研究のために選ばれるなら,母集団はこ
れらの選ばれた村の住人から構成される。一方,もし,ある特定の地域の全ての村の中から
三つの村がランダムに選ばれるのなら,母集団はその地域の住人全体から構成される。
1.2
サンプリング単位,抽出単位 さんぷりんぐたんい,ちゅうしゅつたんい(sampling unit)
母集団(1.1)を実質的に最小単位に分割したものの一つ。
注記 1 状況に応じて,興味のある最小の単位は,個人,世帯,学校区域,行政単位などがある。
注記 2 本来は一度のサンプリング操作で採られる量又はものを意味し,ものを指す場合は単位体と
呼ぶこともある。
1.3
サンプル,標本,試料 さんぷる,ひょうほん,しりょう(sample)
3
Z 8101-1
:2015 (ISO 3534-1:2006)
一つ以上の
サンプリング単位(1.2)からなる母集団(1.1)の部分集合。
注記 1 サンプリング単位は,対象とする母集団に応じて定まり,アイテム,数値,又は抽象的なも
のでもよい。
注記 2 JIS Z 8101-2 におけるサンプルの定義には,有限母集団からランダムサンプルを採取すると
きに本質的な役割を果たすサンプリングフレームの例が含まれている。
1.4
観測値,測定値 かんそくち,そくていち(observed value)
サンプル(1.3)の一つの構成要素のある側面に関して得られた値。
注記 1
実現値
及び
データ
はよく用いられる同義語である。英語ではデータの単数形は,デ
ータム(datum)である。
注記 2 この定義は,観測値がどのように発生したか,又は,その値がどのように得られたのかを規
定していない。その値は
確率変数(2.10)の一つの実現値を表しているかもしれないが,常
にそうであるとは限らない。当該の観測値は,後で行われる統計解析の対象となる複数の観
測値の一つの場合もある。所定の実現値の集合を観測する確率の決定問題として扱う場合に
限り,統計的メカニズムが関係し,かつ,本質的なものになる。観測値の要約を計算したり,
グラフによる描写をしたりするには,その種の統計的前提は必ずしも必要ではない。観測値
の解析のこの種の予備的段階をデータ分析と呼ぶこともある。
注記 3 注記 2 で予備的段階として位置付けられているデータ分析は,探索的データ解析に含まれる。
注記 2 の趣旨は,検証的データ解析の場合にだけ統計的に厳格な取扱いが要求されることで
ある。
1.5
記述統計 きじゅつとうけい(descriptive statistics)
観測値(1.4)をグラフ,数値,又はその他の要約手段を用いて描写すること。
例 1 数値的要約には,平均(1.15),範囲(1.10),標準偏差(1.17)などを求めることが含まれる。
例 2 グラフを用いた要約の例は,箱ひげ図,ダイアグラム,Q-Q プロット,正規確率プロット,散
布図,多変量散布図,ヒストグラムなどである。
1.6
ランダムサンプル,無作為標本 らんだむさんぷる,むさくいひょうほん(random sample)
ランダムな選択方法によって選ばれた
サンプル(1.3)。
注記 1 この定義は,無限母集団も許容しており,JIS Z 8101-2 の定義よりも制約的ではない。
注記 2 n 個のサンプリング単位からなるサンプルが有限な標本空間(2.1)から選ばれるとき,n 個
のサンプリング単位の可能な各組合せは,特定の抽出
確率(2.5)をもつ。標本調査の計画に
当たっては,可能な全ての組合せに対して,この特定の確率を前もって計算しておく場合が
ある。
注記 3 有限標本空間からの標本調査に対しては,様々なサンプリング計画によって,ランダムサン
プルを得ることができる。例えば,層別ランダムサンプリング,系統ランダムサンプリング,
集落サンプリング,補助変数の大きさに比例した抽出確率を用いるサンプリング,その他多
くの方法がある。
注記 4 この定義は,一般的に,実際の観測値(1.4)を指すこととなる。これらの観測値は確率変数
(2.10)の実現値と考えることができる。すなわち,それぞれの観測値は一つの確率変数に
4
Z 8101-1
:2015 (ISO 3534-1:2006)
対応する。
推定量(1.12),統計的検定(1.48)のための検定統計量,又は信頼区間(1.28)
がランダムサンプルから導かれるときは,この定義は,これらの確率変数の実際の観測値で
はなくて,このサンプルを抽象化した確率変数に対応するものとなる。
注記 5 無限母集団からのランダムサンプルは,しばしば,標本空間からの繰返し抽出によって生成
され,
注記 4 で述べた定義の解釈を用いれば,独立,同一分布に従う確率変数からなるサン
プルを導く。
1.7
単純ランダムサンプル,単純無作為標本 たんじゅんらんだむさんぷる,たんじゅんむさくいひょうほん
(simple random sample)
<有限母集団>ある与えられた大きさをもつ部分集合が,全て等確率で選ばれるような
ランダムサンプ
ル(1.6)。
注記 1 この定義は,表現はわずかに異なるが,JIS Z 8101-2 による定義と整合する。
注記 2 < >の記号は,一つの用語が複数の概念を表す場合に,それぞれの概念に関係する主題又
は分野を表示して対象を限定し,区別するために用いる。
1.8
統計量 とうけいりょう(statistic)
確率変数(2.10)だけで規定された関数。
注記 1 統計量は,1.6 の注記 4 で述べた意味でランダムサンプル(1.6)に含まれる確率変数の関数
である。
注記 2 注記 1 に関連して,{X
1
,X
2
,…,X
n
}
が未知の
平均(2.35)
μ
,及び未知の
標準偏差(2.37)
σ
をもつ
正規分布(2.50)からのランダムサンプルなら,(X
1
+X
2
+…+X
n
)/n
で表される
標本
平均(1.15)は統計量である。一方,[(X
1
+X
2
+…+X
n
)/n]
−μ は,
母数(2.9)を含むので統
計量ではない。
注記 3 ここで与えられた定義は,数理統計学の中に見いだされる取扱いに対応した技術的定義であ
る。英語では statistic(統計量)の複数形,すなわち statistics は統計学を指すこともあり,そ
の場合は ISO/TC 69 の国際規格で記載されている解析活動を含む技術的分野を意味する。
1.9
順序統計量 じゅんじょとうけいりょう(order statistic)
確率変数(2.10)を非減少な順序に並べることによって得られる統計量(1.8)。
例 標本の観測値が 9,13,7,6,13,7,19,6,10,7 であるとする。順序統計量の観測値は,6,6,
7
,7,7,9,10,13,13,19 となる。これらの値は,X
(1)
から X
(10)
までの実現値と考えることが
できる。
注記 1 ランダムサンプル(1.6)の観測値(1.4)を {x
1
,x
2
,…,x
n
}
とし,非減少な順序に並べて
x
(1)
≦ … ≦ x
(k)
≦ … ≦ x
(n)
と表す。そのとき,(x
(1)
,…,x
(k)
,…,x
(n)
)
は順序統計量 (X
(1)
,
…,X
(k)
,…,X
(n)
)
の観測値であり,x
(k)
は k 番目の順序統計量の観測値である。
注記 2 実際的観点では,データセットに対して順序統計量を得ることは,注記 1 で記述したように
形式的にデータをソートすることと同じである。そのとき,データセットをソートすること
によって,この後の幾つかの定義で与えられるように,それ自体が有用な要約統計量になる。
なお,この規格では非減少な又は非増加な順序に並べかえることをソートするという。
注記 3 標本の値を非減少な順序に順位付ければ,順序統計量は,その順位に対応する標本の値を意
5
Z 8101-1
:2015 (ISO 3534-1:2006)
味する。上に示した例のように,まだ観測されていない確率変数をソートするよりも,観測
された標本の値(確率変数の実現値)をソートするほうが理解しやすい。しかしながら,非
減少な順序に並び替えられた
ランダムサンプル(1.6)からの確率変数を考慮することは可能
である。例えば,n 個の確率変数の最大値はその実現値を得る前に検討可能である。
注記 4 個々の順序統計量は,確率変数だけで規定された関数なので統計量である。この関数は,確
率変数を並べ替えた集合における位置又は順位を特定する。
注記 5 離散型確率変数及び桁数の少ない実現値の場合には,同じ値をもつデータ(タイデータ)の
取扱いの問題が生じる。 非減少な順序
という言葉は, 上昇順
という言葉よりも,問題
によってはより正確な言い回しとして用いられる。複数個の同じ値のデータは,その個数分
だけ記録に残し,一つの値にまとめてはならないことは重要である。上記の例では,6,6 の
二つの実現値が同じ値のデータである。
注記 6 順序付けは,確率変数の絶対値に基づくのではなく,符号付きで行う。
注記 7 順序統計量の全体の集合は,n 次元の確率変数になる。ここで,n は標本における観測値の個
数である。
注記 8 n 次元の順序統計量の各成分も順序統計量と呼ばれるが,その場合には,標本内の順序を示
す数字を下付の括弧内に表す。
注記 9 最小値,最大値,及びサンプルサイズが奇数の場合の標本メディアン(1.13)は,順序統計
量の例である。例えば,サンプルサイズが 11 のとき,X
(1)
は最小値,X
(11)
は最大値であり,
X
(6)
は標本メディアンである。
1.10
範囲,サンプルレンジ はんい,さんぷるれんじ(sample range)
最大の
順序統計量(1.9)から最小の順序統計量を引いた量。
例 1.9 の例を引き続き考えると,範囲の観測値は 19−6=13 である。
注記 1 統計的工程管理では,範囲は,時間的に推移する工程のばらつきを監視するためにしばしば
用いられる。特に,サンプルサイズが比較的小さい場合に用いられる。
注記 2 統計量であることを強調するときには,標本範囲と呼ぶこともある。
注記 3 混乱が生じなければ,サンプルを省略してレンジと呼んでもよい。
1.11
ミッドレンジ,中点値 みっどれんじ,ちゅうてんち(mid-range)
最小及び最大の
順序統計量(1.9)の平均(1.15)。
例 1.9 に示した例の数値を用いると,ミッドレンジの観測値は, (6+19)/2=12.5 である。
注記 ミッドレンジを用いると,小さなデータセットの中心位置を迅速に簡便に評価できる。
1.12
推定量 すいていりょう(estimator)
θˆ
母集団のパラメータ θ の
推定(1.36)に用いられる統計量(1.8)。
注記 1 母集団の平均(2.35)
(μ と表す。
)を推定する
標本平均(1.15)は母平均の推定量である。正
規分布(2.50)などのような分布(2.11)に対して母集団の平均 μ に対する 自然な 推定量
は標本平均である。
注記 2 母集団の性質[例えば,1 変量分布(2.16)のモード(2.27)など]を推定する際,適切な推
6
Z 8101-1
:2015 (ISO 3534-1:2006)
定量は,分布の母数の推定量の関数であったり,
ランダムサンプル(1.6)の複雑な関数であ
ったりする。
注記 3
推定量
という言葉は,ここでは広い意味で用いられている。それは,母数の点推定量と
いう意味も,区間推定の意味も含んでおり,更に予測(しばしば予測量と呼ばれることもあ
る。
)の意味も含んでいる。推定量は,カーネル推定量及び他の特別な目的をもつ統計量も含
んでいる。より詳細な議論を 1.36 の
注記に示す。
1.13
(標本)メディアン,中央値,中位数 (ひょうほん)めでぃあん,ちゅうおうち,ちゅういすう(sample
median
)
サンプルサイズ(JIS Z 8101-2,1.2.26 を参照)n が奇数なら,[(n+1)/2] 番目の順序統計量(1.9)。サン
プルサイズ n が偶数なら,(n/2) 番目と [(n/2)+1] 番目との順序統計量の和を 2 で割った量。
例 1.9 の例で考えると,8 が標本メディアンの実現値である。この場合(サンプルサイズは,偶数の
10
)には,5 番目及び 6 番目の値がそれぞれ 7 及び 9 なので,それらの平均は 8 になる。厳密に
は標本メディアンは確率変数として定義されているが,実務上は
標本メディアンは 8 である
という形式で報告される。
注記 1 サンプルサイズ n のランダムサンプル(1.6)に対して,1 から n まで非減少な順序で並べら
れた
確率変数(2.10)において,サンプルサイズ n が奇数なら標本メディアンは, (n+1)/2
番目の確率変数である。また,サンプルサイズ n が偶数なら,標本メディアンは, (n/2) 番
目の確率変数と (n/2+1) 番目の確率変数との算術平均である。対応国際規格では,この注記
において
(n/2
+1) 番目
を
(n
+1)/2 番目
と誤記している。
注記 2 概念的には,まだ観測されていない確率変数を順番に並べることは不可能と見えるかもしれ
ない。しかし,観測された後に並び替えることまでを織り込んだものが順序統計量であると
理解すればよい。実際,観測値を得たら,値を並び替えて,順序統計量の実現値を得る。こ
れらの実現値がランダムサンプルから構成した順序統計量と解釈できる。
注記 3 標本メディアンは,サンプルの半分ずつがそれぞれ上側と下側とにあるという意味で,分布
の中心位置の推定量となる。
注記 4 実務上,標本メディアンは,データセットの中の非常に極端な値に影響されにくい推定量を
与えるという意味で有用である。例えば,収入金額のメディアン及び住宅価格のメディアン
は,要約値としてしばしば報告される。
注記 5 混乱が生じなければ, 標本 を省略してもよい。
1.14
k 次の標本モーメント,k 次の標本積率 k じのひょうほんもーめんと,k じのひょうほんせきりつ(sample
moment of order k
)
E(X
k
)
ランダムサンプル(1.6)における確率変数(2.10)の k 乗の和を標本(1.3)における観測値の個数で割
った量。
注記 1 サンプルサイズが n のランダムサンプル,すなわち,{X
1
,X
2
,…,X
n
}
に対して,k 次の標
本モーメント E(X
k
)
は,
7
Z 8101-1
:2015 (ISO 3534-1:2006)
=
n
i
k
i
X
n
1
1
である。
ここでは,
E(X
k
)
と とを同一視するような記述になっているが,通常の記号法では,
前者は期待値をとった後なので定数であり,かつ,後者は確率変数なので,両者の同一視は
できない。したがって,この記号法
E(X
k
)
を使用することは避けたほうがよい。
注記 2
さらに,この概念を
原点のまわりの
k
次の標本モーメントと呼ぶことがある。
注記 3
1
次の標本モーメントは,次に定義される
標本平均(1.15)である。
注記 4
定義は任意の
k
に対して与えられているが,実際上よく用いられるのは,
k
=
1
の場合[
標本
平均(1.15)],
k
=
2
の場合[
標本分散(1.16)及び標本標準偏差(1.17)に関連],
k
=
3
の場
合[
標本ゆがみ(1.20)に関連],及び
k
=
4
の場合[
標本とがり(1.21)に関連]である。
注記 5
E(X
k
)
の
E
は,確率変数
X
の
期待値
に由来している。
注記 6
(原点まわりの)標本
k
次モーメント
とも呼んでもよい。
注記 7
混乱が生じなければ, 標本
を省略してもよい。
1.15
(標本)平均,算術平均 (ひょうほん)へいきん,さんじゅつへいきん(
sample mean
,
average
,
arithmetic
mean
)
ランダムサンプル(1.6)における確率変数(2.10)の和を,和をとった個数で割った量。
例
1.9
の例を考えると,標本平均の実現値は
9.7
である。これは,観測値の合計
97
をそのサンプル
サイズ
10
で割って求めた値である。
注記 1
統計量として考えると,標本平均は,1.8 の
注記 3 で述べた意味でランダムサンプルにおける
確率変数の関数である。この意味での推定量と,ランダムサンプルの
観測値(1.4)から計算
された標本平均の数値とを区別しなければならない。
注記 2
統計量として考えた標本平均は,母集団の
平均(2.35)の推定量としてしばしば用いられる。
よく使われる同義語は算術平均である。
注記 3
サンプルサイズ
n
のランダムサンプル,すなわち,
{X
1
,
X
2
,…,
X
n
}
に対して,標本平均は,
=
=
n
i
i
X
n
X
1
1
である。
注記 4
標本平均は,
1
次の標本モーメントと考えることができる。
注記 5
サンプルサイズが
2
のときには,標本平均,
標本メディアン(1.13),及びミッドレンジ(1.11)
は一致する。
注記 6
混乱が生じなければ, 標本
を省略してもよい。
1.16
(標本)分散,不偏分散 (ひょうほん)ぶんさん,ふへんぶんさん(
sample variance
)
S
2
ランダムサンプル(1.6)における確率変数(2.10)からそれらの標本平均(1.15)を引いた偏差の
2
乗
和を,サンプルサイズ−
1
で割った量。
=
n
i
k
i
X
n
1
1
8
Z 8101-1
:2015 (ISO 3534-1:2006)
例
1.9
の数値例を引き続き考えて計算すると,標本分散は
17.57
となる。観測された標本平均からの
偏差の
2
乗和は
158.10
で,サンプルサイズは
10
なので,
10
−
1
=
9
となる。
158.10
を
9
で割れば
よい。
注記 1
統計量(1.8)として考えると,標本分散
S
2
は,ランダムサンプルにおける確率変数の関数で
ある。統計量の意味でのこの
推定量(1.12)と,ランダムサンプルの観測値(1.4)から計算
された標本分散の数値とを区別しなければならない。この数値結果は,経験標本分散,又は
観測された標本分散と呼ばれ,普通
s
2
と表される。
注記 2
サンプルサイズ
n
のランダムサンプル,すなわち,
{X
1
,
X
2
,…,
X
n
}
に対して,標本平均を
X と表すとき,標本分散は,次の式による。
=
−
−
=
n
i
i
X
X
n
S
1
2
2
)
(
1
1
注記 3
標本分散は,標本平均からの
確率変数(2.10)の偏差の
2
乗の
ほとんど
平均である(分
母において n ではなく n−
1
を用いることだけが異なる。
)
。n−
1
を用いることによって,標
本分散は母集団の
分散(2.36)の不偏推定量(1.34)となる。これが不偏分散の由来である。
注記 4
n−
1
は,
自由度(2.54)として知られている量である。
注記 5
標本分散は,中心化標本確率変数の
2
次の標本モーメントとみなすことができる。対応国際
規格では
中心化標本確率変数
を
標準化標本確率変数(1.19) と誤記している。この規
格では与えられていないが, 中心化標本確率変数 は 確率変数からその標本平均を引いた
量
と定義される。
注記 6
混乱が生じなければ, 標本
を省略してもよい。
1.17
(標本)標準偏差 (ひょうほん)ひょうじゅんへんさ(
sample standard deviation
)
S
標本分散(1.16)の非負の平方根。
例
1.9
の数値例を用いると,標本分散の観測値が
17.57
なので,標本標準偏差の観測値は
4.192
とな
る。ここで,データに基づいて途中の桁をより多く保持して計算すると
4.191
になる。
注記 1
実務的には,標本標準偏差は,
標準偏差(2.37)を推定するために用いられる。S は確率変数
(2.10)であり,
ランダムサンプル(1.6)からの実現値ではないことを再度強調しておく。
注記 2
標本標準偏差は,
分布(2.11)のばらつきの指標である。
注記 3
混乱が生じなければ, 標本
を省略してもよい。
1.18
(標本)変動係数 (ひょうほん)へんどうけいすう(
sample coefficient of variation
)
標本標準偏差(1.17)を標本平均(1.15)で割った量。
注記 1
変動係数(2.38)と同様,この統計量は,正の値しかとらない母集団のときに用いられる。
変動係数は,通常,パーセントで表示される。ばらつきが平均に比例して増加する場合に,
変動係数は有用である。
注記 2
標本変動係数を
相対標準偏差
と呼ぶことは薦められない。
注記 3
混乱が生じなければ, 標本
を省略してもよい。
9
Z 8101-1
:2015 (ISO 3534-1:2006)
1.19
標準化(された)標本確率変数,規準化(された)標本確率変数 ひょうじゅんか(された)ひょうほん
かくりつへんすう,きじゅんか(された)ひょうほんかくりつへんすう(
standardized sample random variable
)
確率変数(2.10)からその標本平均(1.15)を引いて,標本標準偏差(1.17)で割った量。
例
1.9
の例では,標本平均の観測値は
9.7
であり,標本標準偏差の観測値は
4.191
(対応国際規格は
4.192
と誤記)であった。したがって,標準化標本確率変数の観測値は,次のとおりである(小数
点
2
桁まで示す。
)
。
−
0.17
,
0.79
,
−
0.64
,
−
0.88
,
0.79
,
−
0.64
,
2.22
,
−
0.88
,
0.07
,
−
0.64
注記 1
標準化標本確率変数は,理論的に対応する
標準化確率変数(2.33)と区別しなければならな
い。標準化の意図は,解釈及び比較を容易にするために,確率変数を,平均が
0
,標準偏差
が
1
となるように変換することである。
注記 2
標準化された観測値は,その平均の観測値が
0
,標準偏差の観測値が
1
になる。
注記 3
混乱が生じなければ, 標本
を省略してもよい。
1.20
(標本)ゆがみ,
(標本)ひずみ (ひょうほん)ゆがみ (ひょうほん)ひずみ(
sample coefficient of skewness
)
ランダムサンプル(1.6)からの標準化標本確率変数(1.19)の
3
乗の算術平均。
例
1.9
の数値例を用いると,標本ゆがみの観測値は
0.971 88
となる。この例のようにサンプルサイズ
が
10
程度では標本ゆがみは非常にばらつきが大きくなるので,用いる場合には注意が必要である。
注記 1 に示した別の公式(
2
番目の公式)を用いた場合には,計算結果は
1.349 83
となる。
注記 1
定義に対応する公式は,次のとおりである。
3
1
1
=
−
n
i
i
S
X
X
n
幾つかの統計解析パッケージでは
かたより(1.33)を修正するために,次の標本ゆがみの公
式を用いている。
=
−
−
n
i
i
Z
n
n
n
1
3
)
2
)(
1
(
ここに,
S
X
X
Z
i
i
−
=
である。サンプルサイズが大きい場合には,二つの推定値の違いは無視できるレベルである。
かたよりのある推定値に対するかたよりのない推定値との比は,それぞれ
n
=
10
に対して
1.389
,
n
=
100
に対して
1.031
,
n
=
1 000
に対して
1.003
である。
注記 2
ゆがみは分布の非対称性を表す。この統計量の値が
0
に近ければ,母集団分布は近似的に対
称である。一方,
0
でなければ,分布の中心の片側に極端な値をもつ分布が対応する可能性
がある。データのゆがみは
標本平均(1.15)と標本メディアン(1.13)との値の食い違いにも
反映される。プラスにゆがんだデータは右に裾を引いており,幾つかの極端に大きな観測値
の存在の可能性を示唆する。同様に,マイナスにゆがんだデータは左に裾を引いており,幾
10
Z 8101-1
:2015 (ISO 3534-1:2006)
つかの極端に小さな観測値の存在の可能性を示唆する。
注記 3
標本ゆがみは,
標準化標本確率変数(1.19)の
3
次の標本モーメントと考えることができる。
注記 4
ゆがみ(歪み)ひずみ(歪み)をわいど(歪度)ともいう。
注記 5
混乱が生じなければ, 標本
を省略してもよい。
1.21
(標本)とがり (ひょうほん)とがり(
sample coefficient of kurtosis
)
ランダムサンプル(1.6)からの標準化標本確率変数(1.19)の
4
乗の算術平均。
例
1.9
の数値例を用いると,標本とがりの観測値は
2.674 19
となる。この例のようにサンプルサイズ
が
10
程度では標本とがりは非常にばらつきが大きくなるので,用いる場合には注意が必要である。
統計解析パッケージでは標本とがりの計算において様々な調整を用いている(2.40 の
注記 3 を参
照)
。
注記 1 に示した別の公式を用いた場合には,計算結果は
1.497 23
(対応国際規格では
0.436 05
と誤記)となる。これらの二つの値,
2.674 19
及び
1.497 23
(対応国際規格では
0.436 05
と誤記)
は,直接的には比較できない。比較するために,
2.674 19
−
3
(正規分布のとがりの値
3
と比較の
ため)を求めると−
0.325 81
となる。この値は,
1.497 23
とはかなり異なっている。
(対応国際規
格では
1.497 23
を
0.436 05
と誤記したため, この値は
0.436 05
と近似的に比較できる程度とな
る。 と誤記している。
)
注記 1
定義に対応する公式は,次のとおりである。
4
1
1
=
−
n
i
i
S
X
X
n
幾つかの統計解析パッケージでは,
かたより(1.33)を修正するため,及び正規分布のとが
り(その値は 3)からの違いを示すために,次の公式を用いている。
=
−
−
−
−
−
−
−
+
n
i
i
n
n
n
Z
n
n
n
n
n
1
2
4
)
3
)(
2
(
)
1
(
3
)
3
)(
2
)(
1
(
)
1
(
ここに,
S
X
X
Z
i
i
−
=
である。上記の公式の第 2 項は,
n
が大きければ近似的に 3 になる。しばしば,とがりは,
正規分布との比較を強調するために 2.40 で定義された値から 3 を引き去って報告される。実
務家は,統計解析パッケージを用いるのであれば,この調整がなされているかどうかに注意
することが必要である。
注記 2 とがりは,(単峰の)分布の裾の重さに関連する。正規分布(2.50)の場合には,標本とがり
の実現値は,データのばらつきに依存するが,近似的に 3 になる。実務的に,正規分布のと
がりは,ベンチマーク又は規準の値となる。3 より小さなとがりをもつ
分布(2.11)は正規分
布よりも裾が軽く,3 より大きなとがりをもつ分布は正規分布より裾が重い。
注記 3 とがりの観測値が 3 よりもはるかに大きいときには,母集団分布が正規分布よりも本質的に
重い裾をもつ可能性がある。別な母集団の観測値,又は値を誤記した観測値がサンプルに混
入した可能性もある。この議論は,対称な分布を前提にしたものである。
注記 4 標本とがりは,標準化標本確率変数の 4 次の標本モーメントと考えることができる。
11
Z 8101-1
:2015 (ISO 3534-1:2006)
注記 5 とがり(尖り)をせんど(尖度)ともいう。
注記 6 混乱が生じなければ, 標本 を省略してもよい。
1.22
(標本)共分散,不偏共分散 (ひょうほん)きょうぶんさん,ふへんきょうぶんさん(sample covariance)
S
XY
対になっている
ランダムサンプル(1.6)において,それぞれの確率変数(2.10)からそれぞれの標本平
均(1.15)を引いた偏差の積の和を,サンプルサイズ−1 で割った量(サンプルサイズは,対の数)。
例 1 次に示す三つの確率変数
X
,
Y
,
Z
の 10 組の観測値(
x
,
y
,
z
)を用いた数値例を考える。この
例では,
x
及び
y
だけを用いる。
表 1−例 1 のための測定結果
i
1 2 3 4 5 6 7 8 9 10
x
38 41 24 60 41 51 58 50 65 33
y
73 74 43 107 65 73 99 72 100 48
z
34 31 40 28 35 28 32 27 27 31
X
に対する標本平均の観測値は 46.1,
Y
に対する標本平均の観測値は 75.4 である。標本共分
散は,次のようになる。
[(38
−46.1)×(73−75.4)+(41−46.1)×(74−75.4)+…+(33−46.1)×(48−75.4)]/9=257.178
例 2 表 1 について,
y
及び
z
だけを考える。
Z
に対する標本平均の観測値は,31.3 である。標本共分
散は,次のようになる。
[(73
−75.4)×(34−31.3)+(74−75.4)×(31−31.3)+…+(48−75.4)×(31−31.3)]/9=−54.356
[対応国際規格では,上式の第 2 項を,(74−75.4)×(74−31.3) と誤記している。
]
注記 1 統計量(1.8)として考えると,標本共分散は,1.6 の注記 3 で与えた意味で,大きさ
n
のラ
ンダムサンプルからの確率変数の対 [(
X
1
,
Y
1
)
,(
X
2
,
Y
2
)
,…,(
X
n
,
Y
n
)]
の関数である。統計
量の意味での
推定量(1.12)は,ランダムサンプルにおけるサンプリング単位(1.2) [(
x
1
,
y
1
)
,(
x2
,
y
2
)
,…,(
x
n
,
y
n
)]
の対の観測値から計算された標本共分散の数値と区別する必要が
ある。この数値は,経験標本共分散,又は観測された標本共分散と呼ばれる。
注記 2 標本共分散
S
XY
は,次の式で与えられる。
=
−
−
−
n
i
i
i
Y
Y
X
X
n
1
)
)(
(
1
1
注記 3
n
−1 を用いるのは,母集団の
共分散(2.43)の不偏推定量(1.34)となるようにするためで
ある。
注記 4 表 1 の例は三つの変数からなるが,定義では二つの変数の対を用いる。実際には,多変数が
存在する状況にしばしば直面する。
注記 5 混乱が生じなければ, 標本 を省略してもよい。
1.23
(標本)相関係数 (ひょうほん)そうかんけいすう(sample correlation coefficient)
r
xy
12
Z 8101-1
:2015 (ISO 3534-1:2006)
標本共分散(1.22)を対応する標本標準偏差(1.17)の積で割った量。
例 1 1.22 の例 1 の続きを考える。
X
に対する標本標準偏差の観測値は 12.948,
Y
に対する標本標準
偏差の観測値は 21.329 である。したがって,
(
X
と
Y
との)標本相関係数の観測値は,次のよ
うになる。
257.178/(12.948
×21.329)=0.931 2
例 2 1.22 の例 2 の続きを考える。
Y
に対する標本標準偏差の観測値は 21.329,
Z
に対する標本標準
偏差の観測値は 4.165 である。したがって,
(
Y
と
Z
との)標本相関係数の観測値は,次のよう
になる。
−54.356/(21.329×4.165)=−0.612
注記 1 標本相関係数の計算は,次の数式で表される。
=
=
=
−
−
−
−
n
i
i
n
i
i
n
i
i
i
Y
Y
X
X
Y
Y
X
X
1
2
1
2
1
)
(
)
(
)
)(
(
この表現は,標本共分散と標本分散の積の平方根との比と同値である。しばしば,標本相関
係数を表すために
r
xy
の記号が用いられる。標本相関係数の観測値は,実現値 (
x
1
,
y
1
)
,(
x
2
,
y
2
)
,…,(
x
n
,
y
n
)
に基づいて計算される。
注記 2 標本相関係数の観測値は [−1,1] に値をとる。1 に近い場合は,強い正の相関を意味する。
−1 に近い場合,強い負の相関を意味する。標本相関係数は二つの変数の間の直線関係の程
度を示し,値が 1 又は−1 に近いときには直線関係が強いことを,値が 0 に近いときは直線
関係が弱いことを示す。
注記 3 混乱が生じなければ, 標本 を省略してもよい。
1.24
標準誤差 ひょうじゅんごさ(standard error)
θ
σ
ˆ
推定量(1.12)
θˆ の標準偏差(2.37)。
例 標本平均(1.15)は母集団の平均(2.35)の推定量であり,一つの確率変数(2.10)の標準偏差が
σ なら,標本平均の標準誤差は
n
σ
である。ここで,
n
はサンプルサイズである。標準誤差の
推定量は
n
S
であり,
S
は
標本標準偏差(1.17)である。
注記 1 実務上,標準誤差は,推定量の標準偏差の自然な推定値を与える。
注記 2
非標準 誤差という反対語はない。標準誤差は, 推定量の標準偏差 という表現の省略形
と見ることができる。実務的には,普通,標準誤差は,標本平均の標準偏差を暗黙に意味し
ている。標本平均の標準誤差には,記号として
X
σ を用いる。
1.25
区間推定 くかんすいてい(interval estimator)
上側限界を与える
統計量(1.8)と下側限界を与える統計量とで囲まれた区間。
注記 1 端点の一つが+∞,−∞又は母数の自然な限界値の場合もある。例えば,0 は母集団の分散
(2.36)の区間推定に対する自然な下側の限界値である。そのような場合には,通常,片側
区間として表示される。
13
Z 8101-1
:2015 (ISO 3534-1:2006)
注記 2 区間推定は,母数(2.9)の推定(1.36)と結び付けて行われる。区間推定では,サンプリン
グを繰り返すという条件の下で,又はほかの確率的な意味において,名目の比率で母数を含
むと考えられる。
注記 3 よく用いられている三つのタイプの区間推定は,母数に対する信頼区間(1.28),将来の観測
値に対する
予測区間(1.30),及び分布(2.11)の一定比率以上を含む統計的許容区間(1.26)
である。
1.26
統計的許容区間 とうけいてききょようくかん(statistical tolerance interval)
ランダムサンプル(1.6)から決定され,所定の信頼率で,その母集団(1.1)の定められた割合を少な
くとも含むような区間。
注記 ここでいう信頼率は,このような区間を多数回構成したとき,その母集団の一定以上の割合が
含まれる比率である。
1.27
統計的許容限界 とうけいてききょようげんかい(statistical tolerance limit)
統計的許容区間(1.26)の端点を表す統計量(1.8)。
注記 1 統計的許容限界には,次の二つの場合がある。
− 片側統計的許容区間(片方の端点が無限大か,又は確率変数の取り得る自然な境界値に
なっている。
)の場合には,上側又は下側統計的許容限界のいずれかをもつ。
− 両側統計的許容区間の場合には,上側及び下側の両方の統計的許容限界をもつ。
確率変数の取り得る自然な境界値が片側限界の限界となることもある。
注記 2 JIS Z 8101-2 の 3.1.6 specified tolerance(許容差) と混同してはならない。
1.28
(両側)信頼区間 (りょうがわ)しんらいくかん(confidence interval)
母数(2.9)
θ の区間推定(1.25)で,統計量(1.8)
T
0
,
T
1
が
P
[
T
0
<
θ <
T
1
]
≧
1
−
α を満たす区間 (
T
0
,
T
1
)
。
注記 1 区間の信頼率は,同一条件による多数回の繰り返しで得られたランダムサンプル(1.6)から
の信頼区間が,母数の真値を含む場合の比率である。信頼区間は,観測された信頼区間が母
数の真値を含む
確率(2.5)を意味するものではない(真値は,観測された信頼区間に含まれ
るか,含まれないかのいずれかである。
)
。
注記 2 母数
θ の任意の値に対して,不等式
P
[
T
0
<
θ <
T
1
]
≧
1
−
α が成立するとき,この 100(1−
α
) %
を信頼率又は信頼係数と呼ぶ。これは信頼区間の性能を表している。ここで,
α
は一般
に小さな数とし,信頼率は 95 %又は 99 %とすることがよくある。適用する分野によっては,
信頼率として 90 %なども用いられる。
1.29
片側信頼区間 かたがわしんらいくかん(one-sided confidence interval)
片方の端点が,+∞,−∞,又は自然な境界値となっている
信頼区間(1.28)。
注記 1 1.28 の定義で,
T
0
を−∞とするか,又は
T
1
を+∞にした場合である。片側信頼区間は,興味
の中心が厳密に片方に限定されている状況で用いられる。例えば,携帯電話の安全性に関す
る音量の試験では,所定の安全条件の下で発生する音量の上限を示すので,上側信頼限界が
関心事となる場合が多い。一方,構造力学的な試験では,機械が故障する力の下側信頼限界
14
Z 8101-1
:2015 (ISO 3534-1:2006)
が関心事となる場合が多い。
注記 2 片側信頼区間のもう一つの場合は,母数が 0 のような自然な境界をもつ場合に生じる。ポア
ソン分布(2.47)を用いて,顧客からの苦情回数をモデル化する場合には,0 が下側の境界値
となる。他の例としては,電子部品の信頼度の信頼区間は,(0.98,1) となる場合が多い。こ
こで,1 は自然な上側の境界値である。
1.30
予測区間 よそくくかん(prediction interval)
連続値の
母集団(1.1)から追加的にランダムサンプル(1.6)を抽出したときに,少なくとも与えられ
た個数より多くの個数が,所定の信頼率で含まれることが主張可能な変量値の範囲。
注記 予測区間を算出した観測値と同様な状況で,通常,新たに得られる 1 個の値を観測する場合に
関心がある。このほかにも,実際的な状況としては回帰分析の場合がある。ここでは,独立変
数の与えられた領域に対して予測区間を構成する。
1.31
推定値 すいていち(estimate)
推定量(1.12)の観測値(1.4)。
注記 推定値は,観測値から得られた数値を指す。仮想した確率分布(2.11)の母数(2.9)の推定(1.36)
の場合は,推定量は母数の推定のための
統計量(1.8)を指し,推定値は観測値を用いて得られ
た結果を指す。単一の値を計算したことを強調する場合には点推定値と呼び,区間推定の場合
には区間推定値と呼ぶ。
1.32
推定誤差 すいていごさ(error of estimation)
推定値(1.31)から母数(2.9)又は推定しようとした母集団の特性を引いたもの。
注記 1 母集団の特性は,単一若しくは複数の母数の関数,又は確率分布(2.11)に関連する別の量
の場合もある。
注記 2 推定量の誤差の原因となるのは,サンプリング,測定の不確かさ,丸めなどが考えられる。
推定量の誤差は,実質的には,関心事がどの程度分かっているかの性能を実務家に示すもの
である。推定量の誤差の主要な原因を明らかにすることは,品質改善活動の重要な要素であ
る。
1.33
かたより(bias)
推定誤差(1.32)の期待値(2.12)。
注記 1 この定義は,JIS Z 8101-2(3.3.2)並びに TS Z 0032:2012(4.20)と異なっている。ここで
は 1.34 の
注記で示すような一般的な意味で用いられている。対応国際規格では, VIM:1993
(5.25 及び 5.28) と表記しているが,VIM: 1993(5.25)
[及び VIM: 1984(5.28)
]と表記す
るのが正しい。VIM は改訂されて ISO/IEC Guide 99:2007(TS Z 0032:2012 が一致してい
る。
)となり,当該箇条は 4.20 となった。
注記 2 かたよりの存在は,実務的にも不幸な結果を招く可能性がある。例えば,かたよりのために
素材強度の過小な推定がおきれば,機器の予期せぬ故障が生じる可能性がある。標本調査で
は,かたよりは,政策の選択において誤った決定を導く場合があろう。
注記 3
かたより
を
偏り
と表記してもよい。
15
Z 8101-1
:2015 (ISO 3534-1:2006)
1.34
不偏推定量 ふへんすいていりょう(unbiased estimator)
かたより(1.33)が 0 となる推定量(1.12)。
例 1 平均(2.35)
μ
,
標準偏差(2.37)
σ
の
正規分布(2.50)に従う
n
個の独立な
確率変数(2.10)の
ランダムサンプル(1.6)の場合,標本平均(1.15) X 及び標本分散(1.16)
S
2
は,それぞれ平
均
μ
及び
分散(2.36)
σ
2
の不偏推定量となる。
例 2 1.37 の注記 1 で述べているように分散
σ
2
の
さいゆう(最尤)推定量(1.35)は,分母を
n
−1
ではなく,
n
としているので,かたよりのある推定量である。分母に
n
−1 を用いる標本分散の
平方根は,
標本標準偏差(1.17)として,応用上よく用いられているが,これは母標準偏差(2.37)
のかたよりのある推定量となることに注意が必要である。
例 3 対をなす
n
個の独立な確率変数が,
(母)共分散(2.43)
ρ
σ
X
σ
Y
(対応国際規格は,
ρ
σ
XY
と誤記)
の同一な 2
変量正規分布(2.65)からのランダムサンプルである場合には,その標本共分散(1.22)
は,母共分散の不偏推定量となる。そのさいゆう(最尤)推定量は,分母を
n
−1 ではなく,
n
としているので,かたよりがある。
注記 推定量にかたよりがないことは,平均的には推定量が正しい値を与えているという意味で望ま
しいことである。不偏推定量が,母集団の母数の
最適な
推定量を探索する際の,有用な初
期値を与えることは確かである。ここで示した定義は,統計理論的な性質に関するものである。
日常的には,実務家は,日々の応用において研究にかたよりが生じないように努めている。
例えば,ランダムサンプルが,確実に関心のある母集団を代表するものとするといったことで
ある。
1.35
さいゆう(最尤)推定量 さいゆうすいていりょう(maximum likelihood estimator)
ゆうど(尤度)関数(1.38)が,最大,又は上限とみなし得る母数(2.9)の値を推定量(1.12)とした
もの。
注記 1 さいゆう(最尤)推定は,分布(2.11)が[例えば,正規分布(2.50),ガンマ分布(2.56),
ワイブル分布(2.63)などと]特定されている場合に,その母数の推定値を得る方法として
定評がある。さいゆう(最尤)推定量は,
(例えば,単調変換で不変となるといった)統計的
に望ましい性質を持っており,多くの状況で選択すべき推定方法を与える。さいゆう(最尤)
推定量に
かたより(1.33)があるときには,単純な補正を行うことがある。1.34 の例 2 で述
べたように,正規分布の
分散(2.36)のさいゆう(最尤)推定量にはかたよりがあるが,そ
のかたよりは,分母を
n
ではなく,
n
−1 にすることで補正できる。そのような場合に生じる
かたよりの大きさは,標本の大きさを大きくすれば,減少する。
注記 2 略語 MLE が,状況に応じて,さいゆう(最尤)推定量及びさいゆう(最尤)推定のいずれ
にも用いられる。
1.36
推定 すいてい(estimation)
母集団(1.1)から抽出したランダムサンプル(1.6)に基づいて,その母集団を統計的に描写する手続
き。
注記 1 推定には,ある推定量(1.12)から具体的な推定値(1.31)を得る手続きがある。
注記 2 推定は,点推定,区間推定,又は母集団の性質の推定を含むかなり広い状況で用いられると
16
Z 8101-1
:2015 (ISO 3534-1:2006)
理解されている。
注記 3 多くの場合,統計的な描写とは,想定したモデルの単一又は複数のパラメータ(2.9)の推定
又は母数の関数の推定を指す。より一般的な,母集団の描写は,それに特化したものとは限
らず,例えば,自然災害の被害に関連する統計を指す(死傷者数,被害損失,及び農作物の
被害の全ては,防災対策上で推定したいものであろう。
)
。
注記 4 想定したモデルがデータの描写としては不適切であることが,記述統計(1.5)を考察するこ
とで示唆される場合もある。例えば,当該モデルのデータへの適合度指標が,それを示唆す
ることもあろう。そのような場合には,他のモデルを考えて,推定プロセスを続ける。
1.37
さいゆう(最尤)推定 さいゆうすいてい(maximum likelihood estimation)
さいゆう(最尤)推定量(1.35)に基づく,推定(1.36)。
注記 1 正規分布(2.50)の場合,標本平均(1.15)は母数(2.9)
μ
の
さいゆう(最尤)推定量(1.35)
であるが,
標本分散(1.16)の分母を
n
−1 ではなくて,
n
にしたものが母数
σ
2
のさいゆう(最
尤)推定量である。通常は,
σ
2
の
不偏推定量(1.34)になるので,分母に
n
−1 を用いること
が多い。
注記 2 さいゆう(最尤)推定は,ゆうど(尤度)関数からの推定量(1.12)の導出そのものを指す
ことがある。
注記 3 さいゆう(最尤)推定を行う場合には,推定量の明示的な数式表現ができる場合もあるが,
そうでない場合には,さいゆう(最尤)推定値を求めるのに連立方程式の解を得る反復計算
が必要となる状況もある。
注記 4 略語 MLE が,状況に応じて,さいゆう(最尤)推定量及びさいゆう(最尤)推定のいずれ
にも用いられる。
1.38
ゆうど(尤度)関数 ゆうどかんすう(likelihood function)
確率密度関数(2.26)又は確率質量関数(2.24)を観測値(1.4)で評価し,分布族(2.8)の母数(2.9)
の関数とみなしたもの。
例 1 非常に大きな母集団(1.1)から 10 個のアイテムがランダムに選択された状況を考えてみよう。
この中で 3 個のアイテムが特定の性質をもっていたことが分かった。この標本から当該特性を
もっている母比率は,0.3(3/10)という直感的な
推定値(1.31)が得られる。2 項分布(2.46)
に基づくモデルを用いると,ゆうど(尤度)関数(
n
を 10,
x
を 3 に固定し,確率質量関数を
p
の関数とみなしたもの)は,
p
=0.3 で最大となり,直感と一致する。
[さらに,このことは,この 2
項分布(2.46)の確率質量関数 120
p
3
(1
−
p
)
7
を
p
を横軸にし
てプロットすると検証できる。
]
例 2 標準偏差(2.37)既知の正規分布(2.50)では,ゆうど(尤度)関数が最大となる
μ
が標本平均
と一致することを一般的に示すことができる。
注記 1 対応国際規格で 確率質量関数 が抜けているのは誤りである。
注記 2 例 2 では標準偏差が既知としているが,標準偏差が未知の正規分布でも,ゆうど(尤度)関
数が最大となる
μ
が標本平均と一致する。
1.39
プロファイルゆうど(尤度)関数 ぷろふぁいるゆうどかんすう(profile likelihood function)
17
Z 8101-1
:2015 (ISO 3534-1:2006)
ゆうど(尤度)関数(1.38)を単一の母数(2.9)の関数として表現するために,当該母数以外の全ての
母数をゆうど(尤度)関数が最大となるように定めたときのゆうど(尤度)関数。
注記 母数を
θ
1
,
θ
2
,…,
θ
p
とし,ゆうど(尤度)関数を
l
(
θ
1
,
θ
2
,…,
θ
p
)
とした場合,単一の母数
を
θ
1
としたときのプロファイルゆうど(尤度)関数
l
1
(
θ
1
)
は,次のように表される。
)
,
,
,
(
max
)
(
2
1
,
,
1
1
2
p
l
l
p
θ
θ
θ
θ
θ
θ
=
1.40
仮説 かせつ(
hypothesis
)
H
母集団(1.1)についての主張。
注記
母集団に関する主張には,通常,ある
分布族(2.8)の単一又は複数の母数(2.9)に関するもの,
又は分布族自体に関するものがある。
1.41
帰無仮説 きむかせつ(
null hypothesis
)
H
0
統計的検定(1.48)によって検定される仮説(1.40)
例 1
平均(2.35)及び標準偏差(2.37)ともに未知の同一正規分布(2.50)に従う独立な確率変数(2.10)
からの
ランダムサンプル(1.6)で,平均
μ
に関する帰無仮説を,平均が
μ
0
以下となるという
ものとする場合があり,このことは,通常,
H
0
:
μ
≦
μ
0
と書く。
(対応国際規格で用いられて
いる不等号付きの帰無仮説
H
0
:
μ
≦
μ
0
については,様々な議論がある。
)
例 2
母集団(1.1)に関する統計モデルが,正規分布であるという帰無仮説もあり得る。このタイプ
の帰無仮説では,平均と標準偏差は特定しない。
例 3
母集団に関する統計モデルが,対称分布であるという帰無仮説もあり得る。このタイプの帰無
仮説では,分布形を特定しない。
注記 1
帰無仮説は,実現可能な確率分布の集合の部分集合を明確に示したものである。
注記 2
この定義は,
対立仮説(1.42)及び統計的検定(1.48)と一緒に考えた方がよい。なぜならば,
仮説検定を適切に応用しようとすれば,これら全ての要素が必要となるからである。
注記 3
実際には,帰無仮説を実証することは決してできない。むしろ,与えられた状況が,帰無仮
説を棄却するには,評価が不十分と考えられる場合があるだけである。元来,仮説検定を行
うのは,取り扱おうとしている問題に関する対立仮説を,仮説検定結果が支持することを期
待しているからである。
注記 4
帰無仮説を棄却できないということは,帰無仮説の妥当性を
証明
したことではなく,む
しろ,帰無仮説を否定する十分な証拠がなかったと考えることができる。この場合は,帰無
仮説が実際に正しい(若しくは帰無仮説に極めて近い)
,又は帰無仮説からの逸脱を検出する
にはサンプルサイズが不十分である,のいずれかである。
注記 5
本来の関心が帰無仮説に集中している場合もある。その場合でも,帰無仮説からの逸脱の可
能性は,関心事となろう。帰無仮説に対する評価を適切なものとするためには,サンプルサ
イズ,及び所定の逸脱又は対立仮説の検出力に正当な配慮を行う必要がある。
注記 6
帰無仮説を棄却できない場合とは異なり,対立仮説を採択することは,関心のある予想が支
持されたという意味で,明確な結果である。 帰無仮説を棄却し,対立仮説を支持する とい
18
Z 8101-1
:2015 (ISO 3534-1:2006)
う結論は, 今回は,帰無仮説が棄却できなかった といった結論よりは,曖昧さが少ない結
論である。
注記 7
帰無仮説は,帰無仮説の評価に対応する
検定統計量(1.52)を構成するときの基礎となる。
注記 8
帰無仮説は,
H
0
で示されることが多い(
H
の添え字は,英語ではオー又はノート
nought
と発音されることもあるが,ゼロを用いる。
)
。
注記 9
帰無仮説で指定される部分集合は,可能ならば,主張が検討したい予想と排反するように選
択するのがよい。1.48 の
注記 2,及び 1.49 の例を参照されたい。
(この部分集合の設定に関し
て様々な議論がある。
)
1.42
対立仮説 たいりつかせつ(
alternative hypothesis
)
H
A
,
H
1
帰無仮説(1.41)が成り立たないときに,許容される確率分布(2.11)の全ての集合又は部分集合の選択
に関する主張。
例 1
1.41
の
例 1 の帰無仮説に対する対立仮説は,平均(2.35)が指定された値より大きくなること
であり,このことは,
H
A
:
μ
>
μ
0
と書く。
例 2
1.41
の
例 2 の帰無仮説に対する対立仮説は,母集団に関する統計モデルが,正規分布ではない
というものである。
例 3
1.41
の
例 3 の帰無仮説に対する対立仮説は,母集団に関する統計モデルが,非対称分布である
というものである。このタイプの対立仮説では,非対称な分布形を特定しない。
注記 1
対立仮説は,帰無仮説の補集合である。定義に基づくと補集合の部分集合であってもよい。
注記 2
対立仮説は,
H
1
又は
H
A
で示すことができ,この両者のどちらかが好まれるということはな
い。
注記 3
対立仮説は,帰無仮説と相反する主張である。対応する
検定統計量(1.52)を,帰無仮説か
対立仮説かを決定するのに用いる。
注記 4
対立仮説は,帰無仮説及び
統計的検定(1.48)と一緒に考えた方がよい。
注記 5
対立仮説を採択することは,関心のある予想が支持されたという意味で,帰無仮説が棄却で
きなかったことに比べて,明確な結果である。
1.43
単純仮説 たんじゅんかせつ(
simple hypothesis
)
分布族(2.8)の単一の分布を特定している仮説(1.40)。
注記 1
単一の
確率分布(2.11)だけから構成される単純仮説には,帰無仮説(1.41)の場合もあれば,
対立仮説(1.42)の場合もある。
注記 2
平均(2.35)未知,標準偏差(2.37)既知の同一の正規分布(2.50)に従う独立な確率変数(2.10)
からの
ランダムサンプル(1.6)の場合,
μ
に関する単純仮説は,その平均が,所与の値
μ
0
に
等しいことである。これは,一般に,
H
0
: μ
=
μ
0
と書く。
注記 3
単純仮説は
確率分布(2.11)を完全に特定する。
1.44
複合仮説 ふくごうかせつ(
composite hypothesis
)
分布族(2.8)の複数の分布(2.11)を特定している仮説(1.40)。
例 1
1.41
と 1.42 の例で与えられた
帰無仮説(1.41)及び対立仮説(1.42)は,全て複合仮説の例で
19
Z 8101-1
:2015 (ISO 3534-1:2006)
ある。
例 2
1.48
の
例 3 のケース
3
は,単純仮説である。
例 4 の帰無仮説も単純仮説である。1.48 のその他
の仮説は,複合仮説である。
注記
複数の
確率分布(2.11)から構成される複合仮説には,帰無仮説(1.41)の場合もあれば,対立
仮説(1.42)の場合もある。
1.45
有意水準 ゆういすいじゅん(
significance level
)
α
<統計的検定>
帰無仮説(1.41)が真のときに,それを棄却する確率(2.5)の上限値。
注記 1
帰無仮説が
単純仮説(1.43)の場合には,帰無仮説が真のときにそれを棄却する確率は一つ
の値にしかならない。
注記 2
< >の記号は,一つの用語が複数の概念を表す場合に,それぞれの概念に関係する主題又
は分野を表示して対象を限定し,区別するために用いる。
1.46
第 1 種の誤り,第 1 種の過誤 だいいっしゅのあやまり,だいいっしゅのかご(
Type I error
)
帰無仮説(1.41)が真のときに,それを棄却すること。
注記 1
実際,第
1
種の誤りは,正しくない決定である。したがって,このような正しくない決定を
行う
確率(2.5)は,可能な限り小さなものにとどめることが望ましい。第
1
種の過誤の確率
を
0
にしようとすれば,帰無仮説を棄却することは絶対できない。すなわち,証拠のいかん
にかかわらず,帰無仮説を棄却しないという常に同じ決定がなされる。
注記 2
結果の離散性から,事前に設定した有意水準の公称値,例えば,
0.05
が達成できない状況が
ある(例えば,
2
項分布の母数
p
の検定の場合)
。
注記 3
あわてものの誤り
ということがある。
1.47
第 2 種の誤り,第 2 種の過誤 だいにしゅのあやまり,だいにしゅのかご(
Type II error
)
帰無仮説が真でないときに,
帰無仮説(1.41)を棄却できないこと。
注記 1
実際,第
2
種の誤りは,正しくない決定である。したがって,このような正しくない決定を
行う
確率(2.5)は,可能な限り小さなものにとどめることが望ましい。サンプルサイズが十
分でないために帰無仮説からの逸脱を示すことができず,第
2
種の誤りが生じることが多い。
注記 2
ぼんやりものの誤り
ということがある。
1.48
(統計的)検定,統計的仮説検定,有意性検定 (とうけいてき)けんてい,とうけいてきかせつけんて
い,ゆういせいけんてい(
statistical test
,
significance test
)
帰無仮説(1.41)を棄却して対立仮説(1.42)を支持できるかどうかを決定する手続き。
例 1
例として,実際に,
連続確率変数(2.29)が,−∞から+∞の値をとり得るものとし,更に真
の確率分布が
正規分布(2.50)ではないという疑いがあれば,仮説は,次のように策定される。
−
考慮すべき全対象は,−∞から+∞の値をとり得るすべての
連続確率分布(2.23)である。
−
真の確率分布は,正規分布ではないことが予想されている。
−
帰無仮説は,真の確率分布が正規分布となることである。
−
対立仮説は,真の確率分布が正規分布ではないということである。
20
Z 8101-1
:2015 (ISO 3534-1:2006)
例 2
確率変数が
標準偏差(2.37)既知の正規分布に従う場合で,母平均
μ
が所与の
μ
0
から逸脱して
いることが疑われるならば,仮説は,次の例のケース
3
に従って策定される。
例 3
この例では,統計的検定で可能な三つのケースについて考察する。
ケース
1
工程平均が平均の目標値
μ
0
より高いと予想されている。この予想は,次のような仮
説を導く。
帰無仮説:
H
0
:
μ
≦
μ
0
対立仮説:
H
1
:
μ
>
μ
0
帰無仮説を不等号なしで
H
0
:
μ
=
μ
0
と表すことも多い。
ケース
2
工程平均が平均の目標値
μ
0
より低いと予想されている。この予想は,次のような仮
説を導く。
帰無仮説:
H
0
:
μ
≧
μ
0
対立仮説:
H
1
:
μ
<
μ
0
帰無仮説を不等号なしで
H
0
:
μ
=
μ
0
と表すことも多い。
ケース
3
工程平均が平均の目標値(対応国際規格は, 平均の目標値 を工程平均と誤記)と
異なると予想されているが,いずれの方向にずれているかは特定されていない。この予想は,
次のような仮説を導く。
帰無仮説:
H
0
:
μ
=
μ
0
対立仮説:
H
1
:
μ
≠
μ
0
これら三つの場合は,全て対立仮説が基準となる状態からのどの方向に逸脱しているかとい
う予想に基づき,仮説が策定されている。
例 4
この例では,ロット
1
,ロット
2
の各不良率
p
1
,
p
2
(
0
≦
p
1
≦
1
,
0
≦
p
2
≦
1
)を考察の対象
とする。二つのロットは異なるので,ロットの不良率も異なると予想されている。この予想は,
次のような仮説を導く。
帰無仮説:
H
0
:
p
1
=
p
2
対立仮説:
H
1
:
p
1
≠
p
2
注記 1
統計的検定は,サンプルからの観測値を用いて,真の確率分布が帰無仮説と対立仮説のいず
れに属するかを決めるための手続きであり,ある前提条件のもとで妥当となる。
注記 2
統計的検定を行う前に,最初に利用できる情報に基づき確率分布の可能な集合を決める。次
に,検討すべき予想に整合する確率分布を特定し,対立仮説を構成する。最後に,帰無仮説
を対立仮説と相反するものとして定式化する。可能な確率分布の集合,すなわち,帰無仮説
や対立仮説は,多くの場合,関連する母数の値の集合を用いて定められる。
注記 3
決定は,サンプルからの観測値に基づいて行われる。したがって,帰無仮説が正しいときに
それを棄却する
第 1 種の誤り(1.46)と,対立仮説が正しいにもかかわらず,帰無仮説を棄
却することができない
第 2 種の誤り(1.47)といった誤りが生じることがある。
注記 4
例 3 のケース
1
及びケース
2
が,片側検定の例である。ケース
3
が両側検定の例である。片
側か両側かは,対立仮説に対応する母数
μ
の領域を考えることで定まる。より一般的には,
片側検定及び両側検定は,選択した検定統計量の棄却域で決められる。すなわち,検定統計
量には,対立仮説を支持する棄却域が付随する。しかし,棄却域がいつでも,ケース
1
,ケ
ース
2
,及びケース
3
のような母数空間の単純な記述に直接関連するとは限らない。
注記 5
統計的検定の背後にある前提への注意は不可欠であり,これを怠れば統計的検定の結果は妥
21
Z 8101-1
:2015 (ISO 3534-1:2006)
当性を欠くものになることがある。前提が誤って想定されていても推論の結果が安定してい
るような統計的検定はロバストであると呼ばれる。平均に関する一標本
t
検定は,正規分布
でない分布に対しても非常にロバストとなる例である。分散均一性に関するバートレットの
検定は,あまりロバストでない方法の例であり,分散が実際には均一な分布の場合でも,等
分散性の仮説を過度に棄却する傾向がある。
1.49
p 値,有意確率 ぴーち,ゆういかくりつ(
p-value
)
検定統計量(1.52)の観測値に対して,その値を含み,その値よりも帰無仮説(1.41)を支持すること
にならない検定統計量が得られる
確率(2.5)。この確率を計算するためには帰無仮説が成立しているとい
う前提条件が必要である。
例
1.9
で紹介した数値例を考察する。例として,これらの値は,母平均が公称
12.5
であると期待さ
れている工程からの観測値であると仮定しよう。さらに,この工程の技術者は,これまでの経験
から工程平均がこの公称値より一貫して低い値であったと感じているとしよう。検討が行われ,
大きさ
10
のランダムサンプルが採取され,1.9 に示したような観測結果が得られたとする。適切
な仮説は,
帰無仮説:
H
0
:
μ
≧
12.5
対立仮説:
H
1
:
μ
<
12.5
である。標本平均が
9.7
ということは,予想どおりの方向であるが,この予想を支持するのに足
るほど十分に
12.5
からずれているのであろうか?この例では,
検定統計量(1.52)は−
2.112 6
(対
応国際規格は,−
1.976 4
と誤記)であり,対応する
p
値は
0.031 9
(対応国際規格は,
0.040
と誤
記)である。これは,検定統計量の値が−
2.112 6
(対応国際規格は,−
1.976 4
と誤記)以下と観
測される確率は,真の工程平均が実際に
12.5
の場合には,
100
回中
4
回よりも少ないことを意味
する。この場合,事前に有意水準を
0.05
に設定していたなら,帰無仮説を棄却し,対立仮説を支
持することになる。
この問題に,別の定式化がなされていたと仮定しよう。工程は目標値である
12.5
から外れてい
るが,その方向は特定できないと考えてみよう。この状況は,次の仮説を導く。
帰無仮説:
H
0
:
μ
=
12.5
対立仮説:
H
1
:
μ
≠
12.5
ランダムサンプルとして同一のデータが与えられたとすれば,検定統計量も−
2.112 6
(対応国
際規格は,−
1.976 4
と誤記)と等しい値になる。この対立仮説に対して,関心のある質問は, こ
のような極端な検定統計量の値又はそれ以上に極端な値が観測される確率はどのくらいか?
と
いうものになる。この場合,関連する二つの領域があり,検定統計量の値が−
2.112 6
(対応国際
規格は,−
1.976 4
と誤記)以下の領域と,
2.112 6
(対応国際規格は,
1.976 4
と誤記)以上の領域
である。
t
検定統計量がこれらの領域に属する確率は
0.063 8
(対応国際規格は,
0.080
と誤記)で
ある(片側の
p
値の倍である)
。検定統計量の値が,これよりも極端な値として観測されるのは
100
回中
7
回よりも少ない(対応国際規格は,
100
回に
8
回であると誤記)
。したがって,帰無仮
説は有意水準
0.05
では棄却されない。
注記 1
例えば,もし
p
値が
0.029
となれば,検定統計量がこれより極端な値をとる可能性は,帰無
仮説の下で,
100
回に
3
回よりも小さいこととなる。これは,かなり小さな
p
値なので,こ
の情報を基に,帰無仮説を棄却したいと思うであろう。より形式的には,有意水準を
0.05
と
22
Z 8101-1
:2015 (ISO 3534-1:2006)
設定されていた場合には,
0.05
より小さい
p
値
0.029
ならば,確かに帰無仮説は棄却される。
注記 2
p
値は,有意確率と呼ばれることがある。これを応用上,固定値として設定される
有意水準
(1.45)と混同するのは望ましくない。
1.50
(検定の)検出力 (けんていの)けんしゅつりょく(
power of a test
)
1
から
第 2 種の誤り(1.47)の確率(2.5)を引いたもの。
注記 1
確率分布族(2.8)の未知母数(2.9)の特定の値に対する検出力は,当該母数値において計算
される
帰無仮説(1.41)の棄却確率に等しい。
注記 2
実際に検定を行う多くの場合では,サンプルサイズが大きくなることによって検出力も増大
する。いい換えれば,
対立仮説(1.42)が正しい場合,帰無仮説を棄却する確率が,サンプ
ルサイズが大きくなるにつれて大きくなる。したがって,第
2
種の誤りの確率は,減少する。
注記 3
検定を行う状況では,サンプルサイズが極端に大きくなれば,帰無仮説からの小さな逸脱も
検出し,帰無仮説を棄却できることが望ましい。いい換えれば,サンプルサイズが無限に大
きくなる場合,検出力は
1
に近づくことが望ましい。このような検定は,一致性をもつと呼
ばれる。二つの検定を検出力に関して比較する場合,同じ帰無仮説及び対立仮説に対して,
有意水準も同じならば,検出力の高い検定の方が有効であるとみなす。一致性及び有効性に
ついては,より正式な数学的な記述もあるが,それらは,この規格の適用範囲を超えている
(様々な統計学辞典又は数理統計学の教科書を参照されたい。
)
。
1.51
検出力曲線 けんしゅつりょくきょくせん(
power curve
)
検出力(1.50)を分布族(2.8)の母数(2.9)の関数として表した値の集合。
注記
関連する用語
OC
曲線 (JIS Z 8101-2 の 4.5.1)参照。
1.52
検定統計量 けんていとうけいりょう(
test statistic
)
検定(1.48)に関連して用いる統計量(1.8)。
注記
検定統計量は,考察の対象とする
確率分布(2.11)が帰無仮説(1.41)又は対立仮説(1.42)に
整合的であるか否かを評価するのに用いる。
1.53
グラフを用いた記述統計 ぐらふをもちいたきじゅつとうけい(
graphical descriptive statistics
)
図的な表現による
記述統計(1.5)。
注記
一般に多くの数値を管理可能な少数のものに要約する,又は視覚化に適した方法にそれらの数
値を表現することが記述統計のねらいである。グラフを用いた要約の例には,ボックスプロッ
ト,確率プロット,
Q-Q
プロット,正規確率プロット,散布図,多変量散布図,及び
ヒストグ
ラム(1.61)がある。
1.54
数値を用いた記述統計 すうちをもちいたきじゅつとうけい(
numerical descriptive statistics
)
数値で表現された
記述統計(1.5)。
注記
数値を用いた記述統計には,
平均(1.15),範囲(1.10),標準偏差(1.17),四分位範囲などが
ある。
23
Z 8101-1
:2015 (ISO 3534-1:2006)
1.55
級,クラス きゅう,くらす(
classes
)
注記
全ての級を集めたものは網羅的かつ互いに排反であると想定する。数直線は,−∞と+∞との
間の全ての実数を意味する。
1.55.1
級,クラス きゅう,くらす(
class
)
<質的特性>
サンプル(1.3)におけるアイテムの部分集合。
注記
< >の記号は,一つの用語が複数の概念を表す場合に,それぞれの概念に関係する主題又は
分野を表示して対象を限定し,区別するために用いる。
1.55.2
級,クラス きゅう,くらす(
class
)
<順序特性>順序尺度上のカテゴリーの一つ又は近接する複数のカテゴリーをまとめたもの。
1.55.3
級,クラス きゅう,くらす(
class
)
<量的特性>数直線上の区間。
1.56
級の限界,級の境界,クラスの限界,クラスの境界 きゅうのげんかい,きゅうのきょうかい,くらすの
げんかい,くらすのきょうかい(
class limits
,
class boundaries
)
<量的特性>
級(1.55)の上限及び下限を定義する値。
注記
この定義は,量的特性の級の限界を示したものである。
1.57
級の中点,級の中心,クラスの中点,クラスの中心 きゅうのちゅうてん,きゅうのちゅうしん,くらす
のちゅうてん,くらすのちゅうしん(
mid-point of class
)
<量的特性>
級の限界(1.56)における上限と下限との平均(1.15)。
注記
級の中点は,ヒストグラムの関連でクラスマークとしても知られる。
1.58
級の幅,クラスの幅 きゅうのはば,くらすのはば(
class width
)
<量的特性>
級(1.55)の上限から下限を引いた値。
1.59
度数,頻度 どすう,ひんど(
frequency
)
特定の
級(1.55)で,物事が生じる回数,又は観測値(1.4)が含まれる個数。
1.60
度数分布,頻度分布 どすうぶんぷ,ひんどぶんぷ(
frequency distribution
)
級(1.55)と物事が生じた回数との関係性,又は級と観測値(1.4)の個数との関係性。
1.61
ヒストグラム ひすとぐらむ(
histogram
)
底辺の長さが
級の幅(1.58)に等しく,その面積が級の度数に比例する近接する長方形からなる度数分
布(1.60)のグラフ表現。
注記 1
級の幅が不均一な場合には,注意が必要である。級の幅が不均一な場合には,級の面積を級
の度数に比例させるとよい。
24
Z 8101-1
:2015 (ISO 3534-1:2006)
注記 2
全ての級の幅を等しくし,長方形の高さを級の度数に比例させるのが一般的である。
1.62
棒グラフ ぼうぐらふ(
bar chart
)
一定の幅で,高さが
度数(1.59)に比例する長方形からなる,名義尺度の度数分布(1.60)のグラフ表現。
注記 1
長方形は見かけの美観を求めて三次元画像として描かれることがあるが,これは何ら追加情
報をもたらさないので勧められない。棒グラフの場合,長方形は近接させる必要はない。
注記 2
ヒストグラムと棒グラフとの違いは,利用可能なソフトウェアがここで与えた定義に従うと
は限らないため,次第に曖昧になりつつある。
1.63
累積度数,累積頻度 るいせきどすう,るいせきひんど(
cumulative frequency
)
指定された級の上限までの総
度数(1.59)。
注記 1
この定義は,
級の限界(1.56)に対応する値に対してだけ適用可能である。
注記 2
累積度数を
経験分布関数
と呼ぶことがある。
1.64
相対度数,相対頻度 そうたいどすう,そうたいひんど(
relative frequency
)
度数(1.59)を物事が生じた総数又は観測値(1.4)の総数で割ったもの。
1.65
累積相対度数,累積相対頻度 るいせきそうたいどすう,るいせきそうたいひんど(
cumulative relative
frequency
)
累積度数(1.63)を物事が生じた総数又は観測値(1.4)の総数で割ったもの。
2
確率で用いられる用語
2.1
標本空間 ひょうほんくうかん(
sample space
)
Ω
起こり得る全ての結果の集合。
例 1
消費者が購入したバッテリーが故障するまでの時間を考える。もし,初めて使用するときに故
障しているのであれば故障するまでの時間は
0
である。もし,バッテリーがしばらくの間機能
するならば,故障するまでの時間は何時間かになる。したがって,標本空間は{初めてバッテ
リーを使おうとしたとき,すでに故障している}と{
x
時間後(
x > 0
)にバッテリーが故障す
る}という結果からなる。この例は,この章を通じて用いられる。特に,2.68 で徹底した議論
がなされている。
例 2
一つの箱に
1
,
2
,
3
,
4
,
5
,
6
,
7
,
8
,
9
,
10
のラベルが付けられた
10
個の抵抗が入っている。
もし,この抵抗の集まりから二つの抵抗がランダムに非復元抽出されたとすると,標本空間は
次の
45
通りの結果からなる:
(1
,
2)
,
(1
,
3)
,
(1
,
4)
,
(1
,
5)
,
(1
,
6)
,
(1
,
7)
,
(1
,
8)
,
(1
,
9)
,
(1
,
10)
,
(2
,
3)
,
(2
,
4)
,
(2
,
5)
,
(2
,
6)
,
(2
,
7)
,
(2
,
8)
,
(2
,
9)
,
(2
,
10)
,
(3
,
4)
,
(3
,
5)
,
(3
,
6)
,
(3
,
7)
,
(3
,
8)
,
(3
,
9)
,
(3
,
10)
,
(4
,
5)
,
(4
,
6)
,
(4
,
7)
,
(4
,
8)
,
(4
,
9)
,
(4
,
10)
,
(5
,
6)
,
(5
,
7)
,
(5
,
8)
,
(5
,
9)
,
(5
,
10)
,
(6
,
7)
,
(6
,
8)
,
(6
,
9)
,
(6
,
10)
,
(7
,
8)
,
(7
,
9)
,
(7
,
10)
,
(8
,
9)
,
(8
,
10)
,
(9
,
10)
。ここで,事象
(1
,
2)
は
(2
,
1)
と同じとみなし,抵抗が選ばれる順
序は問題としていない。もし,順序を問題とするならば,標本空間は合計
90
通りの結果からな
25
Z 8101-1
:2015 (ISO 3534-1:2006)
る。
例 3
先の例で復元抽出を行ったとすると,
10
個の事象
(1
,
1)
,
(2
,
2)
,
(3
,
3)
,
(4
,
4)
,
(5
,
5)
,
(6
,
6)
,
(7
,
7)
,
(8
,
8)
,
(9
,
9)
及び
(10
,
10)
を追加しなければならない。順序を問題としない場
合は,標本空間は
55
通りの結果からなる。順序を問題とする場合では,標本空間は
100
通りの
結果からなる。
注記 1
結果は,現実の実験から生じることも,完全に仮想的な実験から生じることもあり得る。そ
の集合は,リストに示されたものであったり,正の整数
{1
,
2
,
3
,…
}
のような可算集合で
あったり,又は数直線であったりする。
注記 2
標本空間は,
確率空間(2.68)の三つ組の第
1
要素である。
2.2
事象 じしょう(
event
)
A
標本空間(2.1)の部分集合。
例 1
2.1
の
例 1 において,
{0}
,
(0
,
2)
,
{5.7}
,
[7
,+∞
)
は事象の例であり,初めから故障している
バッテリー,初めのうちは働くが
2
時間未満に故障するバッテリー,ちょうど
5.7
時間で故障
するバッテリー,及び
7
時間未満では故障していないバッテリーに対応している。
{0}
及び
{5.7}
は,それぞれただ一つの値を含む集合である。
(0
,
2)
は,数直線上の一つの開区間であ
る。
[7
,+∞
)
は,数直線上の左側が閉じた無限区間である。
例 2
2.1
の
例 2 に引き続き,順序を考慮しない非復元抽出だけ考える。一つの起こり得る事象は,{抵
抗
1
又は
2
の少なくとも一個が標本に含まれている}で定まる事象
A
である。この事象は,
17
個の結果
(1
,
2)
,
(1
,
3)
,
(1
,
4)
,
(1
,
5)
,
(1
,
6)
,
(1
,
7)
,
(1
,
8)
,
(1
,
9)
,
(1
,
10)
,
(2
,
3)
,
(2
,
4)
,
(2
,
5)
,
(2
,
6)
,
(2
,
7)
,
(2
,
8)
,
(2
,
9)
及び
(2
,
10)
からなる。別の事象
B
として,
{抵抗
8
,
9
,
10
のどれも標本に含まれない}を考える。この事象は,
21
個の結果
(1
,
2)
,
(1
,
3)
,
(1
,
4)
,
(1
,
5)
,
(1
,
6)
,
(1
,
7)
,
(2
,
3)
,
(2
,
4)
,
(2
,
5)
,
(2
,
6)
,
(2
,
7)
,
(3
,
4)
,
(3
,
5)
,
(3
,
6)
,
(3
,
7)
,
(4
,
5)
,
(4
,
6)
,
(4
,
7)
,
(5
,
6)
,
(5
,
7)
,及び
(6
,
7)
からなる。
例 3
例 2 の続きで,事象
A
と
B
との共通部分(すなわち,抵抗
1
及び
2
の少なくとも一つが標本に
含まれ,かつ,抵抗
8
,
9
,及び
10
のどれも含まれない事象)は,次の
11
の結果からなる。
(1
,
2)
,
(1
,
3)
,
(1
,
4)
,
(1
,
5)
,
(1
,
6)
,
(1
,
7)
,
(2
,
3)
,
(2
,
4)
,
(2
,
5)
,
(2
,
6)
,
(2
,
7)
。
事象
A
と
B
との和は,次の
27
の結果,
(1
,
2)
,
(1
,
3)
,
(1
,
4)
,
(1
,
5)
,
(1
,
6)
,
(1
,
7)
,
(1
,
8)
,
(1
,
9)
,
(1
,
10)
,
(2
,
3)
,
(2
,
4)
,
(2
,
5)
,
(2
,
6)
,
(2
,
7)
,
(2
,
8)
,
(2
,
9)
,
(2
,
10)
,
(3
,
4)
,
(3
,
5)
,
(3
,
6)
,
(3
,
7)
,
(4
,
5)
,
(4
,
6)
,
(4
,
7)
,
(5
,
6)
,
(5
,
7)
,
(6
,
7)
からなる。
事象
A
と
B
との和(すなわち,抵抗
1
及び
2
の少なくとも一つが標本に含まれるか,又は抵
抗
8
,
9
及び
10
のどれも含まれない事象)に含まれる結果の数は
27
であり,それは
17
+
21
−
11
である。つまり,事象
A
に含まれる結果の数と事象
B
に含まれる結果の数との和から共通部
分に含まれる結果の数を引いたものが,事象
A
と
B
との和に含まれる結果の数である。
注記
事象及び実験の結果が与えられたとき,その結果がその事象に属するとき,その事象は起こっ
たといわれる。実際の事象は,事象の σ
加法族(2.69)に属することとなる。このシグマ加法
族は,
確率空間(2.68)の三つ組の第
2
要素である。ポーカー,ルーレットなどといった賭け
において事象は,自然に生じる。そこでは,一つの事象に属する結果の数を決定することで賭
けのオッズが決まる。
26
Z 8101-1
:2015 (ISO 3534-1:2006)
2.3
余事象 よじしょう(
complementary event
)
A
C
所与の
事象(2.2)を標本空間(2.1)から除いたもの。
例 1
2.1
のバッテリーの
例 1 において,事象
{0}
の余事象は,事象
(0
,+∞
)
である。同じことだ
が,バッテリーが初めから機能しない事象の余事象は,バッテリーが初めは機能する事象であ
る。同様に,事象
[0
,
3)
はバッテリーが初めから機能しなかったか,機能してもそれが
3
時
間未満であった場合に対応するが,この事象の余事象は
[3
,+∞
)
であり,バッテリーが
3
時
間後も働き,寿命がそれより長い場合に対応する。
例 2
2.2
の
例 2 の続き。事象
B
の中の結果の数は,
B
={標本が抵抗
8
,
9
,
10
の少なくとも一つを
含む}の余事象を考えることで容易に見つけることができる。この事象は,
7
+
8
+
9
=
24
個の
結果,
(1
,
8)
,
(2
,
8)
,
(3
,
8)
,
(4
,
8)
,
(5
,
8)
,
(6
,
8)
,
(7
,
8)
,
(1
,
9)
,
(2
,
9)
,
(3
,
9)
,
(4
,
9)
,
(5
,
9)
,
(6
,
9)
,
(7
,
9)
,
(8
,
9)
,
(1
,
10)
,
(2
,
10)
,
(3
,
10)
,
(4
,
10)
,
(5
,
10)
,
(6
,
10)
,
(7
,
10)
,
(8
,
10)
,
(9
,
10)
を含む。この例では,全標本空間は
45
個の結果を含むから,事象
B
は,
45
−
24
=
21
個の結果[すなわち,
(1
,
2)
,
(1
,
3)
,
(1
,
4)
,
(1
,
5)
,
(1
,
6)
,
(1
,
7)
,
(2
,
3)
,
(2
,
4)
,
(2
,
5)
,
(2
,
6)
,
(2
,
7)
,
(3
,
4)
,
(3
,
5)
,
(3
,
6)
,
(3
,
7)
,
(4
,
5)
,
(4
,
6)
,
(4
,
7)
,
(5
,
6)
,
(5
,
7)
,
(6
,
7)
]を含む。
注記 1
余事象は,標本空間における所与の事象の補集合である。
注記 2
余事象も事象の一つである。
注記 3
事象
A
に対して
A
の余事象は,通常
A
C
の記号で表される。
注記 4
事象の確率そのものよりも余事象の確率を計算するほうが容易であることが多い。例えば,
1
パーセントの不良品を含む
1 000
個のアイテムからランダムに
10
個のアイテムを選ぶとき少
なくとも一つの不良品が見つかる事象を書き下ろそうとすると,結果は,ばく(莫)大な数
になる。この事象の余事象(一つの不良も発見されない。
)は,ずっと扱いやすい。
2.4
独立事象 どくりつじしょう(
independent events
)
共通部分の
確率(2.5)がそれぞれの確率の積となる事象(2.2)の対。
例 1
赤色のさいころ及び白色のさいころを投げる状況を考える。
36
通りの可能な目の出方は,どれ
も等しく
1/36
の確率が割り当てられているとする。
D
i
を赤及び白のさいころの出た目の数の和
が
i
になる事象とする。
W
を白のさいころの出た目の数が
1
である事象とする。事象
D
7
と
W
とは独立であるが,
i
=
2
,
3
,
4
,
5
,
6
に対して事象
D
i
と
W
とは独立ではない。独立でない事
象の対は,従属事象と呼ばれる。
例 2
応用の場面で,独立及び従属事象はごく普通に現れる。事象又は出来事が従属である場合,関
連している事象の結果を知ることは大変有益である。例えば,心臓手術を受けようとしている
人に対して,成功の見込みは,喫煙歴又はその他の危険因子をもっている人の場合は,大変異
なったものになる可能性がある。このように,喫煙及び侵襲的な手術による死は,従属関係が
あり得る。これに対比して,この人が何曜日に生まれたかは,死と独立であろう。信頼性工学
では,故障原因に共通点がある構成要素の寿命は独立ではない。原子炉の燃料棒にひびが入る
確率はおそらく小さいが,一本の燃料棒にひびが入っているという条件のもとでは隣接した棒
にひびが入っている確率はおおむね増加するだろう。
27
Z 8101-1
:2015 (ISO 3534-1:2006)
例 3
2.2
の
例 2 の続きで,標本抽出が単純ランダムサンプリングで行われ,全ての結果が同じ確率
1/45
で起こるとする。このとき,
P(A)
=
17/45
=
0.377 8
,
P(B)
=
21/45
=
0.466 7
,
P(A
かつ
B)
=
11/45
=
0.244 4
である。しかし,積
P(A)
×
P(B)
=
(17/45)
×
(21/45)
=
0.176 3
であって,これは
0.244 4
とは異なるので,事象
A
と
B
とは独立ではない。
注記
この定義は,二つの事象に対して与えられたが,一般化される。事象
A
及び
B
に対して,独立
性の条件は,
P(A∩B)
=
P(A)P(B)
である。三つの事象
A
,
B
,
C
が独立であるためには,
P(A∩B ∩C)
=
P(A)P(B)P(C)
P(A∩B)
=
P(A)P(B)
P(A∩C)
=
P(A)P(C)
及び
P(B∩C)
=
P(B)P(C)
が成り立たなければならない。
一般に,三つ以上の事象に対して,
A
1
,
A
2
,…,
A
n
が独立であるとは,これらの事象の部分
族(
A
1
,
A
2
,…,
A
n
から幾つか選んだもの)の共通部分の確率がそれぞれの事象の積に等しく,
それがあらゆる部分族ごとに成立することである。全ての事象対が独立だが三つの事象は独立
でないような(すなわち,対独立だが完全には独立ではない。
)例を作ることができる。
2.5
(事象 A の)確率 (じしょう A の)かくりつ[
probability (of an event A)
]
P(A)
事象(2.2)に割り当てられる閉区間
[0
,
1]
の中の実数。
例
2.1
の
例 2 の続きで,事象の確率はそれを構成する全ての結果に対する確率を足し合わせることで
得られる。もし,全ての
45
通りの結果が等確率で起こるならば,おのおの確率は
1/45
になる。
事象の確率は,結果の個数を数え,その個数を
45
で割ることで得られる。
注記 1
確率測度(2.70)は,標本空間の全ての事象に対する実数の割り当て方を提供している。実
数を割り当てる。ある一つの事象を取り上げたとき,確率測度による確率の割当てはその事
象に確率を与える。いい換えれば,確率測度は,全ての事象に対する割当てを完全に与え,
一方,確率は一つの事象に対する特定の割当てを表している。
注記 2 この定義では,確率とは特定の事象に対する確率を意味する。確率は,事象の長期にわたる
生起の相対頻度,又は起こりやすさに関する確信の度合いに関連付けられることもある。事
象
A
の確率は,普通
P(A)
で表される。スクリプト文字
℘
を用いた
℘
(A)
という記号は,
確率
空間(2.68)の形式を表に出して考えなければならない状況で用いられる。
2.6
条件付き確率 じょうけんつきかくりつ(
conditional probability
)
P(A | B)
事象
A
及び事象
B
の共通部分の
確率(2.5)を
B
の確率で割ったもの。
例 1
2.1
の
例 1 において,{バッテリーが少なくとも
3
時間持続する}という
事象(2.2)
A
,すなわ
ち
[3
,+∞
)
を考える。事象
B
を{バッテリーが初めに機能する}すなわち
(0
,+∞
)
とする。
B
を与えたもとでの
A
の条件付き確率は,初めに機能するバッテリーだけを扱っていることを
考慮に入れている。
例 2
2.1
の
例 2 の続きで,非復元抽出ならば,抵抗
2
が
1
回目に選ばれたとすると,
2
回目に選ばれ
る確率は
0
である。もし,抵抗が選ばれる確率が全て等しいとすると,抵抗
2
が
1
回目に選ば
28
Z 8101-1
:2015 (ISO 3534-1:2006)
れなければ,
2
回目に選ばれる条件付き確率は
0.111 1 (
=
1/9)
である。
例 3
2.1
の
例 2 の続き。復元抽出で,各回に全ての抵抗が選ばれる確率が全て等しいならば,抵抗
2
が
1
回目に選ばれるかそうでないかにかかわらず,
2
回目に抵抗
2
が選ばれる条件付き確率は
0.1
である。したがって,
1
回目と
2
回目との結果は,独立事象である。
注記 1
事象
B
の確率は,正である必要がある。
注記 2
B
のもとでの
A
(
A given B
) は,より詳しくは 事象
B
が起こったという条件のもとでの
事象
A
という。条件付き確率の記号の縦線は, …の条件のもとで
と読まれる。
注記 3
事象
B
のもとでの事象
A
の条件付き確率が事象
A
の確率に等しいならば,事象
A
と事象
B
とは独立である。いい換えれば,
B
が生起したことを知っても,
A
の確率は変化しない。
2.7
(確率変数 X の)分布関数 (かくりつへんすう X の)ぶんぷかんすう[
distribution function (of a random
variable X)
]
F(x)
事象(2.2)
(
−∞,
x]
の
確率(2.5)を与える
x
の関数。
注記 1
区間
(
−∞,
x]
は,
x
以下の全ての値の集合である。
注記 2
分布関数は,
確率変数(2.10)の確率分布(2.11)を完全に記述する。離散型及び連続型の確
率分布の分類だけでなく確率変数の分類も分布関数の分類に基づいている。
注記 3
確率変数は実数値又は順序の付いた
k
個の実数の組であるので,
x
も実数又は順序のついた
k
個の実数の組であることが定義に暗に含まれている。
多変量分布(2.17)に対する分布関数
は,その多変量分布に従う確率変数が特定の値以下である
確率(2.5)を与える。多変量分布
関数を表現する記法は,
F(x
1
,
x
2
,…,
x
n
)
=
P[X
1
≦
x
1
,
X
2
≦
x
2
,…,
X
n
≦
x
n
]
である。また,
分布関数は,非減少である。
1
変量では,分布関数は
F(x)
=
P[X
≦
x]
となり,確率変数
X
が
x
以下の値をとる事象の確率を与える。
注記 4
通常,分布関数は,
離散分布(2.22)関数と連続分布(2.23)関数とに類別されるが,その他
の可能性もある。2.1 のバッテリーの例を思い出すと,次のような分布関数の例がある。
0
x < 0
の場合
F(x)
=
0.1
x
=
0
の場合
0.1
+
0.9[1
−
exp(
−
x)]
x > 0
の場合
この分布関数の定め方からバッテリーの寿命は,非負である。バッテリーが初めから機能し
ない確率は,
10 %
ある。その後は,バッテリーの寿命は,平均寿命
1
時間の
指数分布(2.58)
である。
注記 5 分布関数は,しばしば
cdf
(
cumulative distribution function
,累積分布関数)と略記される。
2.8
(確率)分布族 (かくりつ)ぶんぷぞく(
family of distributions
)
確率分布(2.11)の集合。
注記 1
確率分布を区別するとき,確率分布の
パラメータ(2.9)がインデックスとしてよく用いられ
る。
注記 2
確率分布の
平均(2.35)及び/又は分散(2.36)が,しばしば分布族のインデックスとして用
いられ,又は分布族を表すのに三つ以上のパラメータが必要な場合はその一部として用いら
れる。平均及び分散は,分布族の明示的なパラメータであるとは限らず,パラメータの関数
29
Z 8101-1
:2015 (ISO 3534-1:2006)
の場合もある。
2.9
パラメータ,母数 ぱらめーた,ぼすう(
parameter
)
分布族(2.8)のインデックス。
注記 1 パラメータは,
1
次元のこともあり,多次元のこともある。
注記 2
分布族の平均に直接対応付けられるパラメータを位置母数(ロケーションパラメータ)と呼
ぶことがある。
標準偏差(2.37),又はそれに比例するパラメータを尺度母数(スケールパラ
メータ)と呼ぶことがある。位置母数でも尺度母数でもないパラメータを,形状母数(シェ
イプパラメータ)と呼ぶことがある。
2.10
確率変数,変量 かくりつへんすう,へんりょう(
random variable
)
標本空間(2.1)の上で定義された,
k
次元実ベクトル値関数。
例
2.1
のバッテリーの例では,標本空間の事象は,言葉で記述されていた(バッテリーが初めから故
障している,バッテリーは初めのうち働き,
x
時間後に故障する。
)
。このような事象は,数学的
に扱いにくいので,それぞれの事象に(一つの実数である。
)バッテリーが故障する時間を対応さ
せることは自然である。確率変数が値
0
をとるならば,そのような結果は,初期故障に対応する
と理解される。確率変数が正の値をとるならば,バッテリーは,初め機能し,その後ある時間に
故障したと理解される。確率変数による表現をすれば, バッテリーがその補償期間,例えば,
6
時間,を超えても機能する確率は幾らか
といった問いに答えることができる。
注記 1
k
次元実ベクトルは,順序のある
k
個の実数の組
(x
1
,
x
2
,…,
x
k
)
を意味する。より一般的
には,順序のある
k
個の実数の組は,
k
次元の行ベクトル又は列ベクトルで表される。
注記 2
確率変数には,次元があり,それを
k
で表す。
k
=
1
であれば,確率変数は,
1
次元又は
1
変
量であるといわれる。
k > 1
の場合,確率変数は多次元であるといわれる。英語では,
k
次元
を
k-dimensional
と表記する。
注記 3
1
次元確率変数は,
確率空間(2.68)の構成要素である標本空間(2.1)の上で定義された実
数値関数である。
注記 4 順序のある実数の対を値とする確率変数は,
2
次元であるといわれる。この定義は,
k
個の数
の組の場合にも拡張される。
注記 5
k
次元確率変数の第
j
要素は,
k
個の組の第
j
要素だけに対応する確率変数である。
k
次元確
率変数の第
j
要素は,その要素の値に基づいて
事象(2.2)が定まる確率空間に対応する。
注記 6 確率変数(
random variable
)のことを変量(
variate
)ということもある。
2.11
確率分布,分布 かくりつぶんぷ,ぶんぷ(
probability distribution
,
distribution
)
確率変数(2.10)によって誘導される確率測度(2.70)。
例
2.1
のバッテリーの例の続き。バッテリーの寿命の分布は,特定の値が起こる確率を完全に定める。
所与のバッテリーの寿命が幾らであるかはっきりせず,
(試験の前には)バッテリーが初めに機能
するかどうかさえもわからない。不確かな結果の確率的な性質を確率分布は完全に定める。2.7
の
注記 4 では,分布関数によって具体的に確率分布が表現された。
注記 1
分布関数(2.7),存在するならば確率密度関数(2.26),特性関数など,数多くの数学的に同
等な分布の表現がある。難しさは様々であるが,これらの表現を用いると確率変数が与えら
30
Z 8101-1
:2015 (ISO 3534-1:2006)
れた範囲の値をとる確率を求めることができる。
注記 2
確率変数は標本空間上で定義されている実数値関数であるから,確率変数は確率
1
で実数値
をとる。バッテリーの例においては,
P[X
≧
0]
=
1
である。多くの場合に,基礎にある確率
測度よりも,確率変数及びその表現の一つを直接扱うほうがずっと容易である。しかしなが
ら,一つの表現から別の表現に変える場合でも,確率測度によって一貫性が保たれている。
注記 3
ただ一つの成分からなる確率変数は,
1
次元分布又は
1
変量分布に従うといわれる。確率変
数に二つの成分がある場合,それは
2
次元分布又は
2
変量分布に従うといい,二つより多く
の成分がある場合,確率変数は多次元分布又は多変量分布に従うという。
2.12
期待値 きたいち(
expectation
)
確率変数(2.10)の関数の確率測度(2.70)に関する標本空間(2.1)上の積分。
注記 1
確率変数
X
の関数
g(X)
の期待値は,
E[g(X)]
と表され,
E[g(X)]
=
=
k
R
Ω
x
F
x
g
P
X
g
)
(
d
)
(
d
)
(
と計算される。
ここに,
F(x)
は,対応する分布関数である。
注記 2
E[g(X)]
の
E
は,確率変数
g(X)
の 期待値(
expected value
,
expectation
) に由来する。
E
は,確率変数を実数へ,上記の計算式で対応させる作用素又は関数とみなすことができる。
注記 3
E[g(X)]
に対して二種類の積分が与えられている。
1
番目は標本空間上の積分であり,概念に
訴えるものであるが,事象そのものは(例えば,言葉で与えられていたりすると)扱いにく
いので,実用的ではない。
2
番目の積分は,
R
k
上の計算を表しており,より実用的である。
注記 4
実際的な多くの場合,上の積分は見覚えのある形になる。例としては,
g(x)
=
x
r
とすると r
次
のモーメント(2.34)になり,
g(x)
=
x
とすると
平均(2.35),
g(x)
=
[x
−
E(X)]
2
とすると
分散(2.36)
になる。
注記 5 この定義は,前の例及び注記のように
1
次元に限定されるものではない。多次元の場合に関
しては,2.43 参照。
注記 6
離散確率変数(2.28)に対して,注記 1 の積分は,総和記号で置き換えられる。例は,2.35
にある。
2.13
p 分位点,100p パーセント点,p 分位数,100p パーセンタイル p ぶんいてん,100p ぱーせんとてん,p
ぶんいすう,100p ぱーせんたいる(
p-quantile
,
p-fractile
,
100p-percentile
)
X
p
,
x
p
0 < p < 1
なる
p
に対して,
分布関数(2.7)
F(x)
が
p
以上になる
x
全体の下限。
例 1
確率質量関数が
表 2 で与えられる 2 項分布(2.46)を考える。この数値はパラメータ
n
=
6
,
p
=
0.3
の
2
項分布に対応している。この場合に幾つかの
p
分位点を挙げると,次のようになる。
x
0.1
=
0
x
0.25
=
1
x
0.5
=
2
x
0.75
=
3
x
0.90
=
3
31
Z 8101-1
:2015 (ISO 3534-1:2006)
x
0.95
=
4
x
0.99
=
5
x
0.999
=
5
2
項分布は離散的なので,
p
分位点は整数になる。
表 2−2 項分布の例
X
P[X=x]
P[X ≦
x]
P[X > x]
0
0.117 649
0.117 649
0.882 351
1
0.302 526
0.420 175
0.579 825
2
0.324 135
0.744 310
0.255 690
3
0.185 220
0.929 530
0.070 470
4
0.059 535
0.989 065
0.010 935
5
0.010 206
0.999 271
0.000 729
6
0.000 729
1.000 000
0.000 000
例 2
標準正規分布(2.51)を考え,その分布関数から値を選んで表 3 に与える。幾つかの
p
分位点
は,次のとおりである。
表 3−標準正規分布の例
p
P[X ≦ x]=p となる x
0.1
−1.282
0.25
−0.674
0.5 0.000
0.75 0.674
0.841 344 75
1.000
0.9 1.282
0.95 1.645
0.975 1.960
0.99 2.326
0.995 2.576
0.999 3.090
X
の分布は連続だから,第
2
列の見出しは,
P[X < x]
=
p
となる
x
,としてもよい。
注記 1
連続分布(2.23)に対して,
p
=
0.5
の場合
0.5
分位点は
メディアン(2.14)に一致する。
p
が
0.25
に対しては,
0.25
分位点は下側四分位点として知られる。連続分布においては,分布の
25 %
は
0.25
分位点より下にあり,また
75 %
は
0.25
分位点より上にある。
p
が
0.75
に対して
は,
0.75
分位点は上側四分位点として知られている。
注記 2
一般に,分布の
100p %
は
p
分位点より下にあり,分布の
100(1
−
p) %
は
p
分位点より上にあ
る。離散分布に対しては,この定義以外にも別な定義が用いられることがあるので,一般に
メディアンの定義を満たす値が複数あり,困難が伴う。
注記 3
F
が連続で狭義の単調増加であれば,
p
分位点は
F(x)
=
p
の解である。
注記 4 分布関数がある区間において,定数であり
p
に等しければ,その区間に属する全ての値を
F
の
p
分位点とする定義もある。
32
Z 8101-1
:2015 (ISO 3534-1:2006)
注記 5
p
分位点は,1
変量分布(2.16)に対して定義される。
注記 6
検定の棄却限界値に用いる,上側
100p
パーセント点は
100(1
−
p)
パーセント点である。両側
100p
パーセント点は,
100(1
−
p/2)
パーセント点である。
注記 7 上側,下側の代わりに 上位 , 下位 と呼ぶこともある。
2.14
メディアン,中央値 めでぃあん,ちゅうおうち(
median
)
0.5
分位点(2.13)。
例
2.7
の
注記 4 のバッテリーの例において,メディアンは,
0.1
+
0.9[1
−exp(−x)]
=
0.5
の解であって,
0.587 8
である。
注記 1
メディアンは,最もよく使われる p
分位点(2.13)の一つである。連続 1 変量分布(2.16)の
メディアンは,
母集団(1.1)の半分がそれ以上,半分がそれ以下となるようなものである。
注記 2
メディアンは,1
変量分布(2.16)に対して定義される。
注記 3
母集団のメディアンであることを強調して,母メディアン,又は母中央値と呼んでもよい。
2.15
四分位点 しぶんいてん(
quartile
)
0.25
分位点(2.13)又は 0.75 分位点。
例
2.14
のバッテリーの例で,
0.25
分位点は
0.182 3
であり
0.75
分位点は
1.280 9
である。
注記 1
0.25
分位点は下側四分位点として,
0.75
分位点は上側四分位点として知られている。
注記 2
四分位点は,1
変量分布(2.16)に対して定義される。
注記 3
母集団の四分位点であることを強調して,母四分位点と呼んでもよい。
2.16
1
変量確率分布,1 変量分布 いちへんりょうかくりつぶんぷ,いちへんりょうぶんぷ(
univariate probability
distribution
,
univariate distribution
)
単一の
確率変数(2.10)の確率分布(2.11)。
注記
1
変量確率分布は,
1
次元の分布である。2
項分布(2.46),ポアソン分布(2.47),正規分布(2.50),
ガンマ分布(2.56),t 分布(2.53),ワイブル分布(2.63)及びベータ分布(2.59)は,
1
変量確
率分布の例である。
2.17
多変量確率分布,多変量分布 たへんりょうかくりつぶんぷ,たへんりょうぶんぷ(
multivariate probability
distribution
,
multivariate distribution
)
複数の
確率変数(2.10)の確率分布(2.11)。
注記 1
二つの確率変数の確率分布は,より限定的な表現として
多変量
の代わりに
2
変量
が
用いられることが多い。序文に述べたように確率変数が一つである場合の確率分布を明示的
に
1
次元,又は 1
変量分布(2.16)と呼ぶ。このために,特に断りがない限り
1
変量である
ことが仮定されていることが多い。
注記 2
多変量分布は,同時分布又は結合分布と呼ばれることもある。
注記 3
多項分布(2.45),2 変量正規分布(2.65),多変量正規分布(2.64)などは,この規格に挙げ
られた多変量分布の例である。
2.18
周辺確率分布,周辺分布 しゅうへんかくりつぶんぷ,しゅうへんぶんぷ(
marginal probability distribution
,
33
Z 8101-1
:2015 (ISO 3534-1:2006)
marginal distribution
)
確率変数(2.10)の成分の空でない真部分集合の確率分布(2.11)。
例 1
三つの確率変数
X
,
Y
,
Z
の確率分布には,二つの確率変数,すなわち,
(X
,
Y)
,
(X
,
Z)
,
(Y
,
Z)
についての周辺分布が三つと,一つの確率変数,すなわち,
X
,
Y
,
Z
についての周辺分布が
三つ存在する。
例 2
2
変量正規分布(2.65)に従う確率変数の対
(X
,
Y)
では,確率変数
X
の周辺分布も確率変数
Y
の周辺分布も,ともに
正規分布(2.50)である。
例 3
多項分布(2.45)では,
k > 3
ならば
(X
1
,
X
2
)
の分布は周辺分布となる。
X
1
,
X
2
,…,
X
k
のそれ
ぞれの分布もまた周辺分布となる。この周辺分布は,それぞれ 2
項分布(2.46)である。
注記 1
k
次元の同時分布について,
k
1
< k
である
k
1
個の確率変数からなる部分集合の確率分布は,周
辺分布の一例である。
注記 2
確率密度関数(2.26)で表された連続(2.23)多変量確率分布(2.17)の場合,その周辺確率
分布の確率密度関数は,周辺分布の対象でない確率変数についてその全定義域においてもと
の確率密度関数を積分することによって求められる。
注記 3
確率質量関数(2.24)で表された離散(2.22)多変量確率分布(2.17)の場合,その周辺確率
分布の確率質量関数は,周辺分布の対象でない確率変数についてその全定義域においてもと
の確率質量関数の和をとることによって求められる。
2.19
条件付き確率分布,条件付き分布 じょうけんつきかくりつぶんぷ,じょうけんつきぶんぷ(
conditional
probability distribution
,
conditional distribution
)
標本空間(2.1)の空でない真部分集合内に限定され,その部分集合内の全確率が
1
になるように補正さ
れた
確率分布(2.11)。
例 1
2.7
注記 4 のバッテリーの例で,初めからバッテリーが機能している場合のバッテリーの寿命
の条件付き分布は
指数分布(2.58)である。
例 2
2
変量正規分布(2.65)で,
X
=
x
のもとでの
Y
の
条件付き分布は,
X
を知ったとき
Y
への影響
を反映している。
例 3
フロリダにおける年間のハリケーン被害の保険損害額の分布を表す確率変数
X
を考える。この
分布は,ハリケーン被害が全くない年もあることから保険損害額がゼロであるという確率も正
である。興味の対象が,ハリケーン被害が実際にあった年に限定した条件付き分布であること
もある。
注記 1
二つの確率変数
X
及び
Y
の分布について,
X
についての条件付き分布と
Y
についての条件付
き分布とが考えられる。
Y
=
y
を条件付けられた
X
の分布は
Y
=
y
のもとでの
X
の条件付き
分布 と表記され,
X
=
x
を条件付けられた
Y
の分布は
X
=
x
のもとでの
Y
の条件付き分布
と表記される。
注記 2
周辺分布(2.18)は,条件付けられていない分布とみなすことができる。
注記 3
上の
例 1 は,
1
変量分布が他の
1
変量分布の値によって調整されることを説明していて,こ
の場合,条件付き分布は,元の分布と異なる分布になる。これに対して,故障分布が指数分
布の場合,最初の
10
時間に故障が起きなかったという条件のもとでの将来の故障の分布は,
元の分布と同一のパラメータの指数分布になる。
注記 4
ある種の結果が起きえないという状況での離散分布は,条件付き分布になる。例えば,り(罹)
34
Z 8101-1
:2015 (ISO 3534-1:2006)
病者中の固形がん患者数のモデルでは,
0
をとらず,正の値[腫瘍のない患者はり(罹)病
の定義外であるため]だけに条件付けられたポアソン分布が用いられる。
注記 5
条件付き分布とは,標本空間を特定の部分集合に限定することを意味する。
(X
,
Y)
が 2
変量
正規分布(2.65)に従うとき,
(X
,
Y)
について
[0
,
1]
×
[0
,
1]
の領域だけに結果が生起する
ことが与えられたもとで,
(X
,
Y)
の条件付き分布に興味があるかもしれない。他には
X
2
+
Y
2
≦
r
が与えられたときの
(X
,
Y)
の条件付き分布も考えられる。この状況は,例えば,部
品の公差がこの領域に対応し,公差を満たしている部品の性能に更に興味があるという状況
である。
2.20
回帰曲線 かいききょくせん(
regression curve
)
確率変数(2.10)
Y
について,確率変数
X
の値が
x
と与えられたときの
条件付き確率分布(2.19)に基づ
く
Y
の
期待値(2.12)の値の集まり。
注記 1 ここで,
(X
,
Y)
が
2
変量分布(2.17 の
注記 1 参照)に従うというもとで回帰曲線が定義され
る。したがって,回帰曲線は,
Y
が確率変数でない説明変数の集まりと関連付けられる回帰
分析とは概念が異なる。
注記 2
(X
,
Y)
が
2
変量正規分布に従う場合では,回帰曲線は直線となり,回帰直線と呼ばれる。
2.21
回帰曲面 かいききょくめん(
regression surface
)
確率変数(2.10)
Y
について,二つの確率変数
X
1
,
X
2
の値が
x
1
,
x
2
と与えられたときの
条件付き確率分
布(2.19)に基づく
Y
の
期待値(2.12)の値の集まり。
注記 1
ここで,2.20 と同様に,
(Y
,
X
1
,
X
2
)
が
多変量分布(2.17)に従うというもとで回帰曲面が定
義される。したがって,回帰曲線と同様に,回帰曲面は,回帰分析及び応答曲面探索の方法
論とは概念が異なる。
注記 2
(Y
,
X
1
,
X
2
)
が
3
変量正規分布に従う場合,回帰曲面は平面となり,回帰平面と呼ばれる。
2.22
離散確率分布,離散分布 りさんかくりつぶんぷ,りさんぶんぷ(
discrete probability distribution
,
discrete
distribution
)
標本空間(2.1)
Ω が有限又は可算無限である確率分布(2.11)。
例
この規格での離散分布の例には,
多項分布(2.45),2 項分布(2.46),ポアソン分布(2.47),超幾
何分布(2.48),及び負の 2 項分布(2.49)がある。
注記 1
離散
とは,標本空間が有限のリストとなること,又は標本空間が,例えば,欠点の数が
0
,
1
,
2
,…のように,先がどのように続くかが明らかな無限のリストになっていることであ
る。また,
2
項分布は有限の標本空間
{0
,
1
,
2
,…,
n}
に対応するが,ポアソン分布は可
算無限の標本空間
{0
,
1
,
2
,…
}
に対応する。
注記 2
合否抜取検査における計数値データには,離散分布が用いられる。
注記 3
離散分布の
分布関数(2.7)は,離散的な値をとる。
2.23
連続確率分布,連続分布 れんぞくかくりつぶんぷ,れんぞくぶんぷ(
continuous probability distribution
,
continuous distribution
)
x
における
分布関数(2.7)が,非負の関数の−∞から
x
までの積分で表される
確率分布(2.11)。
35
Z 8101-1
:2015 (ISO 3534-1:2006)
例
連続分布が生じる状況には,工業分野での応用で見いだされる計量値データが用いられる状況の
ほとんどが相当する。
注記 1
連続分布の例には,
正規分布(2.50),標準正規分布(2.51),t 分布(2.53),F 分布(2.55),
ガンマ分布(2.56),カイ 2 乗分布(2.57),指数分布(2.58),ベータ分布(2.59),一様分布
(2.60)
,
タイプ I 極値分布(2.61),タイプ II 極値分布(2.62),タイプ III 極値分布(2.63),
対数正規分布(2.52)などがある。
注記 2
この定義における非負の関数は,
確率密度関数(2.26)である。したがって,分布関数がい
たるところ微分可能であると主張することは非常に制限的である。しかしながら,実際的に
は多くのよく用いられている連続分布は分布関数の導関数が,対応する確率密度関数になる
という性質をもっている。
注記 3
合否抜取検査における計量値データには,連続分布が用いられる。
2.24
確率質量関数,確率関数 かくりつしつりょうかんすう,かくりつかんすう(
probability mass function
)
<離散分布>
確率変数(2.10)が個々の値に等しくなる確率(2.5)を与える関数。
例 1
三つの正しいコインを投げたとき,表のでる枚数を確率変数
X
とすると,確率質量関数は,
P(X
=
0)
=
1/8
P(X
=
1)
=
3/8
P(X
=
2)
=
3/8
P(X
=
3)
=
1/8
である。
例 2
応用のときによく登場する
離散分布(2.22)の定義のために,多様な確率質量関数が与えられ
る。
1
変量離散分布として,2
項分布(2.46),ポアソン分布(2.47),超幾何分布(2.48)及び
負の 2 項分布(2.49)がある。多変量離散分布の例として,多項分布(2.45)がある。
注記 1
X
が確率変数,
x
i
が実現値,
p
i
でその確率を表すとき,
P(X
=
x
i
)
=
p
i
で確率質量関数が与えら
れる。
注記 2
2.13
の
例 1 の
p
分位点で 2
項分布(2.46)の確率質量関数が導入された。
注記 3
< >の記号は,一つの用語が複数の概念を表す場合に,それぞれの概念に関係する主題又
は分野を表示して対象を限定し,区別するために用いる。
2.25
確率(質量)関数のモード かくりつ(しつりょう)かんすうのもーど(
mode of probability mass function
)
確率質量関数(2.24)が局所的最大値をとる値。
例
n
=
6
,
p
=
1/3
の 2
項分布(2.46)は,単峰でモードは
2
(対応国際規格では,モードは
3
と誤記)
である。
注記
離散分布(2.22)は,モードが一つのときに単峰,二つのときに二峰,三つ以上のときに多峰
である。
2.26
確率密度関数,密度関数 かくりつみつどかんすう,みつどかんすう(
probability density function
)
f
(x)
連続分布(2.23)の
x
における
分布関数(2.7)が,−∞から
x
までの積分によって表されるときの非負
の被積分関数。
36
Z 8101-1
:2015 (ISO 3534-1:2006)
例 1
応用の場面でよく登場する連続分布の定義のために,多様な確率密度関数が与えられる。連続
分布として,
正規分布(2.50),標準正規分布(2.51),t 分布(2.53),F 分布(2.55),ガンマ分
布(2.56),カイ 2 乗分布(2.57),指数分布(2.58),ベータ分布(2.59),一様分布(2.60),多
変量正規分布(2.64),及び 2 変量正規分布(2.65)がある。
例 2
分布関数が
0
≦
x
≦
1
の範囲で
F(x)
=
3x
2
−
2x
3
と定義されるとき,対応する確率密度関数は,
0
≦
x
≦
1
の範囲で
f(x)
=
6x(1
−
x)
である。
例 3
2.1
(より適切には,2.7 の
注記 4 を参照)のバッテリーの例で,初めから故障している確率が
正のため,この分布関数に対応する確率密度関数は,存在しない。しかし,バッテリーが初め
は機能していたという条件付き分布の確率密度関数は,
x > 0
の範囲で
f(x)
=
exp(
−
x)
である。
これは,指数分布である。
注記 1
分布関数
F
が連続微分可能であれば,確率密度関数は,
f(x)
=
dF(x)/dx
である。
注記 2
x
に対して
f(x)
を図示すると,対称,とがっている,裾が重い,単峰,二峰などといった描
写ができる。ヒストグラムに対して,当てはめた
f(x)
を重ねて示すと,データと当てはめた
分布との一致の程度を視覚的に評価できる。
注記 3
確率密度関数の一般的な略字は,
である。
2.27
(確率)密度関数のモード (かくりつ)みつどかんすうのもーど(
mode of probability density function
)
確率密度関数(2.26)が局所的に最大値をとる値。
注記 1
連続分布(2.23)は,その確率密度関数のモードが一つのときに単峰,二つのときに二峰,
三つ以上のときに多峰である。
注記 2
分布の全てのモードが連結集合をなすときも単峰という。
2.28
離散確率変数 りさんかくりつへんすう(
discrete random variable
)
離散分布(2.22)に従う確率変数(2.10)。
注記
この規格で考慮されている離散確率変数として,2
項分布(2.46),ポアソン分布(2.47),超幾
何分布(2.48),多項分布(2.45)などに従う確率変数がある。
2.29
連続確率変数 れんぞくかくりつへんすう(
continuous random variable
)
連続分布(2.23)に従う確率変数(2.10)。
注記
この規格で考慮されている連続確率変数として,
正規分布(2.50),標準正規分布(2.51),t 分
布(2.53),F 分布(2.55),ガンマ分布(2.56),カイ 2 乗分布(2.57),指数分布(2.58),ベー
タ分布(2.59),一様分布(2.60),タイプ I 極値分布(2.61),タイプ II 極値分布(2.62),タイ
プ III 極値分布(2.63),対数正規分布(2.52),多変量正規分布(2.64),2 変量正規分布(2.65)
などに従う確率変数がある。
2.30
中心化(された)確率分布,中心確率分布 ちゅうしんか(された)かくりつぶんぷ,ちゅうしんかくり
つぶんぷ(
centred probability distribution
)
中心化確率変数(2.31)の確率分布(2.11)。
37
Z 8101-1
:2015 (ISO 3534-1:2006)
2.31
中心化(された)確率変数,中心確率変数 ちゅうしんか(された)かくりつへんすう,ちゅうしんかく
りつへんすう(
centred random variable
)
確率変数(2.10)からその母平均(2.35)を差し引いた確率変数。
注記 1
中心化確率変数の母平均は
0
に等しい。
注記 2
この用語は母平均の存在する確率変数だけに適用される。例えば,自由度が
1
の t
分布(2.53)
には母平均が存在しない。
注記 3
確率変数
X
の
母平均(2.35)が
μ
のとき,対応する中心化確率変数は
X
−
μ
であり,その母平
均は
0
に等しい。
2.32
標準化(された)確率分布,標準確率分布 ひょうじゅんか(された)かくりつぶんぷ,ひょうじゅんか
くりつぶんぷ(
standardized probability distribution
)
標準化確率変数(2.33)の確率分布(2.11)。
2.33
標準化(された)確率変数,標準確率変数 ひょうじゅんか(された)かくりつへんすう,ひょうじゅん
かくりつへんすう(
standardized random variable
)
母標準偏差(2.37)が
1
である
中心化確率変数(2.31)。
注記 1
確率変数(2.10)は,その母平均が
0
で母標準偏差が
1
であるならば,そのまま標準化確率
変数である。区間が
(
−
3
0.5
,
3
0.5
)
の
一様分布(2.60)は母平均
0
,母標準偏差
1
である。
標
準正規分布(2.51)は,もちろん標準化された確率分布である。
注記 2
確率変数
X
の
分布(2.11)で,母平均(2.35)が
μ,母標準偏差がσ
であれば,この標準化確
率変数は,
(X
−
μ
)/
σ
である。
2.34
r 次のモーメント,r 次の積率 r じのもーめんと,r じのせきりつ(
moment of order r
,
rth moment
)
確率変数(2.10)の
r
乗の
期待値(2.12)。
例
確率密度関数(2.26)が
x > 0
の範囲で
f(x)
=
exp(
−
x)
である確率変数を考える。このとき部分積
分によって,
E(X)
=
1
,
E(X
2
)
=
2
,
E(X
3
)
=
6
,
E(X
4
)
=
24
であり,一般に
E(X
r
)
=
r!
となる。これは
指数分布(2.58)の例である。
注記 1
離散の
1
変量の場合の公式は,取り得る値の個数が有限で
n
個のとき,
=
=
n
i
i
r
i
r
x
p
x
X
E
1
)
(
)
(
で,また,取り得る値の個数が可算無限大のとき,
∞
=
=
1
)
(
)
(
i
i
r
i
r
x
p
x
X
E
である。連続の
1
変量の場合の公式は,
∞
∞
−
=
x
x
f
x
X
E
r
r
d
)
(
)
(
である。
38
Z 8101-1
:2015 (ISO 3534-1:2006)
注記 2
k
次元の確率変数の場合には,
r
乗は成分ごとに適用する。
注記 3
ここに規定されたモーメントは,確率変数
X
のべき乗を用いている。より一般的に,
X
−
μ
又
は
(X
−
μ
)/
σ
の
r
次のモーメントを考えることができる。
2.35
平均 へいきん(
means
)
2.35.1
母平均,平均,1 次のモーメント ぼへいきん,へいきん,いちじのもーめんと(
mean
,
moment of order r
=
1
)
μ
<連続分布>
確率密度関数(2.26)
f
(x)
と
x
との積の数直線上での積分,すなわち,
r
が
1
のときの
r
次
モーメント。
例 1
連続確率変数(2.29)
X
の確率密度関数が
0
≦
x
≦
1
の範囲で
f(x)
=
6x(1
−
x)
であるとする。
このとき
X
の母平均は,
(
)
=
−
1
0
2
5
.
0
d
1
6
x
x
x
である。
例 2
2.1
及び 2.7 のバッテリーの例で,分布の離散部分の平均は
0
で,その確率が
0.1
,また,連続
部分の平均は
1
で,その確率が
0.9
なので,全体での母平均は
0.9
である。この分布は,連続分
布と離散分布とが混合した分布である。
注記 1
連続分布(2.23)の母平均は,
E(X)
の記号で表され,
∞
∞
−
=
x
x
xf
X
E
d
)
(
)
(
で計算される。
注記 2
全ての
確率変数(2.10)に母平均が存在するわけではない。例えば,確率密度関数が
f(x)
=
[
π(1
+
x
2
)]
−
1
で定義される確率変数
X
は,
E(X)
に対応する積分が発散する。
注記 3
< >の記号は,一つの用語が複数の概念を表す場合に,それぞれの概念に関係する主題又
は分野を表示して対象を限定し,区別するために用いる。
2.35.2
母平均,平均 ぼへいきん,へいきん(
mean
)
μ
<離散分布>
確率質量関数(2.24)
p(x
i
)
と
x
i
との積の総和。
例 1
離散確率変数(2.28)
X
で三つの正しいコインを投げたときの表のでる回数を表すとする。こ
の確率質量関数は,
P(X
=
0)
=
1/8
P(X
=
1)
=
3/8
P(X
=
2)
=
3/8
P(X
=
3)
=
1/8
である。したがって,
X
の母平均は,
0(1/8)
+
1(3/8)
+
2(3/8)
+
3(1/8)
=
12/8
=
1.5
である。
例 2
2.35.1
の
例 2 を参照。
39
Z 8101-1
:2015 (ISO 3534-1:2006)
注記
離散分布(2.22)の母平均は,
E(X)
の記号で表され,取り得る値の個数が
n
のとき,
=
=
n
i
i
i
x
p
x
X
E
1
)
(
)
(
で,また,取り得る値の個数が可算無限大のとき,
∞
=
=
1
)
(
)
(
i
i
i
x
p
x
X
E
で計算される。
2.36
母分散,分散 ぼぶんさん,ぶんさん(
variance
)
V
確率変数(2.10)の中心化確率分布(2.30)における
r
が
2
のときの r
次モーメント(2.34)。
例 1
2.24
の例での
離散確率変数(2.28)の母分散は,
=
=
=
−
3
0
2
75
.
0
)
(
)
5
.
1
(
i
i
i
x
X
P
x
である。
例 2
2.26
の
例での連続確率変数(2.29)の母分散は
05
.
0
d
)
1
(
6
)
5
.
0
(
1
0
2
=
−
−
x
x
x
x
である。
例 3
2.1
のバッテリーの例を引き続き考える。
一般に,
X
の分散が
E(X
2
)
−
[E(X)]
2
で求められる。
2.35.1
の
例 2(対応国際規格では,2.35 の例 3 と誤記)から,
E(X)
=
0.9
である。また,同様の議論に
よって,
E(X
2
)
は,
1.8
であることが分かる。この結果
X
の分散は,
1.8
−
(0.9)
2
で
0.99
である。
注記
母分散の定義は,いい換えると,確率変数とその
母平均(2.35)との差の
2
乗の
期待値(2.12)
となる。確率変数
X
の分散を
V(X)
の記号で表す,すなわち,
V(X)
=
E{[X
−
E(X)]
2
}
である。
2.37
母標準偏差,標準偏差 ぼひょうじゅんへんさ,ひょうじゅんへんさ(
standard deviation
)
σ
母分散(2.36)の非負の平方根。
例
2.1
及び 2.7 のバッテリーの例で,母標準偏差は
0.995
である。
2.38
母変動係数,変動係数 ぼへんどうけいすう,へんどうけいすう(
coefficient of variation
)
CV
<正値の確率変数>
母標準偏差(2.37)を母平均(2.35)で割ったもの。
例
2.1
及び 2.7 のバッテリーの例で,母変動係数は, なので
1.105 54
(対応国際規格では,
0.99/0.995
なので
0.994 97
と誤記)である。
注記 1
変動係数は,パーセントで表されることが一般的である。
注記 2
これまで使われていた
相対標準偏差
よりも,変動係数という用語を用いるべきである。
9
.
0
99
.
0
40
Z 8101-1
:2015 (ISO 3534-1:2006)
注記 3
< >の記号は,一つの用語が複数の概念を表す場合に,それぞれの概念に関係する主題又
は分野を表示して対象を限定し,区別するために用いる。
2.39
(母)ゆがみ,(母)ひずみ (ぼ)ゆがみ,(ぼ)ひずみ(
coefficient of skewness
)
γ
1
確率変数(2.10)の標準化確率分布(2.32)についての 3 次モーメント(2.34)。
例
2.1
及び 2.7 のバッテリーの例は,連続分布と離散分布の混合した分布である,2.34 の例の結果か
ら,
E(X)
=
0.1(0)
+
0.9(1)
=
0.9
E(X
2
)
=
0.1(0
2
)
+
0.9(2)
=
1.8
E(X
3
)
=
0.1(0
3
)
+
0.9(6)
=
5.4
E(X
4
)
=
0.1(0
4
)
+
0.9(24)
=
21.6
である。ゆがみを計算するために,公式
E{[X
−
E(X)]
3
}
=
E(X
3
)
−
3 E(X)E(X
2
)
+
2 [E(X)]
3
と,2.37 か
ら標準偏差が
0.995
となることを用いる。この結果,ゆがみは,
[5.4
−
3(0.9)(1.8)
+
2(0.9)
3
]/(0.995)
3
=
2.028
(対応国際規格は,
1.998
と誤記)となる。
注記 1
(X
−
μ
)/
σ
の
3
乗の
期待値(2.12),すなわち
E[(X
−
μ
)
3
/
σ
3
]
は,同値な定義である。
注記 2
ゆがみは,
分布(2.11)の対称性の尺度であり,
1
β という記号が用いられることがある。
ゆがみは,負の値をとることもあるが,その場合でも,この記号 を用いる。対称な分布
では,ゆがみは,
(必要なモーメントが存在するとして)
0
に等しい。ゆがみが
0
の分布の例
として,
正規分布(2.50),
α
=
β
のときの
ベータ分布(2.59),必要なモーメントが存在する
ときの t
分布(2.53)などがある。
注記 3 ゆがみ(歪み),ひずみ(歪み)をわいど(歪度)とも呼ぶ。
注記 4 混乱が生じなければ, 母 を省略してもよい。
2.40
(母)とがり (ぼ)とがり(
coefficient of kurtosis
)
β
2
確率変数(2.10)の標準化確率分布(2.32)についての 4 次モーメント(2.34)。
例
2.1
及び 2.7 のバッテリーの例でとがりを計算するために,公式
E{[X
−
E(X)]
4
}
=
E(X
4
)
−
4 E(X)E(X
3
)
+
6 [E(X) ]
2
E(X
2
)
−
3 [E(X)]
4
を用いる。この結果,とがりは
[21.6
−
4(0.9)(5.4)
+
6(0.9)
2
(2)
−
3(0.9)
4
]/(0.995)
4
=
9.12
となる。
(対応国際規格では,
9.12
を
8.94
と誤記)
注記 1
(X
−
μ
)/
σ
の
4
乗の
期待値(2.12),すなわち
E[(X
−
μ
)
4
/
σ
4
]
は,同値な定義である。
注記 2
とがりは,
分布(2.11)の裾の重さの尺度である。一様分布(2.60)のとがりは
1.8
,
正規分
布(2.50)のとがりは
3
,
指数分布(2.58)のとがりは
9
である。
注記 3
報告されたとがりを検討する場合,この定義によって計算される値から
3
(正規分布のとが
り)を引いてあることがあるので,注意が必要である。この意味で,
γ
2
(
=
β
2
−
3)
という記号
が用いられることがある。
注記 4 とがり(尖り)をせんど(尖度)とも呼ぶ。
注記 5 混乱が生じなければ, 母 を省略してもよい。
1
β
41
Z 8101-1
:2015 (ISO 3534-1:2006)
2.41
(r,s)次の同時モーメント (r,s)じのどうじもーめんと(
joint moment of orders r and s
)
同時
確率分布(2.11)について,一つの確率変数(2.10)の
r
乗ともう一つの確率変数の
s
乗との積の
平
均(2.35)。
2.42
(r,s)次の同時中心モーメント (r,s)じのどうじちゅうしんもーめんと(
joint central moment of orders
r and s
)
同時
確率分布(2.11)について,一つの中心化確率変数(2.31)の
r
乗ともう一つの中心化確率変数の
s
乗との積の
平均(2.35)。
2.43
(母)共分散 (ぼ)きょうぶんさん(
covariance
)
σ
XY
同時
確率分布(2.11)について,二つの中心化確率変数(2.31)の積の平均(2.35)。
注記 1
共分散は,二つの確率変数の
(1,1)次の同時中心モーメント(2.42)である。
注記 2
E(X)
=
μ
X
,
E(Y)
=
μ
Y
のとき,共分散は,
E[(X
−
μ
X
)(Y
−
μ
Y
)]
の式で表される。
2.44
母相関係数,相関係数 ぼそうかんけいすう,そうかんけいすう(
correlation coefficient
)
同時
確率分布(2.11)について,二つの標準化確率変数(2.33)の積の平均(2.35)。
注記
相関係数は,単に相関と呼ばれることがある。しかしながら,この用法は,二つの変数の関係
性としての相関と重なるので注意が必要である。
2.45
多項分布 たこうぶんぷ(
multinomial distribution
)
確率質量関数(2.24)が
(
)
k
x
k
x
x
k
k
k
p
p
p
x
x
x
n
x
X
x
X
x
X
P
2
1
2
1
2
1
2
2
1
1
!
!
!
!
,
,
,
=
=
=
=
ここに,
x
1
,
x
2
,…,
x
k
は
x
1
+
x
2
+…+
x
k
=
n
を満たす非負の整数
で表される
離散分布(2.22)。ただし,
k
は
2
以上の整数,
パラメータ
p
i
(i
=
1
,
2
,…,
k)
は,
p
i
> 0
で
p
1
+
p
2
+…+
p
k
=
1
を満たす。
注記
多項分布は,それぞれの試行において互いに排反な
k
個の事象のいずれかが起き,一連の試行
を通じてそれぞれの事象の確率が不変なとき,
n
回の独立な試行におけるそれぞれ事象の起こ
る回数の確率を与える。
2.46
2
項分布 にこうぶんぷ(
binomial distribution
)
確率質量関数(2.24)が
42
Z 8101-1
:2015 (ISO 3534-1:2006)
(
)
(
) (
)
x
n
x
p
p
x
n
x
n
x
X
P
−
−
−
=
=
1
!
!
!
,
x
=
0
,
1
,
2
,…,
n
で表される
離散分布(2.22)。ただし,
n
は,
n
=
1
,
2
,…であり,パラメータ
p
は,
0 < p < 1
である。
例
2.24
の
例 1 で説明に用いた確率質量関数は,パラメータ
n
=
3
,
p
=
0.5
の
2
項分布に相当すると考
えることができる。
注記 1
2
項分布は,本質的に,
多項分布(2.45)において
k
=
2
とした場合である。
注記 2
2
項分布は,それぞれの試行において互いに排反な
2
個の
事象(2.2)のいずれかが起き,一
連の試行を通じて,それぞれの事象の
確率(2.5)が不変なとき,
n
回の独立な試行における
それぞれの事象の起こる回数の確率を与える。
注記 3
2
項分布の
母平均(2.35)は,
np
に等しい。
2
項分布の
母分散(2.36)は,
np(1
−
p)
に等しい。
注記 4
2
項分布の確率質量関数は,
2
項係数の記号
(
)
!
!
!
x
n
x
n
x
n
−
=
を用いて表してもよい。
2.47
ポアソン分布 ぽあそんぶんぷ(
Poisson distribution
)
確率質量関数(2.24)が,
(
)
λ
λ
−
=
=
e
!
x
x
X
P
x
,
x
=
0
,
1
,
2
,…
と表される
離散分布(2.22)。ただし,パラメータλは,λ
> 0
である。
注記 1
2
項分布(2.46)において
np
→λとなるように,
n
→∞,
p
→
0
とすればパラメータλのポアソ
ン分布になる。
注記 2
ポアソン分布の
母平均(2.35)及び母分散(2.36)は,ともにパラメータλに等しい。
注記 3
ある単位時間における事象の起こり方が,ある条件(例えば,故障率が時刻と無関係である。
)
を満たしているとき,ポアソン分布の
確率質量関数(2.24)は,単位時間中の事象の生起回
数に関する確率を与える。
2.48
超幾何分布 ちょうきかぶんぷ(
hypergeometric distribution
)
確率質量関数(2.24)が,
(
)
(
)
(
)
(
) (
)
(
)
−
+
−
−
−
−
−
=
=
!
!
!
!
!
!
!
!
!
n
N
n
N
x
n
M
N
x
n
M
N
x
M
x
M
x
X
P
ここに,
x
は,
max(0
,
M
−
N
+
n)
≦
x
≦
min(M
,
n)
を満たす整数,
で表される
離散分布(2.22)。ただし,
N
=
1
,
2
,…
M
=
0
,
1
,
2
,…,
N
−
1
n
=
1
,
2
,…,
N
である。対応国際規格では,
x
の範囲の下限を
max(0
,
M
−
N)
と誤記している。
注記 1
大きさ
N
の母集団(又はロット)にマークの付いたものが
M
個あるとする。その母集団から
43
Z 8101-1
:2015 (ISO 3534-1:2006)
非復元抽出されたサンプルサイズ
n
の
単純ランダムサンプル(1.7)に含まれるマークの付い
たものの数は超幾何
分布(2.11)になる。
注記 2
超幾何分布を理解するのに
表 4 を参照するとよい。
表 4−超幾何分布の一般的な例
全体のアイテム数
マーク付きアイテム数
マークなしアイテム数
母集団
N M
N−M
サンプル内
N x
n−x
サンプル外
N−n M−x N−n−M+x
注記 3
n
が
N
と比べて小さい場合,超幾何分布は試行回数
n
,成功確率
p
=
M/N
の
2
項分布で近似さ
れる。
注記 4
超幾何分布の
母平均(2.35)は,
(nM)/N
である。超幾何分布の
母分散(2.36)は,
1
1
−
−
−
N
n
N
N
M
N
M
n
である。
2.49
負の 2 項分布 ふのにこうぶんぷ(
negative binomial distribution
)
確率質量関数(2.24)が,
(
) (
)
( )
(
)
x
c
p
p
c
x
x
c
x
X
P
−
−
−
+
=
=
1
!
1
!
!
1
,
x
=
0
,
1
,
2
,…
で表される
離散分布(2.22)。ただし,パラメータ
c
と
p
は,
c > 0
と
0 < p < 1
である。対応国際規格では,
x
の範囲の上限を
n
と誤記しているが,上限はない(上限=+∞)
。
注記 1
パラメータ
c
が
1
の負の
2
項分布は幾何分布である。幾何分布の確率質量関数は,ある
事象
(2.2)が生起する
確率(2.5)を
p
としたとき,その
事象(2.2)が
x
+
1
回目に初めて生じる
確率を表す。
注記 2
確率質量関数を,
(
)
{
}
x
c
p
p
x
c
x
X
P
−
−
−
=
=
1
)
(
のように表記してもよい。負の
2
項分布という名称は,この確率質量関数から名付けられた。
対応国際規格では,確率質量関数の右の部分
{
−
(1
−
p)}
x
を
(1
−
p)
x
と誤記している。
注記 3
パラメータ
c
が
1
以上の整数値をとるとき,定義どおりの確率質量関数は
パスカル分布
と呼ばれる。その場合の確率質量関数は,
確率(2.5)
p
の
事象(2.2)の生起する回数が
x
+
c
試行目にちょうど
c
回に達する確率をあたえる。
注記 4
負の
2
項分布の
母平均(2.35)は,
c(1
−
p)/p
である。負の
2
項分布の
母分散(2.36)は,
c(1
−
p)/p
2
である。
2.50
正規分布,ガウス分布 せいきぶんぷ,がうすぶんぷ(
normal distribution
,
Gaussian distribution
)
確率密度関数(2.26)が,
44
Z 8101-1
:2015 (ISO 3534-1:2006)
( )
(
)
2
2
2
e
2
1
σ
μ
π
σ
−
=
x
x
f
−
,−∞
< x <
+∞
で表される
連続分布(2.23)。ただし,パラメータ
μ
及び
σ
は,−∞
< μ <
+∞,
σ > 0
である。
注記 1
正規分布は統計的方法では,最もよく用いられる
確率分布(2.11)の一つである。確率密度
関数の形状から,俗に(西洋の)釣鐘型の分布と呼ばれている。正規分布は確率現象を表す
モデルであるだけではなく,
標本平均(1.15)の分布の極限でもある。また,実験の妥当性
を評価するために,統計的方法において参照用の分布としてもよく用いられている。
注記 2
正規分布で,位置母数
μ
は
母平均(2.35)であり,尺度母数
σ
は
母標準偏差(2.37)である。
2.51
標 準 正 規 分 布 ひ ょ う じ ゅ ん せ い き ぶ ん ぷ (
standardized normal distribution
,
standardized Gaussian
distribution
)
μ
=
0
,
σ
=
1
の
正規分布(2.50)。
注記
標準正規分布の
確率密度関数(2.26)は,
( )
2
2
e
2
1
x
x
f
−
π
=
,−∞
< x <
+∞
で表される。一般の数値表では,様々な
x
の値に対して,標準正規分布の確率密度関数の積分
値を正規分布表として与えている。
2.52
対数正規分布 たいすうせいきぶんぷ(
lognormal distribution
)
確率密度関数(2.26)が,
( )
(
)
2
2
2
In
e
2
1
σ
μ
π
σ
−
−
=
x
x
x
f
,
x > 0
で表される
連続分布(2.23)。ただし,パラメータ
μ
及び
σ
は,−∞
<
μ
<
+∞と
σ > 0
である。
注記 1
Y
が
母平均(2.35)
μ
,
母標準偏差(2.37)
σ
の
正規分布(2.50)に従うとき,
X
=
exp(Y)
で変
換される
X
は定義に示された確率密度関数をもつ対数正規分布に従う。逆に,
X
が定義に示
された確率密度関数をもつ対数正規分布に従うとき,
ln(X)
は母平均
μ
,母標準偏差
σ
の正規
分布に従う。
注記 2
対数正規分布の母平均は,
exp[
μ+
(σ
2
/2)]
である。対数正規分布の母分散は,
exp(2μ
+
σ
2
)
×
[exp(σ
2
)
−
1]
である。これは,対数正規分布の母平均と母分散が正規分布のパラメータ
μ
と
σ
2
の関数であることを意味している。
注記 3
対数正規分布と
ワイブル分布(2.63)は,信頼性工学の分野でよく用いられる。
2.53
t 分布,スチューデント分布 てぃーぶんぷ,すちゅーでんとぶんぷ(
t distribution
,
Student’s distribution
)
確率密度関数(2.26)が,
( )
( )
[
]
( )
( )
2
1
2
1
2
2
1
+
−
+
×
Γ
+
Γ
=
v
v
t
v
v
v
t
f
π
,−∞
< t <
+∞
で表される
連続分布(2.23)。ただし,パラメータ
v
は,正の整数である。
45
Z 8101-1
:2015 (ISO 3534-1:2006)
注記 1
母標準偏差をデータから推定した場合に,
標本平均(1.15)の評価するために
t
分布はよく用
いられている。母平均がある特定の値に等しいかどうかの判定は,
t
統計量と自由度
n
−
1
の
t
分布とを比較で可能となる。
注記 2
分子は
標準正規分布(2.51)に従う確率変数,分母は分子と独立にカイ 2 乗分布(2.57)に従
う確率変数を自由度で割って正の平方根をとったものである分数を考えたとき,その分数は
t
分布に従う。パラメータ
v
は,
自由度(2.54)と呼ばれる。
注記 3
ガンマ関数は,2.56 で定義されている。
2.54
自由度 じゆうど(
degrees of freedom
)
v
和における項の数からそれらの項に対する制約式の数を引いたもの。
注記
この概念は,
分散(2.36)の推定量(1.12)の分母に
n
−
1
を用いる理由のところで既に記述さ
れている。自由度の数はパラメータを修正するのに使われる。自由度という用語は,JIS Z 8101-3
で広く用いられており,自由度で割った平方和を平均平方と定義している。
2.55
F 分布 えふぶんぷ(
F distribution
)
確率密度関数(2.26)が,
( )
(
)
[
]
( ) (
)( ) ( )
(
)
(
)
(
)
2
2
1
1
2
2
2
2
1
2
1
2
1
2
1
1
2
1
2
2
2
v
v
v
v
v
v
x
v
x
v
v
v
v
v
v
x
f
+
−
+
Γ
Γ
+
Γ
=
,
x > 0
で表される
連続分布(2.23)。ただし,パラメータ
v
1
,
v
2
は正の整数であり,ガンマ関数は 2.56 で定義され
ている。
注記 1
F
分布は,
母分散(2.36)の比を評価するための参照用の分布である。
注記 2
独立な二つの
χ
2
分布(2.57)に従う確率変数をそれぞれの自由度(2.54)で割ったものの比
は分子の自由度
ν
1
,分母の自由度
ν
2
の
F
分布に従う。
2.56
ガンマ分布 がんまぶんぷ(
gamma distribution
)
確率密度関数(2.26)が,
( )
( )
α
β
α
β
α
Γ
=
−
−
x
x
x
f
e
1
,
x > 0
で表される
連続分布(2.23)。ただし,パラメータ
α
及び
β
は,
α > 0
及び
β > 0
である。
注記 1
ガンマ分布は,信頼性工学における故障時間の分布として用いられる。
指数分布(2.58)は,
ガンマ分布の特殊な場合である。また,故障率が時間とともに増加するモデルもガンマ分布
で表現できる。
注記 2
ガンマ関数の定義は,
( )
∞
−
−
=
Γ
0
1
d
e
x
x
x
α
α
,
α > 0
である。
α
が整数のとき,Γ
(α)
=
(α
−
1)!
である。
注記 3
ガンマ分布の
母平均(2.35)は,
αβ
である。ガンマ分布の
母分散(2.36)は,
αβ
2
である。
2.57
カイ 2 乗分布,
χ
2
分布 かいにじょうぶんぷ(
chi-squared distribution
,
χ
2
distribution
)
46
Z 8101-1
:2015 (ISO 3534-1:2006)
確率密度関数(2.26)が,
( )
( )
2
2
e
2
2
1
2
v
x
x
f
v
x
v
Γ
=
−
−
,
x > 0
で表される
連続分布(2.23)。ただし,
ν
は,
v > 0
である。
注記 1
データが
正規分布(2.50)に従い,母標準偏差(2.37)
σ
が既知である場合,統計量
nS
2
/σ
2
は自由度
n
−
1
のカイ
2
乗分布に従う。この結果から
σ
2
の信頼区間を構成できる。また,カ
イ
2
乗分布は適合度検定の参照用の分布としても用いられる。
注記 2
カイ
2
乗分布は
ガンマ分布(2.56)のパラメータを
α
=
v/2
,
β
=
2
とした場合に当たる。この
パラメータ
v
は,
自由度(2.54)と呼ばれる。
注記 3
カイ
2
乗分布の
母平均(2.35)は
v
であり,
母分散(2.36)は
2v
である。
2.58
指数分布 しすうぶんぷ(
exponential distribution
)
確率密度関数(2.26)が,
( )
β
β
x
x
f
−
−
=
e
1
,
x > 0
で表される
連続分布(2.23)。ただし,パラメータ
β
は,
β > 0
である。
注記 1
信頼性工学において,指数分布は非経年変化性又は無記憶性を表すための基本的なモデルで
ある。
注記 2
指数分布は
ガンマ分布(2.56)のパラメータ
α
を
1
とした場合に当たり,また,
カイ 2 乗分
布(2.57)のパラメータ
v
を
2
とした場合にも当たる。
注記 3
指数分布の
母平均(2.35)は
β
であり,
母分散(2.36)は
β
2
である。
2.59
ベータ分布 べーたぶんぷ(
beta distribution
)
確率密度関数(2.26)が,
( )
(
)
( ) ( )
( )
1
1
1
−
−
−
Γ
Γ
+
Γ
=
β
α
β
α
β
α
x
x
x
f
,
0
≦
x
≦
1
で表される
連続分布(2.23)。ただし,パラメータ
α
及び
β
は,
α > 0
及び
β > 0
である。
注記
ベータ分布の確率密度関数は,様々な形状(単峰型,
J
型,
U
型)をとる。ベータ分布は,比
率に関係する不確かさのモデルとして用いられる。例えば,ハリケーン保険のハリケーン被害
のモデル化において,ある与えられた風速に対する建造物の損傷率は,家屋によって異なるが,
その平均損傷率は
0.40
であるとする。母平均が
0.40
であるベータ分布は,建造物に対する損傷
率のモデルとして用いることができる。
2.60
一様分布 いちようぶんぷ(
uniform distribution
,
rectangular distribution
)
確率密度関数(2.26)が,
( )
a
b
x
f
−
=
1
,
a
≦
x
≦
b
で表される
連続分布(2.23)。
注記 1
a
=
0
,
b
=
1
の一様分布は典型的な乱数生成のもととなる分布である。
47
Z 8101-1
:2015 (ISO 3534-1:2006)
注記 2
一様分布の
母平均(2.35)は,
(a
+
b)/2
であり,
母分散(2.36)は
(b
−
a)
2
/12
である。
注記 3
a
=
0
,
b
=
1
の一様分布は,ベータ分布のパラメータを
α
=
1
,
β
=
1
とした場合に当たる。
2.61
タイプ I 極値分布,グンベル分布,二重指数分布 たいぷいちきょくちぶんぷ,ぐんべるぶんぷ,にじゅ
うしすうぶんぷ(
type I extreme value distribution
,
Gumbel distribution
)
分布関数(2.7)が,
( )
(
)
b
a
x
x
F
−
−
−
=
e
e
,−∞
<
x
<
+∞
で表される
連続分布(2.23)。ただし,パラメータ a 及び b は,−∞
< a <
+∞及び b > 0 である。
注記 極値分布は一番端の順序統計量(1.9)X
(1)
及び X
(n)
の参照用の分布を与える。n を十分に大き
くしたとき,その極限分布は 3 通りの可能性しかなく,2.61,2.62 及び 2.63 で示された三つの
タイプの極値分布のどれかである。
2.62
タイプ II 極値分布,フレシェ分布 たいぷにきょくちぶんぷ,ふれしぇぶんぷ(type II extreme value
distribution
,Fréchet distribution)
分布関数(2.7)が,
( )
k
b
a
x
x
F
−
−
−
= e
,x > a
で表される
連続分布(2.23)。パラメータ a,b 及び k は,−∞
< a <
+∞,b > 0,k > 0 である。
2.63
タイプ III 極値分布,ワイブル分布 たいぷさんきょくちぶんぷ,わいぶるぶんぷ(type III extreme value
distribution
,Weibull distribution)
分布関数(2.7)が,
( )
k
b
a
x
x
F
−
−
−
=
e
1
,x > a
で表される
連続分布(2.23)。パラメータ a,b 及び k は,−∞ < a <+∞,b > 0,k > 0 である。
注記 1 最大値,最小値の分布の極限がとり得る三つの分布のうちの一つである。ワイブル分布は様々
な応用分野,とりわけ信頼性工学で重要な分布である。ワイブル分布は多種多様なデータに
対する適合性の良いことが経験的に知られている。
注記 2 パラメータ a は,データのとり得る値の下限であるという意味での位置母数である。パラメ
ータ b は,尺度母数[ワイブル分布の
標準偏差(2.37)に関係している。]である。パラメー
タ k は形状母数である。
注記 3 k=1 のワイブル分布は,指数分布である。ワイブル分布において a=0 とし,x を 1/k 乗すれ
ば,指数分布を得ることができる。レイリー分布はワイブル分布のパラメータを a=0,k=2
とした場合に当たる。
2.64
多変量正規分布 たへんりょうせいきぶんぷ(multivariate normal distribution)
確率密度関数(2.26)が,
(
)
(
)
2
2
/
1
2
/
1
e
)
2
(
)
(
μ
μ
−
Σ
−
−
−
−
−
=
x
x
x
T
Σ
f
n
π
,各
x
の要素 x
i
は−∞ < x
i
<
+∞
48
Z 8101-1
:2015 (ISO 3534-1:2006)
で表される
連続分布(2.23)。ただし,
μ
は n 次元パラメータベクトル,Σ はパラメータを要素とする n×n
対称行列で,正値定符号行列である。太字は n 次元ベクトルを示す。対応国際規格では,確率密度関数の
中で (2
π)
−n /2
|
Σ |
−1/2
を (2
π)
− π/2
|
Σ |
−n /2
と誤記している。
注記 多変量正規分布の周辺分布(2.18)は,いずれも正規分布である。しかし,多変量正規分布の
ほかに周辺分布が正規分布となる多変量分布は数多く存在する。
2.65
2
変量正規分布 にへんりょうせいきぶんぷ(bivariate normal distribution)
確率密度関数(2.26)が,
( )
−
+
−
−
−
−
−
−
−
=
2
2
2
2
2
)
1
(
2
1
exp
1
2
1
,
y
y
y
y
x
x
x
x
y
x
y
y
x
x
y
x
f
σ
μ
σ
μ
σ
μ
ρ
σ
μ
ρ
ρ
σ
πσ
−∞ < x,y <+∞
で表される
連続分布(2.23)。ただし,μ
x
,μ
y
は,−∞ < μ
x
,μ
y
<
+∞であり,σ
x
,σ
y
,ρ は,σ
x
,σ
y
>0
,|ρ| <
1
である。
注記 1 上記の確率密度関数(2.26)をもつ確率変数の組 (X,Y) について,X 及び Y の母平均,母分
散は,E(X)=μ
x
,E(Y)=μ
y
,V(X)=σ
x
2
,V(Y)=σ
y
2
であり,X 及び Y の
母相関係数(2.44)は ρ
である。
注記 2 この 2 変量正規分布の周辺分布は,正規分布になる。Y=y という条件付きの X の分布は,X
=x という条件付きの Y の分布も同様であるが,正規分布になる。
2.66
標準 2 変量正規分布 ひょうじゅんにへんりょうせいきぶんぷ(standardized bivariate normal distribution)
標準正規分布(2.51)を周辺分布にもつ 2 変量正規分布(2.65)。
2.67
標本分布,サンプリング分布 ひょうほんぶんぷ,さんぷりんぐぶんぷ(sampling distribution)
統計量の分布。
注記 標本分布の例は,2.53 の注記 2,2.55 の注記 1 及び 2.57 の注記 1 に示されている。
2.68
確率空間 かくりつくうかん(probability space)
(
Ω ,
ℵ
,
℘
)
標本空間(2.1),
σ
集合体(2.69),確率測度(2.70)の三つ組。
例 1 単純な場合として,標本空間が工場である日に作られた全ての製品 105 個からなるとする。σ
集合体は標本空間の全ての部分集合からなる。書き下すと,空集合,
{製品 1}
,
{製品 2}
,…,
{製品 105}
,
{製品 1,製品 2}
,…,
{105 個すべての製品}である。例えば,一つの事象に属
する製品数を全製品数で割った比率で確率測度を定義することができる。その場合,事象{製
品 4,製品 27,製品 92}は,3/105 という確率をもつ。
例 2 二つ目の例として,バッテリーの寿命を取り上げる。バッテリー購入時に既に故障していた場
合,寿命を 0 時間とする。バッテリーが機能していたとすると,その寿命は
指数分布(2.58)
のようなある
確率分布(2.11)に従う。このとき観測される寿命値に,離散データ(既に故障
しているバッテリーの割合)及び連続データ(寿命値)の 2 種類が混在する。この例を簡単に
するために,全ての寿命時間は調査期間より短いと仮定し,連続値であるということを仮定し
49
Z 8101-1
:2015 (ISO 3534-1:2006)
ている。実際には,右又は左打切りデータ(例えば,寿命時間が少なくとも 5 時間であると分
かっている場合,寿命時間が 3 時間から 3.5 時間の間である場合など)が含まれる可能性があ
り,その場合にこの構造の有用性が明らかとなる。標本空間は,半直線(0 以上の実数)から
なる。σ 集合体は [0,x) の形の区間の全て及び集合 {0} を含んでいる。さらに,σ 集合体は
可算個のこれらの集合の和と,可算個のこれらの集合の共通部分の全てを含む。確率測度は,
各集合に対して確率を与える。σ 集合体には,バッテリーが既に故障しているという事象,及
びバッテリーがある正の寿命値をもつという事象も含まれる。寿命時間に関連する計算の詳細
は,別に示した。
2.69
σ
集合体,
σ
加法族 しぐましゅうごうたい,しぐまかほうぞく(sigma algebra of events,σ-algebra,sigma
field
,σ-field)
ℵ
次の性質をもつ
事象(2.2)の集合。
a)
Ω
は,
ℵ
に属する。
b)
ある事象が
ℵ
に属するならば,その
余事象(2.3)もまた
ℵ
に属する。
c)
事象列 {A
i
}
が
ℵ
に含まれるならば,和集合
∞
=1
i
i
A 及び共通部分
∞
=1
i
i
A も
ℵ
に属する。
例 1 標本空間が整数の集合であるならば,σ 集合体を整数の全ての部分集合からなる集合とするこ
とができる。
例 2 標本空間が実数の集合であるならば,σ 集合体を数直線上の区間に対応する全ての集合,並び
にそれらの有限個又は可算無限個の和集合及び共通部分を含むようにとることができる。この
例は,k 次元
区間
を考えることによってより高次元へ拡張することが可能である。特に,2
次元において,区間の集合は実数 s,t の全てに対して {(x,y) : x < s,y < t} で定義される領域
からなる。
注記 1 σ 集合体は,集合を要素としてもつ集合である。性質 a) で述べたように,全ての可能な結果
の集合である
Ω
は,σ 集合体に含まれる。
注記 2 性質 c) には σ 集合体の(高々可算無限個の)部分集合を集めるという集合演算が含まれ,可
算個のこれらの集合の和と可算個のこれらの集合の共通部分のいずれもまた σ 集合体に属す
ることを意味している。
注記 3 性質 c) は有限個の集合の和,及び共通部分をとる演算についても閉じている(演算結果が σ
集合体に属する)ことを示している。σ 集合体の記号 σ は,
ℵ
が集合の可算無限回の演算で
さえも閉じていることを強調するために用いられる。
注記 4 対応国際規格では,a) で, は に属する と誤記している。
2.70
確率測度 かくりつそくど(probability measure)
℘
次の条件 a),b) を満たす σ 集合体上で定義される非負関数。
a)
℘
(Ω)
=1
ただし,
Ω
は
標本空間(2.1),
ℵ
ℵ
50
Z 8101-1
:2015 (ISO 3534-1:2006)
b)
(
)
( )
∞
=
∞
=
℘
=
℘
1
1
i
i
i
i
A
A
ただし,{A
i
}
は互いに排反な
事象(2.2)列。
例 2.1 のバッテリー寿命の例の続きで,バッテリーが 1 時間未満で故障するという事象を考えよう。
この事象は,
{初めから機能しない}及び{初めは機能するが 1 時間未満で故障する}という二つ
の排反な事象からなる。これを {0} 及び (0,1) のように表しても等価である。{0} の確率測度
は,初めから機能しないバッテリーの割合である。集合 (0,1) の確率測度は,ある特定の故障
時間を表す連続確率分布[例えば,
指数分布(2.58)]によって定まる。
注記 1 確率測度は,σ 集合体中の各事象に対して閉区間 [0,1] 内のある値を与える。絶対生起する
ことのない事象に値 0 を,必ず生じる事象に 1 を与える。特に,確率測度は空集合に 0 を与
え,標本空間(全事象)に 1 を与える。
注記 2 性質 b) は,任意の二つの事象の共通部分に要素がないとき和集合の確率測度は個々の事象
に対する確率測度の和であることを意味している。このことは,事象の数が可算無限個であ
る場合にも成り立つ。
注記 3 確率空間の三つ組は,確率変数を介して効果的に関係付けられる。確率変数(2.10)の像集
合内の事象に対する
確率(2.5)は,標本空間内の対応する事象の確率から導かれる。確率変
数の像集合内の事象は,確率変数の像集合上へ確率変数によって移される標本空間内のもと
の事象の確率が割り当てられる。
注記 4 確率変数の像集合は実数の集合,又は n 次元実ベクトルの集合である(像集合とは,写像で
ある確率変数によって対応付けられた集合である。
)
。
51
Z 8101-1
:2015 (ISO 3534-1:2006)
附属書 A
(参考)
記号
記号
用語
英語
箇条
A
事象 event
2.2
A
c
余事象 complementary
event
2.3
ℵ
σ
集合体,σ 加法族
sigma algebra of events
,
σ-algebra,sigma field, σ-field
2.69
α
有意水準 significance
level
1.45
α,λ,μ,β,
σ,ρ,γ,
p,N,M,c,
ν,a,b,k
パラメータ parameter
2.9
β
2
(母)とがり
coefficient of kurtosis
2.40
E(X
k
)
k 次の標本モーメント
sample moment of order k 1.14
E[g(X)]
期待値
expectation of the function g of a
random variable X
2.12
F(x)
分布関数 distribution
function
2.7
f
(x)
確率密度関数
probability density function
2.26
γ
1
(母)ひずみ
coefficient of skewness
2.39
H
仮説 hypothesis 1.40
H
0
帰無仮説 null
hypothesis 1.41
H
A
,H
1
対立仮説 alternative
hypothesis
1.42
k
次元の数 dimension
k,r,s
モーメントの次数
order of a moment
1.14
,2.34,
2.41
,2.42
μ
平均 mean
2.35
ν
自由度 degrees
of
freedom
2.54
n
サンプルサイズ sample
size
Ω
標本空間 sample
space 2.1
(
Ω ,
ℵ
,
℘
)
確率空間 proba
space
2.68
P(A)
事象 A の確率
probability of an event A 2.5
P(A
|
B)
条件付き確率
conditional probability of A given B 2.6
℘
確率測度 probability
measure
2.70
r
xy
標本相関係数
sample correlation coefficient
1.23
s
標本標準偏差の実現値
observed value of a sample standard
deviation
S
標本標準偏差
sample standard deviation
1.17
S
2
標本分散,不偏分散 sample
variance
1.16
S
XY
標本共分散 sample
covariance 1.22
σ
母標準偏差,標準偏差 standard
deviation
2.37
σ
2
母分散,分散 variance
2.36
σ
XY
(母)共分散 covariance
2.43
52
Z 8101-1
:2015 (ISO 3534-1:2006)
記号
用語
英語
箇条
θ
σ
ˆ
標準誤差 standard
error 1.24
X
σ
標本平均の標準誤差
standard error of the sample mean
θ
分布のパラメータ
parameter of a distribution
θ
ˆ
推定量 estimator
1.12
V(X)
母分散,分散
variance of a random variable X 2.36
X
(
i
)
順序統計量
i
th
order statistic
1.9
x
,
y
,
z
観測値,測定値 observed
value
1.4
X
,
Y
,
Z
,
T
確率変数,変量 random
variable
2.10
X
p
,
x
p
p 分位点,100p パーセント点
p-quantile
p-fractile
100p-percentile
2.13
X ,
x
標本平均,平均,算術平均
average, sample mean
1.15
53
Z 8101-1
:2015 (ISO 3534-1:2006)
附属書 B
(参考)
統計に関するコンセプトダイアグラム
図 B.1−母集団及びサンプルに関するコンセプトダイアグラム
54
Z 8101-1
:2015 (ISO 3534-1:2006)
図 B.2−サンプルモーメントに関するコンセプトダイアグラム
55
Z 8101-1
:2015 (ISO 3534-1:2006)
図 B.3−推定に関するコンセプトダイアグラム
56
Z 8101-1
:2015 (ISO 3534-1:2006)
図 B.4−統計的検定に関するコンセプトダイアグラム
57
Z 8101-1
:2015 (ISO 3534-1:2006)
図 B.5−度数分布及び級に関するコンセプトダイアグラム
58
Z 8101-1
:2015 (ISO 3534-1:2006)
図 B.6−統計的推測に関するコンセプトダイアグラム
59
Z 8101-1
:2015 (ISO 3534-1:2006)
附属書 C
(参考)
確率に関するコンセプトダイアグラム
図 C.1−確率の基本に関するコンセプトダイアグラム
60
Z 8101-1
:2015 (ISO 3534-1:2006)
図 C.2−モーメントに関するコンセプトダイアグラム
61
Z 8101-1
:2015 (ISO 3534-1:2006)
図 C.3−確率分布に関するコンセプトダイアグラム
62
Z 8101-1
:2015 (ISO 3534-1:2006)
図 C.4−連続分布に関するコンセプトダイアグラム
63
Z 8101-1
:2015 (ISO 3534-1:2006)
附属書 D
(参考)
用語の開発に用いた方法論
D.1
序文
JIS
を普遍的に適用するためには,統計的方法の規格を使用する可能性のある全ての利用者にとって,
分かりやすく,相互に矛盾のない,調和のとれた用語が用いられていることが要求される。
概念というものは互いに独立してはいないので,統計的方法の分野で用いられる概念の相互関係を分析
し,概念の体系として整理することは,相互に矛盾のない用語を作成する上で不可欠である。このような
分析がこの規格の原案作成に際して行われた。原案作成作業で用いられたコンセプトダイアグラムは参考
として有用と考え,D.4 に採録した。
D.2
見出し語の内容及び置換えルール
概念は,言語間の変換の単位となる(一つの言語の中での変形を含む。例えば,米語,英語など)
。それ
ぞれの言語ごとに,その言語における概念を普遍的に分かりやすくするための最適な用語の選択,すなわ
ち翻訳に対する文学的ではない方法が選択される。
ある定義は,概念を明確にするために本質的な特性だけを記述することによって行われる。重要ではあ
るが,その説明に本質的ではない概念に関する情報は,その定義の参考に記述される。
用語をその定義で置き換えるとき,小さな構文上の変更は行うにしても,文章の意味が変わることは望
ましくない。このような置き換えは,定義の正確さをチェックする簡単な方法である。しかし,定義が多
くの用語を含み,意味が複雑な場合には,置き換えは一度に一つ又は多くとも二つにとどめないとうまく
いかない。用語の全文を置き換えることは,構文的に実現が難しくなり,また,意味を伝える助けになら
ないであろう。
D.3
概念の相互関係及び図示
D.3.1
一般
概念間の相互関係は
種
の特性の階層構造に基づくので,用語の定義作業において,概念の最も容易
な記述は,その
種
に名前を付けること,及びその親の概念又は兄弟の概念とを区別する特性を記述す
ることによって行える。
この附属書に示された概念間の相互関係には,三つの基本形がある。それは
一般的関係(D.3.2),部分
的関係(D.3.3)及び連関的関係(D.3.4)である。
D.3.2
一般的関係
階層内の下位概念は,上位概念の全ての特性を受け継ぎ,また,上位(親)の概念及び同位(兄弟)の
概念と区別する特性についての記述を含む。例えば, 春夏秋冬
と
季節
との関係である。
一般的関係は,矢印なしの扇又は樹形図で示される(
図 D.1 参照)。
64
Z 8101-1
:2015 (ISO 3534-1:2006)
図 D.1−一般的関係の図示
D.3.3
部分的関係
階層内の下位概念が,上位概念の構成部分を形成する。例えば, 春夏秋冬
は, 年
という概念の部
分として定義してもよい。これに対し, 晴天 (夏の一つの特性)を
年
の部分として定義するのは不
適切である。
部分的関係は矢印なしのレーキ(熊手)の記号で示される(
図 D.2 参照)。単数の部分は一本の直線で,
複数の部分は二重線で示される。
図 D.2−部分的関係の図示
D.3.4
連関的関係
連関的関係は,
一般的関係及び部分的関係で示したように簡単には記述できないが,
概念の体系の中で,
一つの概念及び他の概念の関係の性質を明確にするために役立つ。例えば,原因及び結果,活動及び位置,
活動及び結果,道具及び機能,材料,製品などである。
連関的関係は,両端に矢印のある直線で示される(
図 D.3 参照)。
図 D.3−連関的関係の図示
D.4
コンセプトダイアグラム(概念体系図)
図 B.1〜B.5 までは,この規格の箇条 1 によって定義される用語のコンセプトダイアグラムである。図
B.6
は,
図 B.1〜B.5 の中に既に登場する特定の用語の関係を示す,追加のコンセプトダイアグラムである。
図 C.1〜C.4 は,この規格の箇条 2 で定義される用語の概念図である。幾つかの用語は,複数のコンセプト
ダイアグラムに登場し,それが図をつな(繋)げる役目をしている。その用語は,以下の表のとおりであ
る。
65
Z 8101-1
:2015 (ISO 3534-1:2006)
図 B.1 母集団及びサンプルに関する概念
記述統計(1.5)
図 B.5
単純ランダムサンプル(1.7)
図 B.2
推定量(1.12)
図 B.3
検定統計量(1.52)
図 B.4
確率変数(2.10)
図 C.1,C.2
分布関数(2.7)
図 C.1
図 B.2 サンプルモーメントに関する概念
単純ランダムサンプル(1.7)
図 B.1
図 B.3 推定に関する概念
推定量(1.12)
図 B.1
パラメータ(2.9)
図 C.1
確率分布族(2.8)
図 B.4,C.1
確率密度関数(2.26)
図 C.3
確率質量関数(2.24)
図 C.3
図 B.4 統計的検定に関する概念
検定統計量(1.52)
図 B.1
確率密度関数(2.26)
図 B.3,C.3
確率質量関数(2.24)
図 B.3,C.3
確率分布族(2.8)
図 B.3,C.1
図 B.5 度数分布及び級に関する概念
記述統計(1.5)
図 B.1
図 B.6 統計的推測に関する概念
母集団(1.1)
図 B.1
サンプル(1.3)
図 B.1
観測値(1.4)
図 B.1,B.5
推定(1.36)
図 B.3
統計的検定(1.48)
図 B.4
パラメータ(2.9)
図 B.3,C.1
確率変数(2.10)
図 B.1,C.1,C.2
図 C.1 確率の基本に関する概念
確率変数(2.10)
図 B.1,C.2
確率分布(2.11)
図 C.2,C.3
確率分布族(2.8)
図 B.3,B.4
分布関数(2.7)
図 B.1
パラメータ(2.9)
図 B.3
図 C.2 モーメントに関する概念
確率変数(2.10)
図 B.1,C.1
確率分布(2.11)
図 C.1,C.3
66
Z 8101-1
:2015 (ISO 3534-1:2006)
図 C.3 確率分布に関する概念
確率分布(2.11)
図 C.1,C.2
確率質量関数(2.24)
図 B.3,B.4
連続確率分布(2.23)
図 C.4
1
変量確率分布(2.16)
図 C.4
多変量確率分布(2.17)
図 C.4
図 C.4 連続分布に関する概念
1
変量確率分布(2.16)
図 C.3
多変量確率分布(2.17)
図 C.3
連続確率分布(2.23)
図 C.3
図 C.4 に関して,正規分布,t 分布,F 分布,標準正規分布,ガンマ分布,ベータ分布,カイ 2 乗分布,
指数分布,一様分布,タイプ I 極値分布,タイプ II 極値分布,及びタイプ III 極値分布は,1 変量確率分布
の例として示されている。また,多変量正規分布,2 変量正規分布,及び標準 2 変量正規分布は,多変量
確率分布の例として示されている。1 変量確率分布(2.16)及び多変量確率分布(2.17)を概念図に入れる
と,あまりにも煩雑になるので含めていない。
67
Z 8101-1
:2015 (ISO 3534-1:2006)
参考文献
[1]
ISO 31-11:1992
,Quantities and units−Part 11: Mathematical signs ans symbols for use in the physical
sciences and technology
[2]
JIS Z 8101-2
統計−用語及び記号−第 2 部:統計の応用
注記 対応国際規格:ISO 3534-2:2006,Statistics−Vocabulary and symbols−Part 2: Applied statistics(IDT)
[3]
JIS Z 8402
(全ての部) 測定方法及び測定結果の精確さ(真度及び精度)
注記 対応国際規格:ISO 5725 (all parts),Accuracy (trueness and precision) of measurement methods and
results
(IDT)
[4]
TS Z 0032
:2012 国際計量計測用語−基本及び一般概念並びに関連用語(VIM)
注記 対応国際規格:ISO/IEC Guide 99,International vocabulary of metrology−Basic and general concepts
and associated terms (VIM)
(IDT)