統計用語つづき1
正規分布
(a)大量生産品の部品の寸法を精密に計測した計測値をヒストグラムに描くと計測値にはいろいろの誤差を含んでおり釣り鐘上のグラフになる。こうした誤差を生む原因は製造、計測にかかわる複雑な多くの要因がかかわっているためである。このように多数の原因が互いに不規則に作用するとき、そのデータの分布は正規分布になる。
(b)正規分布は連続型確率変数の分布であり、変数域は−∞から+∞までの実数値をとる。確率密度関数は次のように示される。
![]()
正規分布の母数は平均値μと分散
である。
(c)正規分布の特定の確率変数xに対する一つの確率は決まらない。
(d)正規分布の変数xを次式のように変換(z変換)すると確率密度関数
は簡単な形になる。
![]()
この形の正規分布を標準正規分布という。標準正規分布では分布の平均値は0、分散は1である。
(e)標準正規分布の次の式で表せる数値が計算され数値表になっている。
![]()
この数値表は標準正規曲線の中心z=0から任意の値
までの面積の割合を示す。
(f)次表は検定や推定で使用される標準正規分布の重要な値である。
![]()
![]()
(*1)例−加工寸法の誤差が正規分布をする量産品の工程では平均値からの偏差が標準偏差の3倍を越えるものの発生は0.3%以下である。
(*2)例−危険率5%のZ検定(両側検定)を行う場合、Z変数の棄却限界値は1.96である。(g)ワークシート統計関数NORMDIST/NORMINV/NORMSDIST/NORMSINVを参照のこと。
標準化
一般の正規分布を平均が0,標準偏差が1の標準正規分布に変換すること。標準化のための変数変換は次式による。
![]()
μ、σは正規分布の平均と、標準偏差、xは正規分布の標本データこの変換をZ変換という。正規分布の統計表は標準正規分布により作成されている。ワークシート統計関数STANDARDIZEにより求めることができる。
Z検定
1 Z検定(その1)
(a)標準偏差既知の母集団の平均がある値xに等しいかどうかを検定する。
(b)帰無仮説は「母集団の平均値はある値xに等しい」とする。
(c)次の値Zを求める。
![]()
(d)危険率αに対する棄却限界値は次の通り。
![]()
(e)Z値が棄却限界値より大の場合は帰無仮説を棄却し、母集団の平均値はある値xに等しくないと判断する。
2 Z検定(その2)
(a)2標本X、Yの母集団の平均値がある値に等しいかどうかを検定する。ただし、母集団の標準偏差は既知とする。
(b)帰無仮説は「2つの母集団の平均値は等しい」である。
(c)次の統計量Zを求める。
![]()
![]()
(d)1(d)(e)に従って帰無仮説を棄却するかどうかを判定する。
指数分布
(a)ある事象の発生間隔時間が一定であるような事象のある時間間隔の発生確率の確率分布である。
(b)例−ある町では平均して2ヶ月に1回交通事故の死亡者が発生するとする。
x月の間に死亡者が発生する確率は次の通りである。
x月間 1 2 3 4 5 6 死亡者の発生確率 0.393 0.632 0.777 0.868 0.915 0.950 (c)確率分布の確率変数は連続型確率変数である。このため確率変数xに対する単独の確率は決まらず、確率分布P(x)は確率密度関数
として次のようになる。
確率分布の母数
は事象発生の平均間隔(時間)である。
(d)変数
がある値
を超えない確率は次の分布関数で求める。
(b)の例は本分布関数で計算したものである。
(e)ワークシート統計関数EXPONDISTにより求めることができる。
t分布
(a)小数の標本データから母集団の母数の推定やまたは平均値に関する検定をする場合に有用な確率分布である。
(b)母集団の分散が不明な場合は標本から求めた標準偏差
を利用するしかない。この標本標準偏差
を利用した場合の、下記に示す確率変数tの確率分布がt分布である。
![]()
(c)t分布の確率密度関数はガンマ関数を使った式で与えられることが証明されている。この式で定められる分布を自由度n-1のt分布という。
(d)t分布は正規分布をする母集団から抜き取った(抽出)標本を前提にしている。ただし正規分布の前提が正しく満たされていなくても平均値の推定や検定にt分布を利用することができる。
(e)標本データの数が50以上の場合は正規分布を利用しても誤差は小さいので実用上差し支えはない。
(f)ワークシート統計関数TDIST/TINVを参照のこと。
t検定(その1)
(a)標本データが
のように対になっている場合、xに対応する母平均
とyに対応する母平均
が等しいか どうかを検定する。(b)帰無仮説は「母平均
と
は等しい」である。
(c)統計量t
対になったデータの差を
とする。
![]()
![]()
![]()
(d)自由度φ=n-1
(e)危険率(有意水準)αと自由度φに対する棄却限界値t(α、φ)をt分布表から求める。ワークシート統計関数TINVから求めることもできる。
(f)tの絶対値が棄却限界値より大であれば帰無仮説を棄却し、「対の母平均
と
は等しくない」と判断する。
(g)この検定法はデータが対になっているという情報を利用しているので、通常の平均値の差の検定より精度のよい検定が期待できる。
(h)ワークシート統計関数TTESTにより2の検定を行うことができる。
t検定(その2)
(a)母分散は未知であるが母分散は等しいと考えられる場合の2つの平均値の差の検定である。
(b)母分散の不偏推定量は次式で求められる。
(c)帰無仮説は「両母集団の平均値は等しい」である。
![]()
(d)対立仮説は次のいずれかである。
![]()
(e)統計量tは次式で表される。
![]()
(f)
![]()
(g)危険率(有意水準)をαとした時、帰無仮説の棄却限界値t(α、φ)をt分布表などから求める。ワークシート統計関数TINVから求めることもできる。
(h)例えば危険率を0.05とした場合、両側検定ではα=0.05/2、片側検定ではα=0.05として棄却限界値t(α、φ)を求める。
(i)
ならば帰無仮説を棄却し、対立仮説を採択する。
ならば帰無仮説を保留する。
(j)この検定では母分散は等しいと仮定したことが正しいかどうかを確認した方がよい。この場合はF検定を利用する。
(k)ワークシート統計関数TTESTによりこの検定を行うことができる。
t検定(その3)
(a)母分散は未知であり、かつ母分散は等しくないと考えられる場合の2つの平均値の差の検定である。
(b)母分散の不偏推定量は次式で求められる。
(c)帰無仮説は「両母集団の平均値は等しい」である。
![]()
(d)対立仮説は次のようになる。
(e)統計量tは次式による。
![]()
(f)自由度は次式により計算して最も近い整数値をとる。
![]()
(g)危険率(有意水準)をαとした時、帰無仮説の棄却限界値t(α、φ)をt分布表などから求める。
ワークシート統計関数TINVから求めることもできる。(h)例えば危険率を0.05とした場合、両側検定ではα=0.05/2、片側検定ではα=0.05として棄却限界値t(α、φ)を求める。
(i)|t|>t(α、φ) ならば帰無仮説を棄却し、対立仮説を採択する。
ならば帰無仮説を保留する。
(j)本t検定に関してはいろいろの解法が提案されているが、Excelはここに説明したWelchの方法を採用している。
(k)ワークシート統計関数TTESTによりこの検定を行うことができる。