分析ツール

分散分析:一元配置
分散分析:繰り返しのある二元配置
分散分析:繰り返しのない二元配置
相関:2変数の関係の指標
共分散:2変数の関係の指標
基本統計量:標本の各種代表値
指数平滑:変動を均らして標本の推移をみる
F検定:2標本の分散検定
フーリェ解析:
ヒストグラム:度数分布表とパレート図
移動平均:変動を均らして標本の推移をみる
乱数発生:各種分布の標本データ生成
順位と百分位数:順位統計量を求める
回帰分析:変数Xと変数Yの関係の分析
サンプリング:母集団より標本を抜き取る
t検定:一対の標本による平均の検定
t検定:等分散を仮定した2標本の平均値検定
t検定:分散が等しくないと仮定した
   2標本の平均値検定
Z検定:2標本による平均値検定

分散分析:一元配置
分散分析:繰り返しのある二元配置
分散分析:繰り返しのない二元配置

1 概要

(a)分散分析
(b)効果要因(「グループ」)が一種の場合は分散分析(一元配置)を使う。効果要因が二種の場合は分散分析(二元配置)を使う。
(c)例−ある化学合成において温度を200,220,250℃の3種類に設定して実験するものとする。また各温度の設定で複数回の実験を行いデータを取るものとする。この実験の場合「温度」を効果要因という。また3種類の設定温度を水準という。この実験は一元配置の分散分析になる。温度とさらに圧力をそれぞれ何種類かに設定して実験する場合は「温度」と「圧力」2効果要因の二元配置の分散分析になる。
(d)帰無仮説は「各効果要因、水準間の平均値は等しい」である。 検定
(e)一元配置の場合は各水準のデータ数は同じでなくてもよい。 

2 分析結果

(a)「グループ」:効果要因における水準(級ともいう)
(b)「変動」:データの平方和 平方和
(c)「自由度」:自由度
(d)「分散」:変動を自由度で割った値 不偏分散
(e)「観測された分散比」:級(グループ)内変動に対する級(グループ)間変動の比(分散比F)を表す。
(f)「P-値」:(e)で求めたF値のF確率分布における出現確率。この値がユーザが定めた危険率αより小さい場合、帰無仮説は棄却される。ワークシート統計関数FDISTと同じ結果を与える。
(g)「F境界値」:危険率、自由度に対するF確率分布より求まる棄却限界値。統計表(F分布臨界値)より求まる値。(e)で求めた分散比Fがこの値より大きい場合、帰無仮説は棄却される。ワークシート統計関数FINVと同じ結果を与える。   

相関

(a)二つ以上の標本間の関係の強さを示す相関係数行列を求める。 相関係数
(b)ワークシート統計関数CORREL,PEARSONは二つの標本間の相関係数を与える。   

共分散

(a)二つ以上の標本間の関係の強さを示す一つの指標である共分散行列を求める。 共分散
(b)このツールでは、偏差の積和をデータ数nではなくn−1で割り算をしているので注意すること。
(c)ワークシート統計関数COVARは二つの標本間の共分散を与える。計算にはデータ数nを使用している。   

基本統計量

1 概要

標本の性格を表す基本的な代表値(統計量)を求める。

2 分析結果

(a)「平均」、「最小」、「最大」、「合計」、「標本数」略
(b)「標準誤差」:母集団平均値(母平均)の推定値の標準偏差 標準誤差
(c)「中央値(メジアン)」:標本データを昇順に並べた場合の中央順位のデータ
標本数が偶数個の場合は中央に近い2個のデータの平均値を取る。ワークシート統計関数MEDIANと同じ結果を与える。
(d)「最頻値(モード)」:標本データの内、最も個数の多いデータ 
最頻値がない場合は「#N/A」が表示される。ワークシート統計関数MODEと同じ結果を与える。
(e)「標準偏差」:データの偏りを示す指標である。(f)の不偏分散の平方根である。データ数が少ない場合はこの結果は利用しない方がよい。ワークシート統計関数STDEVと同じ結果を与える。
(f)「分散」:データの偏りを示す指標である。偏差平方和をデータ数n-1で割って求めている。即ち母集団の分散(母分散)の不偏推定量(不偏分散)である。ワークシート統計関数VARと同じ結果を与える。
(g)「尖度(せんど)」:標本分布のまとまり具合の指標である。尖度が正の場合は正規分布に比べて平均値近くのデータの偏りがより小さいことを示す。標準偏差が0の場合はエラー値「#DIV/0!」を表示する。ワークシート統計関数KURTと同じ結果を与える。
(h)「歪度(わいど)」:標本分布の歪み具合の指標である。平均値の左右が均等な分布の場合は0となる。正の場合は正の方向に長く偏った分布を示す。標準偏差が0の場合はエラー値「#DIV/0!」を表示する。ワークシート統計関数SKEWと同じ結果を与える。
(i)「最大値(n)」、「最小値(n)」:標本データにおけるn番目に大きなデータ、又は小さなデータを示す。nは基本統計量のダイアログボックスで指定する。
(j)「信頼区間(95.0%)」:母集団の標準偏差が未知の条件で、母集団の平均値を危険率5%で推定する場合の標本平均からの上下の区間巾を与える。 母平均の推定

指数平滑

1 概要

時系列で得られたデータについて、前の3データの影響を反映して次のデータを予測する。時系列データの偏りを平滑化するように順次、先のデータを生成する。

F検定:2標本を使った分散の検定

1 概要

(a)2標本(「変数1」、「変数2」)のばらつき(分散)を分析して、そのばらつきが偶然に発生するばらつきより十分大きく有意な意味があるかどうかをF確率分布を利用して判定する。 検定 F分布 F検定
(b)帰無仮説は「2標本の分散は等しい」である。両側検定を行う。
(c)2標本のデータ数は同じでなくてもよい。
(d)ワークシート統計関数FTESTは片側検定なので注意する。

2 分析結果

(a)「分散」:不偏分散
(b)「観測された分散比」:2標本の分散の比Fを示す。分散比Fが1より大になるよう、「変数1」、「変数2」を決めた方がよい。
(c)「P(F<=f)」:F分布より求めた(b)の分散比Fの出現確率。この値がユーザが定めた危険率αより小さい場合、仮説は棄却され「2標本の分散は異なる」と判定する。
(d)「F境界値」:危険率、自由度に対するF確率分布より求まる棄却限界値。統計表(F分布臨界値)より求まる値。
(b)で求めたF値がこの値より大きい場合、帰無仮説は棄却される。ワークシート統計関数FINVと同じ結果を与える。

ヒストグラム

(a)標本データの分布の形を観察することができる「ヒストグラム」又は「パレート図」を作画する。
(b)「データ区間」にはデータをクラス分けする場合の各々のクラスの上限値を入れる。例えば10、20、30と「データ区間」を決めた場合、2番目のクラスには(11,20)のデータの度数が入る。
(c)標本データは複数の列(行)に記入されてもよい。欠損値があってもよい。
(d)「ヒストグラム」又は「パレート図」のどちらかを選択して作画する。

移動平均

1 概要

(a)標本の個々の変動を押さえた形で、標本の推移を観察できる「移動平均」を求める。
(b)標本データは1列(行)に記入する。
(c)「区間数」:平均を求めるデータの個数
(d)欠損値がある場合は「区間数−欠損データ数」のデータにより平均を求める。

2 分析結果

(a)「標準誤差」:標本データ、移動平均の各々の2乗差の平均平方根

乱数発生

(a)各種の確率分布に従った数値データ(「乱数」)を生成する。
(b)「分布」:生成する数値データの確率分布を選択する。
(c)「パラメタ」:選択した確率分布の母数を指定する。
(d)「ランダムシード」:数値を指定すると「変数の数」に2以上の数値を指定した場合、異なる種類の数値データが生成される。


順位と百分位数

(a)標本データを降順に並べた場合の順位(順位統計量という)及び昇順に並べた場合の百分位数(パーセントランク)を求める。
(b)複数の列(行)を指定した場合は各列(行)の標本ごとに順位、百分位数を求める。
(c)欠損データがあってもよい。
(d)ワークシート統計関数PERCENTRANKと同じ結果を与える。

回帰分析

1 概要

(a)従属変数(Y)に対する独立変数(X)が2個以上の重回帰分析にも対応している。
(b)「定数に0を使用」(回帰分析ダイアログボックス)をチェックすると、データを標準化した場合の回帰分析を行う。 標準化
(c)「有意水準」:回帰分析の結果が有意かどうかの検定(分散分析)で使う危険率。 検定

2 分析結果

2-1 概要(回帰分析)

(a)「重決定R2」:回帰式の当てはまりの良さを評価する指標である。決定係数ともいう。回帰予測値の分散と実測値(Y)の分散の比で求められる。
(b)「重相関R」:回帰式の当てはまりの良さを評価する指標である。重相関係数という。「重決定R2」の平方根である。この値は独立変数Xの数が増えると大きくなるが、回帰式の精度がよくなったとは限らない。独立変数の数に比べて観測データ数が十分多くない場合は注意が必要である。 
(c)「補正R2」:この値の平方根は自由度調整済み重相関係数と呼ばれる。重相関係数が独立変数Xの数により増える性質を補正するものである。
(d)「標準誤差」:残差の標準誤差である。 標準誤差
(e)「観測数」:観測データの数

2-2 分散分析表 

(a)「分散分析表」:分散分析
(b)「係数」:偏回帰係数と呼ばれる。観測データより求まった回帰式の各独立変数の係数である。切片に対する係数は回帰式の定数項である。 
(c)「標準誤差」:偏回帰係数の標準誤差である。母集団より繰り返し観測データを取って回帰係数を求める場合の回帰精度の指標と考えられる。 標準誤差
(d)「t」:「係数」を「標準誤差」で割って求めた値である。観測データより求めた統計量tである。 
(e)「P-値」:(d)で求めた統計量tのt確率分布における出現確率である。この値がユーザが決める危険率αより小さい場合は回帰係数は有意と判定する。 
(f)「下限95%」「上限95%」:t確率分布より求めた、危険率5%の両側検定の棄却限界値である。(d)で求めた統計量tがこの値より大の場合は回帰係数は有意と判定する。

2-3 残差出力 

(a)「予測値Y」:独立変数の観測値から回帰式により予測した従属変数Yの値である。
(b)「残差」:観測値Yと予測値Yの差 
(c)「標準残差」:「残差」を残差の標準誤差で割った値である。 標準誤差

   

サンプリング

(a)有限母集団のデータから標本をランダムに抜き取り、標本データを生成する。
(b)同一の標本を2度抜き取る場合もあるので注意する。

t検定:一対の標本による平均の検定

1 概要

(a)「右手と左手の握力が等しいか」、「N個のサンプルを使って分析計A、Bにより計測したN組のデータにより分析計に差があるかどうか」を検定する場合が一対の標本の例である。
(b)帰無仮説は「変数1」−「変数2」の平均はある仮説平均(通常0)に等しい」である。
(c)2標本の母集団の分散は等しいと仮定する。
(d)標本データは同じ数とする。

2 分析結果

(a)「ピアソン相関」:相関係数
(b)「自由度」:自由度
(c)「t」:標本データより観測された統計量t t検定(その1)
(d)「P(T<=t)片側、両側」:片側検定、両側検定の場合の(c)の統計量tのt確率分布から求まる出現確率。
 この値が危険率αより小さい場合、帰無仮説は棄却され、2標本の平均は仮説平均とは異なると判定する。
 ワークシート統計関数TDISTと同じ結果を与える。
(e)「t境界値 片側、両側」:は指定した危険率αの場合のt確率分布から求まる棄却限界値。(c)の統計量tの値がこの値より大きい場合、帰無仮説は棄却される。

t検定:等分散を仮定した2標本による検定
t検定:分散が等しくないと仮定した2標本による検定

1 概要

(a)2標本(「変数1」、「変数2」)の平均値に差があるかどうかをt確率分布を利用して検定する。 検定 t検定(その2) t検定(その3)
(b)母集団の分散が未知の仮定による検定である。
(c)帰無仮説は「2標本の母集団の平均値は同じ」である。
(d)2標本のデータ数は同数でなくてもよい。
(e)「仮説平均との差」

2 分析結果

(a)「分散」:2標本の母集団の分散推定量である。 不偏分散
(b)「プールされた分散」:t検定(その2)
(c)「t」:標本より観測された統計量t
(d)「P(T<=t)片側、両側」:片側検定、両側検定の場合の、統計量tのt確率 分布から求まる出現確率。この値がユーザが定めた危険率αより小さい場合、帰無仮説は棄却され、2標本の平均は異なると判定する。ワークシート統計関数TDISTと同じ結果を与える。
(e)「t境界値 片側、両側」:はユーザが定めた危険率αによりt確率分布から求まる棄却限界値。(c)の統計量tがこの値より大きい場合、帰無仮説は棄却される。ワークシート統計関数TINVと同じ結果を与える。

3 その他

 等分散を仮定したt検定を利用する場合は、念のためF検定により「等分散の帰無仮説」が棄却されないことを確認した方がよい。

   

Z検定:2標本による平均の検定

1 概要

(a)大標本(標本数100以上)に適用できる標準正規分布を利用した検定である。2標本(「変数1」、「変数2」)の平均値がある仮説平均に等しいかどうかを検定する。 検定 正規分布 Z検定
(b)2標本(「変数1」、「変数2」)の平均値に差があるかどうかの検定の場合は「仮説平均」を0とする。
(c)2標本の分散は既知を仮定しているので必ず入力する。
(d)帰無仮説は「2標本の母集団の平均はある仮説平均に等しい」又は「2標本の母集団の平均は等しい」である。
(e)2標本の標本データ数は同数でなくてもよい。

2 分析結果

(a)「Z」:標本より観測された統計量Zの値 Z検定
(b)「P(Z<=z)片側、両側」:片側検定、両側検定の場合の(a)の統計量Zの標準 正規分布から求まる出現確率。この値が危険率αより小さい場合、帰無仮説は棄却され、2標本の平均は仮説平均とは異なると判定する。
(c)「Z境界値 片側、両側」:はユーザが定めた危険率αにより、標準正規分布から求まる棄却限界値。(a)の統計量Zの値がこの値より大きい場合、帰無仮説は棄却される。


ホームへ戻る