- 重回帰分析
- データの読み込み
まず,csv形式と呼ばれる,個々のデータがコンマで区切られた形式の
データファイルを読み込む.
- メニューの「データ」から,
「データのインポート」→
「テキストファイルまたはクリップボードから」を選ぶ.
- 読み込んだデータに R 用の名前(データセット名)を指定して,
ファイルの形式の詳細を指定する.下の例では,@データセット名が「Tairyoku」,
Aファイルの1行目に変数名があることをチェック,Bフィールドの区切り記号が
カンマであること(フィールドとは,データファイルの列のこと),
C小数点の記号がピリオドであること,を指定している.これらを指定してから,
一番下の「OK」ボタンを押す.
- 読み込むデータファイルを指定する.
- 読み込んだデータの中身を確認しよう.
メニューの下にある「データセットの編集」ボタンを押すと,
読み込んだデータが表示され,修正もできる.データを見るだけなら,
「データセットを表示」ボタンでもいいが,そのボタンを押すと
ハングアップする不具合があるみたいだから,押さないように.
読み込んだデータセットは,5つの変数 No,throw,grip,height,weight をもつ.
- 散布図行列を表示する
読み込んだデータの変数 throw,grip,height,weight をペアにして,
散布図の表(散布図行列)を描くことにする.
- メニューの「グラフ」から, 「散布図行列」を選ぶ.
- 表示対象の変数 throw,grip,height,weight を選ぶ.複数の変数を
選ぶときは,2個目以降はCtrl キーを押しながら選択しよう.
各散布図に最小2乗法による直線を表示するか,散布図の中心を通る滑らかな
曲線(平滑線)を描くかを指定することができる.さらに,行列の対角線上に
描くグラフの種類を指定することができる.ここでは,ヒストグラムを
選んである.
- 散布図行列が表示された.
- 重回帰分析
- メニューの「統計量」から, 「モデルへの適合」→「線形回帰」を選ぶ.
- 目的変数(y)と説明変数(x1,x2,...)を選ぶ.説明変数を2個以上選ぶときは,
コントロールキー(Ctrl)を押しながら,クリックすること.
- 下のような回帰分析の結果が得られる.
- Residuals の項には残差(residual)の最小値(Min)と,第1四分位点(1Q),中央値(Median),第3四分位点(3Q),最大値(Max) が表示されている.throw(遠投)が,grip(握力)とheight(身長),weight(体重)の線形結合と切片(定数)の和で表されるというモデルが,データに当てはまっているならば,
残差は 0 を中心に対称な分布をするはずなので,
中央値は0に近い値をとり,Min=-Max, 1Q=-3Q という関係が近似的に成り立つはず.
この結果は,中央値がやや0より大きくなっているが,データ数が15個ではこの程度の
ズレはありうる.
- Coefficients の項には,回帰係数(Regression Coefficient) の推定結果が表れている.Estimate の列では,縦から順に切片(Intercept)が-13.2173,握力(grip) の係数が
0.2014,身長(height) の係数が 0.1710,体重(weight) の係数が 0.1249 という推定値(Estimate)が得られたことがわかる.Std.Error の列でも同様に上から順に,切片,
握力,身長,体重の標準誤差(Standard Error)が得られている.また,t value の列には推定値÷標準誤差である t-値(t value) が,P(>|t|) の列には t-値より
大きくなる確率である P-値が得られている.この結果から,真の回帰係数が 0 であるかどうかの仮説検定ができる.もし,有意水準 5%の検定を行うのであれば,P-値が0.05
より小さくなければならないが,どの係数に関しても 0.05 より大きいので,
回帰係数が 0 である帰無仮説が棄却できない.つまり,各回帰係数が有意に0と異なる
とは言えないので,遠投にどの要素も効果があるとは言えないことがわかる.言うまでもなく,5%で有意でなければ1%でも有意ではない.
- 最後の3行には,誤差分散の推定値が 2.532 であること,寄与率(重相関係数)が 0.6913,自由度調整済み寄与率が 0.6072 であること,回帰係数が全て 0 である帰無仮説を仮説検定するためにF統計量(授業のプリント8ページのW)の値(F-値)が 8.213で,
その自由度が (3,11) で,その P-値が 0.003774 であることがわかる.
P-値が0.01より小さいので,すべての回帰係数が 0 であるという帰無仮説が有意水準1%でも棄却され,握力,身長,体重の要因が複合的に遠投に影響していることがわかる.