1. 重回帰分析
    1. データの読み込み
      まず,csv形式と呼ばれる,個々のデータがコンマで区切られた形式の データファイルを読み込む.
      1. メニューの「データ」から, 「データのインポート」→ 「テキストファイルまたはクリップボードから」を選ぶ.



      2. 読み込んだデータに R 用の名前(データセット名)を指定して, ファイルの形式の詳細を指定する.下の例では,@データセット名が「Tairyoku」, Aファイルの1行目に変数名があることをチェック,Bフィールドの区切り記号が カンマであること(フィールドとは,データファイルの列のこと), C小数点の記号がピリオドであること,を指定している.これらを指定してから, 一番下の「OK」ボタンを押す.



      3. 読み込むデータファイルを指定する.



      4. 読み込んだデータの中身を確認しよう. メニューの下にある「データセットの編集」ボタンを押すと, 読み込んだデータが表示され,修正もできる.データを見るだけなら, 「データセットを表示」ボタンでもいいが,そのボタンを押すと ハングアップする不具合があるみたいだから,押さないように.




          読み込んだデータセットは,5つの変数 No,throw,grip,height,weight をもつ.


    2. 散布図行列を表示する
      読み込んだデータの変数 throw,grip,height,weight をペアにして, 散布図の表(散布図行列)を描くことにする.
      1. メニューの「グラフ」から, 「散布図行列」を選ぶ.



      2. 表示対象の変数 throw,grip,height,weight を選ぶ.複数の変数を 選ぶときは,2個目以降はCtrl キーを押しながら選択しよう. 各散布図に最小2乗法による直線を表示するか,散布図の中心を通る滑らかな 曲線(平滑線)を描くかを指定することができる.さらに,行列の対角線上に 描くグラフの種類を指定することができる.ここでは,ヒストグラムを 選んである.



      3. 散布図行列が表示された.



    3. 重回帰分析
      1. メニューの「統計量」から, 「モデルへの適合」→「線形回帰」を選ぶ.



      2. 目的変数(y)と説明変数(x1,x2,...)を選ぶ.説明変数を2個以上選ぶときは, コントロールキー(Ctrl)を押しながら,クリックすること.



      3. 下のような回帰分析の結果が得られる.
        1. Residuals の項には残差(residual)の最小値(Min)と,第1四分位点(1Q),中央値(Median),第3四分位点(3Q),最大値(Max) が表示されている.throw(遠投)が,grip(握力)とheight(身長),weight(体重)の線形結合と切片(定数)の和で表されるというモデルが,データに当てはまっているならば, 残差は 0 を中心に対称な分布をするはずなので, 中央値は0に近い値をとり,Min=-Max, 1Q=-3Q という関係が近似的に成り立つはず. この結果は,中央値がやや0より大きくなっているが,データ数が15個ではこの程度の ズレはありうる.
        2. Coefficients の項には,回帰係数(Regression Coefficient) の推定結果が表れている.Estimate の列では,縦から順に切片(Intercept)が-13.2173,握力(grip) の係数が 0.2014,身長(height) の係数が 0.1710,体重(weight) の係数が 0.1249 という推定値(Estimate)が得られたことがわかる.Std.Error の列でも同様に上から順に,切片, 握力,身長,体重の標準誤差(Standard Error)が得られている.また,t value の列には推定値÷標準誤差である t-値(t value) が,P(>|t|) の列には t-値より 大きくなる確率である P-値が得られている.この結果から,真の回帰係数が 0 であるかどうかの仮説検定ができる.もし,有意水準 5%の検定を行うのであれば,P-値が0.05 より小さくなければならないが,どの係数に関しても 0.05 より大きいので, 回帰係数が 0 である帰無仮説が棄却できない.つまり,各回帰係数が有意に0と異なる とは言えないので,遠投にどの要素も効果があるとは言えないことがわかる.言うまでもなく,5%で有意でなければ1%でも有意ではない.
        3. 最後の3行には,誤差分散の推定値が 2.532 であること,寄与率(重相関係数)が 0.6913,自由度調整済み寄与率が 0.6072 であること,回帰係数が全て 0 である帰無仮説を仮説検定するためにF統計量(授業のプリント8ページのW)の値(F-値)が 8.213で, その自由度が (3,11) で,その P-値が 0.003774 であることがわかる. P-値が0.01より小さいので,すべての回帰係数が 0 であるという帰無仮説が有意水準1%でも棄却され,握力,身長,体重の要因が複合的に遠投に影響していることがわかる.