課題1

締切:8月8日締切
提出先:A棟2階教務前レポートボックス,または,A732(阪本の研究室)
形式:A4縦置き横書き(表題・名前入り表紙付き).R(コマンダー)を使って,以下の問題に答えること.結果の説明に必要な R の出力を添付し,その中のどの部分から結論が得られるのか明示すること.
  1. ガラパゴス諸島のデータに対して,
    1. 回帰式を最小2乗法により求めよ.
    2. 誤差分散の推定量,重相関係数,寄与率,自由度調整済み寄与率を求めよ.
    3. 回帰係数が全てゼロであるかどうか仮説検定を行え.
  2. 嗜好度(日本語タグ英語タグ)のデータについて,
    1. 累積寄与率90%以上になる主成分を求め,それぞれの主成分はどのような尺度と考えられるか考察しなさい.
    2. 横軸が第1主成分,縦軸が第2主成分の散布図を描き,その散布図に食品名を書き入れることで,主成分の意味が食品の特徴をとらえているかどうかを確認しなさい.
  3. ただし,変数は,
      g1(15歳以下男),g2(16〜20歳男),g3(21〜30歳男),g4(31〜40歳男),g5(41歳以上男),
      g6(15歳以下女),g7(16〜20歳女),g8(21〜30歳女),g9(31〜40歳女),g10(41歳以上女)
    を意味し,それぞれのデータは,変数の表す群に属する人(50〜121人)の,各食品の好き嫌い(1〜9点)の平均点である.得点が高いほど好き,低いほど嫌いを意味する.
  4. アイリスデータは,3種類(setosa,versicolor, virginica)のアイリス(あやめ)に 関する,蕚(がく)片(sepal)の長さ(Length)と幅(Width),花びらの 長さ(Length)と幅(Width)のデータである.
    1. 種類ごとに色分けした,散布図行列を描き,どの変数が 判別に有効であるか,検討せよ.
    2. B-W法による第1判別得点のグループ別ヒストグラムを描き, 第1判別得点による判別能力を吟味しなさい.
    3. B-W法による第1判別得点と第2判別得点の散布図をグループ別に描き, 第1および第2判別得点の判別能力を吟味しなさい.
    4. 蕚(がく)片の長さが5.5と幅が3.2,花びらの 長さ5.3と幅1.5のアイリスは,どの種類であるか, マハラノビスの距離による方法と B-W 法の2つの方法で, 判別しなさい.