相関係数の見方について *************質問************** 回帰分析を行なう際、散布図にて傾向を確認したのち相関係数rが0.6以上を目 安として相関があるものと判断しておりますが、先日次の様な記述を見つけて とまどってしまいました。 表.相関係数の有意水準 試料の数n rの有意水準(危険率5%) 3 0.997 4 0.950 5 0.878 6 0.811 7 0.754 8 0.707 9 0.666 10 0.632 20 0.444 30 0.349 出典 推計学のすすめ‐決定と計画の科学(ブルーバックスB-116)     株式会社 講談社  佐藤 信 数字の根拠もそうですが、相関係数をnが3や4で判断しようとするところが解 せませんでした。 お忙しい所申し訳ありませんが、以上の内容に関する見解をお聞かせ下さい。 **********回答********* 最初に、ご質問の内容のうち、なぜあのような表があるのかについて述べ、その後に、なぜ、n=3 のよう な場合が表に載っているのかについてコメントします。 ところで、ご質問の「回帰分析において」という言葉について、相関係数の大小を議論する最も単純な状 況は「相関分析」でありますので、主に「相関分析において」の観点から説明させて頂きます。両者の結果 は、非常に良く対応しておりますが、相関分析が2つの変量の関係を見るのに対して、回帰分析は1つの変 量で他方の変量を説明したり予測したりといったように、解析によって目的が違うからです。 まず、回帰分析において、相関係数 r が 0.6 以上を目安とされているそうですが、このとき、サンプル の大きさ n も大切な情報であります。 と言いますのは、データから計算される、相関係数(厳密には、標本相関係数、とも言います)r も統計 量でありますので、データのばらつきの影響を受け、相関係数の真の値(母相関係数)の付近でバラツキま す。 このとき、標本平均(xバー)の時と同じく、標本の大きさ n が小さいと、大きくバラツキます。つまり 、-1 から 1 まで動く r が、たとえ 1 の近くであっても、それが 1)真の相関係数の値が 1 に近いことが現れた (本当は、両者には強い正の相関関係がある:対立仮説) のか 2)真の相関係数はほぼ 0 だが、単なるばらつきの結果 (本当は、両者には関係は無い。無相関である:帰無仮説) なのかが区別がつきません。 そこで、無相関の検定(真の相関係数が 0 かどうかの検定)という手法があり、標本相関係数 r が、 (0 から)意味がある差があるという判断の基準が、ご質問の中にあった表です。これは、表を見れば分 りますように、標本の大きさ n によって、基準となる限界値( n=3 のときは、0.997 )が異なります。 例えば、標本の大きさ n が 30 のときですと、相関係数 |r| (r の絶対値)が 0.349 以上あれば、 単なる偶然のばらつきではなく意味のある差だと判断し、|r| がそれ以下だと、意味のある差ではないと 判断します。 ご質問頂いた「表」の意味と使い方は以上の通りです。 また、簡単のために有意水準として 5% の場合だけを表記されていますが、場合によっては、20% で検 定すべき状況もあることを申し添えます。 次に、なぜ、n=3 などの場合に表があるのでしょうか。これは、標本の大きさ n が 3 個などの場合に も、相関関係を議論することを推奨しているわけでは無いことを最初にお断りしておきます。 では、使うことを薦めてはいないのに、なぜ、表に掲載されているのでしょうか。(以下は稲葉の私見 です。)まず、表を作る立場で考えます。すると、n について、ある人は「30 以上だけで良い」と言う かもしれませんし、また別の人は「50 以上だけで良い」と言うでしょう。人によって、いくつ以上があ れば良いかが違っているわけです。つまり、万人が最善だと納得する表は作れないわけです。 こういう時、稲葉ならば、どうぜ誰かは「そんな小さい n の時は使えないのに、なぜ表に載っている のか」と非難する訳ですから、「私が使いたいのに、表に数値が無い」とさえ言われなければイイか、と 思い、出来るだけ小さい n も表に載せておこうと考えるでしょう。その結末が、n=3 から載せるという 現在の形になったのではと想像しております。 また、もう1つの観点では、n が小さいとき、如何に大きい相関係数が出ないと有意差在りにならない か、ということを実際に説明するために表に載せてあるとも考えられます。教育的な観点では、非常に有 り難い表だと思います。 まとめますと、相関係数は 0.6 ぐらいを目安にされることは、その前提として、標本の大きさ n が 30 以上の場合は良いと思いますし、それ以下の場合は、相関関係を議論しないという立場に賛成します。 ただ、どうしてもたくさんデータが取れない段階で、相関関係を議論する必要に迫られた場合は、不本 意ながら、表を利用して、検討することができるように、表は(多い目に)作られている、といった感じ です。 以上