因果はわからないが相関はあるとは?

研究などでよく聞かれるこのセリフ。正直、よく意味がわかりませんね(笑 いくつかのパターンがあったりするのかなと思います。日常用語的には、因果は原因と結果の関係で、相関は相互に関係があるということかと思いますが、この理解だと、上のセリフはほとんど意味のないものになります。問題は、因果というよりも、相関という言葉が曖昧だからです。

1. 因果はわからないが、相関「係数」は高かった。または有意であった。

このパターンが基本は正しいのかなと思います。「係数」という言葉が省略されているという場合です。この場合は、何かしらのデータを用いて、相関分析(や回帰分析)を行なった。結果として、係数が高かった、または有意であった。とはいえ、相関係数が高い、または有意というだけで、因果関係はわからないというわけです。

2.偽相関かもしれないが、相関「係数」は高かった。または有意であった。

このパターンは、上記のもう少し詳細なバージョンです。相関分析では、しばしば偽相関の問題が指摘されます。よく言われるように、子供の身長と学力には相関が見られることがありますが、これは年齢の方が影響要因だと考えられます。身長を伸ばしても学力は上がりませんし、学力を上げると身長が上がるわけでもありません。年齢が上がれば、身長も学力も伸びるでしょう。因果は「まだ」わからないが、みかけの相関係数は高かったということになりそうです。

多分、しかし、この意味で言っている人はあまりいない気もします。相関係数は高かったです、でも偽相関かもしれませんとか、偽相関じゃない?と言うのは、要するに相関自体が間違っていると言うことだからです。因果がわからないということではなく、相関自体が怪しいということです。

3.因果「の方向」はわからないが、相関「係数」は高かった。または有意であった。

このパターンあたりになってくると、ちょっと微妙な気もしますが、現実には良くあるバージョンかと思います。相関係数が高ければ、相互の影響関係が気になります。しかしこの場合にしばしば含意されているのは、双方向の影響です。例えば、良い職場と売り上げに相関があるとすれば、多分それは鶏と卵の関係でしょう。良い職場環境は売り上げを引き上げ、売り上げが引き上がることで職場環境はより良くなりそうです(違う会社も多そうですが。。)。これも、偽相関系と同じかもしれませんが、偽ではない点が特徴です。因果は「まだ」わからないが(双方向かもしれないが)、相関係数は高かったということです。

しかし、これも変な感じが正直少しします。相関係数が高かった時点で、それが偽相関でないというのならば、因果関係はわかっているように思うからです。それは双方向かもしれませんが、因果関係があるのは時間的、あるいは論理的にわかっているはずです。ようするに、2のパターンが念頭に置かれていなければ、「因果はわからないが、相関係数は高かった」と言うことはあまり意味がなく、しかし2のパターンは厳密には因果がわからないのではなく、偽相関かもしれないと言うだけなのです。

「因果はわからないが、相関(係数)はある」には注意しようと思う今日この頃ですね。


2024年04月30日 | Posted in エッセイ | タグ: Comments Closed 

関連記事