因果関係より相関関係:ビッグデータの時代

Img_0001ノバルティス社のディオバン問題は検察の強制捜査が入っています。最初にこの問題が報道されたとき、統計処理をノバ社の社員に任せた、と報じられたのですが、「統計の分からない医者が臨床試験をやっているのか?」と驚いたものです。『p値とは何か 統計を少しずつ理解する34章』という本の翻訳者を見ると、たくさんの製薬企業の社員が名を連ねていました。考えてみれば当然で、商品の売れ行きを左右する臨床試験は統計処理されるのですから、企業としてはここに優秀な社員を配置することはあたりまえなのですね。どのようにすれば統計的有意差が出やすいのかに、日夜励んでいるのでしょう。

医者は忙しくて統計の勉強などしている暇はないのでしょう。今では医療統計のソフトにデータを入れれば何らかの結果は出てきますが、試験のデザインとかデータの扱いには専門的な知識と経験が必要です。岡山大学の津田敏秀氏は、医者は統計が分からないし、疫学が分かっていない、と『医学的根拠とは何か (岩波新書)』で述べています。

医学的根拠とは何か (岩波新書)

医学的根拠とは何か (岩波新書)

津田 敏秀
836円(04/26 01:42時点)
Amazonの情報を掲載しています

疫学においては、疾患の発生速度を変える要因を病気の原因と見なすのであり、「何倍その病気が多発する」という発生の程度の違いによってわれわれは因果影響を知るのです。ところが福島原発事故による小児甲状腺癌の多発に際しても、山下俊一氏らは「原発の放射能によるとは考えられない」と言っています。津田氏はこうした立場を「直感派」と定義しています。

病気のメカニズムが分からないと原因が分からないという鈴木鎮一氏らの見解があります。これは「メカニズム派」としています。原因と結果が1対1に対応していることを暗黙に想定しているのですが、がんの原因が一つであるはずはないのです。被曝線量の多い地域で甲状腺癌が多く見つかっていれば相関関係があると言えます。多くの相関関係が見出されて始めて因果関係があるのだろうと推定できるのですが、ヒューム「客観的因果律否定の問題」として知られているように、因果関係は完全には証明できません。津田氏に言わせると、山下氏も鈴木氏も「確信犯なのか無知なのかも分からない」ほどひどい専門家です。

因果関係など要らない。相関関係が分かればそれで十分だ、という立場でものごとの関係を見ていこうとするのが、ビッグデータ時代の新しい動きです。2009年の新型インフルエンザ(N1H1ウイルス)が蔓延したとき、米国の疾病予防管理センター(CDC)に医療機関から情報が集約される数週間前にこのウイルスの流行を予言した者がいるのです。Googleの技術者らです。

ビッグデータの正体 情報の産業革命が世界のすべてを変える

ビッグデータの正体 情報の産業革命が世界のすべてを変える

ビクター・マイヤー=ショーンベルガー, ケネス・クキエ
1,822円(04/26 10:14時点)
Amazonの情報を掲載しています

彼らは流行に関するCDCのデータとGoogleの検索ワードとの相関関係を調べたのです。Googleは過去の「全ての」検索ワードとその結果を保存しています。そして検索語の使用頻度とインフルエンザの流行する空間的・時間的な相関関係を調べて、州ごとの流行予測までやったのです。

ビッグデータの時代では

  1. 全てのデータを扱う
  2. データの精度は重要ではない(質よりも量)
  3. 因果関係よりも相関関係(答えが分かれば、理由は要らない)

が重要であり、データに対するパラダイムシフトが求められます。

その数学が戦略を決める (文春文庫)

その数学が戦略を決める (文春文庫)

イアン エアーズ
935円(04/26 10:14時点)
Amazonの情報を掲載しています

コンビニも店の端末で「全ての顧客」の性別・年齢などのデータを保存しています。ここから売れ筋商品はなにか、どれをどんなタイミングで調達するかなどの判断をして、最大の利益が上がるように運営しています。アマゾンも同じです。NHKスペシャルで、3.11のときの人々の携帯電話の移動情報から、津波予報が出たとき、逆に海岸へ移動する大勢の人がいたことが明らかになりました。多分残した家族の元へ急いだのでしょう。

ビッグデータを活用することで、これまでとは違った目で世界を見ることができるようになります。


膵臓がんと闘う多くの仲間がいます。応援のクリックをお願いします。

にほんブログ村 病気ブログ 膵臓がんへ
にほんブログ村

にほんブログ村 病気ブログ がんへ
にほんブログ村


スポンサーリンク

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です