
1月からスタートしたシリーズ企画「山本一郎と燃ゆるICT界隈」。2月はビッグデータ、パーソナルデータ強化月間ということで、『統計学が最強の学問である』著者の統計家・西内啓さん、そして新潟大学大学院・実務法学科教授の田中幸弘さんをゲストにお迎えしています。最終回となる今回は、ネット業界からゲノム創薬まで斬り込みます。(※本文内敬称略)
第一回「ビッグデータは幻想なのか?」(掲載中)
西内さん、田中さんのプロフィールはこちらから
第二回「データサイエンティストって、ぶっちゃけどうなの?」(掲載中)
第三回「パーソナルデータで広告界の地殻変動は起きるか?」(今回の記事)
ネット業界のリーガルマインドはカオス状態
山本:
さて、前回は
っていう話から、企業経営におけるビッグデータの位置付けまで議論させていただきました。で、結局、データサイエンティストって何する人だったんでしょうね?(笑)。
西内:
僕が思うに、そもそもデータ分析には2種類あると思っていて。一つが予測のための分析。予測することで何かを「最適化」しましょうという考え方ですね。もう一つが、データの背後にあるメカニズムを理解して「洞察」しましょうという考え方。「予測精度は分からないけど、少なくともここを改善するといいらしいよ」っていうヒントを探すのが「洞察」。
同じ手法を使っていても、「最適化」と「洞察」は見方が違う。それがごっちゃになって教えられているんですよね。今いるデータサイエンティストは圧倒的に前者の、「最適化」側が多いです。
山本:
前回、西内さんがご指摘されていた「仮説」と「問い」の違いはここにもつながってくるわけですね。
前回のコラム「データサイエンティストって、ぶっちゃけどうなの?」西内:
おっしゃる通りです。良い洞察には「仮説」ありきより「問い」からスタートする方が適しています。
山本:
これだけデータを見る側のリテラシーが上がっている以上、データを見て情報をつくり出す側や統計学を教育する立場の皆さんは、「旧来のやり方だとあかんよね」っていう危機感を持ってないといけないですね。