| エンタープライズ:ニュース | 2003/12/08 13:03:00 更新 |

産学の橋のたもとで〜産業界に必要とされる統計学とは〜
基調講演のスピーカーとして登場した早稲田大学文学部教授 豊田 秀樹氏は、「産学の橋のたもとで 〜産業界に必要とされる統計学とは〜」と題し、SPSS Open House 2003のテーマである「産学協同」に寄せた講演を行った。
基調講演のスピーカーとして登場した早稲田大学文学部教授 豊田 秀樹氏は、「産学の橋のたもとで 〜産業界に必要とされる統計学とは〜」と題し、SPSS Open House 2003のテーマである「産学協同」に寄せた講演を行った。
冒頭で豊田氏は、「統計学とは統計的基礎と実質科学的知見の接点で初めて花開く学問である」と述べた。これは、学問と実務、すなわち産学の接点においてこそ大きな成果があがる、と言い換えることもできるだろう。
在学中に統計学を習得できなかった学生も企業に入ればほんの数ヶ月でスキルを上げることを例に、企業と大学における統計の違いについて説き起こした。
企業では明確な目標を定め、統計を利用する。つまり、時間・空間・対象が制約されているため、短期間で力が出せる。一方大学では、こうした制約からできるだけ自由な枠組みでの研究を行う。「その研究は何の役に立つのですか?」との問いを受けることがあるそうだが、大学の研究は100年後に何が残るかを見据えた研究であり、スピードを重視するビジネス利用とは視点が異なることを明らかにした。しかし、100年後を考える研究者が学術的な突破口を見出すのは、現在の研究の延長線上ではなく、ビジネス界からもたらされることが多いという。その意味でも、産学協同というテーマは産学両岸にとって価値あるものであると豊田氏は言う。

企業と協同研究を進めたり、企業へのアドバイスを行う自身の立場を、「産学の両側をフラフラと行き来するコウモリ」に例え、コウモリの視点でデータ解析の7つの視点について解説した。豊田氏が上げた7つの視点は以下の通りである。
1) データマイニング
2) ビジュアルプログラミング
3) ブートストラップ
4) 交差妥当化
5) 傾向スコア重み付け法
6) ビジネスモデル
7) 非正規分布の統計学
この中からいくつかをピックアップして報告する。
データハンドリングの重要性〜データマイニング〜
データマイニングはビジネスでの利用がさかんで、非常に華やかな印象を受けるが、プロセスのうち9割は地道なデータハンドリングに費やされる。実際、企業が使う大量データをそのまま流し込んで意味のある結果がでる分析手法は存在しない。センス良く、分析に適したきれいなデータに再構成することができれば5割成功したと言えるほど、データハンドリングが負う部分は大きい。
豊田氏はデータハンドリングについて「将来統計学から分離し、一つの学問的分野として成立するのではないか」と、その将来性を予測した。
GUIとは本質的に違うインターフェース〜ビジュアルプログラミング〜
ビジュアルプログラミングは、データ分析インターフェースの第三世代と言える。第一世代はラインモード、第二世代はスプレッドシート型あるいは、GUIと呼ばれるものである。
第一世代で統計学を学んだ豊田氏にとって、第二世代のGUIは「自分がどのプロセスの何をやっているのかわからなくなる」親しみにくいものだったが、SPSSのデータマイニングツールClementineに代表されるビジュアルプログラミングは、これと本質的に異なると指摘する。プログラムを構築する思想は第一世代のラインモードと同質であるもののプログラム言語に比べ習得が容易で、また、豊田氏をはじめ第一世代で育ったデータ分析者も優しく受け入れてくれるインターフェースであり、「これから大きな進歩を見せる」と期待を示した。
一つの原理で検定の代替を〜ブートストラップ〜
世の中の変化のスピードが、これまで絶対と思われた統計学の資産を追い越した例として、ブートストラップが紹介された。
ブートストラップとは、コンピューター内に一つの世界をつくり、途方もない繰り返し作業を行わせた上で統計的判断をさせる手法である。従来、検定で行っていたことを、コンピューターの力で実現する。統計学を学ぶ際、高度な数学的理解が必要となる検定で挫折する学生も多い。ブートストラップはその難解な検定の必要をほとんどなくし、一つの原理でさまざまな検定の代替を可能とする。SPSS社製品には既に実装されているとのこと。
時代の趨勢、Web調査に応える〜傾向スコア重み付け法〜
無作為抽出・無作為割当が困難な時代である。例えば薬効調査を行う際、人道的な理由やインフォームドコンセントの普及で、過去に行われていたような無作為割当は難しくなっている。また、無作為抽出の調査は、コスト面・個人情報保護の観点などから、Web調査に取って代わられる傾向にある。ただしWeb調査の場合、調査で集まったサンプルが母集団を代表するのか?との疑問が指摘されている。
傾向スコア重み付け法とは、無作為抽出や無作為割当が困難な場合、予め想定した母集団に近似するよう補正する手法である。手軽で安価、しかも短時間で多くのサンプルを集めるWeb調査が広まる中で注目される手法であると紹介された。
最後に豊田氏は自身の目指すものをディーラーに例えた。
ディーラーとは、次世代の手法・製品の開発に携わり、データに対する愛情を持ち楽しんでユーザーの問題解決を手助けし、自身もデータ解析を楽しむ、産学両岸にとっての理想の架け橋である。産学の接点でこそ花開く統計であるが、時に両岸の違いは、産学協同のプロジェクトを頓挫させることもあるだろう。しかし違うものを持っているからこそ、その成果は大きな花を咲かせるのである。
豊田氏は、産学の架け橋として「私はメーカーとユーザーの間のディーラーでありたい、胸をはった、肝の据わった、迷いのないディーラーでありたいと思います」と自らの希望を述べ、講演を結んだ。
[ITmedia]
