コレ1枚で分かる「機械学習とデータサイエンス」即席!3分で分かるITトレンド

AIが人間の思考手法を模倣する形で発展したきた「機械学習」の仕組みを考察しつつ、AIや機械学習の技術を使いこなすために必要な「データサイエンス」の意義について説明します。

» 2018年12月29日 07時00分 公開

この連載は

 いまさら聞けないITの最新トレンドやビジネス戦略を、体系的に整理して分かりやすく解説する連載です。「この用語、案外、分かっているようで分かっていないかも」「IT用語を現場の社員にもっと分かりやすく説明できるようになりたい」――。情シスの皆さんのこんな課題を解決します。


Photo

 世の中の森羅万象を理解したいという科学者たちの飽くなき探究心が、科学を発展させてきました。彼らは、さまざまな現象を観察し、そこに秘められた規則性や法則性について仮説を立て、実験を行って検証しました。

 その事実をさらに考察し、その現象が生じるルールを見つけ出してきたのです。ニュートンの「運動方程式」、アインシュタインの「質量とエネルギーの等価性」を意味する「E=mc2」方程式などが、これに相当します。

 この方程式の変数に入力として数字を当てはめれば、この方程式に組み込まれたルールに従って結果が出力されます。私たちは、このような「ルール」すなわち「ものごとを理解するモデル」を使って、ものごとを理解したり課題を解決したりしてきたのです。

Photo 【図解】コレ1枚で分かる「機械学習がやっていること:人間は思考でルールを見つけ、AIは機械学習でルールを導き出す」

 機械学習は、この「ルール」すなわち「モデル」を、データの中から見つけ出そうというものです。

 例えば、肺がん患者のレントゲン写真を、「肺がんがある」という情報とともに機械学習プログラムに読み込ませます。このとき入力されるレントゲン写真が、「学習データ」です。そうすると「肺がんがある」とは、どういう特徴の組み合せパターンなのかをプログラムが見つけ出そうとします。

Photo

 ただ、1枚の写真だけでは、際立った特徴を見つけ出すことはできません。そこで、同様の処理を大量のレントゲン写真で行うことで、「肺がんがある」場合に共通する際立った特徴の組み合せパターンを機械学習プログラが見つけ出していきます。

 こうして生成されたレントゲン写真に写し出された“肺がんであること”の「特徴の組み合せパターン」を「モデル」として用意しておきます。

 これに未知の肺のレントゲン写真を入力すると「肺がんがある」ことを示す「特徴の組み合せパターン」と照らし合わせて、肺がんの有無を判別することが可能になります。

Photo 【図解】コレ1枚で分かる「機械学習がやっていること:がんの病巣を識別するモデルを生成する例

 このように、人間の思考によらず、データを分析することで「ルール」すなわち「モデル」を生成するのが機械学習です。

 機械学習で生成されたモデルは、「E=mc2」のようなすっきりした方程式にはなりませんが、結果として「有効」であるとされれば、それが使われるようになります。また、われわれには気付けなかった規則性や法則性を見つけ出してくれる可能性もあります。

 一方で、なぜそうなるのかを明確に説明できないことが課題でもあり、「説明できる機械学習」を実現しようという研究も行われています。

 ただ、結果として「有効」であることの判断や、それをどのようなことに役立てるかは、人間の役割であり、機械学習プログラムが自分で決めてくれることはありません。また、「有効」となるような学習データをそろえることや適切な機械学習のアルゴリズムを選択することも人間の役割です。

 機械学習を使うと便利なことは多数ありますが、それを使いこなすための人間の役割は広範に及びます。それを明らかにし、整備していく学問領域が、「データサイエンス」です。

著者プロフィール:斎藤昌義

book 【図解】コレ1枚でわかる最新ITトレンド [増強改訂版]

 日本IBMで営業として大手電気・電子製造業の顧客を担当。1995年に日本IBMを退職し、次代のITビジネス開発と人材育成を支援するネットコマースを設立。代表取締役に就任し、現在に至る。詳しいプロフィールはこちら。最新テクノロジーやビジネスの動向をまとめたプレゼンテーションデータをロイヤルティーフリーで提供する「ITビジネス・プレゼンテーション・ライブラリー/LiBRA」はこちら


Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ