塩野: ルールを記述するという話ですが、人工知能は元になるデータがないとルールの整備が大変、つまりデータがないものは苦手と考えていいですか?
松尾: いま人工知能が進展している原動力は、やはりデータだと思います。人工知能は50年以上の歴史がありますから、データがない世界でどうするかについてはかなり研究し尽くされています。データがなかったがために進んだとも言えますが。
塩野: いまですと、みんながTwitterでつぶやいたりFacebook に書き込んだりで、勝手にデータを作ってくれていると思いますが、こうしてインターネット上に残る形、デジタルで記述してくれるようになったのは、人工知能の研究にとって大きかったのでしょうか。
松尾: そうですね。Webが発展して、そこにいろいろな人の声や行動がデータとして残るようになったことは、大きな転機でした。
データの中身について少し補足しておきますと、TwitterやFacebookなどのコミュニケーション系だけでなく、一般消費者がWebに書き込む本や音楽作品などに関するレビュー、ホテルやレストランの感想といった情報も爆発的に増えました。検索エンジンに入力されるキーワードも毎日毎時、蓄積されていきます。
加えて小売店などで発生する購買データ、POSで処理された情報、自動販売機の売上データ、あるいは人々が交通機関を使って移動した記録や位置情報など、あらゆるデータがネットワークに記録されていきます。
塩野: 人間の活動だけでなく、モノから出る情報もありますね。例えば、建物のそこら中にセンサーを付けて揺らしてみて、センサーから出てくるぼう大なデータを記録し、解析してどこをどう補強すればいいかを探る。こうした処理は実際に行われています。
ただ、生のデータを貯めただけでは、構造的なものかどうかは分からない。解析していくと、何らかの傾向が見つかる可能性があるということですね。モノのインターネット化(※3)がどんどん進んでいきます。
松尾: そうです。いまは必要とあれば、あらゆるデータをWeb上に蓄積できる状態、「Web=ビッグデータ」と考えていいでしょう。人工知能の技術は、いろいろな予測精度を高めていくことがおもな目的ですから、Webというフィールドを、どう生かしていくかの知恵は必要ですね。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR注目記事ランキング