ITmedia NEWS > AI+ >
ITmedia AI+ AI活用のいまが分かる

ある日突然「AI担当」になったら何をすべきか プロジェクトを成功させる”データ準備”のコツきょうから始めるAI活用(4/4 ページ)

» 2018年12月04日 08時00分 公開
[小林啓倫ITmedia]
前のページへ 1|2|3|4       

(3)大量にデータを集めるリスク

 それでは十分な品質のデータを確保するためにも、データは多ければ多いほど良いのだろうか。ここは議論の余地があるところで、集めるデータは多い方が良いという主張もあれば、好ましくないという意見もある。

AI 画像はイメージ

 前述の通り、一見大量のデータが集まっていたとしても、AIに学習させるためにはそこからごみや偏りを取り除く必要がある。不適切なデータを使うと、Amazonのように深刻な問題を引き起こす恐れもある。集めたデータは慎重に“洗濯”(クレンジング、画像の矢印C)しなければならないが、それにも時間と予算が掛かる。

 またデータの量に加えて種類が増えると、検証作業が急激に複雑化する。AIは「とりあえずデータを入れておけば答えが出る」というわけではなく、専門知識を持った技術者が、データを処理するモデルを構築しなければならない。時間と予算、そして人材が無尽蔵にあるという会社であれば良いが、本連載を目にして下さっている皆さんは、恐らくそのような支援が得られない状況に置かれていることだろう。こうした点を地道にチェックし、あらかじめ問題になりそうな箇所をつぶしておく作業に時間と手間を惜しむべきではない。

 他の陥りがちな失敗は、データ量に目を奪われ、それを起点にしてAI開発を進めてしまうことだ。「これだけ大量のデータが集まっているのだから、ここから何か面白いAIを作れるだろう」という考え方は良くない。目標を議論している段階では「目の前のデータを基に議論する」のは有効かもしれないが、目標が決まっているならそのやり方ではまずい。

迷ったら「自分の役割は何か」に立ち返る

 なぜなら「手持ちのデータから何ができるか考える」という発想は、プロジェクトを迷走させる原因になるからだ。データから目標を修正するのは、あくまで「現状のデータで不可能な点が判明した」場合だけに留め、「現状のデータから他のAI活用も考えられそうだ」と分かった場合は、別プロジェクトとして切り出す方が無難だ。いまあなたが任されているのは、AIの可能性を研究することではなく、目標とする成果を達成することだからである。

 AIを開発するのに適切なデータを確保できるめどが立っても、またようやくスタートラインに立ったにすぎない。次回はAIとの二人三脚を始め、ゴールするまで走り続けるにはどうすべきかについて考えてみよう。

著者プロフィール:小林啓倫(こばやし あきひと)

経営コンサルタント。1973年東京都生まれ、獨協大学外国語学部卒、筑波大学大学院地域研究研究科修士課程修了。システムエンジニアとしてキャリアを積んだ後、米Babson CollegeにてMBAを取得。その後外資系コンサルティングファーム、国内ベンチャー企業などで活動。著書に『FinTechが変える! 金融×テクノロジーが生み出す新たなビジネス』(朝日新聞出版)、『IoTビジネスモデル革命』(朝日新聞出版)、訳書に『テトリス・エフェクト 世界を惑わせたゲーム』(ダン・アッカーマン著、白揚社)、『シンギュラリティ大学が教える 飛躍する方法』(サリム・イスマイル著、日経BP社)など多数。


前のページへ 1|2|3|4       

Copyright © ITmedia, Inc. All Rights Reserved.