ニュース
» 2020年05月01日 19時30分 公開

プレミアムコンテンツ:AIの判断を邪魔する「ゴミデータ」をきれいにするには

機械学習で人工知能(AI)エンジンの精度を上げるには、質の良い学習データが不可欠だ。質の悪い学習データでは、AIエンジンの不適切な判断を招くリスクがある。事例を基に、学習データの作成方法を考える。

[TechTargetジャパン運営事務局]
ダウンロードはこちら

 人工知能(AI)エンジンの機械学習に利用する学習データ(教師データとも)は、「量」が重要だと考えられてきた。その考え方自体は今でも通用するが、状況は変わりつつある。AIエンジンが誤った判断を下すことが問題になり、判断結果を左右する学習データの「質」がより重視されつつある。

 質の高い学習データを用意するには、収集したデータから“ゴミ”となる不要なデータを排除し、AIエンジンの用途に合わせてデータを分類する必要がある。こうしたデータクリーニングの過程には、従来データサイエンティストを必要としていたが、自動化ツールも登場している。

 本資料では、AI技術の活用を積極的に進めるFacebookやIBMをはじめ、各企業が学習用データを用意するために実践している手法を紹介する。

プレミアムコンテンツのダウンロードはこちら

ALT ダウンロードはこちら

TechTargetジャパンサービス利用登録はお済みですか?

「TechTargetジャパン」メンバーシップのご案内

会員登録をすることで、2000点以上の技術資料がそろったホワイトペーパーや興味・関心分野ごとに情報を配信するメールマガジン、ITmediaや@ITの特集記事がPDFでまとまって読める電子ブックレットなど、各種サービスを無料で利用できます。TechTargetジャパンサービス利用登録

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ