ITmedia NEWS > STUDIO >

ビッグデータも「質」の時代へ AI学習データ提供する翻訳ベンチャーの勝算(2/2 ページ)

» 2018年08月03日 06時00分 公開
[村上万純ITmedia]
前のページへ 1|2       

 例えば、「アラビア語で書かれた政治関連のツイートを感情分析してほしい」という依頼が来た場合、「アラビア語が読める」「アラビアの政治事情が分かる」など、いくつもの条件をクリアした人材を集める必要がある。ワルター氏は「Gengoなら、アラビア語ができる人を1000人集められる。多言語に対応できるのは大きな特徴。コールセンターのように、単に大量の人員を集めるのとは異なる」と話す。

AI AI学習データにおける人間の役割

 他にも、「日本語が母国語ではない人が話す日本語の音声データ」「さまざまな国の人の目の動き(アイトラッキング)の動画」など、多種多様なデータを求められるため、「クライアント企業へのコンサルティングも行える、フレキシブルなプラットフォーム作りを意識している」という。

AI普及で人間の仕事は増える?

 今後はGengoプラットフォーム内でも人力の作業を減らし、自動化を進めていくという。例えば、翻訳の前後であまりに文章量に差が出たり、数字が入っていた文章から数字が抜けていたりした場合に自動で警告を出す、などだ。

 自動化が進むと、クラウドワーカーの数も減っていくのか。ワルター氏は「むしろクラウドワーカーの数は増えていく。2000万人くらいに増えているとうれしい」と笑う。

 「AIが人の作業を99%代替しても、残りの1%は人間がやらないといけない。それは文化や文脈で意味が変わる翻訳の分野でもそうだろう。一方でAI市場もさらに広がるため、学習データの提供をはじめ、AIに関連する新しい仕事がそれ以上に生まれていく」(ワルター氏)

AI Gengoが提供するAIデータは中・高難度タスクのものが中心になる

 例えば、各社が開発を行っている自動車の遠隔運転システムについても、ワルター氏は「これが普及すれば、リモートドライバーという新たな職業が生まれるかもしれない。メディアではよくAIが人の仕事を奪うといわれるが、全てを奪うわけではない」と前向きだ。

 最後に、良質なデータの重要性を改めて強調した。「どんなにデータを集めても、その質が微妙だとAIのアルゴリズム精度は向上しない。コストをかけて大量のデータを集めるより、中身が適切であることの方が重要だ」(ワルター氏)

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.