米Facebookの年次開発者会議「F8 2019」の2日目、5月2日(現地時間)の基調講演は、例年通りAI、AR/VRについてだった。
マイク・シュローファーCTO(最高技術責任者)は、Facebook上の多様な問題に対処するために使っているAIツールなどについて語った。
ポリシー違反コンテンツの検出について、自然言語処理(NLP)とコンピュータビジョン(CV)での取り組みを紹介した。
Facebookではポリシー違反投稿検出のために機械学習システムを採用しているが、これまで、データの少ない言語での検出が困難だった(Facebookはかつてミャンマー語が解析できずロヒンギャ問題ですぐに対処できなかった)。
この問題に対処するため、一種の共通語として機能する共有多言語埋め込みスペースを開発。クロスリンガルの事前トレーニング作業で、追加の言語ラベル付きトレーニングデータなしに、複数言語での違反コンテンツ検知が可能になったとしている。
画像検出のための、従来の「DeepMask」などの技術は人物や物体など、前景のオブジェクトの識別は得意だが、背景の解析は苦手だった。
「Panoptic FPN」(パノラマ的特徴ピラミッドネットワーク)というオブジェクト認識の新たなアプローチを使って、単一のニューラル上で前景用タスクと背景用タスクを同時に実行することに成功。これにより、解析時間が大幅に短縮でき、ポリシー違反画像の検出が改善された。
この手法は動画にも使えるが、動画では一連のフレームを構成する多数のイメージとそのシーケンスで表される動きも考慮する必要があり、動画全体の解析には時間がかかる。そこで、問題のありそうなフレームを検知する“saliency sampler(顕著性サンプラー)”システムを開発した。
このシステムを、昨年のF8で発表したInstagramのハッシュタグ付き画像を使った画像認識モデルのトレーニングデータの解析に使うことで、動画の解析精度が向上したという。
既に実用化しており、このシステムにより、いじめの検出率が約85%上がったとしている。
AIのサンプルの偏りを是正する取り組みなども紹介する基調講演全体は以下のYouTubeで視聴できる。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR