ITmedia NEWS > 速報 >
速報
» 2019年05月03日 10時13分 公開

Facebook、違反コンテンツ検出AI強化でいじめ検出率85%向上

Facebookの開発者会議「F8 2019」の2日目の基調講演は、例年通りAI、AR/VRがテーマだった。この中から、ポリシー違反コンテンツ検出ツールについての発表を紹介する。

[佐藤由紀子,ITmedia]

 米Facebookの年次開発者会議「F8 2019」の2日目、5月2日(現地時間)の基調講演は、例年通りAI、AR/VRについてだった。

 マイク・シュローファーCTO(最高技術責任者)は、Facebook上の多様な問題に対処するために使っているAIツールなどについて語った。

 ai 1 F8基調講演に登壇するマイク・シュローファーCTO

 ポリシー違反コンテンツの検出について、自然言語処理(NLP)とコンピュータビジョン(CV)での取り組みを紹介した。

データの少ない言語の投稿もチェックできる共有多言語埋め込みスペース

 Facebookではポリシー違反投稿検出のために機会学習システムを採用しているが、これまで、データの少ない言語での検出が困難だった(Facebookはかつてミャンマー語が解析できずロヒンギャ問題ですぐに対処できなかった)。

 この問題に対処するため、一種の共通語として機能する共有多言語埋め込みスペースを開発。クロスリンガルの事前トレーニング作業で、追加の言語ラベル付きトレーニングデータなしに、複数言語での違反コンテンツ検知が可能になったとしている。

ポリシー違反画像検出に役立つ「Panoptic FPN」

 画像検出のための、従来の「DeepMask」などの技術は人物や物体など、前景のオブジェクトの識別は得意だが、背景の解析は苦手だった。

 「Panoptic FPN」(パノラマ的特徴ピラミッドネットワーク)というオブジェクト認識の新たなアプローチを使って、単一のニューラル上で前景用タスクと背景用タスクを同時に実行することに成功。これにより、解析時間が大幅に短縮でき、ポリシー違反画像の検出が改善された。

 ai 2 「Panoptic FPN」

ハッシュタグ利用の機械学習動画解析と“顕著性サンプラーシステム”

 この手法は動画にも使えるが、動画では一連のフレームを構成する多数のイメージとそのシーケンスで表される動きも考慮する必要があり、動画全体の解析には時間がかかる。そこで、問題のありそうなフレームを検知する“saliency sampler(顕著性サンプラー)”システムを開発した。

 ai 3 saliency sampler

 このシステムを、昨年のF8で発表したInstagramのハッシュタグ付き画像を使った画像認識モデルのトレーニングデータの解析に使うことで、動画の解析精度が向上したという。

 既に実用化しており、このシステムにより、いじめの検出率が約85%上がったとしている。

 AIのサンプルの偏りを是正する取り組みなども紹介する基調講演全体は以下のYouTubeで視聴できる。


Copyright © ITmedia, Inc. All Rights Reserved.