メディア

Facebook、画像・動画内のポリシー違反テキスト検出AIツール「Rosetta」導入

ヘイトスピーチやフェイクニュースの拡散阻止が課題になっているFacebookが、画像や動画に含まれるテキストを検出・認識する機械学習システム「Rosetta」を発表した。既に導入済みだ。

» 2018年09月12日 08時26分公開

[佐藤由紀子，ITmedia]

　米Facebookは9月11日（現地時間）、Facebookおよび傘下のInstagramに投稿される画像・動画内のテキストを検出する機械学習システム「Rosetta」を発表した。既に導入済みだ。

　このシステムは、ニュースフィードに関連性の高いコンテンツを表示することやユニバーサル機能に貢献していることに加え、ヘイトスピーチやフェイクニュースなど、ポリシー違反コンテンツの早期検出に役立つという。

　Rosettaは現在、FacebookとInstagramに投稿される1日当たり10億点以上の画像および動画からテキストをリアルタイムで抽出し、テキストとイメージのコンテキストを理解するよう訓練されたテキスト認識モデルに入力している。

R-CNNで画像から単語を検出し、完全畳み込みモデルで単語を認識する2ステップモデルアーキテクチャ

　Rosettaはまず、画像からテキストを含む可能性の高い長方形の領域を検出し、検出した領域をテキスト認識する。この作業には畳み込みニューラルネットワーク（CNN）を利用する。

長方形部分をテキストとして検出

　このシステムは、英語以外でも、アルファベット以外でも認識する。例えば、右から左に読むアラビア文字でも、ヒンディでも認識するという。このシステムを訓練するために、Facebookは公開された画像を使っている。

　世界に20億人以上のユーザーを擁する同社では、ヘイトスピーチやフェイクニュースへの迅速で正確な対策が大きな課題になっている。

Facebook、ミャンマー軍人のアカウントや軍関連ページを複数削除
Facebookが、ロヒンギャ迫害問題で揺れるミャンマーの軍上層部のアカウントや軍関連ページを多数削除したと発表した。いずれもUNが深刻な人権侵害に関わったと報告した個人や組織に関連するものとしている。
Facebook、過去3カ月で8億件以上の問題投稿を削除──初の透明性レポート
Facebookが同社としては初の透明性レポートを発表した。この中で、1～3月の3カ月間に削除したスパム投稿数や無効化したフェイクアカウント数などを公表した。
Facebook、AIフレームワーク「PyTorch 1.0」公開　Instagramのデータで訓練したモデルも
Facebookが開発者会議F8の2日目の基調講演で、AIフレームワーク「PyTorch 1.0」の公開、Microsoftと立ち上げた「ONNX」でのGoogle TensorFlow他複数のツールのサポートなど、AI関連の取り組みについて発表した。
Facebook、EUのGDPR対策のプライバシー強化を世界でも実施へ
個人情報不正利用スキャンダルの渦中にあるFacebookが、5月にEUが施行する「一般データ保護規則」に向けたプライバシー保護強化について発表した。ほとんどの取り組みはEU以外でも実施する。
Facebook、テキスト内容を理解するディープラーニングエンジン「DeepText」
Facebookは、従来の自然言語処理ではなく、ディープラーニングのアプローチでテキストの内容を理解する人工知能エンジン「DeepText」を発表した。将来的にはニュースフィード上の表示優先順位やヘイトスピーチの迅速な駆除に活用したいとしている。