Facebook、画像・動画内のポリシー違反テキスト検出AIツール「Rosetta」導入

ヘイトスピーチやフェイクニュースの拡散阻止が課題になっているFacebookが、画像や動画に含まれるテキストを検出・認識する機械学習システム「Rosetta」を発表した。既に導入済みだ。

[佐藤由紀子，ITmedia] PC用表示関連情報

LINE

Hatena

　米Facebookは9月11日（現地時間）、Facebookおよび傘下のInstagramに投稿される画像・動画内のテキストを検出する機械学習システム「Rosetta」を発表した。既に導入済みだ。

　このシステムは、ニュースフィードに関連性の高いコンテンツを表示することやユニバーサル機能に貢献していることに加え、ヘイトスピーチやフェイクニュースなど、ポリシー違反コンテンツの早期検出に役立つという。

　Rosettaは現在、FacebookとInstagramに投稿される1日当たり10億点以上の画像および動画からテキストをリアルタイムで抽出し、テキストとイメージのコンテキストを理解するよう訓練されたテキスト認識モデルに入力している。

R-CNNで画像から単語を検出し、完全畳み込みモデルで単語を認識する2ステップモデルアーキテクチャ

　Rosettaはまず、画像からテキストを含む可能性の高い長方形の領域を検出し、検出した領域をテキスト認識する。この作業には畳み込みニューラルネットワーク（CNN）を利用する。

長方形部分をテキストとして検出

　このシステムは、英語以外でも、アルファベット以外でも認識する。例えば、右から左に読むアラビア文字でも、ヒンディでも認識するという。このシステムを訓練するために、Facebookは公開された画像を使っている。

　世界に20億人以上のユーザーを擁する同社では、ヘイトスピーチやフェイクニュースへの迅速で正確な対策が大きな課題になっている。