Meta、Wikipediaの膨大な引用元の信頼性を自動判定するAIモデル「Sphere」をオープンソース化

» 2022年07月12日 14時04分公開

[ITmedia]

　米MetaのAI部門Meta AIは7月11日（現地時間）、Wikipediaの数十万件の引用の信頼性を一度に自動的に検証するAIモデル「Sphere」を開発したと発表した。GitHubでオープンソースで公開した。

　Metaはこのモデルのために、1億3400万の公開Webページのデータセットを作成した。

　現在Wikipediaには約650万件の項目があり、毎月約1万7000件の項目が追加されている。Sphereプロジェクトの目標は、Wikipediaの人間の編集者の手間を省き、引用されたコンテンツを迅速に確認し、修正できるようにする支援をすることだ。

Sphereの引用真偽判定の概要

　Sphereは、自然言語理解（NLU）技術を採用している。人間が理解する文章（あるいは単語）を数学的表現に変換し、あるステートメントが別のステートメントをサポートするか矛盾するかを判断する比較ツールを設計した。

　オープンソース化している検索ライブラリ内の数百万のWebページから適切なソースを見つけるために、膨大な量の情報にインデックスをつけるAIも設計した。Wikipediaから400万件のクレームを提供し、ステートメントの検証を学習させた。

　このプロジェクトはまだ調査段階であり、Wikipediaの運営元であるWikimediaと提携しているわけではないが、Sphereを展開する準備ができたら「われわれのモデルはWikipediaの知識の質を高め、人々が使うリソースの正確さを維持するのに役立つ。さらに、最終的には研究コミュニティがAIの難問を解決するのに役立つ可能性がある」としている。

　Metaは6日、AIモデル「NLLB-200」をオープンソース化すると発表した際、Wikipediaの翻訳をこのモデルで改善していると語った。

Meta、200言語対応のAI翻訳プロジェクト「NLLB-200」をオープンソース化
Metaは、200言語を中間言語なしに翻訳するAIモデル「NLLB-200」をオープンソース化する。FacebookやInstagramでも採用する他、「より多くの人々がメタバースにアクセスできるようになる」としている。
Meta（旧Facebook）、メタバース構築に向けてNVIDIAと共同で高速AIスパコン構築中
Meta（旧Facebook）は「AI Research SuperCluster（RSC）」を発表した。NVIDIAのGPUシステムを採用しており、2022年半ばに完成の見込み。有害コンテンツの特定に役立ち、メタバース構築を支える。
欧州委員会の偽情報対策の新規範にTwitter、Meta、Googleなどが署名
欧州委員会が「Code of Practice on Disinformation」（偽情報に関する行動規範）を発表した。フェイクニュースの拡散を阻止するためにプラットフォーマーが行うべき取り組みを決めたものだ。Twitter、Meta、Google、Microsoftなど34社が署名した。
Meta、AIチームを再編　AIトップは退社
Metaは、「AIが業務の中心となってきた」ことに合わせたAI部門の再編を発表した。研究部門から各製品部門にAI業務が分散される。ヤン・ルカン博士とFAIRは研究部門として存続する。