ITmedia NEWS > STUDIO >
ITmedia AI+ AI活用のいまが分かる

Meta、Wikipediaの膨大な引用元の信頼性を自動判定するAIモデル「Sphere」をオープンソース化

» 2022年07月12日 14時04分 公開
[ITmedia]

 米MetaのAI部門Meta AIは7月11日(現地時間)、Wikipediaの数十万件の引用の信頼性を一度に自動的に検証するAIモデル「Sphere」を開発したと発表した。GitHubでオープンソースで公開した。

 Metaはこのモデルのために、1億3400万の公開Webページのデータセットを作成した。

 現在Wikipediaには約650万件の項目があり、毎月約1万7000件の項目が追加されている。Sphereプロジェクトの目標は、Wikipediaの人間の編集者の手間を省き、引用されたコンテンツを迅速に確認し、修正できるようにする支援をすることだ。

 sphere Sphereの引用真偽判定の概要

 Sphereは、自然言語理解(NLU)技術を採用している。人間が理解する文章(あるいは単語)を数学的表現に変換し、あるステートメントが別のステートメントをサポートするか矛盾するかを判断する比較ツールを設計した。

 オープンソース化している検索ライブラリ内の数百万のWebページから適切なソースを見つけるために、膨大な量の情報にインデックスをつけるAIも設計した。Wikipediaから400万件のクレームを提供し、ステートメントの検証を学習させた。

 このプロジェクトはまだ調査段階であり、Wikipediaの運営元であるWikimediaと提携しているわけではないが、Sphereを展開する準備ができたら「われわれのモデルはWikipediaの知識の質を高め、人々が使うリソースの正確さを維持するのに役立つ。さらに、最終的には研究コミュニティがAIの難問を解決するのに役立つ可能性がある」としている。

 Metaは6日、AIモデル「NLLB-200」をオープンソース化すると発表した際、Wikipediaの翻訳をこのモデルで改善していると語った。

Copyright © ITmedia, Inc. All Rights Reserved.