米MetaのAI部門Meta AIは7月11日(現地時間)、Wikipediaの数十万件の引用の信頼性を一度に自動的に検証するAIモデル「Sphere」を開発したと発表した。GitHubでオープンソースで公開した。
Metaはこのモデルのために、1億3400万の公開Webページのデータセットを作成した。
現在Wikipediaには約650万件の項目があり、毎月約1万7000件の項目が追加されている。Sphereプロジェクトの目標は、Wikipediaの人間の編集者の手間を省き、引用されたコンテンツを迅速に確認し、修正できるようにする支援をすることだ。
Sphereは、自然言語理解(NLU)技術を採用している。人間が理解する文章(あるいは単語)を数学的表現に変換し、あるステートメントが別のステートメントをサポートするか矛盾するかを判断する比較ツールを設計した。
オープンソース化している検索ライブラリ内の数百万のWebページから適切なソースを見つけるために、膨大な量の情報にインデックスをつけるAIも設計した。Wikipediaから400万件のクレームを提供し、ステートメントの検証を学習させた。
このプロジェクトはまだ調査段階であり、Wikipediaの運営元であるWikimediaと提携しているわけではないが、Sphereを展開する準備ができたら「われわれのモデルはWikipediaの知識の質を高め、人々が使うリソースの正確さを維持するのに役立つ。さらに、最終的には研究コミュニティがAIの難問を解決するのに役立つ可能性がある」としている。
Metaは6日、AIモデル「NLLB-200」をオープンソース化すると発表した際、Wikipediaの翻訳をこのモデルで改善していると語った。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR