そこでNIIは、日本語の処理性能が高い独自モデルの構築を目指しながら、学習データや開発手法を公開し、第三者が検証・分析できる透明性に注力している。日本のAI開発における「再現可能なベースライン」を提示し、全体的な開発力の強化につなげたい考えだ。
特に学習データについては、ライセンスの関係でモデル公開時に制約が生じるものは品質が高くても使用しないなど、厳しい条件を課している。その理由について、黒橋所長は「著作権との共存」がポイントだと語る。
「クローズドで何をやっているか分からない状況が、著作者の疑心暗鬼を生んでいる。『この小説のデータで学習している。でも小説そのものが出てくることはない。小説に含まれる“気持ち”を学習して良いモデルになり、日本の子どもの教育にも活用できる』とはっきり示す。こうしたあるべき姿を目指している」(黒橋所長)
透明性にこだわる背景には、AI開発における国家間での協力を重視する考えもある。NIIでは、韓国やインド、フランス、ブラジルなどと連携を進めている。一見、ソブリンAIの考え方に反するようにも思われるが、黒橋所長は「それは誤解だ」という。
「ソブリンAIというと、自分たちのデータのために閉じこもってやるという誤解があるが、それぞれ大事な部分をやりながら、方法論や共通化できるデータは徹底的に共有する。国際的な協力のもとで推進していくことが大事だ」(黒橋所長)
これに関連して「AIは国家のためにあるべきか、人類のためにあるべきか」という記者からの質問に対し、黒橋所長は「圧倒的に人類のためだ」と主張した。
「『国家のためだ』というから、このざまなわけだ。人類は紛争が絶えない。AI時代に紛争のまま突入すれば、AIはすごい兵器で、簡単に悪用できるようになる。大急ぎで仲良くなり、病気などに立ち向かっていく方が良いと学者的には思う」
「政治の世界に難しい側面があることは理解しているが、目指しているものを聞かれれば『人類のための知見だ』と答える。ただ国からお金をもらうためには、そこをコンプロマイズしながら(折り合いをつけながら)説明するということかもしれない」(黒橋所長)
NIIは今後、より大規模なパラメータを持つ「LLM-jp-4 32Bモデル」と、小型の専門家モデルを複数組み合わせて処理効率を高めたMoEモデル「LLM-jp-4 332B-A31Bモデル」を26年度中に公開する予定だ。AIが試行錯誤しながら性能を高める強化学習などを活用し、性能面での向上を目指す。また既存モデルの社会実装も進める。
【修正履歴:2026年4月24日午後3時】記事掲載当初、記者向けの「懇親会」と記載していましたが「懇談会」に修正しました。
Copyright © ITmedia, Inc. All Rights Reserved.