フランスのAIスタートアップ・Mistral AIは7月24日(現地時間)、大規模言語モデル(LLM)「Mistral Large 2」を公開した。ベンチマークでは、コード生成の分野で米Metaの最新LLM「Llama 3.1 405B」などと同程度の性能を記録したという。研究や非商用利用が可能で、商用利用するにはMistral AIへの問い合わせが必要となる。
パラメータ数は1230億。前モデル「Mistral Large」に比べてMistral Large 2では、コード生成や数学、推論の能力が大幅に向上しているのが特徴という。また、コンテキストウィンドウ(AIモデルが応答を生成できるテキストの量)は12万8000で、日本語やフランス語、中国語、ロシア語など数十の言語と、PythonやJava、Cなど80以上のプログラミング言語にも対応している。
また、LLMに度々見られるハルシネーション(AIがもっともらしいうそをつく現象)の発生を最小限に抑えているという。他にも、与えられた指示に対して、解決策が見つからない場合や自信を持って回答できない場合には、それをAI自身が自覚するよう訓練している。このことも、数学分野の性能向上に寄与しているとしている。
会話能力や、指示を遂行する能力も飛躍的に向上していると同社は説明しており、複数回のやりとりを行う会話処理が得意という。同社は「多くのビジネスアプリケーションでは、簡潔であることが最重要」とし、短いやりとりに関する性能を高めたとしている。
Mistral Large 2は、Mistral AIが提供するAI基盤「La Plateforme」で公開している他、指示学習済みのAIモデルを同社のWebサイトやHugging Faceで提供している。
Mistral AI、コーディング用生成AIモデル「Codestral」リリース
OpenAI、軽量で安価なマルチモーダルAI「GPT-4o mini」リリース
サイバーエージェント、新たな日本語特化LLMを一般公開 「Llama-3-70B」と同等の日本語能力 商用利用も可
パナソニック、1000億パラメータの社内専用LLMを開発へ AIスタートアップ・ストックマークと協業
「AI幹事」飲食店に大ウケ──開発者が明かす、誕生のきっかけと想定外の反響 人とAIの新しい関係は居酒屋で始まる?Copyright © ITmedia, Inc. All Rights Reserved.