仏Mistral AI、最新LLM「Mistral Large 2」を公開 コード生成で米Meta「Llama 3.1」と同程度の性能
フランスのAIスタートアップ・Mistral AIは、大規模言語モデル(LLM)「Mistral Large 2」を公開した。
フランスのAIスタートアップ・Mistral AIは7月24日(現地時間)、大規模言語モデル(LLM)「Mistral Large 2」を公開した。ベンチマークでは、コード生成の分野で米Metaの最新LLM「Llama 3.1 405B」などと同程度の性能を記録したという。研究や非商用利用が可能で、商用利用するにはMistral AIへの問い合わせが必要となる。
パラメータ数は1230億。前モデル「Mistral Large」に比べてMistral Large 2では、コード生成や数学、推論の能力が大幅に向上しているのが特徴という。また、コンテキストウィンドウ(AIモデルが応答を生成できるテキストの量)は12万8000で、日本語やフランス語、中国語、ロシア語など数十の言語と、PythonやJava、Cなど80以上のプログラミング言語にも対応している。
また、LLMに度々見られるハルシネーション(AIがもっともらしいうそをつく現象)の発生を最小限に抑えているという。他にも、与えられた指示に対して、解決策が見つからない場合や自信を持って回答できない場合には、それをAI自身が自覚するよう訓練している。このことも、数学分野の性能向上に寄与しているとしている。
会話能力や、指示を遂行する能力も飛躍的に向上していると同社は説明しており、複数回のやりとりを行う会話処理が得意という。同社は「多くのビジネスアプリケーションでは、簡潔であることが最重要」とし、短いやりとりに関する性能を高めたとしている。
Mistral Large 2は、Mistral AIが提供するAI基盤「La Plateforme」で公開している他、指示学習済みのAIモデルを同社のWebサイトやHugging Faceで提供している。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Mistral AI、コーディング用生成AIモデル「Codestral」リリース
Microsoftが支援するMistral AIは、同社として初のコーディング向け生成AIモデル「Codestral」を発表した。HuggingFaceからダウンロードできるが、商用利用は不可だ。
OpenAI、軽量で安価なマルチモーダルAI「GPT-4o mini」リリース
OpenAIは、軽量で安価なマルチモーダルAIR「GPT-4o mini」をリリースした。アプリ開発者向けのAPIは従来のハイエンドモデルより1桁安く、GPT-3.5 Turboよりも高性能としている。
サイバーエージェント、新たな日本語特化LLMを一般公開 「Llama-3-70B」と同等の日本語能力 商用利用も可
サイバーエージェントは、大規模言語モデル(LLM)「CyberAgentLM3」を一般公開した。225億パラメータの日本語AIモデルで、既存モデルをベースに使わずスクラッチで開発した。
パナソニック、1000億パラメータの社内専用LLMを開発へ AIスタートアップ・ストックマークと協業
パナソニックホールディングスは、パナソニックグループ専用大規模言語モデル(LLM)「Panasonic-LLM-100b」を開発すると発表した。AIスタートアップ企業のストックマーク(東京都港区)と協業し、開発していく。
「AI幹事」飲食店に大ウケ──開発者が明かす、誕生のきっかけと想定外の反響 人とAIの新しい関係は居酒屋で始まる?
「AI幹事」が、飲食業界の注目を集めているようです。なぜ、AI幹事を作ろうと思ったのか、Gateboxとだるまジャパンにお話をうかがったところ、このサービスは絶妙なタイミングで登場したことが分かりました。


