ITmedia AI＋
生成AI
リコー、モデルマージで“GPT-4レベル”の大規模言語モデル開発　プライベートLLMの開発効率化に貢献

リコー、モデルマージで“GPT-4レベル”の大規模言語モデル開発　プライベートLLMの開発効率化に貢献

公開 2024年09月30日 13時54分

[ITmedia]

印刷する

　リコーは9月30日、モデルマージ技術によって高性能な日本語大規模言語モデル（LLM）を開発したと発表した。東京工業大学などが開発したLLM「Llama-3-Swallow-70B」をベースにしたAIモデルで、米OpenAIのLLM「GPT-4」と同等の性能を持つとしている。

リコー、モデルマージで“GPT-4レベル”の大規模言語モデル開発

　モデルマージとは、複数の学習済みのLLMモデルを組み合わせて、より性能の高いモデルを作る方法のこと。

　リコーは今回、Llama-3-Swallow-70Bをベースにしてモデルマージを実行。Metaの指示学習済みモデルから抽出した「Chat Vector」（AIモデルから抽出した指示追従能力のベクトルのこと）と、リコーが作成したChat Vectorを独自のノウハウでマージさせて、新たなLLMを開発した。

　開発したLLMは、日本語性能の評価指標「ELYZA-tasks-100」でGPT-4と同等のスコアを記録。また、比較対象にした他のLLMでは、タスクによって回答を英語でする場合もあったが、リコー製のLLMは全てのタスクに対して日本語で回答し、高い安定性を示したという。

ELYZA-tasks-100のスコア

　リコーは「AIを実際の業務に適用するには、企業固有の用語や言い回しなどを含む大量のテキストデータをLLMに学習させ、その企業独自のAIモデル（プライベートLLM）を作成する必要がある」と指摘。モデルマージ技術は、プライベートLLMや特定業務向けの高性能LLMの開発の効率化につながるとし、今後も研究開発を進める方針を示した。

印刷する