米AMD、AIモデル「Instella」シリーズ公開 パラメータ数30億の小規模サイズ 同社製GPUを利用
米AMDは3月5日(現地時間)、AIモデル「Instella」シリーズを公開した。同社のGPU「AMD Instinct MI300X」を使いトレーニングしたのが特徴。パラメータ数30億の「Instella-3B」は、他社が公開する同等サイズのAIモデルと比べて、おおむね性能を上回っているとしている。
今回公開したAIモデルは、4065兆トークンで1段階だけ事前トレーニングをした「Instella-3B-Stage1」、さらに575億7500万トークンで事前トレーニングを重ねたInstella-3Bなど。いずれのAIモデルも、Llama-3.2-3BやGemma-2-2Bと同等か、それを上回る性能を記録し、Qwen-2.5-3Bに迫る性能を記録したという。
他にも、Instella-3Bの指示学習済みAIモデルとして「Instella-3B-SFT」「Instella-3B-Instruct」も公開中だ。
AMDは「Instellaのリリースは、オープンソースAIの進歩と、大規模な言語モデルトレーニングにおけるAMDハードウェアの能力を実証する上で、大きな一歩を示している」と説明。AIモデルを公開した理由については「透明性、再現性、アクセシビリティーがAI研究開発の進歩の重要な原動力であると考えているため」などと述べている。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
2
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
3
「Claude Fable 5」の性能が落ちた? 提供停止前後で比べた結果 米AI企業2社がそれぞれ報告
-
4
人型ロボットが工場で稼働する様子を6日間生配信、作業成功率99.99%をうたう 中国メーカー
-
5
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
6
NTT、独自のAIモデル「tsuzumi 2」発表 “国産AI開発競争”に「負けられない」と島田社長
-
7
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
-
8
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
9
Meta、「Claude Codeと組織改編で爆速開発」のはずが「想定より加速せず」 ザッカーバーグ氏、社内集会で発言
-
10
ゲームエンジン「Godot」AI生成コードを原則禁止へ レビュアー疲弊「機械と話したくない」
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR