米Microsoftは4月12日、ChatGPTのようなモデルを生成できるツール「DeepSpeed-Chat」を公開した。GPU1台で100億以上のパラメータを持つモデルの学習ができる上、学習速度も既存技術の15倍以上としている。
DeepSpeed-ChatはChatGPTでも採用されている学習手法「RLHF」を効率的に実行するためのツール。これまでは高価なGPUを大量に使う必要があったが、DeepSpeed-Chatは少ないGPUで効率的に学習ができる。
例えば、クラウド上でGPU「A100-80GB x8」を使って大規模言語モデル「OPT-B13」を訓練する場合、9時間程度で完了し、コストも290ドル程度という。複数台のGPUを使えば1000億パラメータ規模のモデルの学習にも対応する。
Microsoftは「1〜2時間のコーヒータイムや昼休みに、DeepSpeed-Chatで小規模なトイモデルをトレーニングしてみるのも良いでしょう」と手軽さをアピールしている。
ChatGPTが職務経歴書を作成するサービス続々 エンジニア向けから看護師まで
今の技術ではChatGPTが書いた文章だと見抜けない? さまざまなツールで検証、成功率は50%以下に
25人のAIが一緒に暮らしたら、自我は芽生えるか? ゲームの中で検証 バレンタインなど勝手に企画
文章の“AI度”をChatGPTが判定「AI作文判定くん」 「AI作文くん」と同じ開発者が公開Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR