無料で商用可、ChatGPT(3.5)に匹敵する生成AI「Llama 2」 Metaが発表、Microsoftと優先連携
米Metaは7月18日(現地時間)、大規模言語モデル「Llama 2」を発表した。利用は無料で商用利用も可能としている。最大サイズの70億パラメーターモデルは「ChatGPT(の3月1日版)と互角」(同社)という。
米Metaは7月18日(現地時間)、大規模言語モデル「Llama 2」を発表した。利用は無料で商用利用も可能としている。最大サイズの700億パラメーターモデルは「ChatGPT(の3月1日版)と互角」(同社)という。
ダウンロードには、Metaが用意するフォームから名前とメールアドレス、国、組織名を入れ、利用規約に同意した旨を送信する。Metaが受理すると専用URLが送られてくるため、同社がGitHubで公開しているダウンロード用のスクリプトと合わせるとLlama 2の各モデルをダウンロードできるようになる。
モデルサイズは70億、130億、700億パラメーターの3種類があり、それぞれベースモデルとチャット向けに追加学習(ファインチューニング)したモデルを用意する。いずれも4096トークン(おおよそ単語数の意)まで文脈を読める。
性能は、Llama-2-70b-chat(700億のチャット向けモデル)と米OpenAIの「ChatGPT-0301」(おそらくgpt-3.5-turbo-0301のこと)や米Googleの「PaLM-Bison」(PaLM 2の2番目に大きいモデル)を人間による評価で比べたところ、ChatGPT-0301とは互角、PaLM-Bisonに対しては大幅に上回る結果になったとしている。
提供に当たっては、直接ダウンロードの他に米MicrosoftのAzure上でも利用可能になっている。MetaはMicrosoftを優先パートナーと位置付けている。今後、AWSやHugging Facesなど他のプロバイダーからも入手可能になるという。
なお、利用は無料だが、Llama 2のリリース日時点で月間アクティブユーザー数が7億人を超える製品で利用する場合はMetaにライセンスを要求しなければならないとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- Meta、独自大規模言語モデル(LLM)の「LLaMA」を限定リリース
Metaは独自の大規模言語モデル「LLaMA」(Large Language Model Meta AI)を研究者向けにリリースした。「ChatGPT」のLLM「GPT-3.5」よりも小規模でも高性能としている。 - ラズパイで動く大規模言語モデルがGitHubで公開 性能は“GPT-3相当”、Metaの「LLaMA」派生
Raspberry Pi上で動かせる、GPT-3相当のLLM(大規模言語モデル)「Alpaca LoRA」がGitHub上で公開された。 - 機械に話しかけて設定できる時代が来る? なぜ“小規模”なLLMが求められるのか
LLMにおいて、学習パラメータ数は性能に直結する。一方で、注目を集めているのがLLaMaのような小規模なモデルだ。それはなぜか。