サイバーエージェントは11月2日、新しい日本語大規模言語モデルを無料公開した。日本語と英語データで事前学習をした70億パラメータのベースモデル「CyberAgentLM2-7B」と、チャット向けにチューニングした「CyberAgentLM2-7B-Chat」の2種類を配布。ライセンスはApache License 2.0で、いずれも商用利用できる。
CyberAgentLM2-7B-Chatは、一度に3万2000トークン(日本語にして5万文字)の入出力に対応。ベースモデルと合わせて、AIモデル共有サイト「Hugging Face」で配布している。
サイバーエージェントは5月にも、最大68億パラメータの日本語大規模言語モデル「CyberAgentLM」を無料公開していた。同社は「今後もモデルの公開や産学連携などの取り組みを通じて国内における自然言語処理技術の発展に貢献していく」と表明している。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR