ニュース
年末年始にLLMの勉強はいかが? 東大松尾研、大規模言語モデルの講座資料を無料公開
東京大学松尾研究室は、大規模言語モデル(LLM)の講義資料を無償公開した。同研究室が9〜10月に実施した「東京大学サマースクール 大規模言語モデル講座」で使用したもの。
東京大学松尾研究室は12月27日、大規模言語モデル(LLM)の講義資料を無償公開した。同研究室が9〜10月に実施した「東京大学サマースクール 大規模言語モデル講座」で使用したもの。ライセンスは「CC BY-NC-SA 4.0 DEE」で非営利の場合に限って二次利用できる。
講義資料は特設ページからダウンロード可能で、全7講義分のパワーポイントを無料で取得できる。内容はLLMの概要から、日本でのLLMの開発状況、Transformerと事前学習の仕組み、ファインチューニングなど。
また、2024年1月には演習用コンテンツも新たに公開を予定している他、「更にバージョンアップした」という、24年度版大規模言語モデル講座も開催する。こちらの講座の事前申し込みも受付中。
関連記事
- 東大松尾研、大規模言語モデルの研究者&開発エンジニアを募集 「LLM研究をさらに加速させる」
東京大学松尾研究室は、大規模言語モデル(LLM)の研究者や開発エンジニアを募集するとX(旧Twitter)で発表した。2024年、LLMの研究をさらに加速させるためチームを拡大するという。 - ChatGPTでの業務効率化を“断念”──正答率94%でも「ごみ出し案内」をAIに託せなかったワケ 三豊市と松尾研の半年間
「ごみ出し案内」業務にはChatGPTを“活用しない”と決断──生成AIを使った業務効率化を検証してきた、香川県三豊市がそんな発表をした。実証実験には松尾研も協力したが、思ったような成果が出せなかったという。一体なぜか? - 東大松尾研究室がインフラエンジニア募集 物理サーバ・クラウド双方の経験がある人材募る
東京大学松尾研究室が、新たにインフラエンジニアの募集を始めた。 - ELYZA、新たな日本語言語モデルを一般公開 同社「日本語ならGPT-3.5を上回る性能」 商用利用も可
東大発のAIスタートアップ企業であるELYZAは、商用利用可能な日本語の大規模言語モデル(LLM)「ELYZA-japanese-Llama-2-13b」を公開した。日本語性能の評価では「GPT-3.5(text-davinci-003)」を上回るという。 - 日本語に強い大規模言語モデル「Swallow」 産総研と東工大が公開 事前学習用の日本語データに工夫
産業技術総合研究所と東京工業大学の研究チームは、日本語に強い大規模言語モデル(LLM)「Swallow」を公開した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.