ニュース
サイバーエージェント、日本語に強い“視覚言語モデル”公開 パラメータ75億、商用利用もOK
サイバーエージェントは、75億パラメータの日本語大規模視覚言語モデル(Vision Language Model、VLM)を一般公開した。
サイバーエージェントは6月13日、75億パラメータの日本語大規模視覚言語モデル(Vision Language Model、VLM)を一般公開した。Hugging Faceで商用利用可能なAIモデルや、研究用途でのみ使えるデモを公開中だ。
VLMとは、画像とテキストを複合して扱えるマルチモーダルなAIモデル。画像とテキストを理解できることで「この写真に写っているものは何ですか?」のような質問にも対応できる。米OpenAIの「GPT-4o」などが代表的なモデルで、近年では画像を扱えるAIモデルの進化が急速に進んでいる。
一方で「VLMのほとんどは英語のデータを中心に学習しており、日本文化の理解や日本語での会話に強いVLMは少ない状況」とサイバーエージェントは説明する。このような背景から同社は日本語に強いVLMを公開。日本語大規模言語モデルで合成して作ったデータセットをメインに学習させたという。
サイバーエージェントは「公開したモデルをベースとしてチューニングすることで、画像を加味した対話AIなどの開発も可能。これにより、より多くの人々が日本語VLMに関する最先端の研究開発に取り組んでもらえる」と説明。同社は今後もVLMの開発とビジネス活用を進めるという。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
サイバーエージェントはなぜ“基盤モデル”を開発するの? 生成AIブームの今知りたい、AIベンダーの動向
生成AIブームの今、注目のキーワードが「基盤モデル」だ。各AIベンダーたちの間で基盤モデルの開発競争が激化する中、それぞれの開発状況や強みを探っていく。今回は、サイバーエージェントに話を聞いた。
AI開発・運用手法「MLOps」の資料、サイバーエージェントが無料公開 全500ページ超えの大ボリューム
サイバーエージェントは、AIや機械学習アルゴリズムの開発・運用手法「MLOps」の研修資料を無料公開した。アプリ開発などに使う仮想化技術「Container」の資料の他、MLOpsの基礎編と応用編、実践編の全4つの資料を公開している。
社内向け「画像生成AIガイドライン」 サイバーエージェントが策定 「既存作品や作家名の入力は禁止」
サイバーエージェントは、社内クリエイター向けに「画像生成AIガイドライン」を策定したことを発表した。「プロンプトに既存著作物や作家名、作品、著名人、有名人の名称の入力を禁止する」などの項目を設け、2月から運用中という。
“純粋な国産AI”誕生 ハードもデータも全部日本製 スパコン「富岳」で開発
スーパーコンピュータ「富岳」で学習をした日本語特化の大規模言語モデルを開発した──東京工業大学と東北大学、富士通、理化学研究所、名古屋大学、サイバーエージェント、Kotoba Technologiesの合同研究チームは、そんな発表をした。
米Appleの独自AI「Apple Intelligence」の技術詳細 基盤モデルや学習データなどを解説
米Appleは、年次開発者会議「Worldwide Developers Conference 2024」(WWDC24)において、iOS 18、iPadOS 18、macOS Sequoiaに統合される独自AI「Apple Intelligence」を発表した。このシステムの基盤モデルについて、簡潔にまとめる。
