サイバーエージェント、日本語に強い“視覚言語モデル”公開　パラメータ75億、商用利用もOK

» 2024年06月13日 13時07分公開

　サイバーエージェントは6月13日、75億パラメータの日本語大規模視覚言語モデル（Vision Language Model、VLM）を一般公開した。Hugging Faceで商用利用可能なAIモデルや、研究用途でのみ使えるデモを公開中だ。

サイバーエージェント、日本語に強い“視覚言語モデル”公開

　VLMとは、画像とテキストを複合して扱えるマルチモーダルなAIモデル。画像とテキストを理解できることで「この写真に写っているものは何ですか？」のような質問にも対応できる。米OpenAIの「GPT-4o」などが代表的なモデルで、近年では画像を扱えるAIモデルの進化が急速に進んでいる。

　一方で「VLMのほとんどは英語のデータを中心に学習しており、日本文化の理解や日本語での会話に強いVLMは少ない状況」とサイバーエージェントは説明する。このような背景から同社は日本語に強いVLMを公開。日本語大規模言語モデルで合成して作ったデータセットをメインに学習させたという。

　サイバーエージェントは「公開したモデルをベースとしてチューニングすることで、画像を加味した対話AIなどの開発も可能。これにより、より多くの人々が日本語VLMに関する最先端の研究開発に取り組んでもらえる」と説明。同社は今後もVLMの開発とビジネス活用を進めるという。

サイバーエージェントはなぜ“基盤モデル”を開発するの？　生成AIブームの今知りたい、AIベンダーの動向
生成AIブームの今、注目のキーワードが「基盤モデル」だ。各AIベンダーたちの間で基盤モデルの開発競争が激化する中、それぞれの開発状況や強みを探っていく。今回は、サイバーエージェントに話を聞いた。
AI開発・運用手法「MLOps」の資料、サイバーエージェントが無料公開　全500ページ超えの大ボリューム
サイバーエージェントは、AIや機械学習アルゴリズムの開発・運用手法「MLOps」の研修資料を無料公開した。アプリ開発などに使う仮想化技術「Container」の資料の他、MLOpsの基礎編と応用編、実践編の全4つの資料を公開している。
社内向け「画像生成AIガイドライン」　サイバーエージェントが策定　「既存作品や作家名の入力は禁止」
サイバーエージェントは、社内クリエイター向けに「画像生成AIガイドライン」を策定したことを発表した。「プロンプトに既存著作物や作家名、作品、著名人、有名人の名称の入力を禁止する」などの項目を設け、2月から運用中という。
“純粋な国産AI”誕生　ハードもデータも全部日本製　スパコン「富岳」で開発
スーパーコンピュータ「富岳」で学習をした日本語特化の大規模言語モデルを開発した──東京工業大学と東北大学、富士通、理化学研究所、名古屋大学、サイバーエージェント、Kotoba Technologiesの合同研究チームは、そんな発表をした。
米Appleの独自AI「Apple Intelligence」の技術詳細　基盤モデルや学習データなどを解説
米Appleは、年次開発者会議「Worldwide Developers Conference 2024」（WWDC24）において、iOS 18、iPadOS 18、macOS Sequoiaに統合される独自AI「Apple Intelligence」を発表した。このシステムの基盤モデルについて、簡潔にまとめる。