マイページ

注目記事を集めた総合ページ

ITの今と未来を見通す

スマホと通信の最新トレンド

進化するPCとデバイスの未来

好きが集まる　比べて選べる

ビジネスと働き方のヒント

AI活用のいまが分かる

企業ITのトレンドを詳説

経営リーダーのコミュニティ

マーケ×ITの今がよく分かる

ITエンジニア向け専門サイト

企業向けIT製品の総合サイト

IT製品の技術・比較・事例

製造業のIT導入・活用を支援

モノづくり技術者専門サイト

エレクトロニクス専門サイト

電子設計の基本と応用

エネルギーの専門メディア

建設×テクノロジーの最前線

ちょっと気になるネットの話題

Google I/O 2024

米Google、オープンな視覚言語モデル「PaliGemma」公開　「Gemma 2」の登場も予告

公開 2024年05月15日 05時08分

著者

[ITmedia]

印刷する

　米Googleは5月14日、視覚言語モデル（VLM）「PaliGemma」を公開した。VLMとは視覚的な入力に言語を対応させる言語モデルのことで、画像や動画を入力すると自然言語を出力できる。同社はこれを「オープンなVLM」と位置付けており、Hugging FaceやGitHubなど複数のプラットフォームで公開している。

「PaliGemma」の利用例

　また、同社が現在公開している大規模言語モデル（LLM）「Gemma」の次世代モデルに当たる「Gemma 2」も近々公開する予定であると発表。現在事前学習を進めている段階だが「Gemma 2の270億パラメータの性能は、米MetaのLLM『Llama 3』の700億パラメータに匹敵する」としている。

「Gemma 2」と他LLMとの性能を比較したグラフ

　Gemma 2の公開時期については「今後数週間以内」と説明している。

Copyright © ITmedia, Inc. All Rights Reserved.

印刷する

SpecialPR

この記事の著者

松浦立樹

関連記事

SpecialPR

メールマガジンを配信中

メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

メールマガジン最新号

国内大手が共同出資の「日本AI基盤モデル開発」、新名称「Noetra」で始動　産総研と国産マルチモーダルAI開発へ／AIでAIは作れるか Sakana AI、一部「ミュトス越えの性能」うたうAIを提供／日本のAI企業が活発に発表した1週間

SpecialPR

よく見られているカテゴリー

アクセスランキング

もっと見る

SpecialPR

ITmedia AI＋ SNS

@itm_aiplusをフォロー

インフォメーション

注目情報をチェック

お問い合わせ

広告に関するお問い合わせ

ITmedia AI＋をフォロー

あなたにおすすめの記事PR