速報
Geminiアプリに10ページの絵本生成Gems「Storybook」追加 無料版、日本語でも
Googleは、Geminiアプリ上でAIが10ページの絵本を生成する新機能「Storybook」を発表した。プロンプトや写真、文書から物語とイラスト、ナレーションを自動作成する。日本語にも対応し、無料プランでも利用可能だ。
米Googleは8月5日(現地時間)、Webおよびモバイルの「Gemini」上で利用できる実験的アプリ「Storybook」を発表した。日本語を含む45カ国語をサポートし、無料プランでも利用可能だ。
Storybookは、プロンプトに大まかなストーリーを入力することで、10ページの絵本を生成する機能。完成した絵本には、読み上げナレーションも付く。
サンプルとして提示されているストーリーをクリックすると、1分前後でカスタムアートと音声で構成された10ページの絵本が表示される。
写真をアップロードすると、その写真の人物(や動物)を主人公にしたストーリーになるが、写真のままではなく、その写真をベースにしたイラストになる。
左カラムで修正を求めることもできる(例えば犬の名前を変更したり、画風を変えたりなど)。
写真だけでなく、ドキュメントをアップロードし、その内容を絵本にすることもできる。以下の動画では、自分のキャリアについて説明したGoogleドキュメントをアップロードし、自分の娘に仕事について説明する絵本を生成するというものだ。
StorybookはGemsとして提供されている。
完成した絵本はURLで共有したりFacebookやLinkedInで公開することも可能。印刷することもできる。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Google DeepMind、リアルタイムで世界を生成するAI「Genie 3」発表 “AGIへの足がかり”
Google DeepMindは、プロンプトから対話可能な世界をリアルタイムで生成するAI「Genie 3」を発表した。物体の状態を記憶する「ワールドメモリ」機能を搭載し、数分間の一貫性を維持する。AGIへの足がかりと位置づけられ、AIエージェントの訓練などに活用される。
Google、「Gemini」アプリに写真から音声付き動画を生成する機能追加
Googleの「Gemini」アプリに、写真1枚から音声付きの8秒動画を生成する新機能が追加された。動画生成モデル「Veo 3」を活用したもので、有料プランユーザー向けに提供。生成された動画にはAI製を示す透かしが入る。
Googleの動画生成AI「Veo 3」、Geminiアプリでも利用可能に(ただし「Pro」以上)
Googleの動画生成AI「Veo 3」が、Geminiアプリでも利用可能になった(「AI Pro」プラン以上対象)。また、Veoで生成した動画には、SynthIDに加え目視可能なウォーターマークも追加される(「Flow」のUltraプランを除く)。
Googleの動画生成AI「Veo 2」、Gemini AdvancedとWhiskに降臨
Googleは、高品質な動画生成AI「Veo 2」を「Gemini Advanced」で利用可能にした。また、「Google One AI Premium」ユーザーは、「Whisk」で生成した画像をVeo 2でアニメ化できるようになった。


