ChatGPTにはテキストを処理する機能だけでなく、画像を処理する機能があります。この機能のエンジンになるのは、米OpenAIが開発しているDALL-Eという名前の画像生成AIです。
例えば、料理の写真をアップロードして「この写真の料理のカロリー計算をして」と頼めば、瞬時に料理が特定されて、カロリーが出力されます。「この写真に写っている車の台数を数えて」だとか「このグラフでおかしなところを教えて」のような質問もできます。
画像の合成機能も強力です。例えば、最初に「〇〇県〇〇市のマスコットキャラクターの企画書を作成して」と頼むと、地域の魅力を盛り込んだ企画書がテキストで出力されます。
この後さらに「この企画書をベースにしてマスコットキャラクターの画像を描いて」と頼むとDALL-Eが呼び出されて、マスコットのキャラクターを表示します。「眼鏡をかけて」とか「ガッツポーズで」と頼めば、注文に応じて描き直します。
ChatGPTにはPythonとDALL-E以外にも外部のアプリケーションの機能を呼び出すGPTsの機能があります。
文章を映像化するHeyGenやVisla、美しい図を作成するWhimsical Diagrams、高度な科学計算を行うWolfram、YouTube動画を要約するVoxScriptなど、ロゴデザインや資料作成のCanvaなど、すでに数万種類のカスタムAIが用意されています。あなたが作ったカスタムAIを公開して他のユーザーに使ってもらうことも可能です。
ChatGPTsのメニューから「GPTsを探索する」でGPTsのディレクトリに入り、使いたいGPTsを検索します。試用してよかったら、メニューの「サイドバーに保持する」をチェックすると、簡単に呼び出せるようになります。
最近使ったGPTs、自作のGPTs、サイドバーに保持したGPTsは「メンション」機能を使って呼び出すこともできます。GPTsの画面ではなく、通常のChatGPTのセッションのプロンプトの入力中に@を入力してみてください。呼び出せるGPTs が表示されますので、選択し@GPTs名を含めた形でプロンプトを入力します。メンション機能を使うと、一つのセッションの中で複数のGPTsを組み合わせて活用することができます。
GPTs図解のディレクトリでWhimsical Diagramsを選択してセッションを始めます。そして「AIの未来についてブレインストーミングしてください」というプロンプトを入れてみます。すると最初にGPTsによってテキストでアイデア出しが行われます(GPTが気を利かせていきなり図が出ることもあります)。そこで「Whimsical Diagramsでブレスト内容をマインドマップにして」と指示すると、次のようなきれいなマインドマップの画像が生成されます。
Whimsical Diagramsが気に入ったらサイドバーに保持で登録しておき、サイドバーのメニューから、あるいはメンション機能で呼び出せば、いつでもこんな図が作成できるのです。
次は原稿を与えるとナレーターが読み上げをしてくれるHeyGenを使ってみましょう。HeyGenをディレクトリで検索してセッションを開始したら「本日のトレンドを3つ教えて」と依頼してみましょう。
まずWeb検索を使って最新のニュースがChatGPTに取り込まれて表示されるでしょう。ここで「このトレンドを解説する映像を作成して」と頼んでみましょう。ナレーターの音声選択など追加で質問されるかもしれませんが、3つのニュースをアナウンサーが解説する映像が生成されます。
Geminiを業務で使いこなす! Google Cloudが指南する「プロンプト入力」4つのポイントは?
野村が捨てた「資産3億円未満」を狙え SMBC×SBIが狙う“新興富裕層”の正体
なぜ日本企業のDXは失敗続き? BCGが指摘する“ITを知らなすぎる”経営者の責任
DXの“押し付け”がハラスメントに!? クレディセゾンのデジタル人材育成を成功に導いた「三層構造」とは
日本人はなぜこれほどまでに「学ばない」のか 背景にある7つのバイアスCopyright © ITmedia, Inc. All Rights Reserved.
Special
PR注目記事ランキング