メディア

2024年、生成AIはどう進化する？　「カスタマイズ」「マルチモーダル化」から考える：前編（3/3 ページ）

» 2023年12月29日 07時00分公開

＜注目キーワード2＞マルチモーダル化

　画像や音声といった複数の形式のデータを扱うことができるマルチモーダル化も、生成AIの可能性を広げている。

　ChatGPTでは、画像解析の機能が9月から利用可能になった。これは、画像をアップロードしてその内容について質問できるものだ。例えば、写真をアップロードして「ここは何が写っていますか？」と質問すれば、写真の内容について説明した回答が返ってくる。紙の書類を撮影したものをアップロードしてその内容についてやりとりするといったことも可能なので、デジタル化されていない資料も扱いやすくなった。

写真をアップロードして、「この写真には何が写っていますか？」と質問すると、写真の内容についての説明が返ってくる

　また、同じく9月から提供されている音声会話は、ユーザーが音声で質問して、それに対してChatGPTから音声で回答を得るやりとりを連続で行える機能だ。日本語にも対応しており、イントネーションもかなり自然なので、人間同士の会話に近い感覚でやりとりできる。リリース当初は有料プランのみで利用できる機能だったが、現在は無料プランのユーザーにも開放されている。実際に使ってみるとかなり「未来」を感じられる機能なので、まだ使ったことのない方はぜひ試してみてほしい。

音声で質問をすると、音声で回答が返ってくる。連続して会話を続けることができ、やりとりの内容はテキストでも残される

　そしてGoogleも、マルチモーダルAIモデルの「Gemini」を12月に発表。実際にどの程度の性能を備えているのかはまだ見えていない部分も多いものの、GPT-4の対抗モデルということで寄せられる期待は大きい。Bardの英語版ですでに提供されているほか、今後はGoogle PixelやGoogle検索、Chromeといった同社の主要な製品やサービスで利用できるようにしていく予定だという。

　24年はこれらがさらに進化し、これまでは扱いづらかった情報が扱えるようになったり、生成AIでは十分な成果が得られなかった作業を問題なく行えるようになったりしていきそうだ。

　生成AIが進化し、できることが増えていくのは喜ばしいことだが、それによって「うまく使いこなす人」と、「積極的に使おうとしない人」の差はより広がっていくかもしれない。置いていかれないためには、自分の仕事に対して「この作業は本当に自分でやる必要があるのか？」「AIに任せたり、協業したりできる可能性はないか？」という視点をもち、実際にトライしていく姿勢が重要になるだろう。

　記事の後編では「今からでも遅くない！ビジネスシーンで使えるおすすめプロンプト」の事例を紹介する。

分析作業、9時間→6分に　パナソニック流、生成AIの活用法
「生成AI 動き始めた企業たち」第6回はパナソニックコネクトを取り上げる。これまで9時間かかったアンケート分析業務を6分に短縮できたと発表し、話題を呼んだ同社。いかにして生成AIの業務活用を進めているのか。
生成AIを「利用しない」リスクとは　村田製作所が全社導入した理由
連載「生成AI 動き始めた企業たち」第10回は、村田製作所を取り上げる。スマートフォンやPCで使われる電子部品の生産・開発は世界でもトップクラスのシェアを誇る同社。長年、DXにも注力し、AI開発にも力を入れる。同社の強みはどこにあるのか――。
東京都、生成AIをどう利用？　最大の効果は「時短」ではなく……
8月から文章生成AIの全局導入を始めた東京都は、生成AIのメリットについて「単純な業務時間の短縮効果にとどまらない」とする。導入から約3カ月。東京都が生成AI活用を通じて得た「時短効果」以上の手応えとは――。
ChatGPT、神戸市はどう活用？　職員の負担を半減させたテクニックとは
DXの先進自治体として知られる神戸市。5月に他の自治体に先駆けて、生成AIの利用に関する条例を制定し、6月から対話型AI「ChatGPT」の試験利用を進めている。市では現在、生成AIをどのように活用しているのか。条例やガイドラインはどのように整備していったのか。