2023年は「生成AI(生成系AI、ジェネレーティブAI)」に関連するトピックが盛り上がった一年でした。一方で、急に多くの話題が展開したこともあって、「ChatGPT(チャットジーピーティ)が流行ったことは知っているけれど、ほかに何があるのかさっぱり……」という人も少なくないのではないでしょうか。
そこで、本稿では、テキストや画像を生成できるサービスを中心に、生成AIに関連するここ1年ほどのトピックを、かいつまんで振り返りたいと思います。
スマートフォンやスマートウォッチ、タブレットを軸に、ICT機器やガジェット類、ITサービス、クリエイティブツールなどを取材。Webメディアや雑誌に、速報やレビュー、コラムなどを寄稿する。X:@kira_e_noway
生成AIの中でも、テキストから画像を生成できる技術のトピックは2022年ごろから増えていました。例えば2022年7月には「Midjourney(ミッドジャーニー)」、同年8月には「Stable Diffusion(ステイブル・ディフュージョン)」がリリースされており、翌年の生成AIブームを迎える前からこうしたサービスはすでに話題になっていたのです。
爆発的に生成AIの話題が増えたのは2022年11月30日、自然言語処理に長けたChatGPTを米OpenAI社が公開したのがきっかけでした。このタイミングでは大規模言語モデルとしては「GPT-3.5」が使われており、サービスもプロトタイプ版として無料で一般公開されていた状態でした。
23年2月には有料版サービス「ChatGPT Plus」が登場。こちらは大規模言語モデルが「GPT-4」にアップデートされました。
このころには、ChatGPTのAPIを活用したサードパーティ製のサービスが続々と登場。2月にはAI機能を英会話の練習機能を整えた英会話アプリ「Speak(スピーク)」の日本語版がリリースされ、App Storeの「教育」カテゴリで1位に。3月にはChatGPTのAPIを活用することでLINE上でChatGPTが使える「AIチャットくん」がリリースされ、多くのユーザーを獲得しています。
ChatGPTの競合も現れ、Facebookを運営する米Meta(メタ)は2月、大規模言語モデルの「LLaMA(ラマ)」をリリース。言語モデルを公開するオープン戦略での差別化が特徴です。米Googleも3月に「Bard(バード)」を公開しています(現在は「Gemini(ジェミニ)」に名前が変わっています)。
2023年3月には、画像生成に関連するトピックが重なりました。
「Photoshop」などで知られる米Adobe(アドビ)が3月、画像生成AIサービス「Firefly(ファイアフライ)」を発表。一般向けの正式提供は同年9月からでしたが、「著作権侵害のリスクがほぼない状態で生成された画像を商業利用できる」という特徴がユニークでした。
4月には、米Microsoft(マイクロソフト)がWebブラウザ「Edge」上で使える画像生成ツール「Image Creator(イメージクリエイター)」の提供を開始。同社が出資しているOpenAI社の画像生成モデル「DALL・E2」を活用して実現しています。10月には「DALL-E3」ベースの「Bing Image Creator」もリリースしています。
23年5月以降、「ChatGPT」のようなテキスト生成に対応したWebサービス(生成AIチャットボット)への関心が加速しました。このころには大手企業がある程度形になったサービスを複数の国向けに提供し始めます。
Microsoftは5月、生成AIを活用した「新しいBing」をオープンプレビュー版として公開。同月にはGoogleも、Bard(現Gemini)を日本語にも対応した状態で提供するに至りました。
7月にはMetaが「LLaMA 2(ラマ2)」の無料提供をスタート。8月末には、中国で検索エンジン「百度」を運営するBaidu(バイドゥ)が「ERNIE Bot(アーニー・ボット)」の一般提供を開始しています。
生成AI活用の深化も急ピッチで進みます。8月、米Qualcomm Technologies(クアルコム・テクノロジーズ)が、同社のスマートフォン向けプロセッサ「Snapdragon」で使える「オンデバイス生成AI」への取り組みを発表。クラウドを経由せずスマートフォンなどの端末上で直接AI処理を行う技術で、MetaのLLaMA 2をベースにして24年以降にオンデバイスで利用可能な状態になるとしています。
(2023年10月以降のトピックは後編に続きます)
Copyright © ITmedia, Inc. All Rights Reserved.