Galaxy S24シリーズの目玉機能「Galaxy AI」を全方位で検証 スマホ体験が大きく拡張される!(1/4 ページ)

» 2024年04月11日 17時00分 公開
[石井徹ITmedia]
※本記事はアフィリエイトプログラムによる収益を得ています

 Galaxy S24シリーズの目玉機能「Galaxy AI」。通話翻訳、文字起こし、画像編集……といった具合に多くの新機能が発表された。このレビューでは、「Galaxy AI」の名の下に集いし新機能を検証した。

Galaxy AI Galaxy AIは「Galaxy S24」シリーズの目玉機能だ

「Galaxy AI」はオンデバイスとクラウドを併用 2025年までは無料で利用できる

 Galaxy AIは、Galaxy S24シリーズとともに発表されたGalaxyスマートフォンの新たな看板機能だ。以下のようなことができる。

  • 機内モードで翻訳する
  • 会話した内容を文字起こしする
  • 通話を文字起こしする
  • 録音やWebサイトを要約する
  • 写真の被写体の位置を動かす
  • 画像生成で壁紙を作る
  • 動画をスローモーション再生する

 Galaxy AIには現時点で対話機能はない。それどころか「Galaxy AI」というアプリがあるわけでもない。スマホ内の随所に統合されており、「キラキラの絵文字」が目印だ。多くは生成AIを用いた機能だが、アプリを使う一連の流れの中で、スムーズに利用できるように工夫されており、ChatGPTのように質問を考えたりする手間もない。

 Galaxy AIは、対象のGalaxyスマートフォンのユーザーには2025年までは無料で提供される。ただし、2026年以降のGalaxy AIの提供形態については明らかになっていない。 

 Galaxy AIでは、オンデバイス処理とクラウド処理の2種類のタスク実行方法を使い分けている。

 オンデバイス処理は端末側に学習済みの言語モデルをインストールしておいて、実際にデータを処理する段階ではローカル環境で行うものだ。通信を必要としないためレスポンスが早く、オフライン環境でも利用できる。データ処理がオフラインで完結するため、プライバシーの観点から重要なデータを扱うのに適しているとされる。

 クラウド処理は、5GやWi-Fiなどでデータを送信し、サーバ上で処理する。スマホでは扱いづらい大きなデータや、複雑なタスク処理に適している。サーバを設置する費用がかかるため、サーバ運営者としては負担になる。

Galaxy S24 Snapdragon 8 Gen 3を搭載する「Galaxy S24」。通訳機能をオンデバイス処理でまかなえる

 オンデバイス処理の性能は、スマホに搭載されているSnapdragonプロセッサのNPUに依存している。一部の機能については、最新のGalaxy S24ではオンデバイス処理が可能だが、旧世代モデルではクラウド処理を利用する必要があるかもしれない。この場合、旧世代モデルではレスポンスが多少遅くなる可能性がある。

 オンデバイス処理による通訳機能は日本語を含む13カ国語に対応している。対応言語は今後拡充予定としている。

Galaxy S23やZ Flip/Fold5もGalaxy AIをサポート

 サムスンはGalaxy AIの機能をGalaxy S23シリーズやGalaxy Z Fold5/Flip5、Galaxy S23 FEなどに展開するとしている。日本で発売済みのGalaxy スマートフォンのうちGalaxy AIが利用可能となる機種は以下の通り。

  • Galaxy S24シリーズ(対応済み)
  • Galaxy S23シリーズ(S23/S23 Ultra)
  • Galaxy S23 FE
  • Galaxy Z Fold5
  • Galaxy Z Flip5

 Galaxy AIの多数の機能のうち、どの機能が移植されるかは明らかにされていないが、サムスン電子ジャパンの広報担当によると、「ほとんど全てが対象となる」という。Galaxy AIが目当てなら、旧世代モデルのGalaxy S23も利用できるようになりそうだ。

Galaxy AIとGoogleの生成AIの関係

 Galaxy AIは、Googleの生成AI「Gemini」シリーズを利用している。文字起こしのようなクラウド型のタスクでは、Google Cloud上で処理するGemini Pro/Ultraシリーズが活用している。一方、リアルタイム翻訳機能など、スマホ上で完結するオンデバイス処理のAIタスクにはGemini Nanoが用いられているようだ。

 なお、サムスンは具体的にどの機能にどのAIモデル(LLM)を用いているかについては明確にしていない。一部に自社開発の言語モデルや、Google製ではない言語モデルを採用している可能性もある。

検索が楽しくなる「かこって検索」

 「かこって検索」はAndroidの標準機能だが、Google Pixel以外ではGalaxy S24シリーズで先行して導入されている。この機能は、Google レンズの検索機能を拡張したものであり、スマホのどの画面からでも起動できる。画面内の検索したい対象を“かこって”指定することで、簡単に検索できるのが特徴だ。

 かこって検索は、さまざまな場面で活用できる。例えば、Instagram リールで見かけたファッションをショッピングサイトで検索したり、YouTubeショートで紹介されているガジェットについて深く調べたりするときに便利だ。また、カメラアプリ上で写した内容からも起動できるので、目の前にいる動物について調べることもできる。

かこって検索 「かこって検索」をカメラで使用して、目の前のものを検索できる

通話中の翻訳やテキスト表示はオフラインで動作する

 「通訳」アプリでは、対面の会話をリアルタイムで翻訳できる。オンデバイスで動作するため、外部に音声を保存する必要がなく、データも消費しない。

 通訳機能は電話での会話中に利用できるようになっている。通話では話した内容をテキスト認識→外国語へ翻訳→音声合成というステップを踏むことになるが、この一連の流れをオンデバイス処理で実現できている。

 通話口に話すと通話の文字起こしは逐次行われ、1秒もかからずに翻訳された内容が再生される。相手が食い気味に会話してくると難しいが、旅先の旅行カウンターで道を聞く用途などでは十分に使えそうだ。

 なお、通訳機能はボイスレコーダー機能と併用できない。つまり、通訳機能を使って外国人と会話した内容をプレゼン発表などについて質問しながら録音したい場合は、録音用と通訳用の機器は分けた方がいいだろう。

       1|2|3|4 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

最新トピックスPR

過去記事カレンダー

2024年