Galaxy S24シリーズの目玉機能「Galaxy AI」を全方位で検証 スマホ体験が大きく拡張される!(2/4 ページ)

» 2024年04月11日 17時00分 公開
[石井徹ITmedia]
※本記事はアフィリエイトプログラムによる収益を得ています

通話をチャット感覚で行える「テキスト通話」

 通話中には「テキスト通話」と「リアルタイム翻訳」の2つの機能が利用できる。前者のテキスト通話は、通話を文字起こしして、合成文字で会話する機能だ。音声のテキスト化や処理はオンデバイスで行われる。

通話中に2つのAI機能が利用できる 通話中に2つのAI機能が利用できる

 テキスト通話は、通話を文字起こしして、テキストでやりとりする機能だ。音声のテキスト化や処理はオンデバイスで行われる。例えば、知らない番号からの着信に応答したくないときや、電車内など通話しづらい場面で重宝する。

テキスト通話機能 テキスト通話機能

 この機能を有効にすると、自分の声は相手に届かなくなる。Galaxyスマホがテキストに変換されて、通話相手には合成音声として再生される。相手の発話は、テキストに変換されて、チャット形式で確認できる。

 定型文として「今は話せません」「後でかけ直します」など、即座に送信できるボタンが4つ用意。状況に合わせて「電車なので後でかけ直します」といったメッセージをテキスト入力して送ることもできる。

 通話の音声は、男声と女声が選択できる。いずれも一聴して合成音声と分かるような声になっている。声を出さずにスムーズなコミュニケーションが取れる点が魅力だが、通話相手からすると心理的なハードルを感じそうな印象だ。込み入った内容のやりとりには不向きだが、宅配便などの事務的な連絡や、知らない通話相手とのコミュニケーションには効果的だろう。

通話の「リアルタイム翻訳」は、ゆっくり話すなら十分実用的

 通話アプリはリアルタイム翻訳機能も備えている。この機能をオンにすると、自分が日本語で話した内容を、英語や韓国語などの外国語に変換してくれる。

 例えば、海外旅行先のホテルに予約確認の電話をする際、相手は英語で話し、こちらは日本語で話すような状況でもスムーズにコミュニケーションが取れる。自分が話した内容は逐次テキストに変換され、即座に翻訳されて相手に伝えられる。

 音声認識、翻訳、音声合成という一連の処理はオンデバイスで行われ、発話から翻訳音声の再生まで1秒もかからない。ホテルの受付のように、ゆっくりと話す相手なら十分実用的な会話ができるだろう。

通話アプリの「リアルタイム翻訳」機能 通話アプリの「リアルタイム翻訳」機能

 ただし、相手が早口で話した場合などは、聞き取りが間に合わず、誤訳によって意図が伝わらないこともありそうだ。また、テキスト通話と同様に人工音声でのやりとりになるため、相手に不審に思われる可能性もある。あくまで、旅先で自分が話せない言語での意思疎通を図るためのツールといったところだ。

 シンプルな会話なら、言葉の壁を感じずにコミュニケーションが取れるのは魅力といえる。旅先での問い合わせや、外国人との簡単な意思疎通には重宝しそうだ。

ボイスレコーダーで通話録音の文字起こしが可能 精度はどう?

 ボイスレコーダーアプリには、「文字起こしアシスト」という機能が搭載されている。これは、録音した音声をテキストに自動変換する機能で、クラウドを利用して処理される。録音後にアプリから文字起こししたい部分を選択し、サーバに送信する必要がある。Googleの「Pixel」シリーズのように、オンデバイス処理ではないため、話を聞きながらリアルタイムで文字起こしを確認することはできない。

 Galaxy S24シリーズ発表会のプレゼンテーションを録音し、文字起こししてみた。45分間の録音に対して、かかった処理時間は4分弱だった。

 文字起こし結果はおおむね正確で、一度聞いたスピーチを文字起こしで振り返るといった用途ならば、特に修正を行わずとも、大意は把握できる。話者認識機能も適切に動作しており、4人の登壇者が適切に区別されていた。ただし、固有名詞や専門用語などはうまく判別できないことが多い。書き起こしだけからスピーチ内容を正確に把握するのは、ちょっとコツを要するかもしれない。

ボイスレコーダーアプリの文字起こし機能ボイスレコーダーアプリの文字起こし機能 ボイスレコーダーアプリの文字起こし機能

 複数の言語が混ざった録音では、複数回文字起こしの操作を行う必要がある。日本語を選択して文字起こしを行った場合、英語で発言された部分は正しく文字起こしされないため、言語選択を変えてもう一度文字起こしする必要がある。外国語で文字起こしした内容は、翻訳した上で要約することも可能だ。

 以前からある通話録音機能を活用すれば、電話した内容も文字起こしできる。通話時に録音ボタンを押すと、通話内容がレコーダーアプリに録音される。通話後、レコーダーアプリから「文字起こし」を選ぶと通話内容の要約が取得できる。

録音、ノート、Webページの「要約」機能 アプリに統合されているのが強み

 ボイスレコーダーアプリで文字起こしした内容を、ワンタップで要約できる。「要約」機能もある。文字起こしした内容を、ワンタップで要約できる。長い録音の場合は、数分ごとに時間を区切って要約する形になっており、適宜見出しを付けている。要約の精度はCloud 3 Opsには及ばず、無料版ChatGPTのGPT-3.5と同等程度に感じられた。

ボイスレコーダーの要約機能 ボイスレコーダーの要約機能

 クラウドを利用したい文字起こしツールには、Galaxy AI以外の他の選択肢も多くある。例えば文字起こしは「ポケトーク」のようなアプリや専用デバイスもあり、要約機能はChatGPTなどの生成AIツールも活用できる。

 一方、Galaxy S24の文字起こしアプリでは、スマホの標準アプリに統合されているため、非常にシームレスに利用できる。操作の手間が掛からず、音声ファイルのやりとりなどの面倒な手順を経なくても文字起こしができる。こうした小さな手間がかからない点は、Galaxyならではの便利さといえる。

 要約は、ノートアプリでも利用できる。ノートに手書きで入力した内容をテキスト化して、その要約を作成することもできるため、ペン入力に対応する「Galaxy S24 Ultra」では、手書きした内容を文字起こしして、ノートのまとめを作成する用途にも使える。

 ただし、ノートの要約機能には200文字〜4000文字という文字数制限がある。手書きで走り書きした程度の文章では要約を作成することはできない(する必要もないかもしれないが)。

 「Samsung ブラウザ」には、Webページの要約機能が追加された。ボタンを押すだけで、ニュース記事の概要を読みやすい形で表示できる。要約の詳しさは2段階で選べる。要約した内容を翻訳することもできる。外国語のニュースをざっと把握したい時に便利だ。

Webサイトの要約機能 Webサイトの要約機能

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年05月16日 更新
最新トピックスPR

過去記事カレンダー

2024年