レビュー

視界に情報が浮かぶ「Rokid AIスマートグラス」を試す スマホを超えるトキメキあり?(4/4 ページ)

Makuakeで6億円以上の資金を調達し注目を集める「Rokid スマートAIグラス」の実機レビューをお届け。約49gの軽量ボディーにカメラとディスプレイを凝縮。AI字幕やハンズフリー撮影の実力から、実生活での課題までを解説する。

前のページへ |       
※本記事はアフィリエイトプログラムによる収益を得ています

実生活で検証:特に輝いた「カメラ」と「字幕」のポテンシャル

 Rokid スマートAIグラスが届いてから数週間、日常生活の中で使い込んでみた。正直なところ、使い始めの数日間は「このデバイスをどう使いこなすべきか」と戸惑いがあった。確かに「Hi Rokid」と話しかければ、AIが素直に質問に答え、指示に従ってくれる。それは面白いが、それらの機能をどう日常に落とし込んでいくのかを考える日々だった。


専用スマートフォンアプリのUI。主要機能の呼び出しやカスタマイズ、詳細な本体設定を一括で行える

カウンターのすし店での一コマ。職人から手渡しされる瞬間など、両手がふさがるシチュエーションでも目線そのままの構図でハンズフリー撮影ができる(撮影協力:田町惠万)

 個人的に最初に便利だと感じたのはハンズフリーで撮影できるカメラだ。テンプル(つる)部分のボタンを1回押すだけで撮影できる。

 例えば、ランチで食べたメニューもスマートフォンを取り出すことなく、ボタンを押すだけで撮れる。バス停の時刻表や街角のちょっとしたポスターなどもメモ感覚で撮れる。また、写真からの検索も可能だ。草木や動物など、気になったモノを撮影して検索すると、それだけで答えが出る。これまではスマホを取り出して撮影/検索していたため、その手間が大幅に省けるようになった。

advertisement

画像認識によるAI検索の例。ミミズクの画像を認識させると、関連する正確な情報を返してきた

 また、私の仕事柄、メーカーからレビュー用の家電やガジェットをお借りする機会が多い。返却時のために開封前の梱包(こんぽう)状態を記録しておく必要があるのだが、開梱しながらの一連の作業を動画でそのまま記録できるのは非常に便利だ。両手が自由になるハンズフリー撮影の恩恵を最も強く感じる瞬間である。

 カメラ画質は約1200万画素ということもあって最新スマホと比べれば割り切りが必要であり、暗所や動きの激しい被写体の撮影には不向きだ。

 しかし、日常のメモとしてのクオリティーは十分に満たしている。注意したいのは、初期設定では縦長のアスペクト比になるため、慣れるまではフレーミングがやや難しかった点だ。ただし、目線からの画角は新鮮で臨場感がある。小さな子どもがいる家庭などでは、より楽しい家族写真が撮れそうだ。


アプリ内のカメラ設定画面。アスペクト比の変更やロゴの配置などをカスタマイズできる

 そして個人的に最も役に立ったのが字幕機能だ。これは会話の音声を認識して、視界内に緑色の文字で字幕を表示する機能だ。Rokid スマートAIグラスはライブ翻訳が可能な製品であり、日本語を認識して字幕を表示させることもできるが、これが非常に便利だった。

 例えば、大人数が集まるパーティーや騒がしい居酒屋での会食といったシーンが挙げられる。大音量でBGMが流れていたり、隣のテーブルの歓声にかき消されて相手の声が聞き取りづらかったりする状況において、このリアルタイム字幕が強力な味方になってくれる。


字幕モードの活用イメージ。適度な騒音下であれば十分に機能する。プライバシーに配慮し、音声データ自体は保存されず、テキストログのみがアプリ側に残る仕組みだ

 発言がほぼタイムラグなしで文字化されるため、環境音に阻まれて言葉を拾い損ねた瞬間でも、視覚的に会話を補完して内容を把握できる。まれに誤認識や細かな誤変換は見られるものの、前後の文脈から意味を推測するのは容易だ。ビジネスや社交の場で、相手に何度も「え?」と聞き直す気まずさから解放されるメリットは非常に大きい。

 試用期間に外国語を話す人と会う機会がなかったので、ライブ翻訳は動画で試した。静かな場面での会話やナレーションはしっかり認識してくれる。英語/中国語/韓国語から日本語への翻訳で試したところ、誤訳や無反応のタイミングもあったが、感覚的に7~8割の精度でライブ翻訳できた。

 ただし、映画などでBGMの音量が大きいと、「周囲が騒がしい」と警告が表示され、翻訳が止まったので環境に左右される印象だ。

 スマホを取り出して翻訳アプリを起動する従来の方法と比べると、視線の移動が格段に減る。相手の顔を見たまま字幕を読めるため、会話の自然さが損なわれにくい。完璧ではないが、速度と精度のバランスは実用域だと感じた。

 また、翻訳機能については、看板やメニューなどのテキスト翻訳も試した。飲食店のメニューにカメラを向けると、そのまま視界内に日本語が表示される。ただし、スマートフォンのカメラ翻訳の場合、写真の上に翻訳結果が載るのに対して、Rokidの場合は、テキストと音声なのでやや分かりにくかった。


中国語メニューのテキスト翻訳結果。レイアウトの再現性には課題を残すが、注文内容の把握には十分に役立つ

実用上の課題は多数あるが、未来を感じた

 日常的に運用する中で見えてきた懸念点もある。最大のハードルは、操作の主軸が音声コマンドである点だ。

 人通りの多い街中や静まり返った電車内で、突然「Hi Rokid」と発話するのは心理的抵抗が大きい。また、騒音に阻まれてコマンドが不発に終わるシーンも散見され、屋外での扱いづらさにつながっている。

 右側テンプルのタップ操作によって物理的にメニューを呼び出す手段も用意されているが、こちらのレスポンスやUIの操作性についても、もう一段のブラッシュアップを期待したい。

 また、期待の大きかったGoogleナビゲーションの視界内表示だが、スマホの画面を見下ろす「歩きスマホ」を防止できる点は評価できるものの、現時点では実用性にやや不満が残る。

 目的地を設定する際にアプリ側での詳細な住所入力が求められたり、音声コマンドでの曖昧な指定では見当違いの場所へナビゲートされたりするケースがあった。

 移動モードとして自転車や自動車も選択可能だが、視界に情報が常時介在する特性上、徒歩以外のシチュエーションでは道路交通法や安全運転義務の観点から使用を控えるべきだろう。

 社会的なリスクとして看過できないのは、カメラ内蔵のデバイスを常時着用しているがゆえに、周囲から盗撮などを疑われかねない点だ。実際、知人にこのデバイスの機能を説明した際、カメラの存在に対して警戒感やネガティブな反応を示す人は少なくなかった。

 プライバシーへの配慮として、公共の場所や特定のコミュニティー内など、使用するシチュエーションには細心の注意を払う必要がありそうだ。

 Rokid スマートAIグラスは、視覚と撮影を両立した“ディスプレイ・カメラ双方を搭載する多機能モデル”として極めて魅力的なプロダクトだ。しかし運用にあたり留意したいのは、メーカー側が多言語ライブ翻訳などの高度なAI機能の利用に対して、ポイント消費型の従量課金システムを導入している点である。

 レビュー時点でアプリ内にはまだサブスクリプションやポイント購入の導線が見当たらなかったため、これらは一般発売後のアップデートで正式実装されるとみられる。

 Makuakeのプロジェクトページにおける案内によると、オンライン翻訳の利用に「5ポイント/分」、AI文字起こしに「3ポイント/分」が消費される仕様だ。

 毎月100ポイントが無償提供される他、月額1500円で1000ポイントがパッケージされたプランが用意されるという。必要に応じてポイントの都度購入(チャージ)も可能なため、毎日ヘビーに翻訳機能を使わないライトユーザーであれば、月額課金なしでも十分に運用できそうだ。

 Rokid スマートAIグラスを実際に使ってみた結果、豊富な機能とその使い勝手から、スマホやスマートウォッチが登場したとき以上の強い高揚感と未来を感じている。AIとウェアラブルの相性の良さがそこにはある。

 まだまだ課題はあるが、今みんながスマホを持っているように、スマートグラスを装着するのが当たり前になる生活を、いち早く体験させてくれるデバイスだ。

前のページへ |       

Copyright © ITmedia, Inc. All Rights Reserved.