連載

2018年、ユーザーインタフェースに真の革新が始まるか鈴木淳也の「Windowsフロントライン」(3/3 ページ)

コンピュータUIの世界はCUIからGUIへの移行で利用者のハードルを下げることに成功し、タッチUIはそれをさらに簡易で直感的なものにした。一方で「コンピュータに逐次命令する」という利用スタイルは、CUIの時代から変化していないが、それがいよいよ変わる時が来るかもしれない。

前のページへ |       

Microsoftが目指している(かもしれない)未来のUIとは?

 コンピュータUIの歴史は、基本的なコマンドを覚える必要があったCUIから、マウスでウィンドウやアイコンを操作してキーボードで文字を入力できるGUIへと移行することで、ユーザーの裾野を広げることに成功した。そして、iOSに代表されるタッチUIでは、コンピュータの操作をさらに簡易で直感的に進化させている。


現在のタッチUIが一般化するきっかけとなった「iPhone」(画像は「iPhone X」)

 しかし一方で「コンピュータに逐次命令する」という利用スタイルは、CUIの時代から変化していない。これがコンピュータの利用スタイルを「次」へ飛躍させるための障害にもなっていると言える。

 恐らく、次のUIで最も重要なのは「先回り」だ。つまり、ユーザーの行動を先回りして予測し、最後にユーザーの「了承」を得ることで実行するスタイルになるのではないかと考える。

advertisement

 これまでPCやスマートフォンを使ってWebやアプリ経由で操作していたことの多くをコンピュータ(とクラウド、さらにその先にあるAI)が肩代わりし、ユーザーはその一連の動作を確認だけして、必要に応じてゴーサインを出すというスタイルだ。

 1日の行動に当てはめると、移動時は交通機関の乗り換え案内や天気予報、仕事中は会議や来客のリマインド、タスク管理など必要な情報を逐次適切なタイミングでユーザーに提示し、メールへの返信確認や出張先で泊まるホテルの予約確認など、最終的にユーザーの操作が必要なもののみ、「手」や「声」によるアクションを行う形となる。

 これを助けるのが各社が研究している「AI」や「ディープラーニング」のキーワードで呼ばれるクラウド技術の最新成果で、AppleのSiri、AmazonのAlexa、GoogleのGoogleアシスタント、MicrosoftのCortanaといったAIアシスタントの役割だ。


Windows 10標準のAIアシスタントとしておなじみの「Cortana」

 「機能をスキル単位で分割して音声で呼び出して制御する」というアイデアでAlexaの市場を広げたAmazonの存在は大きいが、一方で未来のUIの実現にあたっては従来のCUIやGUIの延長にあるAlexaでは、自ずとできることに限界があるとも考える。

 真のAIアシスタントとは、ユーザーのことを自動学習して、細かい設定や命令なしにユーザーの行動をバックアップできる「優秀なデジタル秘書」と呼べる存在だからだ。全てを音声で処理するなんてナンセンスだと言える。

 例えば、筆者はメモ書きなど単純な日本語テキスト打ちなら1時間で5000~6000文字程度のキーボード入力が可能だが、恐らく音声だけでこれを実現するのは難しいだろう。さらに言えば、手書き入力でも厳しい。適材適所というわけだ。

 もしAIで筆者の仕事を助けてくれるならば、タイプミスの自動修正や長い単語の自動補完、確実な日本語変換と校正機能を望むわけで、ユーザーの行動をなるべく省力化する方向に進むのが筋だと考える。

 スマートスピーカーなどのデバイスに向かって「音声で話し掛ける」という行為に抵抗感を抱く人も少なくないようだが、実は対話型インタフェースの肝は会話内容の省略可にある。

 例えば、スピーカー経由でピザをオンライン注文する場合でも、普段注文しているようなユーザーであれば「いつものやつでいいですか?」というおなじみの店員がやるような受け答えをスピーカーがしてきてもいいわけだ。つまり、1から10までアプリなど従来型UIでの操作を、そのまま対話インタフェースに置き換える必要はない。

 現状では「チャットボット(Chatbot)」のような仕組みに「面倒」と思う人もいるかもしれないが、初期のチャットボットが実現するのは「レスポンスのよさ」と「ヒューマンエラーの低減」にあり、究極的には「ユーザーとのやりとりを最低限にする」ことにある。対話方法は音声でもテキストでもいいが、未来のUIとは「逐次命令スタイルからの脱皮」にあるというのが筆者の意見だ。

 これが実現された世界では、WebのUIもアプリのUIも省略可能なものとなり、ユーザーが1対1で全ての項目を入力し、操作を行う必要はない。最低限の操作でアプリの実行内容に「同意」するだけだ。

 この未来のUIは、究極的には現在のアプリ文化を過去のものとする可能性がある。SMSを拡張したRCS(Rich Communication Service)などが典型的だが、メッセージングサービスのUIを使ってリッチなコンテンツ情報のやりとりが可能になる。

 例えば、チケット予約やQRコードで示された切符の取り出しなど、現在はアプリを使って行っているサービスがRCSで代替できる。ディスプレイやタッチパネル、キーボードといったデバイスを各サービスが必要としているのは、結局のところ情報確認の手段や、あるいはWebやアプリの細かい操作が必要とされることによる。


RCSの利用例。英Virgin Trainsのサービスでは対話インタフェースで、座席の予約や列車の到着情報を適時確認できる

ドラッグストアチェーンの米Walgreensのフォトプリントサービス利用例。対話インタフェースながら項目を選択して同意するだけで注文が完了する

 もし、AIの補助で全てのメールに目を通さなくてもよくなり、アプリで細かいチケット予約をする必要がなくなったとしたら、スマートフォンのようなデバイスを全てのユーザーが持つ必要があるだろうか。もしかすると、クラウド接続されたインカム型の音声入出力装置だけで用事が済むかもしれない。

 クラウドにリソースを注力するMicrosoftは、こうした世界を見据えて動いているのではないか。

前のページへ |       

Copyright © ITmedia, Inc. All Rights Reserved.