この秋、iOSに本格的AR・AI時代が到来(2/5 ページ)

» 2017年06月16日 20時46分 公開
[林信行ITmedia]

iOS内蔵の人工知能、Siriがさらに賢く進化

 一方で、3億7500万ユーザーが利用するiOS内の人工知能、Siriもさらに賢く進化する。

 まず米国英語版では人と区別がつかないほど自然な声に進化。同じ単語に対しても何種類か違う発音のバリエーションが用意されているおかげで、機械っぽさが抜けて、まるで人間が話しているように聞こえる。

 英語圏ではさらに、Siriを旅行先で通訳に使える。英語のフレーズを中国語、スペイン語、フランス語、ドイツ語、イタリア語の5カ国語に翻訳させることが可能になるのだ。もちろん、日本語圏を含む英語圏以外の人たちがすぐに恩恵を受けられるポイントもたくさんある。

 例えば、Siriは一問一答の人工知能で、「エイブラハム・リンカーンの子どもは?」(実は2人いる)と聞いたとき、これまでは最も該当する確率の高い回答を1個しか答えてくれなかったが、iOS 11のSiriは「ロバート・トッド・リンカーン」と「タッド・リンカーン」といった具合に複数の答えを列挙してくれる。

Siriは複数の答えがある問いにも対応

 また、新しいSiriはユーザーが次に何をしたいか先回りして予想する精度がさらに上がる。例を挙げると、SiriはApple Musicを通してあなたの音楽の好みを既に理解しているので、あなたが気に入りそうな曲をより正確に予想して選曲してくれる。Siriができるのは音声による受け答えだけでなく、iPhoneの中で静かにあなたの行動を見守って、次にやりそうなことを手助けしてくれるのだ。

 SiriはあなたがiOS標準の「ニュース」機能でどんな記事をよく読んでいるかを学び、あなたが気に入りそうなニュースを正確におすすめしてくれる。メールで文字を入力する際は、位置情報を元にあなたが入力しそうな地名などを候補として表示してくれる(アイスランド旅行中は数文字打つと、普段はでてこない「レイキャビック」が入力候補として出てくる)。iMessageで友だちから「何時ごろに着きそう?」と聞かれると、経路探索をして到着時間を計算し結果の到着時間を返答の候補として表示してくれるし、Safariで旅行予約サイトなどから予約を行うと、そのことを認識してカレンダーに入力すべきかを聞いてくる。

進化したSiriで、より広範なアプリが声で操作できるようになった

 こうして学んだあなたに関する情報は、iPhone単体だけではなく、iPadやMacといったあなたのApple IDを登録した他のアップル機器でも共有される。これまではiPhoneのSiriもiPadのSiriも、MacのSiriもバラバラで、アドレス帳にある誰が自分の配偶者で、誰が自分の兄弟なのか一台一台学習させる必要があったが、これからはたった1度だけ教えれば他デバイスで教え直す必要はなくなる。

あなたの次の動きを読むSiriの知性がiCloudを経由して機器間で同期するように。しかも、プライバシー情報の保護にはIT業界でも最先端の配慮

 Siriが、ここまであなたについて詳しくなると、なんだか生活を監視されているようで心配になる人もいるかもしれない。だが、実はSiriが観察した情報は必要なとき以外はiPhone、iPad、Macといったあなたの手の中にある機器の中にとどまっている。たまに必要に応じて行われるクラウドとの通信は傍受できないように暗号化され、他の会社はもちろん、Apple自身にも見られることはないとしている(次の記事でも触れるが、もともとユーザーのプライバシー保護を重視しているAppleが、最近さらに本腰を入れ始めている)。

Siriの知性が他社製のアプリでも活用できるように

 こうしたSiriの知性は今後、Apple以外のアプリにも組み込まれていく。既に昨年のiOS 10からSiriを使って他社製アプリの操作が少しずつ可能になっている。例えば、乗り物の配車やメッセージの送受信、写真の検索、VoIP通話の発信、ワークアウトアプリの操作といったアプリのうち、Siriに対応しているものは、既に音声操作が可能になっていた。

 iOS 11では、それに加えオンラインバンキングアプリの操作や車連携機能、一覧型項目の作成、QRコードの作成なども可能になる。WWDCではその具体例な例として、OmniFocusというアプリでの新規To Do項目作成やCitiBank銀行アプリの操作、Evernoteでのメモの作成、Things 3アプリでのリマインダーの作成、そしてWeChatアプリで友人に送信するQRコードを自動作成といった事例が紹介された。

 また、Siriの高い認識能力も他のアプリに組み込みやすいように、AppleはiOS 11にCore MLという開発者向けの核テクノロジーを用意する。

 iOS 10のSiriに向かって「お寿司の写真を見せて」と言ったことはあるだろうか。あなたのアルバムの中にお寿司の写真があれば、かなり正確にそれを認識して一覧表示してくれる。これは最近、流行りの「機械学習」(Machine Learning)という方法で学習した認識能力だ。

Siriインテリジェンスには写真に何が写っているか、どういう用途に向いた写真かを認識して自動的にアルバムを作成する。iOS 11ではより多彩な写真を認識できるようになった

 Core MLを使えば、開発者がお寿司以外にも色々な物の写真を認識させたり、音を認識させたりすることが可能になる。

 Core MLでは、基本技術として写真や動画に写っている顔の認識や追跡、写っている名所旧跡がどこであるかの認識、写真中に写っている文字の認識、書類など四角い形状の歪み認識、バーコードの検出、写っている物体の移動を追跡、認識した物体の登録といった技術を用意している。つまり、こうしたプログラミングが苦手な人でも、今後は勝手にカメラで映った文字やQRコードを簡単に認識して利用できるアプリが開発できるようになる。

最近、話題の機械学習(マシンラーニング)の手法は一通りOS機能として用意。しかも、iPhone/iPadのGPUを最大限に活用し、1分あたりに行える画像認識の量もGoogle PixelやSamsung S8に比べて最大で6倍。プライバシーに配慮してすべて機器内で処理する

 画像認識以外に、文章の解析技術も組み込まれている。その文章が何語であるかの識別に始まり、少し専門的になるが形態素解析(文章を最小単位に分解)、語形変化の解析、品詞の同定、固有表現抽出といった技術が標準装備されている。

 Appleが用意した上記の基本の認識技術に加え、自らiPhoneにもっと複雑な認識機能を加えたい場合には、下の写真にある6種類の機械学習ライブラリも利用できる。

 少し難しい話が続いたが、我々は徐々に人工知能の時代に入りつつある。ここ1〜2年で多言語翻訳を代表とする魔法のように賢いWebサービスが出始めていたが、まもなくこのこのCore MLを使って、さらに多くの魔法のようなアプリが登場しそうだ。

 ARkitとCore MLは、OSをアップデートしたからといって即座に恩恵が受けられるものではない(Siriは試せる)。だが、2018年以降にかけて登場するiPhone、iPad用のアプリを劇的に賢く、楽しく進化させる起爆剤となるテクノロジーだ。

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2024年04月19日 更新
  1. バッファロー製Wi-Fiルーターに脆弱性 対象機種は今すぐファームウェア更新を (2024年04月17日)
  2. ノートPCに外付けキーボードを“載せて”使える「タイプスティックス/打ち箸」に新色 (2024年04月18日)
  3. ついに8K対応した「Insta360 X4」の画質をX3と1インチ360度版で比較 今買うべき全天球カメラだと確信した (2024年04月16日)
  4. さらなる高速化を実現! PCI Express 5.0接続SSDの新モデル「Crucial T705」を試して分かったこと (2024年04月18日)
  5. SwitchBotのミニプラグに不具合 「断続的にオン/オフを繰り返す、異音」などで該当製品の交換を呼びかけ (2024年04月17日)
  6. アイロボットが4万円切りの「水拭き対応ロボット掃除機」を投入 “一家に1台”を目指す (2024年04月17日)
  7. 無線LANルーター「Aterm」シリーズの一部に複数の脆弱性 設定変更や買い替えをアナウンス (2024年04月11日)
  8. あなたのPCのWindows 10/11の「ライセンス」はどうなっている? 調べる方法をチェック! (2023年10月20日)
  9. 「JBL GO 4」でBluetoothスピーカーデビュー! 累計出荷台数5700万台を突破した人気製品の最新モデルを試す (2024年04月17日)
  10. NVIDIA、Ampereアーキテクチャを採用したシングルスロット設計のデスクトップ向けGPU「NVIDIA RTX A400/A1000」を発表 (2024年04月17日)
最新トピックスPR

過去記事カレンダー