2019年は「エッジAIがもたらすソフトウェアの進化」に注目 しかし停滞を招く要因も:本田雅一のクロスオーバーデジタル(1/3 ページ)
2018年はクラウドとエッジ、両方のAIが進化することで、テクノロジー業界が進んでいくという道筋がはっきりしてきた年だった。2019年は特に「エッジAI」に注目だが、進化を停滞させるかもしれない要因もある。
この1年で、クラウドとエッジ、両方のAIが進化することによりテクノロジー業界が進んでいく道筋が、誰の目にも見えるようになってきた。
今では、クラウドコンピューティングという、いわば有り余る処理能力をいかに効率的に活用し、インターネットを通じてみんなで共有するかをテーマにしたメソッドが当たり前になった。ただ、クラウドはインフラであり、未来でもなければ未来を作るものでもない。未来はクラウドと半導体の上に生まれていく。
その半導体は投資サイクルがソフトウェアよりもはるかに長いわけだが、Apple、Google、Huawei、ARMなどは、一般的なコンピューティング資源ではなく、AI処理向けに資源を集中投下し始めた。
Appleが2018年秋に投入した「iPhone XS」シリーズと「iPhone XR」が搭載する新SoCの「A12 Bionic」。ニューラルネットワーク処理を行う「Neural Engine」の性能を大幅に高めた
2019年も当然、この流れは継続するだろう。順番から言えば、「エッジAIにおけるソフトウェア側の進化」が顕在化する番だ。
AIに対する誤解は過去のものになる
ほんの2年ほど前までは、「AI技術に対して過度の期待をする時代が来るのではないか」と言われたこともあった。理由はAIを「人工知能」と表現し、それを本当に「知能があるかのように」想像する人が多かったからだ。
AIの研究者たちを何人も取材してきたが、将来のビジョンとして「まるでよく訓練された人間のように判断できる人工知能が生まれる」と語る人はいるが、人工知能が「人間と同じように物事を認知し、判断を下せるようになる」という人はいない。なぜなら、コンピュータは物事を「認知」することはないからだ。
2011年から2016年にかけて、国立情報学研究所(NII)が主導して行った「東ロボくん」というプロジェクトがある。人工知能の技術で東京大学合格を目指し、大学入試センター試験や模試を受験し続けたプロジェクトだったが、関わっていたエンジニアたちは一様に「みなさん、東ロボが問題を認知して考え、答えを出していると勘違いしている」と話していた。
しかし、実際の問題の解き方は「考えて答えを出す」のではななく、受験生が正答率を上げるために使っている「テクニックを解法としてプログラムすること」だという。複数の解法を組み合わせることで、より確からしい答えを選択する。
また、同じ科目であっても「問題のタイプ」ごとに異なる解法を開発している。例えば、世界史だけでも4種類の問題に対応できるようになっており、問題タイプごとに異なるプログラムに入れるようになっている。
そもそも、問題文を「認識」もしていない。文章は紙ではなく、テキストデータとして放り込まれ、問題タイプごとに分類された上で、それぞれ過去問と突き合わせながら、何を問題として解決させようとしているのかを判断するのだ。
もちろん、こうした解法を突きつめることで、正答率は上がっていく。より良い解法を使い、そこに正しい情報を入力して学習させることで、確からしさを高めることができるものの、コンピュータ自身はその回答を正しいかどうかさえ認知できない。
しかし、外から見ると「まるで解いている」ように見えるため、AIの研究者たちは「この研究の先に、人間のような認知できるコンピュータを想像し、夢見て、決して認知できないことで、AI技術を見捨てたりしないだろうか」と心配していたわけだ。なぜなら、過去にもAIに対する絶望感から研究費が絞られることが繰り返されてきたからだという。
話が横道に逸れたが、深層学習を利用した最先端のクラウドAIは魔法のように見えるが、エッジAIで実現できる程度の機械学習モデルはまだまだ稚拙だ。今後、CPUとGPUを足したトランジスタの倍以上の資源が投入されたとしても、稚拙さが多少マシになる程度だろう。
しかし、一方で「便利」であることは実感できる。AIを人工知能ではなく、「AIと呼ばれている手法」と捉え、これまでよりも適応的にさまざまなことを助けてくれるとすれば、拒否するユーザーがいないことも、また事実に違いない。
エッジAIを処理するための専用プロセッサを内蔵する動きは始まったばかりだが、まだその入口だからこそ、これまでのような過度の期待に押しつぶされることなく、誤解されずに発展できる環境が生まれているように思う。
プロフェッショナル“ライク”を全ての人に
その上で、今年はさまざまなエッジAIの実験的取り組みが、いろいろなアプリケーションの中に組み込まれていくだろう。
ニューラルネットワーク処理は、通常のコンピュータ処理では効率的に実行できないが、GPUを上手に使えばそれなりのパフォーマンスは出せる。パソコンであれ、スマートフォンであれ、タブレットであれ、ツールやライブラリが充実してきていることもあって、今後、応用ジャンルは広がっていく。
昨年末のコラムで紹介した画像編集アプリの「Pixelmator Photo」などは、その典型例だ。従来と同じようなツール、同じような機能ではあるものの、よりインテリジェントに「ボタンを押すだけ」あるいは「利用者が知らないうちに」より良い結果を得られるものが出てくるだろう。
β版が配信された画像編集アプリの「Pixelmator Photo for iPad」。カラー、露出、ディテール、ホワイトバランスなど、多様な写真の要素についてニューラルネットワーク処理を用いて自動最適化を行う機能が実装されている
ざっくりと言えば、プロフェッショナル“ライク”な結果を、より簡単に得られるようになるはずだ。もちろん、100%確実な結果を得られるわけではないから、エッジで処理する場合には、勝手に自動処理するよりはPixelmator Photoのように特別なボタン(「ML」ボタンを押すと全自動で現像パラメータが調整されたり、個々の要素のみAI処理で最適化されたりする)を用意するものが多いに違いない。
Adobe Systemsが「Adobe Creative Cloud」で提供しているような(本来はプロフェッショナル向けで、機能の存在を把握した上で、その動作の意味を理解していないと使いこなせないような)ツールを、機械学習モデルを用いてボタンを押すだけで一気に適用し、ちょっとした好みの調整を行うと、結果に反映される……といった機能が実現されていくと思う。
写真や動画だけでなく、例えばWebページのデザインなども、幾つかの要素を選んでデザインテイストを指定すると、素材の解像度や色味などを考えた上でレイアウトやWebの構造を自動的に作ってくれるだろう。
DJプレイはもちろん、音楽制作やEDM的なミックスなども機械学習がどんどん入っていく。プロのツールで使われる……というのではなく、プロ向けツールで開発されたアルゴリズムを使い、アマチュア向けの簡単操作のアプリが増えていくという意味だ。AIではそれらしいもの、偶然によって独創的なものは生まれても、本当の意味でクリエイティブな作品は生まれない。
Copyright © ITmedia, Inc. All Rights Reserved.