ITmedia NEWS > AI+ >

AIで“小鳥のさえずり”を分類→Webアプリ化 大量のデータを可視化する手法「t-SNE」の活用例遊んで学べる「Experiments with Google」(第17回)(1/2 ページ)

» 2022年08月27日 09時30分 公開
[佐藤信彦ITmedia]

 「Experiments with Google」は、Googleが人工知能(AI)や拡張現実(AR)といった最新技術の可能性を示すために、実験的な応用例を紹介するショーケースだ。膨大なコンテンツを公開しており、その多くはスマートフォンやPCで試せる。

 この連載では、多種多様な応用例の中から興味深いものをピックアップ。実際に遊んだ体験レポートを通して、裏側にあるテクノロジーや、技術の活用方法とその目的を解説する。

 読者の皆さんも、ぜひ自分の手で試しながらその仕組みを学んでもらえたらうれしい。きっと、最新技術の魅力に気付くはずだ。

今回も“AIの頭の中”をのぞいてみる

 連載17回目は、前回に引き続きAIの内部で音声や画像などのデータがどのように表現されているか、いわば“AIの頭の中”を視覚的に表現するコンテンツを紹介する。

AIは情報を多次元ベクトルで処理する 視覚化するには?

 前回「Visualizing High-Dimensional Space」を取り上げた際に説明した通り、AIは音声や画像、単語などの情報を内部で「多次元ベクトル」化して処理している。このベクトルの次元数は数百〜千次元に及ぶこともあり、3次元で物事を捉える人間には想像すら難しい。

 Visualizing High-Dimensional Spaceは、そんなAIが扱う多次元ベクトルの世界を3次元化し、さらに横と縦の2次元しかないPCの画面で表示できるCGに加工するコンテンツだった。これを使えば、AIが扱うデータを直感的なイメージで捉えられる。

多次元ベクトルを表現する手法 今回は「t-SNE」を紹介

 多次元ベクトルを表現するために次元数を減らす手法はいくつかある。Visualizing High-Dimensional Spaceは3つの手法――「Uniform Manifold Approximation and Projection」(UMAP)、「t-distributed Stochastic Neighbor Embedding」(t-SNE)、「Principal Component Analysis」(PCA)に対応していた。前回の記事では、計算量が少ないので扱いやすいPCAを使ってAI内のデータを視覚化した。

 このPCAよりもデータ分布の特性を把握しやすいのがt-SNEだ。t-SNEは高次元データを、似たデータ集合は近く、異なる集合は離れるように配置することで簡易表示する。Experiments with Googleにはt-SNEを用いたデータの3DCG化コンテンツをまとめて掲載している。そこで今回は3つのコンテンツを実際に操作してみた。いずれもWebアプリなので誰でも簡単に試せる。

鳥の鳴き声を機械学習で分類した「Bird Sounds」

 1つ目のコンテンツは、さまざまな鳥の鳴き声を機械学習で分類し、t-SNEで分かりやすく表示する「Bird Sounds」だ。処理負荷が高いからかPC用ページしかなく、スマートフォンのWebブラウザでは動作しない。

photo さまざまな鳥の鳴き声を楽しめる(出典:Google)

 Bird Soundsでは鳥の鳴き声を分類する際に、鳥の名前といったタグ付けはしていない。補足情報なしで、純粋に音声データだけで各鳴き声の特徴だけを多次元ベクトル化して分類した。その多次元ベクトルをt-SNEの手法で2次元化すると、似ている鳴き声が画面上で近くに配置された。似た波形の鳴き声が並んでいることが一目で分かる。

photo 鳴き声だけで分類したデータ
photo 拡大すると似た波長が近くに並んでいると分かる

 それぞれの波形をクリックすると鳴き声を再生できるので、自分の耳でも確認してみた。隣あった鳴き声はよく似ている近縁種で、聞き分けられないこともある。一方、遠くなるにつれ違いが大きくなり、異なる種類の鳥になっていくのが音でも分かった。

 機械学習アルゴリズムは、人間の介在なしでデータの特徴を捉え、見事に分類してしまった。そして、t-SNEはその結果をうまく視覚化した。鳥の鳴き声をこのアルゴリズムに与えれば、その鳥の種類を推測するといった使い方をできるだろう。例えば、鳥の声から鳥の名前を教えてくれるスマホアプリだって作れるかもしれない。

鳴き声を自分の耳で確認してみた
       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.