Googleさんが10月に発表したハミングで曲を検索する機能について、Googleの中の偉い人、クリシュナ・クマールさんが11月12日にオンライン説明会でいろいろ説明してくれました。また、同日公式ブログも公開されました。発表時にはこの機能の名称は明示されていませんでしたが、「Hum to Search」(日本では「鼻歌検索」)というそうです。発表されてからいろいろ実際にやってみましたが、その的中度(?)に驚きました。今回の「Googleさん」は、この鼻歌検索の話です。
何かの曲のサビの部分だけが頭をぐるぐる回って思考の妨げになること、ありますよね? これ(米国ではearwormsと呼ぶ)は結構苦しいですが、オリジナル曲を聴くと耳虫は退散するそうです。そこで、曲名が分からなくてもオリジナル曲を検索できるようにしよう、というのが鼻歌検索立ち上げのきっかけらしい。
そういうサービスは昔からあります。Midomiとか。Siriも歌って曲名を尋ねることができます。でも、鼻歌検索の的中度は群を抜いてます。
イマドキの曲であれば、韓国アイドルグループBTSでもアニソンでも、多少リズムや休符が違っても、ちゃーんと検索してくれます。今期のアニメのオープニング(下図左端の「魔王城でおやすみ」)だって出てきました。
「ウィ・ウィル・ロック・ユー」(上図右端)の一致度が低い(それでも当たった)のはたぶん、最初の「どんどんちゃっ」も入れちゃったからだと思います(後述しますが、検索に反映されるのは旋律のみなので)。
さすが、AIの先端を走るGoogleさん。この実力のヒミツは機械学習のアプローチの違いにあります。
従来のハミング検索(サービス名と区別するために、鼻歌で検索できるサービス全般をこう呼ぶことにします)のアプローチの多くで学習データに使うのは、メロディ(旋律)のみか、ハミングされたバージョンの曲のデータベースです。つまり、オリジナル曲ではなく、別途旋律のみの曲を探してくるか、作っています。これを、マイクから入れた鼻歌とマッチングさせます。これだとデータ量が限られるし、手動更新になることがほとんど。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR