#SHIFT

テープ起こしをするなら音声認識が最強AI時代の仕事術(2/4 ページ)

» 2018年12月23日 10時20分 公開
[斎藤健二ITmedia]

 PCでもさまざまな音声認識の方法があるが、無料で簡単に使えるのは、Googleドライブのドキュメントを開き、ツールから「音声入力」を選ぶ方法だ(chromeを使う)。マイクボタンが表示されるので、クリックしてオンにすると、あとはマイクに話しかければ次々と文字に変換される。

Googleドライブのドキュメントで音声認識を使う

 Googleドライブの場合、かなり長い文章でも次々と変換されていくので、今回のテープ起こしにはこれを使うのがベターだ。ただ、突然音声に反応しなくなることがあるのが欠点。そのたびに、マイクボタンをクリックして再アクティベートしなくてはならない。

うまく音声認識させる方法

 一昔前に音声認識を試したことのある人は、単語ごとに区切って、ゆっくりと発音して認識されるのかを確かめながら入力していたと思う。ところが、現在の音声認識は逆だ。スピードは早くても構わないので、普段話すような抑揚で一息に話すほうが認識精度が高い。ディープラーニングなどを活用したアルゴリズムに変わってきたことが理由だろう。

 ただし文章として成り立っていない口語は、認識率が大きく落ちる。そのため、日本語として正しい文章構造で話す必要がある。会議で話されたことを、「あー」や「えー」まで議事録に残さなければならないほど厳密にやるなら別だが、日本語として意味が通る文章にして話すことが認識率を上げるポイントだ。

 ちなみにあまりに小声だと、当然認識率が下がる。そこで普通に話すくらいの声を出すのだが、これはオフィスでやっても喫茶店でやっても周囲から奇異の目で見られること請け合いだ。自分の個室を持っているようなエグゼクティブなら別だが、自宅や会議室などで作業するしかないのが、この方法の欠点だ。

Copyright © ITmedia, Inc. All Rights Reserved.