誰もが思うのが、そこまで音声認識が良くなったのなら、会議の録音をそのまま認識させればそれだけで議事録ができるんじゃないか? という疑問だろう。実際、それをうたうスマホアプリやサービスも多数登場している。
しかしいくつかのアプリを試したところでは、なかなか思ったような認識はしてくれなかった。音量の問題もあると思うが、複数人が話した場合は致命的にダメだし、そもそも話した内容がそのまま日本語の文章として成り立つように話せる人はごくまれだ。そして音声認識はそうした文章が苦手なのである。
ではどうするか? 録音データをイヤホンで再生させて聞きながら、自分の声で話し直すのである。それを音声認識させる。話者の名前を冒頭に入れることもできるし、破綻している日本語を組み立て直して話すこともできる。
やったことのある人なら分かると思うが、1時間の会議をテープ起こしするには、少なくとも2時間はかかる。でも、この「自分で話し直す音声認識」なら、1時間ちょっとで完了するのだ。あとは、音声認識がミスった部分を最後に直すだけでいい。
筆者の場合は、iPhoneで録音したデータを再生し、PCでGoogleドキュメントを開いて話しかける方法を使っている。人によっては、iPhoneで聞いて、iPadの音声認識機能で入力するほうが使いやすいかもしれない。ここは人それぞれだと思う。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PRアクセスランキング