一方で、「インタビューでの書き起こしがもっと楽にならないか」と考えてしまうのは、それがすでに英語では実現できているから、という部分が大きい。
筆者は英語でのインタビューやカンファレンス取材の場合、「Otter」を愛用している。Otterの場合、言語は英語に限られるが、筆者のニーズにはほぼ完璧に応えてくれる。話者を聞き分けた上で英語を「間違いがごくまれ」と感じるレベルの精度で、周囲がうるさい場所での録音でもちゃんと書き起こしてくれる。
そして、Pixelのレコーダーがそうであるように、「録音とテキストの同期記録」がされている。Otterの精度がいくら良くても間違いはある。自分の聞き取りによるメモとの間で不整合があった場合、聞きなおして確認が必要になるため、「単語をクリックしたらその部分の音声が再生される」機能は必須だ。
精度の差については、日本語に比べて英語の方が技術の蓄積が多いことや、英語の方が話し言葉と書き言葉の乖離が少ないこと、同音異義語や外来語の混在などが影響していると感じる。ある部分致し方ないのだが、英語でここまでできていると、日本語でもなんとか……という気になってくる。
もう1つ、Otterの方が優位な点としては、「録音済みの音声から書き起こしを作れる」という点がある。取材時にはメモしつつ録音だけしておいて、後から音声ファイルをアップロードしてもいいのだ。
常にPixelをレコーダーとして使わなければいけない、という状況よりは自由度が高いので、こちらの方が使う側としてはありがたい。
とはいえ、これはOtterが「書き起こしと記録のためのサービス」であり、Pixelの書き起こしが「ボイスレコーダーの付加機能」である、という違いから来ているので、しょうがない部分ではある。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR