書き起こしはまさかの「Web版Word」最強説
以前は「録音の書き起こし」での選択肢はほとんどなかった。だが、今は日本語であってもいろいろな選び方ができる。お金も使っていろいろなサービスをテストして、なんとなく今のところの「ベストシナリオ」が見えてきた。
英語の取材は「Otter」ですることに変わりはない。こちらもいろいろ選択肢はあるのだが、機器を選ばない使い勝手と精度の両面で、いまだファーストチョイスである。
英語話者との取材はまだオンラインが主流なので、PC/Mac内でKrispを使って録音し、そのデータをOtterに読み込ませて書き起こしをする。そのまま英語で読むこともあるが、「DeepL」に通して日本語にし、おかしいところや、英語での取材時とニュアンスが違うと感じるところだけOtterの書き起こしを見て、さらに違うと思ったら聞き直す……という3段構えになった。それでも、英語だけのインタビューだと、半分くらいは最終的に聞き直すが、原稿を書くまでの労力は昔の3分の1くらいに減っていると感じる。
日本語での取材は、結局「Web版Microsoft Word」の日本語トランスクリプト(書き起こし)機能と、ネットサービス「Notta」の合わせ技になった。
Pixel 6の書き起こしを使うとコストがかからないのだが、難点は「録音済みの音声から書き起こしができないこと」「Pixelを必ず必要とすること」だった。ビデオ会議取材の書き起こしだと、外にPixel 6を置いてスピーカーの音を聞かせる感じになるが、それも、どうもスマートじゃない。
結果、まずは録音してしまい、後から録音データを読み込んで書きおこせるサービスがいい……という結論に至った。Web版WordとNottaは、どちらも録音データからの書き起こしに対応しており、こちらの要望に合う。
実は、一番優秀で使い勝手もいいのはWeb版Wordだと思う。これも以前記事で書いたが、Web版Wordの日本語トランスクリプト機能は、「録音中に出てくる話者を聞き分け」た上で書き起こしをしてくれる。この要素は他のサービスにはなく、インタビューなどのテキスト化には重要な要素である。
ただし、Web版Wordには「1カ月で300分のデータしか書き起こせない」という制限がある。1時間の取材で5本分だから、西田のニーズにはまったく足りない。
そこで、「ここぞ」というところでWeb版Wordを使い、それ以外ではNottaを使う……という流れが定着した。
Nottaは無料版と有料の「プレミアム」があり、西田は「プレミアム」に契約しているので、月に1800分の書き起こしができる。補助的に……というには少々高いのだがしょうがない。
実は現在、note版で金曜日に掲載している「今週の壁打ち」の書き起こしは、Nottaで書き起こしたものを修正して掲載している。
ずいぶんラフな内容とはいえ、認識後のデータからの掲載版への校正は、作業時間10分から15分。それで20分くらいのトーク内容の書き起こしができているのだから、十分な省力化だと思っている。
この辺はまだまだ変化があるところかと思うが、なんとか、取材音声のテキスト化にめどがついてきた印象がある。もう少しサービスを絞り込めると、出費も少なくなるのだが。
関連記事
- ここまでできる日本語ディクテーション 「句読点自動認識」に「会話文書き起こし」、Microsoftの2つの「日本語認識」を試す
Microsoftが投入してきた日本語ディクテーションの新機能。これで文字の書き起こしがどれだけ楽になるか、西田宗千佳さんが検証した。 - 本体でAIノイズ低減するピンマイク「Razer Seiren BT」がすごい
Bluetoothピンマイクの「Razer Seiren BT」を購入した西田宗千佳さんがお気に入りのポイントを解説。 - コロナ禍、M1 Mac──2020年、自分の仕事環境がどう変化したのか振り返り、2021年を予測してみる
激動の2020年が終わろうとしている中、ITジャーナリストの西田宗千佳さんが仕事環境の変わり具合を振り返り、2021年への展望を語る。 - VR空間でガチに原稿を書いたらその実用度に驚いた 「バーチャルで仕事」のメリットと課題
リアルと同程度の速度で原稿が書けてしまう、そういうところまでVR HMDは来ている。 - Pixel 6の「日本語書き起こし」は仕事で使えるか 今できること、できないこと
「音声からの日本語自動書き起こしがすごい」と言われるPixel 6。実際に仕事に使っている西田宗千佳さんの手応えは。
Copyright © ITmedia, Inc. All Rights Reserved.