プロナビ

カセットテープ風の録音アプリ「Qyur2(キュルキュル)」 有料の文字起こし機能はどこまで使えるか?モバイルdeワークスタイル変革(2/2 ページ)

» 2019年07月04日 14時00分 公開
[井上晃ITmedia]
前のページへ 1|2       

文字起こしは「ポイント制」 Wi-Fi接続を推奨

 それでは、Qyur2に新規搭載された文字起こし機能を利用していこう。

 まず、文字起こしのもとになる音声を録音するには、カセットレコーダーのUIを表示して、赤丸の「REC」ボタンをタップする。説明するまでもないだろうが、録音を停止するときは「STOP」ボタンをタップすればよい。録音時間は最大で120分(2時間)だ。

録音ボタン 音声の録音は「REC」をタップするだけ

 録音した音源は、先述の通り録音リストに一覧表示される。ファイルの右端に表示されている「i」ボタンをタップすると、メニューが表示される。ここで「音声認識」を選択すると、文字起こし機能を利用できる。

 認識できる言語は「英語」と「日本語」の2種類。なお、文字起こしを実行する際にはデータ通信が発生するため、あらかじめWi-Fi(無線LAN)に接続しておくことを勧める。

 今回は日本語で文字起こしをしてみることにする。

メニュー認識言語 録音リストの「i」をタップしてメニューを表示し「音声認識」を選ぶと(写真=左)、音声の言語を選択する画面に遷移する(写真=右)

 Qyur2アプリ自体は無料で利用できるが、先述の通り文字起こし機能は有料制となっている。具体的には、App内課金で「ポイント」を購入し、文字起こしする音声の長さに応じてポイントが消費される仕組みとなっている。

 筆者が試した範囲では、30秒前後の音源で「5ポイント」、1分前後で「10ポイント」を消費するようだった。ただし、無音部分は課金されないようになっているようで、公式サイトでも「1分5円〜12円程度」と幅を持たせて表記されている。アプリをインストールした段階では、5ポイントが標準で備わっているので、おおむね20秒くらいの音声の文字起こしを試せる。

 ポイントの価格は以下の通り(いずれも税込み)。

  • 100ポイント(10分相当):120円
  • 500ポイント(50分相当):600円
  • 1000ポイント(120分相当):1200円
ポイント確認ポイント購入画面 音声認識では音源の長さによってポイントを消費する(写真=左)。ポイントを購入する場合の金額一覧(写真=右)

 文字起こしにはGoogleの「Speech-to-Text」を活用している。文字起こしを実行すると、音源がテキスト化されつつ、目安となる時間表示とともに縦に積み重なるように表示される。

 音声認識がうまく行われなかった箇所も出てくるが、それぞれの欄にある再生ボタンをタップすると、その位置から音源を再生できるので、音声の再確認も行いやすい。

 テキスト部分をタップすると文字として起こされた内容を編集できる。話者が詰まってしまった前後が認識されなかったり、誤変換があったりもする。話者も区別もされないので、手動での微調整(編集)は必須だ。

 このように手間は多少かかってしまうが、ゼロから文字起こしを全て手作業で行うよりは、全体の流れがテキスト化された状態の方が明らかに楽である。「ちょっと変だな」と感じるテキストの部分があれば、該当箇所の音源をピンポイントで確認しながら手動で調整するだけで済む。

文字起こし過程聴きつつ編集 1分弱の会話の音源で文字起こしを実行した結果(写真=左)。テキストは再編集できる(写真=右)

 テキスト化したファイルを共有メニューから出力すると、目安の時刻とともにテキストが伴った状態で出力される。そうすれば、「Dropbox」などのアプリを使ってクラウドストレージにテキスト形式で文字起こしを保存できる。

共有メニュー書き出したテキストファイル 画面右上の共有メニューアイコンをタップして、テキストを出力できる(写真=左)。Dropboxにアップロードしたテキストファイルの中身(写真=右)

まとめ:Qyur2の文字起こしは3つの注意点を踏まえて利用しよう

 Qyur2を使う上で注意したいポイントは3つある。

 1つ目は、アプリ内で音源の長さを編集できないこと。音声認識によってテキスト化するときに、無音部分に料金が発生しないようになっているとはいえ、無駄に音源が長いと余計なお金がかかってしまう恐れがある。

 そのため、インタビューなどの文字起こしをする場合には、録音する時点から尺に気をつける必要が出てくるだろう。

 2つ目は、別の機械で再生した音をうまく認識しないこと。これはQyur2に限った問題ではないが、一度録音した音源の声を、別のスマホやPCで再生し、それを録音すると、うまくテキスト化できないことがある。ファイル操作にあまり自由度がないQyur2では、既にレコーダーで認識した音源を使って文字起こしする用途には向いていないと思う。

 3つ目は、誤操作によるファイル削除に気を付けなくてはならないということ。例えば、iOS標準の「ボイスメモ」アプリでは、削除操作を行うと「最近削除した項目」というフォルダに移動し、一定期間はそこからリカバリーできる工夫が施されている。しかし、Qyur2で一度スワイプ操作で削除してしまったファイルは、復元できない。重要な録音ファイルを扱うにはやや不安が残る。そういう意味で、慎重に操作する必要があるだろう。


 もろもろ注意点を挙げたが、これらを意識さえしておけば、Qyur2を試してみる価値は十分にあると思う。メリットはコストとスピード感だ。

 例えば、激安な文字起こしの代行サービスを頼んでも1分あたり100円、120分の音源では1万2000円ほどかかることになる。一方、Qyur2では120分で1200円程度であり、料金はざっくり計算して10分の1。「大まかなテキスト認識だけを自動で済ませて、後は自分で微調整したい」という人にはうってつけだ。

 代行サービスでは納品までに数日から1週間前後かかるのが一般的。すぐにテキスト化を済ませたいという案件でも、すぐに結果が返ってくる音声認識は重宝すると思う。

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

最新トピックスPR

過去記事カレンダー

2024年