6月3日にスマホ新法に関する勉強会があり、それに登壇してきた。スピーカーは5人、およそ1時間半の会を録音した。
録音後は、レコーダーからスマートフォンに自動的に転送される。Bluetoothでの転送で時間がかかりそうな時は、Wi-Fiによる高速転送に切り替えることができる。
転送された後は音声ファイルがクラウドにアップロードされ、自動的に文字起こしが開始される。しばらく待つと文字起こしが行われた結果が出てくる。読んでみると、かなりのベタ起こしになっているようだ。PLAUDにはPrivate Cloud Syncというサービスがあり、これを利用すると録音データや書き起こし結果がクラウドに保存され、ほかのスマホやPCからWebブラウザ経由で利用する際に、データを共有することができる。
PLAUD.AIのポイントは、この文字起こし機能ではない。それをAIによって「要約」してくれる機能こそが、重要である。要約を作る場合にいくつかのテンプレートが選択できる。適切なものを選択すると、要約の内容もより最適化されたものになる。
要約はテーマごとにブロックが分けられ、さらにはスピーカー別に音声識別しているのが分かる。発表前に司会から名前を呼ばれたりしていれば、発言にもその名前が採用されるなど、かなり気が利いた作りだ。もちろん名前は間違っていれば、「発言者識別」のボタンから修正することができる。
要約は、タイトル、結論、論点の順にまとめられる。自分でしゃべった部分を見てみたが、特に誤った点は見つからず、よくまとまっている。他の登壇者の要約を見ても、記憶と違って「そんな話でしたっけ?」といったところは見当たらなかった。
「要約」と似たようなネーミングだが、「概要」という機能がβ版として搭載されている。これはAIが全体の中から特に重要と判断したポイントを抽出してくれる機能だ。さらにその部分を切り出して、別の要約テンプレートを使って要約を行うことで、議論を細分化していくことができる。
重要なのは、この細分化は書き起こしベースで行われるのではなく、音声ファイルベースで行われることである。つまり、細分化部分の音声ファイルをもう1回クラウドにアップロードして文字起こしから再度行っている。最初の文字起こしをベースに細分化を行うと、誤りに誤りを重ねてしまってあさってな方向に行ってしまいがちだが、元ファイルに立ち戻ることで、誤りの積み重ねを排除しようとする設計が伺える。
もう一つ面白い表示方法が、マインドマップである。要約の内容をマインドマップ形式で表示してくれる機能だが、これだけの広大な表示をスマートフォンの中で展開されても使いづらい。これはPCのWebサービス側に移行して利用すべきだろう。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR