文字起こし→要約・アウトプットまで全自動 厚さ3mmのAIボイレコ「PLAUD NOTE」が進化していた:小寺信良のIT大作戦(3/3 ページ)
厚さわずか3mmの薄型レコーダ「PLAUD NOTE」は単なる録音機器ではない。AIを活用して文字起こしから要約、マインドマップ化まで自動実行する次世代ツールだ。スマホへの音声転送、クラウドでの高精度文字起こし、テーマ別の要約生成を一気通貫で実現。会議やインタビューの録音から最終アウトプットまでのワークフローを試してみた。
どのようにアウトプットにつなげるか
PC上で使用するWebサービスも、スマホ版と同じアカウントでログインすることで、内容が共有される。文章構造を把握する上では、スマートフォンで見るよりも、全体像がつかみやすい。
ここではもう一つβとして提供されている機能として、「ASK AI」という機能をご紹介しておく。これは書き起こされて1つのファイルとなったノートに対してAIに質問できる機能だ。例えば今回の勉強会の中で、「スマホ新法が施行された場合、先行するDMAの施行状況を参考にすると、どのような問題が生じるか」と質問したところ、以下のような回答が得られた。
これはAIがWebデータや内部の情報を参照したのではなく、ノート内の情報を元にまとめたものである。Google「NotebookLM」のようなものと考えればいいだろう。この機能のポイントは、AIが現在検討している情報の外に出ない、ということである。外の情報が混じると、知識的には広がるかもしれないが、録音した内容をベースに整理したい場合には邪魔になる。
ただこうした情報は、専用アプリやWeb上にあるだけでは、何らかのアウトプットにはならない。情報を外に出すためには、共有ボタンから録音ファイルや文字起こし、要約、マインドマップが出力できる。
例えば要約のエクスポートとしては、テキスト、Markdown、Microsoft DOCX、PDFが選択できる。アプリやWeb上の記述は、どうやらMarkdown形式で書かれているようだ。
PLAUD.AIでは他のツール連携として、「Zapier」と接続できるようだ。これは複数のアプリを接続してワークフローを自動化するサービスである。あまり筆者は詳しくないが、IFTTTのようなものと理解している。今後は他のツールにも連携できるようだ。個人的にはObsidianやCursorとの連携に期待したいところだが、Markdownで出せればファイルとしては読めるので、まあそれでもいいか、とも思っている。
思考をさらに深めるためには、マインドマップは利用価値がある。だがPLAUD.AI上で展開されるマインドマップは、要約の内容をツリー上にレンダリングしただけで、構造を移動させたり関係性をひも付けしたりといった作業ができるわけではない。筆者は執筆の骨子を練る際にマインドマップを20年ぐらい愛用しているが、ツリー構造が変えられないのでは意味がない。
マインドマップの出力としては、MarkdownかPNGが選べるが、これで出力しても汎用のマインドマップツールにインポートできるわけではない。せめてFreeMind形式で出力してくれれば、他のツールでいじれるようになる。このあたりは今後のアップデートに期待したい。
PLAUD導入で、ワークフローはどう変わる?
これまでインタビューやセミナー取材の際には、バックアップとしてレコーダーやデジタルカメラで現場を録音・録画しつつ、話を聞きながらPCでメモを取っていた。できれば現場で重要なところは全部メモしておき、聞き取れなかったところだけ後からファイルをAIに食わせて文字起こししてすり合わせる、ということになる。
多くの比重は現場でのメモにかかっているわけだが、知らない新語が出てきたり、普段使わないような言い回しが出てきたりした時には、うまく変換できずにわちゃわちゃしてしまい、その間にも話が先に進んで追い付けなくなるといったことが度々起こっていた。また現場では初めての話を聞き取りながら書いているので、メモはしたがあまり重要なところじゃなかった、ということもあり、割と無駄が多い。
だがPLAUD NOTEがかなりしっかり録音でき、終了後数分で文字起こし、サマリー化してくれることがわかったので、これをベースにして、現場でのメモを手薄にしてもいいかもしれない。そうなれば、もっと話を聞くということに集中できるだろう。さらには演者の表情に注目したり、写真を抑えたりすることにも余裕ができる。
そもそも何かを理解するという行為には、2パターンの得意・不得意がある。話し言葉として人から説明してもらったほうが分かる人と、文字で読んだほうが分かる人だ。筆者は圧倒的に後者である。それゆえに、人に会って話を聞き取るタイプの取材というのがあまり得意ではなかった。
こうした不得意な部分を助けてくれるツールとして、PLAUD NOTEはかなり有用である。単に文字起こしツールとして見ていたら、PLAUD NOTEの真価は測れないのだろう。
【訂正:7月23日午前4時30分】 初出時、各プランの月間書き起こし時間について、無料のStarterプランは300時間、Proプランは1200時間と記載しておりましたが、正しくは前者が300分、後者が1200分まででした。訂正してお詫び申し上げます。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
会議発言をAIが書き起こし、議事録作成を楽に NTTテクノクロスが新サービス
音声認識AIで会議中の発言を書き起こし、議事録作成を効率化するサービス「SpeechRec Plus for Meeting」をNTTテクノクロスが提供
Web会議の議事録を自動作成、頻出単語の分析も ユーザーローカルが無料公開
ユーザーローカルが、Web会議の議事録を自動で作成するサービスを無料公開。会議の内容をテキストとして自動で保存できる。
日本語特化のAI文字起こしサービス 1時間の音声を5分で文字化、句読点も自動で調整
AIを活用し、日本語の音声データを文字起こしするWebサービスが登場。1時間の音声データを5分程度で文字起こしでき、句読点の位置も自動で調整できるという。料金プランは30秒20円(税別、以下同)、40時間まで10万円。
Google MeetにAIによる自動議事録機能(まずは英語で)
Googleは、Web会議サービス「Google Meet」の新AI機能「Take notes for me」を発表した。会議の内容をまとめた議事録をAIが自動で作成し、Googleドキュメントとして保存する。Gemini Enterprise、Gemini Education Premium、AI Meetings & Messagingユーザー向け。
会議音声を自動でテキスト化 話者も識別 日立が新サービス
会議を録音した音声ファイルから自動で書き起こすクラウドサービスを日立製作所がスタート。音源の方向から話者を識別し、話者ごとに会話をテキスト化する。


