ITmedia NEWS > 製品動向 >
ITmedia AI+ AI活用のいまが分かる

文字起こしと日本語入力の未来小寺信良のIT大作戦(4/4 ページ)

» 2022年05月30日 15時11分 公開
[小寺信良ITmedia]
前のページへ 1|2|3|4       

「文章」に求められるクオリティ

 こうした文字起こしサービスの台頭により、今後は人のしゃべりをテキスト化するハードルは大幅に下がっていくものと思われる。会議議事録作成の時間短縮や、個人制作の動画に字幕が付くなど、その恩恵は計り知れない。

 ただその一方で求められるのは、文章としての「体裁」である。表紙に「第○回○○委員会議事録」などとタイトルが付いたら、読み取ったままのテキストをペッと貼って終わりでは済まないだろう。人の手で成形しないと、ナマのテキストでは非常に読みづらいからだ。

 一方動画字幕についても、長文は一定量で分割する必要があるが、話の流れとしてどこで分割するのが好ましいのかは演出にも関わる部分であり、まだ人間が判断しないと難しいだろう。つまり文章の元が音声であっても、最終的には誰かがテキストエディタを使ってキーボードでチクチクと文章を修正して、見た目を良くするという作業は、当面無くならないものと思われる。

 単純な書き起こしみたいな作業に人間の手がいらなくなる一方で、人間が担当するのはより高度な判断が必要になる部分ということになる。これは、「AIが人間の仕事を奪うのでは?」の問いに対する模範回答「人間はより複雑な判断が要求される仕事をすることになります」を地で行く案件である。ただしAIが「美しい文章の体裁」を理解するまでは、の話ではあるが。

 ではもう少し高度な使い方として、文章の入力方法として音声入力はどれぐらいのポテンシャルがあるのだろうか。いわゆるライターの業務であったり、論文を書くといった作業を、キーボードではなく音声入力でやれるのか、という話である。これは人の能力に寄りかかる話であり、トレーニングしてできるようになる場合もあるだろう。ケガや病気でキーボード操作が難しくなった人の役に立ってほしいという思いもある。

 ただ、ぶっちゃけ長年インタビュー動画などを編集してきた立場からすると、人は最初から最後まで論理的に筋の通った話しをするというのは、なかなかできないものである。

 途中で話が脱線したまま戻ってこなかったり、最初と最後で言ってることが違ってきちゃってるみたいなことは、実際にはよくある。

 これは「話し」というのが、「脳内ライブ」だからということが大きい。つまり終点まであらかじめレールが敷かれているわけではなく、線路を作りながら走っている電車と同じだからである。

 話が上手い人は結論までブレないと思われるかもしれないが、それはその人が同じ話をもうすでに何度もしてきたことで、脳内に話のレールができあがっているからである。そんな人ほどよく講演や取材、インタビューなどを依頼されるので、ますます上手くなる。

 初めて話す、初めて考えることで、最初から最後までブレずにうまく話ができる人は、ゼロとは言わないが、あまり多くないと思われる。つまり音声入力による文書作成は、素材としての入力は可能だが、やはり編集作業が必要になってくる。パソコンレス、キーボードレスでの文章作成は、まだかなり先になるだろう。

 LINE CLOVAの音声入力で最も利用価値がありそうなのは、それこそLINEの文字入力の代替だろう。現在LINEは、テキスト入力脇のマイクボタンを押すと、録音した音声そのままをチャットに乗せることができる。だがそれは、相手も音声で聞かなければならない。音が出せないところでは、内容が分からないことになる。

 これが音声入力でテキスト化できるのであれば、文字入力が苦手な高齢者や、文字を打ってるヒマがない人などに便利になる。文字チャットも新しい世界が開けるだろう。方言の聞き取りや文字表現といった難しさも出る一方、それができれば競争力のある音声認識エンジンとなる。

 また入力した音声の感情に近い表現のスタンプが候補として表示されるなど、エモーショナルな判定も加われば、これまでテキストチャット最大の問題点である、「気持ちが伝わらないことの誤解」もずいぶん軽減されることだろう。

 音声認識は、これまで文章生産分野での利用がメインだったが、コミュニケーションでの利用はあまり考えられてこなかったのではないか。それをやるなら通話やビデオで話せばいいじゃん、と考えてしまうからだ。だがコミュニケーションは、適度に不自由な方が面白いのである。

 高度な不自由さ。音声認識の扉は、そっち方向に開いていくかもしれない。

前のページへ 1|2|3|4       

Copyright © ITmedia, Inc. All Rights Reserved.