そろそろ「日本語入力」にもAIパワーを注入してみないか?:小寺信良のIT大作戦(3/3 ページ)
AIの活用が十分になされていないのではないかと思われる分野が、「日本語入力」だ。OS標準の入力変換エンジン以外にも、Google日本語入力やATOKといった選択肢もあるが、AIの華々しい進化の恩恵にあずかっているようには思えない。「AIが自然な言葉で受け答え」も結構だが、まずは同音異義語の正しい選択や誤変換はどうにかならないのか。
AI校正という方向
現在の文章作成でAIが最も活用されている分野が、校正・校閲である。文章の制作中になんとかしようというより、書き上がってからなんとかしようというわけだ。
Microsoft Wordには、比較的早くから校正ツールが搭載された。AIを使う無料の校正サービスもいくつかあり、朝日新聞も有料の校正サービスをローンチさせている。
専用サービスを使わなくても、ChatGPTにコマンドを投げて校正させることもできる。一緒にメールマガジンをやっている西田宗千佳氏は、いちいちコマンドを投げなくてもいいように、専用の推敲ツールを作って公開している。筆者もよく使わせてもらっている。
誤変換や誤入力に気付かない部分を指摘してくれるのはありがたいところだが、若干動作にムラがあり、2回ぐらいチェックさせないと指摘漏れがあったり、1回目と2回目で違うことを言うあたり、いかにもAIらしいといえばAIらしい。
本来ならばもう少し踏み込んで、論旨展開の問題点まで指摘してくれるとありがたいところだ。例えば前段でこう言っているが、それは後段のこの部分と矛盾するのではないか、といった指摘が欲しいわけである。そこまでやれるのかどうかは、今月発表された新エンジンで試してみたいところである。
現時点での課題は、こうした校正ツールのインタフェースである。書いているテキストエディタ等の文章をコピーして校正ツールにペースト、指摘された部分を原文と見比べながら手動で手直しする、という作業になる。
Wordのように書くためのソフト内に組み込まれているのが望ましいが、みんながみんなWordを使うわけではない。そうなると、ソフトやサービス、ツール間を有機的につなぐ仕組みが必要になる。
もしかしたら、クラウドサービス上に各種テキストエディタや校正ツールをノードとして連結して、自分なりの文章制作環境を作るといった方向性も出てくるのかもしれない。
音声入力という方法論
ライターの立場でAIの恩恵という点では、インタビューや対談内容のテキスト起こしを自分でやらなくてよくなったのは非常に大きい。従来は1時間程度のインタビューの文字起こしでほぼ半日が潰れてしまい、その日は消耗してしまってそれ以上仕事にならなくなったりしたものである。
音声ファイルを食わせればテキスト化してくれるサービスは、日本でもよく発達しており、「notta」や「CLOVA Note」がよく知られるところだ。この機能は動画編集ソフトであるAdobeの「Premiere Pro」やBlackMagic Designの「DaVinci Resolve」にも実装されており、動画制作においても大きな恩恵を受けている。
音声のリアルタイム入力にも、多くのツールが対応している。古くから知られてきたのは「Googleドキュメント」で、2020年ごろにはすでに実用として使えていたと記憶する。「Google Pixel」でも標準のレコーダーアプリに文字起こし機能が内蔵され、録音とテキスト起こしがいっぺんにできるツールとして重宝されている。
欧米では昔から、その場で喋ったり、テープレコーダーに録音したものを秘書が書き起こしてビジネスレターを作成してきた歴史があるが、日本では日本語の特性もあるのか、喋り一発で読みやすい文章を入力するという方法論はあまり発達しなかった。
ただ昨今の若手ライターでは、音声入力で原稿を書く方法も併用するという人も増えているようだ。スマホさえあればどこでも入力可能なので、フィールドワークが中心の人には使いやすいのかもしれない。
ただ、しゃべりには存在しない句読点を自動で入力したり、言い終わりが曖昧になってもそこを丸めて文章を終わらせてくれたりと言った判断まではしてくれない。あくまでも音声をどこまで忠実に文字化できるかというところに特化している。その点ではまだ文章制作ツールではなく、音声書き起こしツールにとどまっているのが現状だ。
これは音声入力後には必ず編集行為が必要になるわけで、その手間をAIでどれだけ減らせるのか、あるいは音声入力操作でテキスト編集行為まで指示できるようになるのか、その辺りが注目ポイントだろう。
現在は大学でもレポートをスマホで書いて送ってくる学生がいるそうだが、長文の入力や編集はスマホでは大変だろう。文章制作の主力がPCからスマホに移るのはもはや時間の問題のような気もしており、筆者のようなキーボード大好きオジサンは絶滅危惧種に指定されそうなのだが、スマホでの長文作成にはAIの助けがどうしても必要になる。
ニーズが多いところは開発が進むわけで、案外次世代の日本語入力の主流は、音声になる日は近いかもしれない。
文章を作る作業は、生成AIとはあまり関係ないと思われている節がある。絵を描く、音楽を作るということはトレーニングが必要で、なおかつうまくできる人とできない人の差が大きい。一方文章の作成は義務教育から徹底的に行われてきたこともあり、全くできないという人は少ない。
つまり能力差が小さいので、AIの力でガーンと伸びるといったことが見分けにくいジャンルなのである。昨今は文章の中身そのものをAIに作らせることが問題になっているが、学校の宿題ならともかく…いやそれはダメと言えばダメなのだが、自分が言いたいことすらもAIに代わってもらうという人は居ないだろう。文章の目的は自分が言いたいことを人に伝えるための手段なので、最初から最後まで自分が責任を負うべきものだ。
そこを踏まえて、助けてくれるAIがあってもいいだろう。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】
米OpenAIが、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。
「ATOK」に10年ぶり新変換エンジン ディープラーニング活用で誤変換30%減 「以前やめた人にも試してほしい」
日本語入力ソフト「ATOK」がディープラーニングを用いた新変換エンジンで進化。従来比で誤変換を約30%削減できるという。
言い間違いも直してくれるGoogleの「音声文字変換」、かなり使える
Googleが早期アクセス版として公開した音声をリアルタイムで字幕にして表示する「音声文字変換」アプリを使ってみました。多少滑舌が悪くても意味が通るよう解釈してくれ、書籍タイトルなどもばっちり正しく表示してくれます。
文字起こしと日本語入力の未来
LINEがCLOVA Noteという文字起こしアプリを無料公開した。これをきっかけに、高度な文字起こし機能が日本語入力をどう変えていくか、考えてみた。
一太郎って誰が使っているの? 38年目、「一太郎2023」がデビュー
ジャストシステムは12月1日、日本語ワープロソフト「一太郎2023」を発表した。2023年2月10日から、量販店店頭や直営オンラインショップなどで発売する。