文字起こしと日本語入力の未来:小寺信良のIT大作戦(1/4 ページ)
LINEがCLOVA Noteという文字起こしアプリを無料公開した。これをきっかけに、高度な文字起こし機能が日本語入力をどう変えていくか、考えてみた。
現在日本語を文字化するという手段は、キーボード入力を変換するためのIM(Input Method)が主力だが、開発できるのはOS提供会社と、ごく少数のサードパーティに限られる。
だが昨今、AI音声認識によるテキスト変換サービスが次々と登場し、テキスト作成にイノベーションをもたらしつつある。IM開発と違い、AI音声認識ではプレイヤーががらりと変わるというのが面白い。特にスマートスピーカーを展開している企業は常に音声データを解析しまくっているため、有利なのだろう。
Googleは直接コンシューマーユーザーにサービス提供しているが、AmazonはAWSの組み込みエンジンとして「Amazon Transcribe」を提供している。Appleは個人情報を持ちたくないだろうから、今のところ直接ビジネスをやるつもりはなさそうだ。
またベンチャーが多く参入しているのも、この世界の特徴である。国外企業もワールドワイド対応の一環として日本語にも対応するサービスを打ち出している。日本語IM市場と比較すると、その数は全く違う。
5月24日、LINEは音声認識AIによるテキスト変換機能を持つアプリ、CLOVA Noteの配付を開始した。現在はまだβ版だが、本サービスは全て無料で提供するとのアナウンスが出ている。
音声を文字起こしするソリューションは、有料のものから無料のものまで提供パターンもさまざまで、単体のアプリになっているものから、Google DocsやMicrosoft Wordのような文書作成ツールのクラウド版に組み込まれたもの、Adobe Premiere Proのように編集ツールに組み込まれた例もある。
NottaやVrewのように専用クラウドサービスになっているものや、Google Pixel 6/6 Pro登場以降は標準レコーダに実装されるなど、今や自動文字起こしには困らない、というところになってきている。
そしてそこにLINEが参入した。LINEって昔スマートスピーカーやってたよな? と思われた方もいるかもしれないが、CLOVA WAVEやCLOVA Friendsといった製品は今も現役商品である。
スマートスピーカーの参入にインパクトがあったので、LINE CLOVAといえばスマートスピーカーだと思われているが、正確にはLINEが開発するAIテクノロジー全般を指す。今回のCLOVA Noteも、こうしたCLOVAブランドの1つということになる。
Copyright © ITmedia, Inc. All Rights Reserved.