ITmedia NEWS > ネットの話題 >

動画の音声を自動で書き起こす「もじもじTV」

» 2009年10月14日 07時00分 公開
[ITmedia]

 音声認識技術の開発を行うカタログは10月14日、動画内の音声を自動でテキストに書き起こし、字幕化するサービス「もじもじTV」のクローズドαテストを開始し、αテスター1000人の募集を始めた。

 YouTubeやニコニコ動画などにアップされた動画のURLを登録すると、音声を自動でテキスト化。字幕として表示する。ユーザーが撮影した動画ファイルや、ICレコーダーで録音したMP3ファイルなどをアップロードし、音声を書き起こすことも可能だ。

 自動で書き起こしたテキストに誤りがある場合は、手作業で修正する機能も備えた。

photo 「もじもじTV」トップページ
photo 検索ページ
photo 動画の詳細ページ

 テキストから動画を検索することも可能。書き起こしたテキストに出てくる単語を自動で抽出し、動画の時間軸上にキーワードとして表示することもできる。キーワードをクリックすれば、登場したタイミングから再生することも可能だ。

 独自の音声認識エンジンを利用した。単語の前後関係を確認し、適切なテキストに変換をするために使う言語データベース「言語コーパス」には、Twitterやはてなキーワードの旬のキーワードから収集した言語情報を導入した。

 TwitterでWeb上の“会話”をカバー。はてなキーワードで最新の流行語もフォローするため、新聞のみからコーパスを構築したエンジンより口語の認識精度が高いという。

 音声認識は単語数を絞った方が精度が高くなるため、従来は語数や分野を絞ったエンジンが多かったという。だが同社のエンジンは100万語を超える単語に対応。幅広いジャンルの動画で利用できるようにした。

 今後は、テキスト化した情報を元に、動画に合わせたコンテンツマッチ広告を掲載するソリューションや、動画配信サイトへのエンジンの提供などを行いたいという。

関連キーワード

音声認識 | 検索 | 動画共有サービス | 字幕


Copyright © ITmedia, Inc. All Rights Reserved.