ニュース動画の音声を自動で書き起こす「もじもじTV」YouTubeやニコ動にアップされた動画の音声を自動で書き起こし、字幕化するサービス「もじもじTV」のクローズドαテストがスタートした。2009年10月14日 07時00分 更新
音声認識技術の開発を行うカタログは10月14日、動画内の音声を自動でテキストに書き起こし、字幕化するサービス「もじもじTV」のクローズドαテストを開始し、αテスター1000人の募集を始めた。 YouTubeやニコニコ動画などにアップされた動画のURLを登録すると、音声を自動でテキスト化。字幕として表示する。ユーザーが撮影した動画ファイルや、ICレコーダーで録音したMP3ファイルなどをアップロードし、音声を書き起こすことも可能だ。 自動で書き起こしたテキストに誤りがある場合は、手作業で修正する機能も備えた。 テキストから動画を検索することも可能。書き起こしたテキストに出てくる単語を自動で抽出し、動画の時間軸上にキーワードとして表示することもできる。キーワードをクリックすれば、登場したタイミングから再生することも可能だ。 独自の音声認識エンジンを利用した。単語の前後関係を確認し、適切なテキストに変換をするために使う言語データベース「言語コーパス」には、Twitterやはてなキーワードの旬のキーワードから収集した言語情報を導入した。 TwitterでWeb上の“会話”をカバー。はてなキーワードで最新の流行語もフォローするため、新聞のみからコーパスを構築したエンジンより口語の認識精度が高いという。 音声認識は単語数を絞った方が精度が高くなるため、従来は語数や分野を絞ったエンジンが多かったという。だが同社のエンジンは100万語を超える単語に対応。幅広いジャンルの動画で利用できるようにした。 今後は、テキスト化した情報を元に、動画に合わせたコンテンツマッチ広告を掲載するソリューションや、動画配信サイトへのエンジンの提供などを行いたいという。 関連記事
関連リンク[ITmedia] Copyright© 2010 ITmedia, Inc. All Rights Reserved. |