東京・渋谷のNHK放送センターで、テレビ番組の制作現場で培った技術を紹介する「第48回 番組技術展」(2月13日まで)が開催されている。昨年末に8Kスーパーハイビジョンの本放送が始まってから初の番組技術展とあって関連展示に力が入っているが、それと同等以上に来場者を集めている展示エリアがあった。地方局が取り組んでいるAI(人工知能)活用事例の展示ブースだ。
「AIを用いた動画要約システム」は、放送用に撮影されたリポート動画をもとにAIを用いて自動的にダイジェスト版を作り出すというもの。SNSを使って番組の宣伝をする際に利用する。
開発したNHK青森放送局は「動画を用いたSNSによる情報発信はテレビ視聴に導く有効な手段です。NHKも全国放送の番組については広報局を中心にTwitterなどで番組PRを行っていますが、地方局ではなかなか人的リソースを割けません」と説明。そんなとき、青森局で製作した情報番組を青森以外の地域でも放送することになり、PRの省力化のためにAIの活用を考えたという。
動画要約では、現地リポートに入る前にスタジオでアナウンサーが概要を紹介する「前説」を活用する。まず放送用の動画全体をフレーム単位の画像認識でスタジオ部分と本編に分割。スタジオ部分の音声(前説)から音声認識でキーワードを抽出する。例えば「続いてリポートです。今別町でマスカット造りを行っている生産者が……」といった音声から「今別」「マスカット」などのキーワードを拾い上げ、単語の意味をベクトル化する「Word2vec」で重み付けを行う。
一方、現地レポート部分は画像認識でシーンごとに細分化し、「今別」や「マスカット」といった音声が含まれる部分を抽出する。「マスカットというキーワードが入っているシーンは、マスカットのアップや収穫シーンになっていることが多いので、必要なシーンを的確に選び出せます」。これを再配列し、前説の音声を付与すればダイジェスト版の完成だ。
京セラコミュニケーションシステムの協力により、動画ファイルをドラッグ&ドロップするだけで要約動画が生成されるシステムとして完成した。現在は青森放送局の公式Twitterアカウントで実際に運用しているという。
「5分の放送用動画から30秒の要約を出力するのにかかる時間は2〜3分と実尺より短時間で済みます。放送だけの場合とほとんど変わらない労力で、(SNSで)番組の告知が行えるようになりました」
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR