ITmedia NEWS > 社会とIT >

「日の丸検索エンジン」は何を狙っているのか(下)ネットベンチャー3.0【第17回】(1/2 ページ)

» 2006年11月24日 10時15分 公開
[佐々木俊尚,ITmedia]

ネットワークの向こうの膨大なデータ

 ソニーのウォークマンがなぜ敗北を喫し、Apple ComputerのiPodが携帯音楽プレーヤーの世界を制覇したのか。その答は簡単だ。ソニーはひたすらモノとして魅力のある製品を作ることだけに傾注し、その製品が持つネットワーク性をあまり考えていなかった。一方でアップルは製品に関してはデザインとインタフェースを除いては細部にあまりこだわらず、徹底的にネットワーク性を重視した。つまりiPodの向こうには、iTunesとiTunes Storeが形作る豊かな平野――世界を覆う巨大な音楽データベース――が地平線の向こうにまで広がっている。人々はiPodの持つその目眩くようなパースペクティブに魅力を感じたのである。しかしウォークマンは、そうした豊かなデータベースを持っていなかった。

 ネットワークと、その向こうに存在するデータベースこそがすべてであるという考え方は、Web2.0の基調音となっている。世界を覆うデータベースから、いかに情報を拾い上げるのかが、Web2.0アーキテクチャーのもっとも重要なテーマであるからだ。そしてこのデータベースは、必ずしもウェブの世界だけにとどまるものではない。今後はリアルの世界すべてがデータベースに転写され、このデータベースからいかに人々にとって有用な情報を拾い上げ、それらをマイニングして新たな価値を提供していけるかどうかがカギとなっていく。

 その観点から見れば、経済産業省の打ち上げた情報大航海プロジェクトの本当の狙いが浮かび上がってくる。情報大航海プロジェクトでは、リアル社会のいかのような分野での新たな情報収集・解析技術の実用化を狙っている。

流通

工場の製品情報、倉庫の持つ在庫情報、運送中の位置情報、そして店舗で商品がどの程度売れているのかというモニタリング情報。さらにこれら加えて、消費者からの情報も加味すれば、流通を効率化することが可能になるのと同時に、消費者ニーズへのきめ細やかな対応や的確な情報発信も行えるようになる。

ITS

自動車には車載カメラやGPS、ワイパーの雨感知センサー、温度センサー、速度センサー、アクセルやブレーキの踏み具合、走行距離など約120個のセンサーが積まれている。自動車をこれらのセンサーの集合体としてとらえ、ネットワーク経由で自動車センサーの情報を収集。情報のリアルタイムとして解析することで、渋滞緩和や環境の改善などに役に立つ。

医療

レセプト(診療報酬明細書)情報や診療情報、個人の健康情報などが電子化され、データベースによって各病院、患者などで共有することになれば、新たな医療サービスが可能になるのと同時に、医療費高騰の抑制も期待できる。

放送

地上波デジタル放送の開始にともなって、放送におけるデジタルデータの量が急増していく。これらのデータを検索・解析して活用する仕組みを作り上げることで、新たなビジネスチャンスの拡大につながる。

製造業

製品の製造プロセスで得られるさまざまな情報が、企業内に大量に蓄積されている。これらの情報がデータベース化されて検索・解析可能になれば、生産効率の向上や省力化に結びつく。

RFID(電子ICタグ)

RFIDによって、リアルタイムで得られる情報の種類や量が急速に拡大している。これらの情報を解析、加工することでさまざまなサービスが可能になる。

 たとえばハードディスクの製造過程において、HDDヘッドを実際に電子顕微鏡で撮影した画像と、各ヘッドの性能値をマイニングによって比較することで、「画像上に特定の特徴ポイントが存在する場合には、性能値が悪化する」といった結論を導き出すことが可能になる。画像情報を追加してデータベース化することで、従来、数値やテキストだけを分析しているだけではわからなかった知見を新たに得られることが可能になるわけだ。

 また放送の分野では、動画をダイレクトに検索・解析するテクノロジの可能性がある。膨大な動画コンテンツの中から、動画そのものを解析することでダイレクトに検索できるようなテクノロジが登場してこれば、動画の世界の可能性は一気に広がるだろう。

放送向けメタデータの狙いと問題

 現在のところ、そこまでの技術は現れていない。放送業界ではかわりに、メタデータ(タグ)を使った動画の検索を検討している状況だ。たとえばNHKや民放各局、それに大手電機メーカーなどが参加して進めている「サーバ型放送」プロジェクトでは、従来のハードディスクレコーダーがEPG(電子番組表)によって番組ごとの管理しか行えないのに対し、場面ごとに細かなメタデータを付与できることを大きな特徴としている。たとえば特定の俳優の名前のメタデータを使えば、ドラマからその俳優が出演しているシーンだけを抽出したり、あるいはスポーツ番組から特定の選手が映っている場面だけを取り出して楽しむ、といった使い方ができるようになる。

 このメタデータには、シーンごとの注釈(アノテーション)に加えて番組のコンテンツIDや番組ジャンル、EPG、ディレクター、出演者、作曲家、ミュージシャン、著作権管理データなどが含まれる。メタデータは国際標準規格のMPEG-7によって記述され、コンテンツとは独立して視聴者のもとへと送られる。伝送の方法はさまざまに考えられており、放送している番組と同じ時間にリアルタイムで電波で送る方法や、番組とは別に個別に電波で送る方法、あるいはインターネット経由で取得してくる方法などもある。いずれにせよ番組の持っているコンテンツIDとメタデータのIDがマッチすれば良いわけで、それらがサーバ型受信機の中でひも付けされれば問題ないというわけだ。

 だがこのメタデータ方式には、ひとつの問題がある。このメタデータを、どのようにして作成し、放送している動画に付加していくのかという問題だ。電波産業会(ARIB)が中心になって立ち上げた「サーバ型放送運用規定作成プロジェクト」に参加している民放関係者は、以前私の取材に次のように話していた。

 「メタデータの生成についてはサーバで検討するのではなく、別途テレビ局がそれぞれ考えることになっている。さまざまな方法が模索されているが、課題も少なくない。たとえば野球中継のメタデータを作るとしたら、中継スタッフを1人増やしてメタデータ要員として張り付けなければならないのではないか、しかしそんな人員の余裕は捻出できるのか? といった問題が出てくる。そう簡単ではない」

 たとえばNHK放送技術研究所は、アルゴリズムによるメタデータ制作技術の研究を行い、システム開発も実際に進めている。同研究所のリポートから。

 番組の内容を詳細に記述するメタデータを、映像・音声の認識処理、言語処理などにより得られた複数の情報を利用して効率的に制作するシステムの一つとして、メタデータ制作・活用システムを開発しました。

 (中略)

 平成17年度の技研公開には、技研で開発した8つのメタデータ抽出技術(スロー検出、カット点検出、シーン種別判定、選手位置検出、顔画像認識、歓声音解析、音声認識、言語処理)を組み込み、得られた情報をメタデータエディターを使って統合することで、精度の高いメタデータを効率よく制作できることを示しました。

 しかし、こうしたアルゴリズムによるメタデータ生成が万能というわけではない。たとえば経済や社会問題に関するニュース番組に関して言えば、アナウンサーが発声しない文脈(コンテキスト)からもメタデータを持ってこなければならない。こうしたケースでは、アルゴリズムによるメタデータ生成には限界がある。

 ニュースに関して言えば、専門的知識を持っている取材記者本人がメタデータを作ることが最も理想的だ。しかし取材で駆け回っている記者が、果たして自分の仕事を押しのけてまでそうした作業を行う時間が取れるかどうか。また記者が新たにメタデータ作成のスキルを身につけなければならず、そうした教育訓練にかかる費用や時間も馬鹿にはならない。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.