ニュース
» 2020年01月22日 10時00分 公開

特定分野・用途向け検索サービス【後編】:Googleと業種/用途特化型検索サービスの最大の違い

業種/用途特化型検索サービスはそれぞれユニークな特徴と機能を備え、特殊な使い方を提案している。こうしたサービスとGoogleなどの汎用検索エンジンの決定的な違いとは何か。

[SA Mathieson,Computer Weekly]

 前編(Computer Weekly日本語版 1月8日号掲載)では、Googleなどの汎用(はんよう)検索エンジンの限界と、特定分野・用途に特化した検索サービスの台頭について解説した。

 後編では、報道機関向けなどの特定業種に特化した検索サービスや文字情報以外のデータ(画像、位置情報)の検索サービスを紹介する。

報道機関向けサービス

Computer Weekly日本語版 1月22日号無料ダウンロード

本記事は、プレミアムコンテンツ「Computer Weekly日本語版 1月22日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。


 英ロンドンの企業Krzanaは、Signal AIと同様のアプローチで報道機関にサービスを提供している。クライアントには「Manchester Evening News」や「Birmingham Mail」などの地域ニュースを運営するReachや国営放送、ファクトチェックサービスが含まれる。

 ジャーナリストは記事を執筆する際に「5W」、つまり「Who、What、When、Where、Why」を念頭に置く必要がある。同社は、記事で言及される人々や組織を機械学習で検出することで「Who」をサポートする。

 「When」については、最近出現したものを重視する「変更履歴」モデルをシステムのアーキテクチャに含めているという。創業者兼CTO(最高技術責任者)のトビー・アベル氏は、「これは平均的な検索システムにはない注目点だ」と話す。特定の地域を担当するジャーナリストにとっては「Where」も重要だ。同社はこのために資料の地理的位置を取得している。これにより英ウェストミッドランズ州の最大の都市(バーミンガム)のジャーナリストが、米アラバマ州の「バーミングハム」の記事を誤って参照することを避けることができる(訳注)。

訳注:英国の「バーミンガム」と米国の「バーミングハム」はどちらもスペルは「Birmingham」だが、発音は「ˈbɜːmɪŋəm」「ˈbɜːmɪŋˌhæm」と異なる。

 このシステムはジャーナリストがお決まりの手法を使うのにも役立ち、特定種類の記事に見受けられるパターンの特定などが可能だ。アベル氏は次のように話す。「ジャーナリストの仕事は創造性にあふれているが、同時に決まり切ったパターンもある。オーダーメイドの検索エンジンはその一部を記号化できる」

 例えば、このシステムはフェスティバル関連の記事に、地域の人々、事業、参加者、悪影響を受けた人々のコメントを含めることを提案する。

 EUの助成金によって開発されているジャーナリスト向けサービス「INJECT」は、関連性はあるが異なる資料をAIによって提供する。6言語に及ぶ380の情報源と1600万を超える記事を取り込んでおり、パートナーの中にはドイツのニュース機関「Deutsche Presse-Agentur」も含まれる。

 英ロンドン大学キャスビジネススクールのデジタルクリエイティビティー担当教授ニール・メイデン氏は次のように語る。「ジャーナリストの創造性を高めようとしているのではない。創造性はそのままに、現時点よりもさらに仕事を速められるようにすることだ」

 INJECTのシステムはつながりとアイデアを提案するため、例えばキプロスの司法大臣ヨナ・ニコラウ氏が外国人女性の殺人事件に関連して2019年5月に辞職したことを検索すると、ギリシャやその他の地中海諸国における外国人失踪事件へのリンクが生成される。メイデン氏によると、このシステムはエビデンス、人間の関心、奇抜またはユーモラスな視点、将来への影響という4つの領域において提案を行うことを目指しているという。

 「これらの視点は特に目新しいものではない。既存のニュースを操作してジャーナリストに新しい記事の執筆を促すという観点から、これらを体系化するのが仕事だ」

画像やデータの検索

 ここまで紹介したサービスはいずれも言葉の検索に特化している。だが、画像やデータを主に使用する専門家もいる。画像ライブラリーを提供するニューヨークの企業Shutterstockによると、ユーザーの90%以上が画像を見つけるのにキーワード検索を使っているという。このプロセスは、人気のあるキーワードを説明に含めるよう画像や写真の提供者に提案することで強化される。同社は、現在対応している21言語のいずれかで提供者が説明を記入できるように、自然言語処理の使用を拡大することを計画している。

 Shutterstockは、表示されている色や対象物などの要素に基づき、画像を使って検索する方法も提供している。これには「コンピュータビジョン」という技術を使っている。また、「Chrome」のブラウザ拡張機能として提供している一対多検索「Reveal」は、オンライン画像検索で見つかったものと似たShutterstock上の画像を返す。リリースされたばかりの新バージョンは動画も返すことができる。多対多検索の「Refine」はユーザーが好みの画像を使って検索機能をトレーニングできるようにしている。

 コンピュータビジョンによる検索ページは、検索ページビューの12%とダウンロードの26%で使用されていると同社は話す。

 Shutterstockのエンジニアリングとアーキテクチャ担当シニアバイスプレジデント、ピーター・シルビオ氏は次のように語る。「画像の数は3億枚に達しようとしている。ユーザーに適切なタイミングで適切な画像を提供するという課題は、対処が急激に難しくなっている。このような追加の検出チャネルを提供することで、ユーザーが今まさに探しているものを細かく検索できるようになる」

 データに関しては、オンライングラフサービスをGoogleなどが無償で提供している。ただし、有料サービスは多数の追加機能を使うことができる。米シアトルのTableau Softwareが提供する新機能「Ask Data」は、通常の言語で入力されたクエリに基づいて視覚化を生成する。もう一つの新機能「Explain Data」は、統計的方法を使って一連のデータにおける予期せぬ値の理由を推測する。

使いやすさ

 Tableauで公共機関担当のディレクターを務めるポール・ヘザー氏によると、総合的な目標は使いやすさの向上であり、データサイエンティストや医療などの公共サービスに従事する人々がデータをより迅速に視覚化できるようにすることだという。「これは人命救助や質の高い治療に関係する」と同氏は補足する。

 同社は多数のNHS(英国民保健サービス)機関をユーザーとして抱えており、その一つGreater Manchester Health & Social Care Partnershipは、Tableauでダッシュボードを生成することで、救急車搬入患者に最適な病院を判断している。

 英ケンブリッジの企業GeoSpockは、IoT(モノのインターネット)センサーデータの処理を目的として、機械が生成した膨大なデータを場所と時間で検索可能にすることを重視している。同社は2019年8月、海運市場情報を専門とするバルチック海運取引所とパートナーシップを結び、業界向けのグローバルな空間データベースを開発すると発表した。最初は、この分野における新しい規制を踏まえ、船舶排気に焦点を当てる。

 自律運航への移行が進んでいることと、貨物追跡の需要が増加していることにより、地理空間的な海事データが急速に増加している。GeoSpockのCEOリチャード・ベイカー氏は、この他にも需要が見込まれる分野として海運以外の物流、物理インフラのスマートセンサーを開発している地方自治体、携帯電話事業者、データに特化した広告主を挙げた。「当社は、GoogleがWebでやったことを物理インフラでやりたいと考えている」

 汎用検索エンジンと、それを超えようとする多くの組織の違いは、後者に有料化の意思があることだ。専門家がより素早く効率的に資料を発見して利用することをサポートする検索エンジンなら、たとえ消費者余剰が少ないとしても支払う価値はあるだろう。

Windows 10アップデート管理戦略ガイド

Windows 10は更新プログラムが頻繁に配信される。本PDFではそうした変更をITリーダーが管理する方法、累積的な更新プログラムがシステム管理者に及ぼす影響、円滑な移行のためにクラウドサービスが果たし得る役割について解説する。


Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ