ITmedia NEWS > STUDIO >
速報
» 2021年06月30日 04時42分 公開

Google、有用なワクチン情報提供のため新検索アルゴリズム「MUM」を採用

Googleは、今年のGoogle I/Oで発表した新検索アルゴリズムMUM(Multitask Unified Model)を、コロナワクチン関連検索の結果改善のために初めて採用した。50以上の言語での800を超えるワクチン名のバリエーションを数秒で識別する。

[佐藤由紀子,ITmedia]

 米Googleは6月29日(現地時間)、「Google I/O 2021」の基調講演で発表した新検索アルゴリズム「MUM」(Multitask Unified Model)を、新型コロナウイルス感染症のワクチン(以下、「コロナワクチン」)の検索で初めて採用したと発表した。これにより、様々な関連クエリに対し、高品質な検索結果をタイムリーに提示できるようになったとしている。

 Google検索での、日本語を含む世界中のコロナワクチン検索結果は、既にMUMを採用したものになっている。

 mum 1 日本語での「コロナワクチン」の検索結果

 同社は昨年、新型コロナウイルス感染症関連の検索結果を改善するために、世界中の人々が用いる異なる新型コロナウイルス感染症の呼び方を特定したが、それには数百時間を要した。MUMを採用したことで、コロナワクチンでは同様の作業が数秒で完了したという。

 コロナワクチンを検索する際、世界中の人々は様々な表現(“Coronavaccin Pfizer”、“mRNA-1273”、“CoVaccine”、“バイオンテックワクチン”など)でクエリーを入力する。Googleによると、17種類のワクチンが、50以上の言語で800を超える名称で認識されているという。

 mum 2 コロナワクチンの名称は800以上

 MUMにより、これらのワクチン名のバリエーションを数秒で識別できるようになった。その結果、これらのどの名称で検索しても、「タイムリーで高品質な情報を人々が見つけられるようになった」。

 results 検索結果例

 MUMは、同社の自然言語処理モデル「BERT」と同様に、Transformerで構成されるディープニューラルネットワーク。BERTと同じようにエンコーダーを使って言語を理解するが、それに加えてテキストを生成するデコーダーのスタックも持っている。すべてのNLP(自然言語処理)タスクを統一されたテキストからテキストへの形式に再構成することを提案するTransformer「T5」に基づくテキスト間モデルを採用している。また、日本語を含む75の言語と多数のタスクで同時にトレーニングされているため、以前のモデルより情報を包括的に理解でき、知識を言語間で伝達できる。

 Googleフェローで検索部門幹部のパンドゥ・ナヤク氏は公式ブログで、マルチリンガルな人間が、ある言語で書かれた書籍を読めば、別の言語で内容を説明できるのと同様に、複数言語でトレーニングしたMUMは言語間で知識を転送できると説明した。従って、1つの言語で新たな能力やスキルを習得すれば、トレーニングデータが少ない他の言語でもその知識を使える。

 Googleが29日にメディア向けに開催したオンライン説明会でナヤク氏は、コロナワクチン検索へのMUM採用は短期的な目標で、次の段階では画像と音声による複合的なクエリーでの検索だと説明した。MUMは「本質的にマルチモーダル」であり、テキストだけでなく、画像や音声でもトレーニングできるという。

 さらに将来的にはGoogle I/Oの基調講演で披露した「先日アダムス山に登ったけど、秋に富士登山を予定している。どんな準備が必要?」のような複雑な質問でユーザーが求めている答えを適切に提供できるようにすると語った。


Copyright © ITmedia, Inc. All Rights Reserved.