Google、有用なワクチン情報提供のため新検索アルゴリズム「MUM」を採用
Googleは、今年のGoogle I/Oで発表した新検索アルゴリズムMUM(Multitask Unified Model)を、コロナワクチン関連検索の結果改善のために初めて採用した。50以上の言語での800を超えるワクチン名のバリエーションを数秒で識別する。
米Googleは6月29日(現地時間)、「Google I/O 2021」の基調講演で発表した新検索アルゴリズム「MUM」(Multitask Unified Model)を、新型コロナウイルス感染症のワクチン(以下、「コロナワクチン」)の検索で初めて採用したと発表した。これにより、様々な関連クエリに対し、高品質な検索結果をタイムリーに提示できるようになったとしている。
Google検索での、日本語を含む世界中のコロナワクチン検索結果は、既にMUMを採用したものになっている。
同社は昨年、新型コロナウイルス感染症関連の検索結果を改善するために、世界中の人々が用いる異なる新型コロナウイルス感染症の呼び方を特定したが、それには数百時間を要した。MUMを採用したことで、コロナワクチンでは同様の作業が数秒で完了したという。
コロナワクチンを検索する際、世界中の人々は様々な表現(“Coronavaccin Pfizer”、“mRNA-1273”、“CoVaccine”、“バイオンテックワクチン”など)でクエリーを入力する。Googleによると、17種類のワクチンが、50以上の言語で800を超える名称で認識されているという。
MUMにより、これらのワクチン名のバリエーションを数秒で識別できるようになった。その結果、これらのどの名称で検索しても、「タイムリーで高品質な情報を人々が見つけられるようになった」。
MUMは、同社の自然言語処理モデル「BERT」と同様に、Transformerで構成されるディープニューラルネットワーク。BERTと同じようにエンコーダーを使って言語を理解するが、それに加えてテキストを生成するデコーダーのスタックも持っている。すべてのNLP(自然言語処理)タスクを統一されたテキストからテキストへの形式に再構成することを提案するTransformer「T5」に基づくテキスト間モデルを採用している。また、日本語を含む75の言語と多数のタスクで同時にトレーニングされているため、以前のモデルより情報を包括的に理解でき、知識を言語間で伝達できる。
Googleフェローで検索部門幹部のパンドゥ・ナヤク氏は公式ブログで、マルチリンガルな人間が、ある言語で書かれた書籍を読めば、別の言語で内容を説明できるのと同様に、複数言語でトレーニングしたMUMは言語間で知識を転送できると説明した。従って、1つの言語で新たな能力やスキルを習得すれば、トレーニングデータが少ない他の言語でもその知識を使える。
Googleが29日にメディア向けに開催したオンライン説明会でナヤク氏は、コロナワクチン検索へのMUM採用は短期的な目標で、次の段階では画像と音声による複合的なクエリーでの検索だと説明した。MUMは「本質的にマルチモーダル」であり、テキストだけでなく、画像や音声でもトレーニングできるという。
さらに将来的にはGoogle I/Oの基調講演で披露した「先日アダムス山に登ったけど、秋に富士登山を予定している。どんな準備が必要?」のような複雑な質問でユーザーが求めている答えを適切に提供できるようにすると語った。
*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***
関連記事
- Google I/O 2021基調講演まとめ
Googleが2年ぶりに開催した年次カンファレンス「Google I/O」で発表したことを時系列に紹介する。詳細は各項目のリンク先を参照のこと。 - Googleアシスタントとより自然な会話が可能に BERT最新版搭載で
Googleアシスタントとの会話がより自然になる。自然言語処理モデル「BERT」の最新版搭載により、例えばアラームやタイマーの設定やキャンセルが改善される。 - Googleを解雇されたAI倫理研究者が指摘していた「大規模言語モデル」の危険性
AI界隈で一目置かれているGoogleの倫理的AIチームリーダー、ティムニット・ゲブルさんが突然解雇されたとツイート。ゲブルさんは黒人女性ですが、発表しようとしていた言語モデルの問題点についての論文が原因のようです。 - 文章をプログラミング言語に変換 Microsoftがローコード開発ツール「Power Apps」に「GPT-3」活用
米Microsoftが、ローコード開発ツール「Power Apps」に英文をプログラミング言語「Power Fx」に自動変換する機能を追加すると発表。変換には自然言語処理モデル「GPT-3」を活用。6月にプレビュー版を公開する。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.