このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
Twitter: @shiropen2
米Google Researchに所属する研究者らが発表した論文「UGSL: A Unified Framework for Benchmarking Graph Structure Learning」は、グラフ構造学習のベンチマーク戦略を提案するもので、既存のいくつかの方法を単一のモデルにまとめたフレームワークに関する研究報告である。
ここでいうグラフとは、棒グラフや円グラフのようなデータを視覚化したものではなく、対象物をノード(頂点)とエッジ(辺)を用いて表現したデータ構造を指す。例えば、SNSのソーシャルグラフに用いられている。各ユーザーアカウントがノードで、アカウント同士の関係をエッジとして結ぶことでグラフ構造を成形する。
他にも、ユーザーと購入した商品との関係や、駅と線路の関係、分子と化学反応の関係など、幅広い分野での応用が期待されている。このような自然言語や画像ではなく、グラフ構造を使ってデータを学ぶ方法は、急速に進展している分野である。これを「Graph Representation Learning」(GRL)と呼ぶ。
GRLは非常に有望で、グラフデータをニューラルネットワークで扱うグラフニューラルネットワーク(Graph Neural Network、GNN)などの機械学習モデルは、とりわけ注目されている。データ数が多いと大きな効果を得られるが、ラベル付きデータが少ない場合でも大きな効果を発揮することが知られている。
しかし、一方で、入力するグラフの品質が悪いとパフォーマンスが下がることが最近の研究で明らかになった。例えば、グラフ構造がタスクに合わない場合、グラフ情報を使わない類似モデルよりも結果が悪くなることがある。
この問題を解決しようと、最適なグラフ構造を設計・作成する研究が始まった。この分野を「Graph Structure Learning」(GSL)と言う。GSLは、例えば友達関係のグラフなど、現実世界の情報だけでなく、複数の情報源から得られる知識を用いることが多い。
特に、実際のグラフがノイズを含んでいたり、不完全だったりする場合、GSLの重要性は高まる。この研究の進展は、新しい分野であるため、方法の比較や評価が難しいものであった。
この研究では、GSLの方法を比較・評価するための統一フレームワークである「Unified Graph Structure Learning」(UGSL)を提案する。このフレームワークは、既存の10以上の方法と4000以上の異なるアーキテクチャを同一のモデル内に組み込んでまとめたものである。10以上の既存の方法と4000以上の異なるアーキテクチャを同じ枠組みで評価できる。
また、6つの異なるデータセットと22の異なる設定で、異なるGSLアーキテクチャを比較するGSLベンチマーク調査を実施した。UGSLを用いて、多数のグラフ学習の方法を比較し、どれが最も効果的であるかを調査し、コンポーネントとアーキテクチャの効果についての洞察を提供している。
UGSLのリポジトリはこちらで公開されている。
Source and Image Credits: Fatemi, Bahare, Sami Abu-El-Haija, Anton Tsitsulin, Mehran Kazemi, Dustin Zelle, Neslihan Bulut, Jonathan Halcrow and Bryan Perozzi. “UGSL: A Unified Framework for Benchmarking Graph Structure Learning.”(2023).
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR