グラフ構造学習を評価するためフレームワーク、米Googleが開発 4000以上のアーキテクチャを統一:Innovative Tech
米Google Researchに所属する研究者らは、グラフ構造学習のベンチマーク戦略を提案するもので、既存のいくつかの方法を単一のモデルにまとめたフレームワークに関する研究報告を発表した。
Innovative Tech:
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
Twitter: @shiropen2
米Google Researchに所属する研究者らが発表した論文「UGSL: A Unified Framework for Benchmarking Graph Structure Learning」は、グラフ構造学習のベンチマーク戦略を提案するもので、既存のいくつかの方法を単一のモデルにまとめたフレームワークに関する研究報告である。
ここでいうグラフとは、棒グラフや円グラフのようなデータを視覚化したものではなく、対象物をノード(頂点)とエッジ(辺)を用いて表現したデータ構造を指す。例えば、SNSのソーシャルグラフに用いられている。各ユーザーアカウントがノードで、アカウント同士の関係をエッジとして結ぶことでグラフ構造を成形する。
他にも、ユーザーと購入した商品との関係や、駅と線路の関係、分子と化学反応の関係など、幅広い分野での応用が期待されている。このような自然言語や画像ではなく、グラフ構造を使ってデータを学ぶ方法は、急速に進展している分野である。これを「Graph Representation Learning」(GRL)と呼ぶ。
GRLは非常に有望で、グラフデータをニューラルネットワークで扱うグラフニューラルネットワーク(Graph Neural Network、GNN)などの機械学習モデルは、とりわけ注目されている。データ数が多いと大きな効果を得られるが、ラベル付きデータが少ない場合でも大きな効果を発揮することが知られている。
しかし、一方で、入力するグラフの品質が悪いとパフォーマンスが下がることが最近の研究で明らかになった。例えば、グラフ構造がタスクに合わない場合、グラフ情報を使わない類似モデルよりも結果が悪くなることがある。
この問題を解決しようと、最適なグラフ構造を設計・作成する研究が始まった。この分野を「Graph Structure Learning」(GSL)と言う。GSLは、例えば友達関係のグラフなど、現実世界の情報だけでなく、複数の情報源から得られる知識を用いることが多い。
特に、実際のグラフがノイズを含んでいたり、不完全だったりする場合、GSLの重要性は高まる。この研究の進展は、新しい分野であるため、方法の比較や評価が難しいものであった。
この研究では、GSLの方法を比較・評価するための統一フレームワークである「Unified Graph Structure Learning」(UGSL)を提案する。このフレームワークは、既存の10以上の方法と4000以上の異なるアーキテクチャを同一のモデル内に組み込んでまとめたものである。10以上の既存の方法と4000以上の異なるアーキテクチャを同じ枠組みで評価できる。
また、6つの異なるデータセットと22の異なる設定で、異なるGSLアーキテクチャを比較するGSLベンチマーク調査を実施した。UGSLを用いて、多数のグラフ学習の方法を比較し、どれが最も効果的であるかを調査し、コンポーネントとアーキテクチャの効果についての洞察を提供している。
UGSLのリポジトリはこちらで公開されている。
Source and Image Credits: Fatemi, Bahare, Sami Abu-El-Haija, Anton Tsitsulin, Mehran Kazemi, Dustin Zelle, Neslihan Bulut, Jonathan Halcrow and Bryan Perozzi. “UGSL: A Unified Framework for Benchmarking Graph Structure Learning.”(2023).
関連記事
- Excelが「Python」に対応 シート上でコードを実行できるように グラフ作成、機械学習なども可能
米MicrosoftがExcelのPython対応を発表した。セルに「PY関数(=PY)」を入力するとPythonのコードを記述できるようになる。 - ドコモ、新料金プランのグラフを“修正” 「高さがおかしい」とのツッコミ受け
ドコモの新料金プラン「eximo」のグラフが話題となっている。該当のグラフは、基本料金から各種施策を適用した割引額を3段階で表記したものだが、見せ方がおかしいとの指摘が集まっているからだ。同社は同日中にグラフを修正した。 - 無料Webクローラー「EasySpider」 プログラミングスキル不要、マウスクリックだけで操作可能
シンガポール国立大学と中国の浙江大学に所属する研究者らは、Excelを使用するように視覚的にWebスクレイピングタスクを設計し、実行できるカスタマイズ可能なWebクローラーシステムを提案した研究報告を発表した。 - 「生きたデジタルカメラ」――“DNA”でカラー画像を撮影、96ピクセルで記録 -20度で凍結保存も可能
シンガポール国立大学に所属する研究者らは、DNAでマルチカラー画像を直接記録する手法を提案した研究報告を発表した。2次元の光パターンをDNAに取り込み、96ピクセルで保存し取り出せる。 - 「LK-99は超電導体ではない」 Nature誌が掲載 世界中の科学者の追試結果を紹介
LK-99は超電導体ではない──英学術誌「Nature」は、そんなタイトルの記事を公開した。韓国チームは7月、「常温常圧で超電導性を示す物質を合成した」とする査読前論文を公開していたが、Natureはこれを否定する研究者たちの証言を紹介した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.