ontology / 存在論
情報科学においては、対象世界(知識領域)をある視点でみたときに立ち現われてくる構成要素(概念)を明示的に表現し、それらの関係を体系的に記述したもののこと。セマンティックウェブでは概念や意味を共有し、コンピュータが文書の意味を理解したり、情報を再利用したりするための基盤機構として構築される語彙(ごい)のセットをいう。
本来は哲学分野で「存在論」を指す言葉だが、情報科学や認知科学などでは意味や概念を取り扱うときに必要となる体系的な知識記述をいう。この分野では、米国人コンピュータ科学者のトム・グルーバー(Thomas R. Gruber)による「概念化の明示的な記述」という定義が受け入れられている。
人間が日常取り扱っている会話や文章には、省略や多義的表現が多く含まれており、提示された情報だけでは正確な理解や解釈ができないことが普通である。例えば、会話や文中に「りんご」という単語が登場したとき、それが果樹ないし果実であり、果実は食用であり、英語ではappleである……といったことが示されることはほとんどない。そのため、人間はこうした意味情報や概念間の関係の欠落を事前知識によって補いながら、文の理解を行っている。たとえていえばオントロジはこうした事前知識に相当するもので、コンピュータで意味処理を行う際に参照される構造的知識の記述である。
知識ベースの一種ということもできるが、知識ベースが何らかの知識を記述・蓄積したものの総称であるのに対して、オントロジは考察対象となっている世界を構成している存在(概念)を明示し、それらの相互関係(同義、包含、依存関係など)の定義を通じて、世界理解の前提となる基盤を作り出すことを目的としている。典型的なオントロジは対象世界で使われる語彙を概念として取り出し、これをis-aリンク(類概念−種概念を表す)を使って分類階層(タクソノミ)を定義し、これに全体−部分関係や意味上の制約事項などを付与して構築する。
セマンティックウェブでは、異なる知識源(RDFスキーマ)の相互運用を保証する役割を担うものとしてオントロジが構築される。RDFメタデータを用いた情報処理を行うとき、一定の範囲でRDF文書内のタグ名やタグ内容、データ型など、概念の標準化が行われるが、その範囲を超えて知識交換や検索を行う場合には諸概念同士の関係を規定する必要がある。こうしたメタデータ記述の意味的な関係がオントロジで定義される。W3Cが推奨するオントロジ記述言語OWLはRDFの拡張であり、これで記述されたオントロジは意味ネットワークに似たネットワーク構造を持つ。
オントロジは通常、目的や用途に応じて作られる。特定の領域に知識したものを「ドメインオントロジ」、特定の問題解決過程を体系化したものを「タスクオントロジ」ということがある。対して特定領域ではなく、共通認識や一般常識を記述することを目的にしたオントロジについても研究が行われている。セマンティックウェブでは多数のオントロジが作られることを前提としているが、それらが相互に協調動作することを目指している。
哲学用語としてのオントロジ(存在論)は「“ある”とはどういうことか?」を考える最も基礎的な哲学分野を意味する。存在者(存在する事物)一般に関する学であって、あらゆる存在者が共通に持つ普遍的な性質を考察する。体系的な存在論は、アリストテレス(Aristotélēs)の第一哲学(後に形而上学と呼ばれる)に始まるとされる。これはギリシア伝統の世界観である「万物流転」と、アリストテレスの師に当たるプラトン(Plátōn)の「イデア論」の結合を図ったものと看做せる。
380年にキリスト教がローマ帝国の国教となると高度な教義を整備する必要が生じ、ギリシア哲学を借用して生成消滅することのないイデアや純粋形相の概念に「神」を代入し、教義の体系化が進められた。こうして形而上学がキリスト教哲学(スコラ哲学)の中で論じられるようになった。文献上、ontologiaという言葉の初出はドイツの哲学者 ルドルフ・ゴクレニウス(Rudolf Goclenius)が著した用語集『Lexicon Philosophicum』(1613年)とされる。ontologiaないしontosophiaという言葉の使用を提唱したのはドイツのヨハン・クラウベルク(Johann Clauberg)で、これは神に関する形而上学を神学(theologia)とするのに対して、アリストテレス以来の存在そのものに関する分野を区別すべきという主張だったようだ。
ontologiaの語は17世紀の半ば、当時著名な哲学者であったクリスティアン・ウォルフ(Christian von Wolff)の著作によって広く知られるようになるが、その説はイマニュエル・カント(Immanuel Kant)に激しく批判され、以後哲学の主流は存在論から観念論へと移行した。存在論が復活するのは20世紀になってからで、エドムンド・フッサール(Edmund Husserl)やマルティン・ハイデガー(Martin Heidegger)によって再構築され、ジャン・ポール・サルトル(Jean-Paul Sartre)やモーリス・メルロ・ポンティ(Maurice Merleau-Ponty)などの実存哲学の興隆によって再び哲学の中心に据えられるようになった。
工学的領域にオントロジという用語を導入したのはAI研究の分野だが、その背景には哲学史における観念論vs.存在論の対立に似た問題意識があった。AI研究の初期には、文法や専門知識などのルールを与えればコンピュータによる自然文の理解や人間との対話が可能となるといった楽観的な見通しがあった。しかし、AI研究の第一人者であるジョン・マッカーシー(John McCarthy)やパット・ヘイズ(Patrick J. Hayes)はフレーム問題という難問に直面すると、「素朴ではあっても常識的な世界観を定義する」ことを主張するようになる。この流れの中、従来の認知過程を情報処理モデルで再構成する認知論的アプローチに対するアンチテーゼとして、オントロジ(存在論)ないしオントロジカルAI(存在論的AI)が登場した。これは人々が認知の前提として仮定している日常世界の構造を記述・定式化することを重視するAI理論で、やがてこれらの存在論的アプローチによって作られた記述自体がオントロジと呼ばれるようになる。
AI分野でオントロジが特に注目されるようになるのは、1990年代初期にスタンフォード大学などが行ったPACTプロジェクトからである。1990年代には企業オントロジや遺伝子オントロジなどが作られ、1990年代末になってW3Cがセマンティックウェブの構想を打ち出すと、オントロジの考え方はコンピュータ技術者に広く浸透するようになった。
世界がどのようにあるか(構成されているか)、という問いに対する答えの1つが分類である。存在論は事物/存在者の分類に関する研究だといえる。存在の記述形式には伝統的に類−種による階層構造が用いられ、アリストテレスは類の最上位である最高類として「実体」「量」「質」「関係」「場所」「時間」「位置」「状態」「能動」「受動」の10の範疇(はんちゅう=categoria)を提示し、スコラ哲学では「存在」「質」「量」「運動」「関係」「持前」の6つを挙げた。
工学的オントロジも世界(認識)がどのような概念・語彙から成り立っているかを分類したカテゴリの体系である。対象範囲が広い、汎用のオントロジは哲学的思考が強く要請される。すべてのドメインに共通した概念体系の提供を目指すIEEEの「SUMO(Suggested Upper Merged Ontology)」では最上位概念として「エンティティ」を置き、その下位を「フィジカル」と「アブストラクト」に分ける。著名なコンピュータ科学者であるジョン・F・ソワ(John F. Sowa)が提唱する上位オントロジでは「オブジェクト」「プロセス」「スキーマ」「スクリプト」「接続」「参加」「説明」「歴史」「構造」「状況」「理由」「目的」の12のトップレベルが置かれている。
▼『オントロジー工学』 溝口理一郎=著/人工知能学会=編/オーム社/2005年1月
▼『人工知能になぜ哲学が必要か――フレーム問題の発端と展開』 ジョン・マッカーシー、パトリック・J・ヘイズ、松原仁著=著/三浦謙=訳/哲学書房/1990年7月(『Some Philosophical Problems from the Standpoint of Artificial Intelligence』の邦訳収録)
▼『定性推論 知識情報処理シリーズ〈別巻1〉』 溝口文雄、古川康一、安西祐一郎=編/共立出版/1989年2月
▼『教養としての存在論』 上岡宏=著/北樹出版/1994年11月
▼『アンビエント・ファインダビリティ――ウェブ、検索、そしてコミュニケーションをめぐる旅』 ピーター・モービル=著/浅野紀予=訳/オライリー・ジャパン/2006年4月(『Ambient Findability: What We Find Changes Who We Become』の邦訳)
▼『反哲学入門』 木田元=著/新潮社/2007年12月
▼『普遍論争――近代の源流としての』 山内志朗=著/平凡社/2008年1月
Copyright © ITmedia, Inc. All Rights Reserved.