ノルウェーのOpera Softwareは10月15日、同社初の検索エンジンプロジェクトの成果を発表した。
この検索エンジンは「MAMA(Metadata Analysis and Mining Application)」と呼ばれ、Webページがどのように構成されているかを記録する。数カ月中に公開の予定で、ブラウザメーカーや標準化団体が、Web技術がどのように使われているかを把握し、より標準に準拠したWebを目指す手助けをするとOperaは述べている。
MAMAはマークアップ、スタイル、スクリプトなどのWebページに使われる技術など、Webページの構造に関する情報をインデックス化する。350万のWebページから、Web技術の利用動向などに関する詳細な情報を引き出すことができる。例えば、Web開発者はMAMAでWeb機能の使用例を探したり、トレンドを調べることなどができる。「100を超えるハイパーリンクを持つWebページを抽出できるか」「平均的なWebページはどんな外観か」といった質問の答えも引き出せるという。
例えばMAMAでの調査結果によると、CSSを使っているWebページの割合は80.4%、平均的なWebページのマークアップミスは47件、平均的なWebページに含まれる文字数は1万6400。「どの国で最もXML HttpRequestが使われているか?」という具体的な問いにも答えられる(答えはノルウェー)。
現在MAMAプロジェクトは、「モバイルに対応しているサイトの割合は?」「Web2.0はどのくらい普及しているか?」といった、簡単に答えが出ないあいまいな疑問に取り組んでいるという。
「Webは細分化され、複雑で、常に進化している。MAMAの巨大なデータベースはWeb技術がどのように使われているかについて詳細な情報をもたらす」とOperaは述べている。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR