ニュース
Google、把握するURLが1兆ページ突破と報告
1兆ページすべてを登録しているわけではないが、Googleは「どんな検索エンジンよりも包括的なインデックスを持っている」としている。
米Googleは7月25日、同社が把握するWeb上のURL数が1兆ページを超えたことを、公式ブログで明らかにした。
同社によると、1998年に初めてインデックスを作成した時点で既に2600万ページを数えたが、2000年にはインデックスページが10億を突破。その後もURLは爆発的に増え続け、Googleが把握している独立したURLの数は、このほどついに1兆ページを突破したという。
Googleはページを数える方法として、まず頻繁に利用されるページを起点として定め、そこから新たなページへのリンクをたどっていくとしている。そのリンク先からまったく同じコンテンツを含むURLや、自動生成されたコピーを省いた残りが今回発表した1兆ページであり、現在1日に数十億ページが新たに生成されているという。
1兆ページの多くは内容が似通っているかWebカレンダーの自動生成コンテンツなどあまり検索の役に立たないものであるため、Googleはすべてのページをインデックス化しているわけではない。しかしどの検索エンジンよりも包括的なインデックスを持っているとし、目標は世界中のデータをインデックス化することだという。
関連記事
- Google、5月の米検索市場でシェア7割に迫る
米国でも英国でも、Googleが圧倒的なシェアを占めている。 - 元Google技術者、新たな検索エンジンを立ち上げ
新しい検索エンジン「Cuil」は、従来のリンク分析ではなく、Webページの内容の分析に基づいて検索順位を決める。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.