米Googleは7月25日、同社が把握するWeb上のURL数が1兆ページを超えたことを、公式ブログで明らかにした。
同社によると、1998年に初めてインデックスを作成した時点で既に2600万ページを数えたが、2000年にはインデックスページが10億を突破。その後もURLは爆発的に増え続け、Googleが把握している独立したURLの数は、このほどついに1兆ページを突破したという。
Googleはページを数える方法として、まず頻繁に利用されるページを起点として定め、そこから新たなページへのリンクをたどっていくとしている。そのリンク先からまったく同じコンテンツを含むURLや、自動生成されたコピーを省いた残りが今回発表した1兆ページであり、現在1日に数十億ページが新たに生成されているという。
1兆ページの多くは内容が似通っているかWebカレンダーの自動生成コンテンツなどあまり検索の役に立たないものであるため、Googleはすべてのページをインデックス化しているわけではない。しかしどの検索エンジンよりも包括的なインデックスを持っているとし、目標は世界中のデータをインデックス化することだという。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR