MS、検索結果からスパムを排除する新プロジェクト(2/2 ページ)

» 2006年07月14日 17時16分 公開
[Ryan Naraine,eWEEK]
eWEEK
前のページへ 1|2       

 Microsoftの研究チームは現在、個々のスパムページを「静的ページ」ではなく「動的ページ」として扱い、実際のブラウザからそれぞれのページにアクセスした結果のトラフィックを分析する「モンキープログラム」の使用を提案している。「大量のドアウェイページにつながるターゲットページのドメインを探り当てれば、主要スパマーのドメインとともに彼らのすべてのドアウェイページ、ドアウェイドメインを捕らえることができる」とワン氏は説明した。

 Strider Search Defenderは、確認済みスパムのURLのシードリストで始まり、自社開発の「Spam Hunter」ツールを使って検索エンジンにあるリンククエリーを走らせる。この自動化されたプロセスによって、既知のスパムURLが掲載されているフォーラムやゲストブックを検出する。これらのページには、さらなるスパムリンクがスクラップされており、スパムURLのリストを自動生成する。

 Microsoftでは、これらのスパムURLを遮断するべく潜在的なスパムURLのリストをStrider URL Tracerにフィードする手法を採用している。Strider URL Tracerは商標権所有者がタイポスクワッティングドメイン(ユーザーがタイプミスした場合に意図的に誘導する類似ドメイン)を探し出すためのツールで、今年Microsoftからリリースされた。

 ワン氏のチームはこのURL Tracerを使って実際のブラウザで各URLにアクセスし、その結果誘導された別のURLをすべて記録する。この自動スキャンニングが完了すれば、大量のドアウェイページURLと関連するターゲットページドメインを特定できるようになる。

 ワン氏によれば、あるときSpam Hunterは1万7000以上のBloggerのURLを収集し、URL Tracerに読み込ませたという。この結果、Googleがホストしているスプログの背後にある上位25のターゲットページドメインが検知された。とりわけトップ6のs-e-arch.com、speedsearcher.net、abcsearcher.com、eash.info、paysefeed.net、veryfastsearch.comが活動的で、これらを合わせるとBloggerのURLの約45%を占めるという。

 Strider Search Defenderプロジェクトは既にMSN Searchから無意味な検索結果を排除する一助になっている、とワン氏は語る。「URLのスパム範囲が広ければ広いほど、Spam Hunterで見つけやすい。「スパムされたフォーラムを検知できれば、そこは私たちにとって、新しいコメント掲載から新たなスパムURLを探すことができる『ハニーフォーラム』となる。スパム行為からその結果が検索エンジンに反映されるまでには時間差があるので、理想的には、スパムURLが検索結果のトップにランクされる前に当社のスパムハンターでそれを検知し、検索エンジンに通知できるようにしたい」とワン氏は語っている。

前のページへ 1|2       

Editorial items that were originally published in the U.S. Edition of “eWEEK” are the copyrighted property of Ziff Davis Enterprise Inc. Copyright (c) 2011. All Rights Reserved.

注目のテーマ