エンタープライズ:ニュース 2002/07/05 11:29:00 更新


WIDEプロジェクトのインターネット計測で判明する利用形態と変化

国内で展開されるWIDEプロジェクトは、2002年現在までに3年間の長期的なインターネットの計測を行っている。商用ISPではデータ公開が行えないが、研究用であるWIDEプロジェクトであるからこそ実現される統計が興味深い。

 NetWorld+Interop 2002 Tokyoの2日目、「インターネットの性能測定ツールとその応用」カンファレンスが開催された。このカンファレンスでは、研究用のWIDEプロジェクトだからこそ可能なインターネットの利用形態調査が明らかにされた。

IMG_0035.jpg

 WIDEプロジェクトに参加するソニーコンピュータサイエンスの長健二朗氏は、まず最初に次の3つのポイントで行うことが、WIDEプロジェクトならではのインターネット計測の価値であると語り始めた。

1. 広域をカバーできる

2. 多地点から調査ができる

3. 長期的に行う

 インターネット上でのデータ収集では、LAN上では問題がないことであっても、何万というプロトコルが行き交うため、さまざまな問題が起こる可能性がある。そして、どのような問題が発生するのか把握するために、多地点から計測を行って、長期的に推移を見ていくことが、このプロジェクトの目的である。

 米国などでも今や研究用のネット網でも一般のトラフィックが含まれることが多く、計測を行うことが困難になっているのが実情だ。そのような中でも研究用として機能するWIDEプロジェクトは珍しい存在になっている。

トラフィックデータレポジトリ

 長氏は、「商用ISPでは、利用者のデータだから公開ができない。だからこそWIDEプロジェクトが行う」ものとコメントする。

 計測を開始した3年前は、T1(1.5Mbps)回線をターゲットとしていた。同氏によれば、当時は欲張らずに狭い帯域から始めたということだ。当初は、一般的なツール「tcpdump」などを用い投稿を頼りに行ったものの、継続が困難になるという問題から、集計の自動化が課題とされた。

 また、パケットに含まれるプライバシー、ユーザー情報の匿名性確保も重要な点だ。研究を行っている課程では、学生に渡すデータに特定人物のメール内容などが含まれてはならない。研究のためには、基本的にIPヘッダだけがあれば十分なことから、安全な公開データを作成するためにペイロードを削除するといった工夫もある。

 これにはツール「tcpdpriv」などが利用され、オリジナルダンプからIPアドレスやポート番号を匿名化するといった処理が行われている。これらの収集データによって、アクセス頻度の高いサーバなどが統計として分かるという。

 現在では、100Mbps回線でも比較的狭い帯域となっているが、200Mバイトごとに記録データを分割するとしても、20〜30分で達してしまう。長氏は、収集よりも加工が困難であることを強調する。

 現在では、「aguri」と呼ばれるツールを開発したことで、1日に150Kバイト、1年で130Mバイトというデータ容量までの集計処理が可能になった。このaguriでポイントとされたのは、MRTGなどのように広域な推移は分かるものの中間データが判別できない状況をクリアにすることだった。また、集約を行う処理が前提のため、後からピンポイントの詳細データを参照することも可能になる。

 なかでも困難を要したのが、事前に記録ルールを設定する方法では限界がある点。昨今のインターネット利用の多様化により、Napsterのようなツールの新たな利用ポートを追うのは困難であり、またDDoSのような攻撃を記録してしまうのも無駄になってしまう。このためにも、サブネットで記録集約処理を行う仕組みは必須だったという。

 現在の利用形態として、HTTPが70%、DNSへの問い合わせが1%という現状もコメントされた。

IMG_0018.jpg
 記録されたデータから集約処理を行っているデモンストレーション

各国にあるルートDNSのパフォーマンス

 意外と確固たるデータが存在しない事が、計測を行うきっかけとなったという。現在、インターネット上で名前解決を行うためのルートDNSサーバは、世界中で13個所が設定されている。しかし、「特定のルートDNSを、インターネット上でどこに移したらどのようになるか?」といった公式なデータは存在しない。このような現状からWIDEプロジェクトで計測を行い、世界中での利用され具合や形態などを明らかにしていくことが目的となっている。

 その手法は、知人などにテストツールを渡して実行してもらうという単純なものだ。UNIX上で実行可能なプログラムであり、5分ごとにルートDNSにパケットを投げ、処理された結果を電子メールで返信することで、集計用サーバでデータ処理が行われる。

 最後に、プレゼンテーションで公開された写真を幾つか紹介しよう。そこには、興味深い内容が見られるはずだ。

IMG_0032.jpg

 左上から右下に対角線を引き、右上から米国、ヨーロッパ、アジアとデータが並んでいる。反応が短いほど赤く表示されており、計測を行った各国でルートDNSに参照を行った際の統計が分かる。つまり、米国やヨーロッパほど、ネットワーク上でも近くにルートDNSが存在し、アジア諸国ほど遠くなっているといった実情が表現されているのだ。

 また、次の写真は東京からそれぞれのルートDNSを利用して参照を行った際、世界中のドメインがどのように見えるかを示したものだ。右下から東京、サンフランシスコ、ロンドンと並び、右上までの比較的小さな国々までのレスポンス(インターネット上での見え方)がグラフ化されている。

IMG_0030.jpg
関連リンク
▼WIDEプロジェクト

[木田佳克,ITmedia]