特集
オルタナブログでまとめサイト:まとめサイト2.0(2/3 ページ)
Web上で必要な情報だけを取り出せると、さまざまなデータ解析が可能だ。取り出すためのポイントは定型化されている個所を見つけること。あとは記事内で紹介するスクリプトで処理してみよう。
*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***
この際、「channel」の下の「title」の部分を見てみよう。
*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***
上記の中で文字列(「ITmedia オルタナティブ・ブログ」という文字列)は、次のように特定して取得することができる。
*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***
すべての記事アイテムを取得する
実際に、RSSを解析して得たいデータは、RSSに含まれている、それぞれの記事アイテムだろう。
記事アイテムは、itemsツリーの下にあるから、$rss->{'items'}として取得できる。itemsツリーは複数存在するため、配列へのリファレンスとなる。RSS上では、itemtsツリーは、itemツリーへの参照となっている。しかしXML::RSSでは、この参照先のitemツリーを取得できる。
itemツリーは、次ページのようになる。
Copyright © ITmedia, Inc. All Rights Reserved.