検索
特集

オルタナブログでまとめサイトまとめサイト2.0(2/3 ページ)

Web上で必要な情報だけを取り出せると、さまざまなデータ解析が可能だ。取り出すためのポイントは定型化されている個所を見つけること。あとは記事内で紹介するスクリプトで処理してみよう。

PC用表示 関連情報
Share
Tweet
LINE
Hatena

*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***

 この際、「channel」の下の「title」の部分を見てみよう。

*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***

 上記の中で文字列(「ITmedia オルタナティブ・ブログ」という文字列)は、次のように特定して取得することができる。

*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***

すべての記事アイテムを取得する

 実際に、RSSを解析して得たいデータは、RSSに含まれている、それぞれの記事アイテムだろう。

 記事アイテムは、itemsツリーの下にあるから、$rss->{'items'}として取得できる。itemsツリーは複数存在するため、配列へのリファレンスとなる。RSS上では、itemtsツリーは、itemツリーへの参照となっている。しかしXML::RSSでは、この参照先のitemツリーを取得できる。

 itemツリーは、次ページのようになる。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る