特集
» 2005年04月08日 15時33分 公開

Blogを支えるテクノロジー:第1回 RSSの要約配信はさらに加速する (3/6)

[大澤文孝,ITmedia]

 RSSでは、Syndicationモジュールもよく使われる。Syndicationモジュールとは、表5に示す要素が定義されているものであり、コンテンツの更新間隔を定義する際に使用する。

 このようにRSS 1.0では、モジュールを使うことで意味付けを拡張できるという特徴があるのだ。

 ただし、ツールであるRSSリーダーを使いRSSデータを読み取る場合、RSSそのものの意味付けが利用されるかどうかは別問題だ。RSSリーダーが理解しない(利用しない)ものは無視される。

表4■Dublin Coreモジュール

要素 意味
title タイトル
creator 作成者
subject サブジェクトやキーワード
description 概要
publisher 発行者
contributor 協力者や貢献者
date 日付
type リソースの種類。画像、テキスト、動画など
format リソースの形式(MIMEタイプ)
identifier リソースの識別子。URIやISBNコードなど
source 引用元などの元リソース
language 言語。ISO-639のコード。日本語なら「ja」
relation 関連するリソース
coverage リソースが適用される範囲や対象
rights 著作権など

表5■Syndicationモジュール

要素 意味
updatePeriod updateFrequencyで指定する単位。「hourly」「daily」「weekly」「monthly」「yearly」のいずれか
updateFrequency このリソースの更新間隔(正の整数)。たとえば、updatePeriodが「hourly」でupdateFequencyが「8」なら「8時間ごと」
updateBase updatePeriodやupdateFrequencyの間隔を決めるときの基準日時

3)RSS 2.0(Really Simple Syndication、仕様関連リンク

 RSS 2.0は、RSS 0.9xを改良したRSSであり、上位互換となるものだ。その一方で、RSS 1.0との互換性はない。また、RSS 2.0はRSS 0.9xの要素に加えていくつか利用できる要素が増えている。そのほか、RSS 1.0と同様に名前空間を指定することで、モジュール追加ができるという特徴を持っている(図4)。

図4■RSS 2.0の構造
コラム■Atom Syndication Format
RSSと同様にしてコンテンツの配信をするためのフォーマットとして「Atom Syndication Format」という仕様が提唱されている。Atom Syndication Formatは、RSSで表現するものをまったく新しい構文で示すものだ(Atom Syndication Formatは、単に「Atom」とも略されるが、Atomにはもうひとつ「Atom Publishing Protocol」という仕様がある。こちらはBlogを編集操作するためのAPIを提供するもの)。現在、IETFによる標準化(RFC)が目指されており、仕様のドラフトも参照できる(関連リンク)。Atomは、まだ仕様ドラフト段階であるが、GoogleのBloggerサービスでは、RSSではなくAtom Syndication Formatが積極的に採用されるなど、導入の動きが活発だ(関連記事)。RSSは、ここまで説明してきたように、RSS 0.9x/2.0系とRSS 1.0系とが混在して分かりにくい状況にある。そのためAtomが正式にRFC化されれば、場合によっては、RSSからAtomへ移行していく可能性もある。RSSリーダーのいくつかは、すでにAtom Syndication Formatに対応しているものもある。なお仕様を見ると分かるが、Atom Syndication Formatは要素名がまったく違うものの、構造はXMLであり、RSSと大きく違わない。そのため、RSSからAtom Syndication Formatへの変換は、それほど難しくはない。

RSSデータを生成するためには

 ここまで説明してきたように、RSSのデータフォーマットは極めて単純なXML形式ファイルなのだ。そのため、その書式に則った形式のXMLファイルを作ればよいだけ、ともいえる。

 慣例的にRSSのファイル名は、「rss.xml」や「rss.rdf」(RSS 1.0の場合)といったファイル名(拡張子)が多いが、特に規定はない。RSSデータはXML形式のファイルのため、コンテンツタイプ(MIMEタイプ)は、サーバサイドで「text/xml」または「application/xml」として規定し、クライアントへ返すようになっていればよい。もしくは「application/rss+xml」を返すという方法もあるが、2005年4月現在、一部対応しないWebブラウザがあるため避けるのが無難だ。

 なおファイル内の文字コードは、<?xml ?>の部分でエンコード指定をすると、こちらも任意で構わない仕様だ。日本語サイトからの配信であれば、<?xml encoding="utf-8">として、UTF-8コードで記述することが多いだろう。実は、第三者から公開されているRSSをリーダーなどで表示する際、ハマりやすい問題は文字コード不一致の文字化けといえる。

 RSSはもちろん手書きで書いてもよいし、RSSを記述するためのソフトを使ってもよい。RSSを記述するためのソフトとしては、たとえば、「Headline-Editor(http://www.infomaker.jp/editorlite/)」などがある。またサイトをデータベースから生成しているなら、データベースからRSSのXML形式ファイルを書き出すようにすれば、RSSの動的な生成も可能だろう。

 ところで、RSSを作成するときには、そのRSSが書式上、正しいかどうかを確認したいことだろう。

 Webでは、RSSが正しいかを調べるバリデータのサービスがいくつか提供されている。有名なところでは、「Feed Validator for Atom and RSS」がある。ここではRSSのURLを入力することで、そのRSSフォーマットが正しく記述されているデータかどうかを調べることができる。また、Feed Validator for Atom and RSSでは、検証に成功すれば、ロゴマーク画像を入手してリンクし、公式データとして知らしめるページ貼り付けが許されている。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ