RSSフィードの真価はSEO=検索エンジン対策=にある。

それが真価だというのはかなり言い過ぎではあるのだけど、あえて。

RSSフィードの真価はコンテンツを「ページという檻」から解放することにある (マーケティング - CNET Japan 2007/12)

上の記事にはほぼ同意である。「ページという檻」から解放する、っていうのは言い得て妙というか、すごく納得できた。 しかし、どうしても付け加えたい。非常に重要な観点がひとつ不足しているのだ。

記事上の図を拝借させてもらうが、

つまり「RSS情報を見る不特定多数の人」には、検索エンジンのクローラーも含まれるはずだ。

RSSをもっとも上手に活用しているものの一つが実は検索エンジンである。更新されたコンテンツを把握してクローラーを効率よく走らせる指標とするにはRSS情報はうってつけだから。 ちなみにこのブログのアクセスログなど見ると、例えばこんな感じ。

66.249.67.16 - - [19/Nov/2007:12:42:16 +0900] "GET /atom.xml HTTP/1.1" 304 - "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.67.16 - - [19/Nov/2007:12:43:24 +0900] "GET /atom.xml HTTP/1.1" 304 - "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.67.16 - - [19/Nov/2007:12:45:08 +0900] "GET /atom.xml HTTP/1.1" 304 - "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.67.16 - - [19/Nov/2007:12:47:22 +0900] "GET /atom.xml HTTP/1.1" 304 - "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.67.16 - - [19/Nov/2007:12:49:05 +0900] "GET /atom.xml HTTP/1.1" 304 - "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.67.16 - - [19/Nov/2007:12:51:13 +0900] "GET /atom.xml HTTP/1.1" 304 - "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.67.16 - - [19/Nov/2007:12:55:20 +0900] "GET /atom.xml HTTP/1.1" 304 - "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
crawl-66-249-67-16.googlebot.com - - [19/Nov/2007:12:56:18 +0900] "GET /atom.xml HTTP/1.1" 304 - "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
66.249.67.16 - - [19/Nov/2007:12:58:32 +0900] "GET /atom.xml HTTP/1.1" 304 - "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
203.216.246.180 - - [19/Nov/2007:13:23:31 +0900] "GET /index.xml HTTP/1.0" 200 153107 "-" "YahooFeedSeeker/2.0 (compatible; Mozilla 4.0; MSIE 5.5; http://publisher.yahoo.com/rssguide; users 0; views 0)"
203.216.243.112 - - [19/Nov/2007:17:39:47 +0900] "GET /index.xml HTTP/1.0" 200 153920 "-" "YahooFeedSeeker/2.0 (compatible; Mozilla 4.0; MSIE 5.5; http://publisher.yahoo.com/rssguide; users 0; views 0)"
209.131.41.48 - - [19/Nov/2007:20:13:58 +0900] "GET /atom.xml HTTP/1.0" 200 158937 "-" "YahooFeedSeeker/2.0 (compatible; Mozilla 4.0; MSIE 5.5; http://publisher.yahoo.com/rssguide; users 1; views 32)"
203.216.243.112 - - [19/Nov/2007:22:50:15 +0900] "GET /index.xml HTTP/1.0" 200 154411 "-" "YahooFeedSeeker/2.0 (compatible; Mozilla 4.0; MSIE 5.5; http://publisher.yahoo.com/rssguide; users 0; views 0)"
Yahooのロボットは必ず数時間おきにRSS/atomフィードを見に来る。googlebotも似たような感じだが新記事をアップした日は数分おきに見に来るという徹底ぶり(注:update pingを各所に打っているからかもしれない)。「ブログに書いたらその3時間後にはググってひっかかるようになってた!すげえ」という話をチラホラ聞くが、そのカラクリは、これ。

ちなみにgooglebotによる激しい繰り返しアクセスはお行儀がよくない(無駄な負荷だ)と考えてしまうのは早合点である。そういうときのGooglebotはIF-Modified-SinceヘッダをつけてGETリクエストしてくるので、サーバー側でちゃんと対応させてステータスコード304(更新されてないよ、の意)を返すようにさせれば、XML情報自体を返す必要が無いのでそれほどの負荷にはならない。

以下は、米国Yahooの「サイトの推薦」のページのキャプチャである。

上の欄が、ふつうのURLを入力する欄。 下が、rss/atomなどのフィード情報のURLを入力する欄。 つまりYahooのクローラーは「フィード情報ウェルカム!」なのだ。

なお、日本のYahooのサイト推薦のページには普通のURLを入力する欄しか無いが、だからと言ってあわててわざわざ米国Yahooへ入力しにいく必要は無い。 各ページのheadタグ内に

<link rel="alternate" type="application/rss+xml" title="RSS 2.0" href="http://example.jp/index.xml" />
みたいに書いて置きさえすれば、フィード情報の存在を察知して自動的にクロールを始めてくれる。

「RSSぅ?RSSリーダー使ってる人なんて世の中の1,2%でしょぉ?いらないよ別に。」とか言っているWebサイト運営者は、潜在的に大きな損をしていることになるだろう。

なお、文中ではRSSもatomフィードも一緒くたに書いてしまってますが、まあ規格は違えどその目的はほぼ同じなので。

see also:

トラックバックURL

このエントリーのトラックバックURL:
http://www.ywcafe.net/mt/mt-tb.cgi/799

コメントする

(初めてのコメントの時は、コメントが表示されるためにこのブログのオーナーの承認が必要になることがあります。承認されるまでコメントは表示されませんのでしばらくお待ちください)


画像の中に見える文字を入力してください。