ほんとかぁ? → 躍進する Google、Yahoo! との差は9.7%

検索エンジンのシェアに関する以下の記事を見て、 「ほんとかぁ?」と思った人は多いだろう。

ユーザーが普段検索に使っている検索サイトの1位は「Yahoo!」50.7%(152人)だが、 2位は Google 41.0%(123人)で、その差はわずか9.7%
躍進する Google、Yahoo! との差は9.7% (Japan.internet.com 国内記事 2005/11)
確かにGoogleの利便性や技術力はすごい。 しかし、一番優れた技術が市場を制するとは限らない。 これはもう数十年前のVHS対ベータマックス戦争の時代から続く真理だ。

インターネットを使う調査会社にパネル(調査対象者)として登録しているような人は、インターネットを使い慣れている人だ。 そういう人を対象にした調査でGoogleとYahooが僅差になるのは必然である。 ある程度経験のあるWeb業界の人間であればすぐにそんなふうに直感できるだろう。 鵜呑みにすると痛い目にあう。

そこで、とある非IT系なWebサイト(日本向け、月間100万PV前後)のアクセスログの解析に基づく検索エンジンのシェアを測定してみた。ログに残るrefererとトラッキング用のCookie値をもとに、ユーザーの重複などの無いように慎重に計算した結果は次のとおりである。

Yahoo60%
Google31%
MSN8%
これが現実。

PHPでExcelデータを読み書きする

前回、前々回の記事から、あらゆる情報のXML化が今後のWeb界のキーのひとつであることがお分かりいただけたとおもう。 しかしそうした話も実を伴わなければ単なる空想に過ぎない。

空想を現実に近づけるひとつの例があったので紹介しよう。

IBM dW : Open source: PHPでExcelデータを読み書きする
(IBM Developper Works 2005/10)
技術者ではない人にはピンとこないかもしれないが、Excelのような一般的なアプリケーションがXML形式をサポートするようになったことで、コンピュータ同士の情報のやりとり(C2C)がよりスムーズになりうることの一例と言える。

See also: @IT:特集 InfoPathの衝撃 ― マイクロソフトの新しい戦略Officeスイート「InfoPath」によって、XML技術は新時代を迎える  (@IT 2003/3)

蛇足だが、Office2003シリーズよりも古いExcelであっても、そのデータの読み書きを実現するモジュールは結構昔からあったりする。

これから始まる、いや、もうそこにあるC2C情報

(前回より続く) もしもホテルや旅館の情報がC2C化されたらどうだろう? つまりこうだ。

栃木県に実在するとある旅館 C2H用情報 C2C用情報
宿の住所、交通機関、部屋数などの基本的な情報はもちろんのこと、 料理の種類、近所のゴルフ場、果ては温泉の洗い場にある蛇口の数(NumberOfFaucet)までもが、全てXML形式で表現される。

このXMLは筆者の想像や冗談ではない。 Travel XMLは、旅行業界が中心となって今も着々と策定が進められている。 静的な情報(住所とか)だけでなく、動的な情報、つまり○月×日の予約可能な部屋数などの情報のXML仕様ももちろんある。

・・・そこでまず、XMLへの認知を主催者(EyeforTravel事務局)や参加者に聞いてみた。  言うまでもなく、旅行業はインターネット上の産業へと変貌しつつある。 実際、ネット上だけで営業する巨大旅行エージェントが多数出現していて、 他のどの産業よりも先駆けている。そうである以上、 たとえば旅行者の個人情報だとか旅程といったデータはすべてXMLで書くのが自然かつ当然で、 他に合理的な選択は無い。だから皆ここに集まっている訳で、 今時なんでそんな質問するの?というのが、彼らの反応だった。
OTA2002カンファレンスレポート - 仮想旅行産業の透明化の鍵を握るXML (PCView 2002/6)
「へぇ~」なんて言ってる場合でもなさそうだ。

もしも職業の求人/求職情報がC2C化されたらどうだろう? ヒューマン リソース コンソーシアムは 本気でそれを考えている。求人情報だけでなく、タイムカード等の労務管理すらその範疇にあるようだ。 ちなみに、Resume(レジュメ≒履歴書)をHR-XMLで策定された仕様で書くとこんなふうになる。

野比のび太のレジュメ

日本では求人情報ビジネスにおけるXMLの活用はまだまだだが、 一部ではC2C化の兆しは既に出ている。

「ジョブエンジン」は、求人情報に特化したロボット型検索エンジンです。 インターネット上をジョブエンジンロボットが巡回し、 主に企業・団体などのサイト上で公開されている求人情報ページを自動的に検知・収集し、 また更新探知を行います。
ジョブエンジン)
前回と重なるが、ジョブエンジンは本来はHuman向けの形式であるHTMLを強引にComputerが読み込んで解析している。これは一般的な検索エンジンと原理的には同じであり、擬似的なC2C化と言えるだろう。

人材業界であれ旅行業界であれ、物理的な製品ではなく、ある程度定型化された情報を大量に扱う業界では、 営業能力ももちろんではあるが、取り扱う情報を収集し編集する能力がモノをいう。 しかしいまや情報の収集はインターネットが、情報の編集はコンピュータがやってくれるようになった。

今後、旅行業界や人材業界で覇を競うことになるのはJTBや近畿日本ツーリストやリクルートや毎日コミュニケーションズではなく、 ちょっとしたコンピュータ言語とデータベース技術とXMLを勉強した一介のプログラマーかもしれないし、 あるいはGoogleかもしれない。

C2HとC2C

Web2.0とかいう単語が流行っているらしい。でもたぶん業界の一部の人間の間だけだ。 個人的には、 秋元@サイボウズ研究所プログラマーBlog: Web2.0 が直面する 10 の課題(2005/11) という記事にある以下の一文に同意である。

2. わかりやすい定義の欠落

これが Web2.0 だ、という簡潔な定義が無い

かといってWeb2.0をいまここで簡潔に定義してやろうということではない。またWeb2.0なんて嫌いだということでもない。 その一部でもいいから、もう少しわかりやすく説明するべきじゃないかということで話を進めよう。

今からもう5年以上前に、今のWeb2.0で提唱されている内容の一部と似たような話が既に出ている。

・・・さらに、Kaldor氏は「4、5年後にはもっと興味深いことが起こる」という。 「コンピュータと人間」という要素によるカテゴライズだ。

 すでに現在、希望する商品がどこで一番安く買えるかということをコンピュータに探させ、 それを購入することができるようになってきている。その結果、同氏は、 「将来は、(販売者の)コンピュータが、(購入者の)コンピュータに対して、 どのような商品情報を提示してくれるか」ということが重要になるという。 こうなると、企業の中間材の取引は、当然のように“Computer To Computer:C2C”で行なわれるようになる。 一方、最終製品については、C2Cの場合もあれば、消費者が自分の手で探して購入する “Computer To Human:C2H”の場合もあるわけだ。
Eコマースの将来は“C2H”と“C2C”に?(Internet Watch 2000/1)より

そう言われてみるとC2C、C2Hという分類は今のWebの状況説明にしっくりくる気がする。

報道情報 C2H用情報 C2C用情報 参考記事
天気予報 C2H用情報 C2C用情報 参考記事
祝祭日情報 C2H用情報 C2C用情報 参考記事
商品情報 C2H用情報 C2C用情報 参考記事
ほかにも、現在のWebサイト運営において常識的な戦略となりつつあるSEO(検索エンジン対策)も、 上で言う「C2C」の一例と言えるかもしれない。 本来はHuman向けの形式であるHTMLを強引にComputerが読み込んで解析しているのだから。

インターネットの登場からいまに至るまでのWebの世界には、C2Hな情報しかなかったのだ。 XML形式に代表されるC2Cな情報は、その規格(書き方)自体はやはり90年代から徐々に策定されつつも、 世間の注目を集めるにはブログとそのRSS形式情報の普及というわかりやすい活用事例の登場を待たなければならなかった。

さてここからは、今現在展開されているあるいは今後展開されうるC2C情報の、 より具体的な話にはいろうと思ったのだが長くなりそうなので次回

アマゾンの日本での売上高は約800億円、うち書籍は624億円、らしい。

この業界でのアマゾンはあまりにも有名なのに、その数字には謎が多い。 特に「アマゾンはいったいどれだけ売り上げているのか?」という、 一見調べればすぐわかりそうな情報が、実はどこにも無い。

2000年前後のネットバブルに翻弄されて以来、 アマゾンは徹底した秘密主義を取っている。 でないとすぐ株価が過剰反応してしまってやりづらかったからだ(今でもそうかも)。 NASDAQに上場している本国はともかく、 アマゾンの日本法人は上場もしていないので決算を公表する義務も無い。

しかし、さまざまな周辺情報から推測することぐらいは可能だ。

「アマゾンはまだ創業初日」--日本市場は売上の10%を占める存在に (CNET Japan 2005/10)という最近の記事から次の事実が浮かび上がる。

  • 全世界でのアマゾンの売上高は69億2100万ドルである(2004年12月期)
  • このうち、日本での売り上げは2004年には全世界の売上高の10%を占めるに至った。
  • 書籍以外の売上(つまり電化製品等)は米国外では22%を占めている。
ここで、為替レートを1ドル=116円だとすると、次のような計算になる。
  • 全世界でのアマゾンの売上高は約8000億円(2004年12月期)
  • うち、日本での売り上げはその10%≒800億円
  • 書籍以外が22%ということは、日本での書籍の売上高は624億円、 書籍以外の売上高は176億円
ということになる。

書籍だけの売上高で見ると紀伊国屋書店のおおよそ半分くらいらしいが、 なにしろその成長率がすさまじいし、書籍より利益率がずっと高い家電等にも進出している。 今後数年で日本の小売業のなかでも実は相当な存在感となるだろうことは想像に難くない。