4大検索エンジン+Cuilの性能を比較してみた(前編)
2008年の夏、検索エンジン・シーンに「Cuil」(「クール」と読む)が登場した。検索技術と検索エンジンの全般的な仕組みに対する熱烈な愛好者として、僕は時間を費やしてこの新しい検索サービスをいろいろといじってみた。そして、この新参者について、グーグル、ヤフー、MSN(Live Search)、Ask.comという、よく知られた市場大手と比較した僕のデータを公表することが役に立つだろうと考えた。
主要ウェブ検索エンジンの価値と性能を判断するにあたり、評価プロセスに不可欠だと思われるいくつかの項目がある。順に挙げていくと、関連性、検索範囲、情報の新しさ、多様性、ユーザー体験だ。
まず、5つの検索エンジンの総合的な性能を簡単に見てから、使用した手法を説明し、個別の項目ごとに詳しく調べていこう。
データからわかる興味深い点
ヤフーが若干他のエンジンをリードしたのには、それほど驚いていない。ロングテールな検索キーワードにおける能力はパッとしないが、すべての項目を重み付けせずに評価するなら、ヤフーはグーグルとトップの座を争っている。
検索に関して、グーグルの方がはるかに強力な「ブランド」を築いているのに、人々がすっかりそちらへ乗り換えるまでにいたっていないというのは、それなりの理由がある。
グーグルは全般的に優秀だが、これも驚くことではない。グーグルは各種エンジンの中で最もバランスがよく、ほとんどの評価項目において見事な成績を示している。この表の数字で判断すれば間違いなくヤフーの勝ちだが、僕個人の考えでは、検索において最も信頼できる基準となるのはやはりグーグルだ。
多様性とユーザー体験に関しては、3DインターフェイスのおかげでAsk.comが明らかに優勢だ。
思うに、特に検索需要曲線の「頭」の部分において、3Dインターフェイスは本当にすばらしい検索結果をもたらしてくれる。
インデックスの規模に関しては、ヤフーが首位に立っているように見えるものの、実際のところ、僕のテストは少し誤解を招くおそれがあるんじゃないかと思う。
インデックス化されたドメイン名の多くについて、記録されているページの数は明らかにヤフーの方が多いのだが、実際にはグーグルの方が検索の速度に関しても範囲に関してもすぐれているような気がする。グーグルはあえて、メインインデックスに収録するページ数を少なく抑えているだけなのではないだろうか(そしてこれが実際、グーグルが関連性ですぐれた成績を上げるのに役立っているようだ)。
グーグルはまた、URLの正規化においても優れており、それに比べればヤフーなど他のエンジンはすべて苦戦している。
僕がいちばん驚いたこととは何かだって? 米マイクロソフトのLive Searchだ。このエンジンの品質と関連性が、相対的に見てこれほど高い成績を収めていることに唖然としている。これだけの規模の調査は2006年ごろを境にやっていないが、ふだん1か月に数十回程度Live Searchで検索している結果は、いつだって今回の調査よりもかなりひどいものだ。Live Searchが影響力を増し、改善の方向へ向かっているのは明らかだ。
いまだにLive Searchが抱えている最大の問題点は、スパムと怪しげなリンク(Live Searchのリンク解析アルゴリズムではこれが判断できていないらしい)だ。この問題を解決すれば、Live Searchはトップクラスの関連性を実現する道を順調に進むものと思う。
Cuilでは、「site:」「inurl:」「intitle:」や除外キーワードなどのような、ごく普通のさまざまな「高性能」検索オプションができないため、インデックス規模に関する評価が不可能に等しい(もっとも、他のエンジンでは何百何千というページが表示されるような語句やフレーズについて、検索結果が0件になるという事実がすべてを物語っているのだが)。
また、こうした検索オプションがないことで、Cuilの技術的検索および高度な検索のスコアがとんでもなく低くなってしまう。Cuilを使い始めようとする「テクノロジー通」はおそらくいないだろう。Cuilは見逃してしまっているが、こういう人たちこそがウェブ上で話題を集めるのに欠かせない要素なのだ。
Cuilのまずかった点は、この完成度で立ち上げてしまったことだ。Cuilが引き起こした騒ぎの大きさと、獲得し得たはずの市場シェア(たとえ1%の何分の1かだとしても、何百万もの価値がある)を考えると、Cuilはまず、大勢の僕のような人間に今回のようなテストをたくさん実施させ、主要検索エンジンに比べたらCuilがはるかに及ばないことを示しておくべきだった。第一印象を作る機会は1回しかなく、Cuilの場合は大失敗に終わった。
Cuilがもうおしまいだとまで断言する気はまだないが、TechCrunchのマイケル・アーリントン氏をはじめとする技術業界の人々や主要メディア、Cuilの主張をまた受け入れるようになるには、きわめて説得力のある証拠が示されでもしないかぎり、相当の時間がかかると思う。僕が見たところ、Cuilのインデックスは他のどの主要検索エンジンよりも小規模だし、関連性ときたらにどれもこれも悲惨としか言いようがない。
僕としては、グーグルに戦いを挑めるところが現れて、検索市場をよりおもしろいものにしてくれることに大きすぎるほどの期待を抱いていたので、Cuilにはほんとうにがっかりしている。次こそはきっとうまくやってくれることを期待したい(この問題に3,000万ドルを超える投資をつぎこみ続けてくれるベンチャーキャピタルがあるとしての話だが)。
今回の調査手法について
それぞれの入力データを取るために、僕は多数の検索を実施し、さまざまな種類の検索文字列を試してみた。
検索エンジンの検索需要がどうなっているかを理解することが、各エンジンの性能を評価するうえで欠かせない。エンジンによっては、ユーザーが頻繁に利用するクエリには優秀な結果を返してくれるのに、需要曲線の「テール」部分ではほとんど役に立たないものもある。“すばらしい検索エンジン”だというには、どちらの種類のクエリにも答えられなければならない。
たいていの場合、僕は、きわめて需要の高い検索クエリ
- Barack Obama(バラク・オバマ)
- Photography(写真)
などにはじまり、ロングテールに属する検索文字列
- pacific islands polytheistic cultures(太平洋の島々 多神論的文化)
- chemical compounds formed with baking soda(重曹から生成される化合物)
といったもの、そして両者の中間に位置するあらゆるクエリという風に、クエリ需要のスケールにおいて異なる点に位置する検索キーワードを使用した。各項目の説明の後に、僕が使用したクエリをすべてリストアップしてある(後編の記事)。テストの際には、各エンジンの品質をランク付けするために、以下のような基準を使用した。
0 | 基本的な要件を満たしていない |
---|---|
1 | 非常に悪い |
2 | 悪い |
3 | 普通/いちおう基準を満たしている |
4 | 良い |
5 | 非常に良い |
この記事は前後編の2回に分けてお届けする。次回は、各調査項目について詳しくお伝えしよう。→後編を読む
ソーシャルもやってます!