検索結果のミステリー:グーグルとBingの場合
以前に奇妙な検索結果に関する記事を書いたら、検索結果ミステリーをもっと紹介してほしいというコメントやメールをたくさんもらった。というわけで、またいくつかご紹介しようと思う。
#1 本当に「Awesome」(すごい)のは誰? その理由は?
2つ目の結果に対する感想は、その通りだと思う。たしかにグーグルはすごい製品だが、このサイトのコンテンツとこのページあるいはサイトが獲得している被リンクを考えると、この検索順位はかなり変だ。他の検索エンジンでは、これが検索結果ページのトップ付近に来ることなどまずあり得ない。
#2 Bingとハッシュについて
これまで、検索エンジンについては、URL中のハッシュ(#)を無視し、リンクグラフにとってはページ内のアンカーなど存在しないものとして扱っていることが知られている。
マイクロソフトの新しい検索エンジンであるBingはさまざまな点で正しい処理を行っており、検索分野ではもう何年も受けたことのない最高の称賛とでもいえるものをマイクロソフトにもたらした。けれど、ページ内アンカーを別個のURLとして扱うことは、多くの問題を引き起こす可能性がある。
この例では、関連性に関わる問題だが、リンクグラフにおける正規化を著しく混乱させかねないケースもある(そうして、ウェブマスターにURLにおけるハッシュの使用を再検討させることになるかもしれない)。
#3 安い書籍があるのはどこ?
「Half.Ebay.com」というURLは、検索結果で最上位に来るのが不思議だ。「http://books.half.ebay.com」にはもっと別に「本」に関連性の高いページがあるうえに、このページのどこにも「安い(cheap)」という単語は登場してこない(それにも、このページに対して、その単語を含むアンカーテキストを持った重要なリンクが張られているわけでもない)。
グーグルは何か別の類義語で処理して、このページに高い順位を与えているんじゃないかと疑いたくなるぐらいだ。
さて、こんどは君たちがこのミステリーを解く番だ。大いにがんばって鋭い洞察力でこれだという結論を出してほしい!
ソーシャルもやってます!