link rel="canonical"によるURL正規化タグ——SEOにとって非常に重要な進歩(後編)
この記事は前後編の2回に分けてお届けしている。前回はURL正規化タグの基本的な解説と使いどころを説明したが、今回は検索エンジン各社から提供されている情報と、URL正規化タグについてまだ不明な点を見ていこう。
URL正規化タグに関して、各検索エンジンはどのような情報を提供しているか
実際のところ、かなり多くの情報を提供している。まずはグーグルの発表から、重要な箇所を引用しよう。
「rel="canonical"」の扱いは参考材料なのか、それとも命令なのか?
重視すべき参考材料として扱います。検索結果に表示する最も関連性の高いページを判断する際に、この設定を他のシグナルと併せて考慮に入れます。
<link rel="canonical" href="product.php?item=swedish-fish" />のように、相対パスを使用して正規URLを指定できるか?
できます。相対パスは、通常のlink要素と同じく認識されます。また、文書中にbase要素がある場合、相対パスはそこで指定されたベースURLを基準として決まります。
正規ページの内容がコンテンツと完全に一致していなくてもかまわないか?
たとえば、製品表の並び順など、多少の差異は許容範囲内です。また、正規のページと重複コンテンツをそれぞれ異なる時点でクロールする場合もあるため、場合によっては同じコンテンツの異なるバージョンを目にするかもしれない点についても認識しています。いずれにしても問題ではありません。
「rel="cannonical"」で指定した正規URLで、404エラーが生じた場合は?
そのコンテンツをインデックスに残したまま、ヒューリスティック的手法によって正規ページを探しますが、なるべく実在するURLを正規URLに指定することを推奨します。
「rel="canonical"」で指定した正規URLが、まだインデックス化されていない場合は?
ウェブ上にあるすべての公開コンテンツと同様、指定された正規URLを速やかに発見し、クロールするよう努めます。そのURLをインデックス化したら、ただちに「rel="canonical"」の内容についても再検討します。
「rel="canonical"」で指定した正規URLをリダイレクトすることはできるか?
他のページにリダイレクトするURLを正規URLに指定することは可能です。グーグルはそのリダイレクトを通常どおり処理し、インデックス化を試みます。
相矛盾する「rel="canonical"」指定を行ったらどうなるか?
当社のアルゴリズムはそれほど厳格でないので、正規ページのつながりをたどることは可能ですが、正規化において最良の結果を得られるよう、リンクを更新して単一の正規ページを指定することを強く推奨します。
次にヤフーからの引用。
<link>タグのURLパスは絶対パスでも相対パスでも構いませんが、エラーの可能性を回避するため、絶対パスの使用を推奨します。
<link>タグでは、同じドメイン名内の正規URLを指定できるだけで、ドメイン名の異なるURLは指定できません。たとえば、「http://test.example.com」上にあるページならば、「http://www.example.com」上のURLを指定することはできますが、「http://yahoo.com」など他のドメイン名にあるURLを指定することはできません。
リンク参照などの効果を正規ページに転送することに関して、<link>タグは301リダイレクトと同様に扱われます。
ヤフーではタグの情報を提供されたとおりに使用しますが、タグが意図どおりに使用されていないと思われる状況を回避するために、アルゴリズム的手法も利用します。たとえば、正規ページが存在せず、404などのエラーが発生する場合や、あるいはソースとターゲットのコンテンツが著しく異なり、それぞれが別個のものである場合、そのURL正規化タグは誤りとみなされ、扱いが保留されることもあります。
このタグは推及的です。つまり、AというURLがBを正規URLとして指定し、さらにBがCを正規URLとして指定している場合、CはAとB両方にとっての正規URLとして処理されますが、無限連鎖などの問題が生じた場合は、何らかの形で解消します。
そして最後にMSNからの引用。
Live Searchでは、このタグを命令ではなく参考材料と解釈します。そのうえで、そのWebサイトについてわかっている他の情報すべてと照らし合わせてこのタグを評価し、正規URLについて最善の判断を下すよう努めます。そうすることによって、このタグについて起こりうるすべての誤用や乱用に対処します。
linkタグの「href」属性では、相対URLと絶対URLのどちらを使用しても構いません。
「href」属性で指定したページおよびURLは、同じドメイン上になくてはなりません。たとえば、ページが「http://mysite.com/default.aspx」にあるのに、linkタグの「href」属性が「http://mysite2.com」を指定している場合、このタグは無効となり無視されます。
ただし、この「href」属性で異なるサブドメインを指定することは可能です。たとえば、ページが「http://mysite.com/default.aspx」にあり、リンクタグの「href」属性が「http://www.mysite.com」を指定している場合、このタグは有効とみなされます。
Live Searchでは、近日中にこの機能のサポートを実装する予定です。
それでもまだ残る疑問
URL正規化タグの機能とそれがもたらす結果については、まだ少しはっきりしない部分がいくつか残っている。以下に挙げてみよう。
各種検索エンジンはこのタグをどの程度信頼するのか。コンテンツが常に100%一致している場合にしか機能しないのだろうか。コンテンツの差異に関してある程度柔軟性はあるのだろうか。あるとすれば、どの程度か。
URL正規化タグは、1つのページから別のページにリンクジュースを100%引き渡すのだろうか。現在301リダイレクトによって引き渡される量に比べ、多いのか少ないのか。グーグルのウェブスパムチームの代表マット・カッツ氏はURL正規化タグは301リダイレクトと同程度のリンクジュースを引き渡すと述べたけど、それと同時に、(SEOmozのジリアン・ミューシッヒの質問に対して)「URL正規化タグが失うリンクジュースは、301リダイレクトと同程度だ」とも答えている。これはつまり、2つのうちのどちらを適用した場合でも、リンクジュースがわずかにだが失われることを示唆している。
各検索エンジンの非英語バージョンに、このタグはどの程度適用されるのか。さまざまなレベルのコンテンツ/重複分析や、国や言語に特有の問題には対応するのか。
すべての検索エンジンが、このタグをまったく同じやり方で処理するのだろうか。そのためには各検索エンジンがコンテンツやリンクの分析アルゴリズムを共有する必要があるから、ちょっとありそうにはない。URL正規化タグの解釈には検索エンジンによって違いがあることは、今後出てくる間接的なデータ(そしておそらくは統計的データも)によってわかってくるだろう。
ヤフーはURL正規化タグに絶対パスを使用するよう強く推奨しているが(ちなみに、SEOmozではまだURL正規化タグを導入してないけれど、相対URLによって生じ得る危険を考えると、やはり絶対パスの使用をお勧めする)、他の検索エンジンは見解を明確にしていない。標準としてどのような形が推奨されるかはいずれはっきりするだろう。
ヤフーはまた、URL正規化タグが推及的な性質を持つと説明しているが(これは長い間たくさんのURL再構築を余儀なくされてきた人には朗報だ)、他のエンジンもこの点をサポートするのかどうかは不明だ。
MSNはURL正規化タグへの対応をまだ開始していないらしい。いつ正式に対応を開始するのか気になるところだ。
SEO業者がURL正規化タグをアフィリエイトリンクに使用してリンクジュースを送り込むことを、各検索エンジンは認めるだろうか。SMX Eastにパネリストとして参加したエンジニアたちから、そういった目的に301リダイレクトを使用することは構わないと聞いたので、このタグに関しても大丈夫だと考えているが、検索エンジンがアフィリエイトリンクをオーガニックリンクとみなすかどうかについて、SEO業者の多くはいまだに懐疑的だ。
この新しいURL正規化タグについて、みんなに知らせておきたい疑問や懸念、体験があれば、ぜひコメント欄に書き込んでほしい。僕はがんばって未解決の疑問を処理し、近いうちに答えを提供するつもりだ。
この件に関してもっと知りたい人には、SELand、 SEJournal、Yahoo!、MSN、それにGoogleの各情報を参考にしてほしい。
日本語でのこの件に関する参照先は次のとおり。
追伸:今回の発表に先立って、検索エンジン各社からSEOmozに対して、この件に関する相談はなかった(わかってる、わかってるって――せいぜい夢見てなよ、Rand)。だからLinkscapeのインデックスはまだURL正規化タグに対応してないけど、近いうちに対応するつもりだ。それと、可能になり次第、このタグがウェブ全体でどれくらい普及しているか統計も取ろうと思ってる。
ソーシャルもやってます!