URLの正規化ができていないよく見かける4つのケース
スキルセットや共通言語が異なる
エンジニアとWeb担当者をつなぐための手引書
前回の記事では、URLの最適化について「永続化」という観点からURLの設計時に押さえておくべきことを解説しました。URLの最適化シリーズ、2つ目のポイントはURLの「正規化」です。永続性を視野に設計したURLですが、パラメータの付加などによってリンクが分散してしまうと、永続化の本来の効果が得られなくなってしまいます。今回は、よく見かける正規化できていないケースを紹介し、その対策・修正方法を解説していくことにしましょう。
- 永続化
- 正規化 ←この記事で解説
- 静的化
- エンジニアさんへ
「正規化」「ノーマライズ」「カノニカライズ」という言葉は、データベースに関連して頻出するワードです。URLの正規化も、基本的にデータベースと考え方は一緒です。今回の記事の対象者 - Web担当者さんへ
システムで生成していないページでもURLの正規化は重要な要素です。今一度自分のサイトで正規化できてない個所がないか、アクセス解析などのデータをチェックしてみてください。
正規化とは
「正規化」とは、システム開発の世界でデータベース設計に関連してよく利用される言葉ですが、これをSEOの世界に置き換えてみると、大きく以下の2つの意味になります。
- そのキーワードを表すURLは、そのサイト内で1つのみ存在する
- そのコンテンツは、そのサイト内で1つのみ存在する
ユーザーが検索キーワードを入力すると、検索エンジンはインデックスされている全ドメインから1~2つのURLをピックアップして、順番に並べて表示します。SEOの対象となる、自然検索(オーガニック検索)結果表示エリアへの露出に関しては、1サイト(=1ドメイン)につき、最大2つのページしか表示されません(Googleではこれをクラスタリングと呼んでいます)。
そのため、URLの正規化をしておかないと意図したページが検索結果に出てこなかったり、リンクが分散して検索結果の上位に表示されなくなったりしてしまいます。つまり、URLの正規化とは検索エンジンに「そのキーワードで検索したユーザーをこのURLへ導いてください」と明確に指定するためのテクニックなのです。
よく見かける正規化できていないケース
- コンテンツに対するURLが分散している
- ページ分割で2ページ目以降に進んで最初のページに戻るとURLが変化している
- トップページのURLが統一されていない
- 大文字小文字や最後の「/」が統一されていない
個別に詳しく見ていくことにしましょう。
1.コンテンツに対するURLが分散している
このケースでは、検索エンジンは「Apple」というキーワードのページが3つあると認識してしまいます。正しくは「/apple/」に統一(正規化)する必要があります。
また、検索エンジンに誤認識される以外のデメリットとして、リンク効果の分散が考えられます。ユーザーがブログなどで「Apple」のページへリンクを張ろうとした場合にリンク先のURLがバラバラだと、せっかくリンクを張ってくれているのにリンクの価値が分散してしまうのです。その結果、検索エンジンは「Apple」というキーワードの検索結果として、3つのURLのうちどれが最も適しているのか迷うことになります。
2.ページ分割で2ページ目以降に進んで最初のページに戻るとURLが変化している
図のように、複数ページに分割されたページで、2ページ目以降にページ進んでから最初のページ(1ページ目)に戻るとURLが変化しているケースがよく見受けられます。この場合、「/camera/list/1/」というページは「/camera/list/」に統一する必要があります。
3.トップページのURLが統一されていない
サイト内には、システムで生成しているページや担当者が手作りで設定したページなど、多くの種類ページが混在しています。また、開発者や制作者も複数人体制で行っていると思います。そういったケースで多発するのが、以下のようなトップページへのリンクの分散です。
- 「Yahoo! カテゴリ」に登録したURL: http://www.example.com/
- 各ページのパンくずリストからトップページへのリンク: http://example.com/
- 各ページのフッターからトップページへのリンク: http://www.example.com/index.html
このように同じトップページへのリンクでも、URLが異なる状況は避けなければなりません。
4.大文字小文字や最後の「/」が統一されていない
- http://example.com/abc/
- http://example.com/abc
- http://example.com/ABC/
(3)やこのケースの場合、もしかしたら検索エンジンは同一視して自動的に処理するかもしれません。しかし、実際には検索エンジン側での正規化が行われない場合もあります。検索エンジンのアルゴリズムや処理に依存せず、URLをしっかり正規化するようにしてください。
正規化の具体策
すでにURLがわかれてしまっているという場合は、以下の流れで順番に対応してください。特にトップページへのURLの場合は要注意です。
- URLをどれか1つに統一する
統一するURLは前回の記事で解説したように、ディレクトリの階層が浅いシンプルなものを選ぶといいでしょう。ただし、(3)の例にあるように、「Yahoo! カテゴリ」のような影響力が強い外部リンクが別のURLで登録されている場合は注意が必要です。
- 統一されたURL以外のURLにアクセスされた場合に、301リダイレクトで正しいURLへ遷移するように設定する
必ず、ステータスコードが「301」でリダイレクトされていることを確認しましょう。前々回に紹介したステータスコードをチェックするツールを使用して確認するのも1つの手です。
- 301リダイレクトしているからといって間違ったリンクを放置せず、すべてのリンク元のURLを正しいトップページのURLに修正する
アクセス解析ツールや検索エンジン各社のウェブマスターツールを活用すれば、特定のURLに対する被リンク元のページを簡単に調べることができます。
URLの正規性を検索エンジンに伝える「rel="canonical"」
2009年の上半期のSEOニュースとしては、比較的大きなニュースでしたのでご存知の方も多いと思いますが、URLの正規性を検索エンジンに伝える方法として、URL正規化タグ「rel="canonical"」のサポートが検索エンジン各社から発表されました。URLへのトラッキングコード付与によるリンク価値の分散などを防ぎ、URLの正規性を保つための方法です。
- SEOmozでの解説記事(前編|後編)
- 検索エンジン各社のヘルプ(Yahoo! JAPAN|Google|Bing(旧Live Search))
現時点では、まだ採用実績が多くないので、「rel="canonical"」に依存した設計をするのは避けたほうがいいでしょう。しかし、今まで多くのサイトで悩みのタネであったSEOとマーケティングの共存が可能になるかもしれません。
主要な検索エンジンが同時期にサポートを表明したことについて、個人的には、サイトの高機能化に伴い検索エンジン側もURLの分散化や重複コンテンツ化が大量に発生し、対応に悩まされた結果の1つの答えなのかもしれないと感じています。今後、「rel="canonical"」については大規模サイトにおいて状況を追跡分析しながら効果のほどを検証していきます。可能であればまたご説明したいと思います。
次回は、URLの疑似静的化についてお話しします。
コメント
これって記事になる
これって記事になるような内容ですかね?
結構普通のことかと・・・
詳しい人にとって普通のことこそ情報として価値があるのです
編集部の安田です。
「普通」というのがだれにとっての普通かにもよりますが、詳しい人にとってはなんてこともない当然のことが、その業界やその領域に詳しくない人にとっては「なるほど」という価値のある情報になるのです。
メディアが記事を出すという側面でもそうですし、メディアでなくても企業サイトでどんなページを作ってどんな情報を出すかについても同じですね。Web担当者さんにとって普通のことでも、お客さん(訪問者)にとっては「へー」となることが実は多いんですよね。