SEOの未来は、セマンティックウェブとリンクのないリンクビルディング?(前編:関連性がなぜ大切か)
ランドが先日行った共起(co-occurrence)についての解説(リンクは日本語記事)は、古いリンクビルディングの実践に固執している人たちへ強く警鐘を鳴らした。アンカーテキストをベースにしたリンクはまだそれなりに効果があるけども、その重要性が低下しているという事実にはほとんど議論の余地がない。
そして、そうしたリンクに取って代わるのは、ソーシャルメディアが発するシグナルやリンク年齢であり、SEOに携わる者にとってとりわけ重要なのが、関連性に対する依存度の高まりとそれをいかに読み解くかだ。
未読の人たちのために紹介しておくと、僕は2012年8月の記事でこのところのグーグルがペナルティを課して本当は何を解決しようとしているのかについて思ったことを書いた。そこで述べている見方とは、グーグルは関連性や関係性を再び明確に解釈できるように、ペナルティを課すことでリンクグラフを整理し、同時に価値のないリンクを一掃しようと本気で試みているというものだ。
そのことは、ウェブの「創造者」ティム・バーナーズ=リー氏が2006年に初めて記事にしており、グーグルはそれ以降折に触れてこの話題を持ち出し、何とか実現するために巨額を投じて買収を続けてきた。
それなら、なぜそのような変革をもたらすプロジェクトに膨大な時間や労力やリソースを投入するのか? それはごく単純で、キーワードベースの情報を取り出すグーグルの既存ビジネスモデルが、セマンティック検索エンジンの進化によって相対的に劣ったものになるおそれがあるからだ。
これがあり得る話だという理由を理解してもらうために、僕たちはまずセマンティクス(意味論)について掘り下げ、それがなぜ検索エンジンの働きを変えてしまうのかを見極めなければならない。
なぜセマンティックな関係性が重要なのか?
簡単に言えば、一層パーソナル化が進んだ効率的な検索結果を提供できるように、グーグルはコンテンツ間の関係性をより的確に描き出したいと考えている。
このプロジェクトに取り組むエンジニアたちにとっての究極の目標は、ユーザーがクエリを入力している時点でその意図を理解し、どういう種類のコンテンツと関係づければいいかを知ることだ。
たとえば、僕が「今日はどんな天気?」と入力したとしよう。現時点では、グーグルにはユーザーがどこにいるのかわかるかもしれないが、このクエリと他のコンテンツとの関係性を見出すことは難しいだろう。僕がこれを検索するのは、バーベキューがやれるかどうか知りたいからかもしれないし、オンラインで調査してきた造園プロジェクトを完成させたいからかもしれない。
グーグルは、なぜ僕が天気を検索しているのかを「知ること」で検索結果を改善できるし、お勧めの食べ物や自宅のリフォームガイドを表示できるようにもなる。
これはデータセットがクリーンである場合にのみ実現可能となるが、現状はあまりに多くのスパム的リンクによりデータセットが濁っている。そこでこの問題の解決に着手するために、ペンギン・アップデートが実施されたというわけだ。
そう考えると、なぜ関連性が重要なのか、そして、検索エンジンを支えている人々やこの新システムに取り組んでいる人々に対して、なぜ検索エンジンが見返りを与えようとするのかが、かなりはっきり見えてくる。
グーグルはどのように測定するのか?
純粋なセマンティック検索エンジンの実現までにはまだ長い道のりがあることは明白で、グーグルはもしかしたらそこにたどり着けないかもしれない。だが、グーグルが検索結果を多様化するために、ますます関連性を重要視する確かな動機を持っているということが大事なのだ。
検索マーケターなら間違いなく、まずこう考えるだろう。
この「関連性」重視への変化を利用するために、自分はどんな取り組みができるだろう?
この質問に答えるためには、まず、グーグルが現在保有しこの目的の達成に役立つ可能性のあるいくつかの特許を把握することから始めよう。
(以下の内容の一部はBill Slawski氏とDan Thies氏に感謝)
トピック型PageRank(Topical PageRank、Topic Sensitive PageRank)
グーグルは2003年頃、さかんにタヘール・H・ハヴェリワラ氏を引き抜こうとしていた。同氏は天才的な博士課程の研究生で、頓挫していたグーグルのPageRankモデルにトピックの関連性を取り入れる新しい方法「トピック型PageRank(Topical PageRank、Topic Sensitive PageRank)」の開発を支えた人物だ。
ハヴェリワラ氏の研究は、トピックに合致するページから張られたリンクの関連性を高く評価するもので、その成果はアプライド・セマンティクスの特許技術CIRCAに取り入れられ、そのアプライド・セマンティクスはグーグルが2003年4月に買収している。これはつまり、関連性を計測する方法の開発にグーグルが着手したかもしれないということだ。
リーズナブルサーファーモデル
この理論は、「クリックされる見込み」に基づいて同じページ上のリンクごとに異なる重みをつけることで、また一歩前進した。つまり、「使用される」可能性が高ければ高いほど、より大きなオーソリティが与えられるわけだ。
この計算には、フォントのサイズから位置、そして色にいたるまで、あらゆる要素が考慮される。
- 最新のグーグル向け内部リンク施策
- グーグルが採用する「リーズナブルサーファー・モデル」とは
- SEOの最重要特許ベスト10 その4 – ページランクがリーズナブルサーファーに出会った日 | SEO Japan
フレーズに基づくインデックス化
グーグルはまた、仕組みをさらに複雑化させるため、ページ上の単語とフレーズの共起(co-occurrence)に注目し、それらの「意味」を把握しようといる。
たとえば「hair of the dog」という語句が使われると、グーグルはその意味を理解する方法が必要になる。というのも、この言葉は「犬の毛」「迎え酒」という複数の意味で使われるからだ。
そのためグーグルは、他にはどんなことが記述されているのかを判断しようと、同じフレーズを使っている他のページを見に行く。もしそこで、たとえば「飲む」と「翌朝」などにも触れていれば、グーグルはそれを読み取り、リンク先のページでは、深酒をした夜の翌日に、二日酔いを紛らわす飲み物について話していると理解し、関連性が非常に高いと判断してそのリンクにより大きなオーソリティを割り当てる。
もし「犬の体毛」について話しているのなら、関連性は低くなり、リンクの価値も下がるだろう。
これは重要な進展だ。というのも、スパム的なリンクビルディング行為の結果として現在よく見られる多くのペナルティは、こうした判定に基づいている可能性が非常に高いからだ。あるページが検索の上位に来るのを妨げるのなら、グーグルはインデックスの中からそのページと特定のキーワードとのつながりを取り除けばいいだけだ。
グーグルは他にも、サイトを最適化する方法を調べている人たちにとって、興味深い機会や新たな方法をいくつか打ち出しているので、そのことについても少し後で触れたい。
メタウェブの買収
これは直接的なアルゴリズム特許の取得やアルゴリズムの変更ではなかったが、人、場所、物などに関するオープンソースのエンティティデータベースを運営するメタウェブの買収によって、「Knowledge Graph」(知識グラフ)の開発を加速し、さらなる多様性と「ユーザーの意図の理解」を検索結果に反映させる方向に進んでいる。
この補強により、グーグルはページ間の関係性について、単に互いがどのようにリンクしているかではなく、現実の世界における結びつきに基づき、理解を深めることが可能になっている。
セマンティック戦略をどう発展させるか
これまで挙げてきたことすべてを知っているだけでは、それが検索マーケティングの取り組みにどう影響するかに関して行動可能な「次のステップ」に進むことにはならない。
そこで、僕がZazzleのオンページやオフページの戦略を立てる際にこういう知識を役立てたやり方をいくつか紹介しよう。
この記事は、前後編の2回に分けてお届けする。後編となる次回は、セマンティック戦略を立てる際に便利なツールと、戦略の立て方について紹介する。
ソーシャルもやってます!