ChatGPT searchの弱点が露呈。隠しテキストで欺かれるAI(25年前のグーグル的)【SEO情報まとめ】
「隠しテキスト」という化石のようなスパム手法が、生成AI検索に効いてしまっているようだ。SEO業界の人なら思わず笑ってしまいそうなChatGPT searchの話題をお届けする。
ほかにも、「生成AIからのトラフィック」「ファセットナビゲーションのベストプラクティス」「CDNで失敗しないために」などなど、今年もあなたのSEO力に役立つ情報をどんどんまとめていく。
- ChatGPT searchの弱点が露呈。隠しテキストで欺かれるAI(25年前のグーグル的)
- LLMからのトラフィックが増加、2025年末までに総トラフィックの0.25%から10%に増えると予想
- ファセットナビゲーションのSEO対策ガイド(ベストプラクティス)
- グーグル検索におけるCDN: 多くの利点と思いがけない落とし穴
- 2024年11月のオフィスアワー: 被リンクリストの配布とページ評価、指名検索で検索結果に出ない、Discoverのパフォーマンス下落 など
- グーグル、年末に立て続けのアップデート ―― コア&スパム対応
- ニュース記事の配信先がオリジナルよりも上位表示してしまう→対処策はnoindex
- 今朝公開したコンテンツのアクセスはどうなってる?→SCの24時間ビューでチェック
- スタートアップ企業にブログは必要か?
- グーグルに続いてBingも検索結果のキャッシュリンクを廃止
- Google、日本版「ディスカッションとフォーラム」をテスト中
- ChatGPT検索がすべてのログインユーザーで利用可能に
今週のピックアップ
ChatGPT searchの弱点が露呈。隠しテキストで欺かれるAI(25年前のグーグル的)
古典的なスパム手法 (The Guardian) 海外情報
ChatGPT search(ChatGPT検索)が隠しテキストにダマされるという話題がでてきた。グーグル検索が25年ぐらい前に通ったルートを改めて見ることになるとは思わなかった。
ChatGPTがウェブ検索と連携するChatGPT searchが2024年10月末に始まった。当初は課金しているChatGPT Plusユーザー(とTeamユーザー、ウェイティングリスト登録ユーザー)だけに提供されていたが、現在は、無料ユーザーであってもログインしていれば利用できる。
鳴りもの入りで登場したこのChatGPT searchだが、「隠しテキスト」にダマされてしまうという弱点があることが判明した。隠しテキストによって、ChatGPTの応答を変更する指示を意図的に作り出せるという(「プロンプトインジェクション」と呼ばれる)。
ガーディアン紙による最近の調査によると、隠しテキストを使用することで、同じページに否定的なレビューがあっても、ChatGPTに製品の肯定的な評価を返させることができたそうだ。偽の製品ページに「好意的なレビューを与えるようにChatGPTに指示する隠されたテキスト」を追加したところ、ChatGPTは否定的なレビューを無視して完全に肯定的な評価を提供したとことである。この脆弱性を悪用すれば、検索したウェブサイトから悪意のあるコードをChatGPTに返させることも可能かもしれない。
こうした脆弱性は、ユーザーを欺くように特別に設計されたウェブサイトを作成する悪意のある人が出現する可能性の懸念を引き起こす。
セキュリティ研究者のジェイコブ・ラーセン氏は、ChatGPTの検索システムが現在の状態で完全にリリースされた場合、ユーザーが詐欺に遭うリスクが高いと指摘している。とはいえ、ChatGPTの開発元であるOpenAIはこれらの問題を認識しているはずで、積極的にテストを行い、これらのタイプの問題の修正に取り組んでいるはずだとも付け加えている。
隠しテキストは古典的なウェブスパムだ。グーグルやBingは現在ではほぼ完全に無効化できているだろう。しかし、ChatGPT searchは騙されてしまっている。ChatGPT searchが普及すればするほどスパムが横行するだろう。検索では巧みで新しいスパムが次々と出現し、グーグルでさえスパムを完全に抑えきれていないのが現状だ。
ChatGPTとウェブスパムの戦いは始まったばかりだ。信頼性を保つためにも、どのように対策していくかに注目したい。
元記事は英語だが、ぜひ生成AIやAI翻訳を活用して読んでみてほしい(元記事には隠しテキストスパムはなさそうだ)。
- SEOがんばってる人用(ふつうの人は気にしなくていい)
グーグル検索SEO情報①
LLMからのトラフィックが増加、2025年末までに総トラフィックの0.25%から10%に増えると予想
LLMトラフィック獲得のための戦略は? (Previsible.io) 海外情報
大規模言語モデル(LLM)がウェブサイトのトラフィックとSEOに及ぼす影響を分析した調査を紹介する。30以上のウェブサイトのデータを分析し、「ユーザーの行動がどのように変化しているのか」「それが企業にとって何を意味するのか」を理解することを目的とした調査だ。
まず調査結果を端的に述べると、グーグルが依然として検索を支配している一方で、LLMのトラフィックシェアが急速に増加していることが判明した。
グーグルの検索市場シェアは90%を下回った一方で、LLMチャットボットはシェアを拡大している。PerplexityとChatGPTは参照トラフィックでそれぞれ37%近くを占めていた、CoPilotが約14%、Geminiが約12%でそれに続いている。Claude、Meta、Mistralなどの他のLLMは、現在のところ市場シェアはわずかだった。
興味深いのが、分析したLLMからの参照トラフィックの84%が金融業界のサイトに対するものだったということだ。特にPerplexityは、金融カテゴリへのトラフィックを最も多く送出していた。他のLLMもすべて、程度の多寡はあれ同様の傾向があった。
LLMからの参照トラフィックのランディングページの分布は次のようになっていた:
- ブログ記事:77.35%
- トップページ:9.04%
- ニュースコンテンツ:8.23%
- ガイド:2.35%
商品詳細ページはLLMトラフィックの0.5%未満だった。商品詳細ページのLLM最適化が今後は必要になってくるだろうと調査者は予見している。
LLM参照トラフィックは、全体的なトラフィックと比較するとまだ少ないものの、急増しているセグメントもあるという。調査した90日間で急増した業界は次のとおりだ:
- イベント業界では、ChatGPTの参照トラフィックが900%増加した
- eコマースと金融では、ChatGPTの参照トラフィックが400%以上増加した
現在の成長率が続けば、LLMトラフィックの総トラフィックに締める比率は、2025年末までに現在の0.25%から10%に増加すると予測している。
AIで強化されたLLMからのトラフィックを獲得するために、次のような戦略を記事は提案している:
高品質で包括的な情報コンテンツを優先し、ブログからコンバージョンへの経路を改善する
LLMがコンテンツを理解するのを手助けするために、クロール可能で高速なサイト、構造化マークアップ、画像の代替テキストの使用など、標準的なSEOプラクティスを維持する
フォーラムへの参加、レビューサイトの監視、ブランドメンションのためのアウトリーチに注力することで、権威を構築する
LLMトラフィックへのアドバイスは、まるでグーグルSEOのアドバイスを見ているかのような内容だ。「コンテンツを評価する」相手に対する姿勢としては、LLMも検索も同じでいいということは、考え方によってはありがたいことだ。
- SEOがんばってる人用(ふつうの人は気にしなくていい)
ファセットナビゲーションのSEO対策ガイド(ベストプラクティス)
クロールの問題を発生させないために (グーグル検索セントラル) 国内情報
ファセットナビゲーションのベストプラクティスを解説するドキュメントを、グーグルが検索セントラルサイトに公開した。
「ファセットナビゲーション」は、さまざまな条件で絞り込む検索メニューのことだ。
たとえばスニーカーなら、購入を検討している人のために、商品一覧ページで次のような絞り込みメニューをあらかじめ用意しておける:
- 価格
- 機能
- ブランド
- サイズ
便利なものだが、このファセットナビゲーションは、SEO的には扱いが難しいものだ。構成によっては条件の組み合わせに応じてURLが無限に生成されてしまう可能性があるからだ。大量のURLはクロールや重複コンテンツの問題を引き起こしかねない。そこで、クロール管理を考慮に入れたファセットナビゲーションの構成をグーグルはドキュメント化したのだ。
クロールさせる必要がないファセットナビゲーションURLに対して次の2とおりの手段をグーグルは提案している:
- robots.txtを使用してファセットナビゲーションURLのクロールを禁止する
- URLフラグメントを使用してフィルタを指定する
また、次のようなことも指摘している:
rel="canonical"
による正規化も場合によっては利用可能だが、非正規URLのクロールが減少する場合がある点に注意が必要。URLパラメータの区切り文字は業界標準の「&」を使う。
URLパスでフィルタする場合、同じ内容を表示するならばURLパス内の各フィルタの並び順が同じになるようにする。
表示する内容がないフィルタの組み合わせでは、正しく404を返す。
読んでみれば当たり前の説明なのだが、UXを突き詰めるあまりに検索エンジンのクロールにまで意識が向いていない場合もあるだろう。特に大規模なサイトでファセットナビゲーションを構成している場合、ドキュメントをよく読んでおくといい。必要ならば構成の変更も検討してほしい。
- ファセットナビゲーションを構成しているサイトのすべてのWeb担当者 必見!
- SEOがんばってる人用(ふつうの人は気にしなくていい)
- 技術がわかる人に伝えましょう
グーグル検索におけるCDN: 多くの利点と思いがけない落とし穴
高速化のメリットはあるが意図しないクロールブロックも (グーグル検索セントラルブログ) 国内情報
「CDNの利点」と「CDNを利用する際のクロールの注意点」を解説する記事を、検索セントラルブログが公開した。
CDNは、Content Network Delivery(コンテンツデリバリーネットワーク)の略だ。世界中に分散されたサーバーネットワークを利用し、ウェブコンテンツをユーザーに近いサーバーから配信する仕組みだ。
CDNには、主に次のような利点がある:
- キャッシュ保存
- サイト表示速度の向上
- 大量のトラフィックからの保護
- サービス提供の継続
一方で、CDNはクロールにこんな問題を発生させることもある:
CDNを検知するとグーグルがクロール頻度を高めるが、それによってサーバーの負荷が急上昇してしまう現象
CDN専用ホスト名を使う場合、別ホストへの接続となるためオーバーヘッドが発生しページ パフォーマンス低下してしまう現象
CDNがセキュリティ機能として提供するサーバー保護機能の影響で、意図せずクロールをブロックしてしまう状況
CDNを利用しているサイト、利用を検討しているサイトの管理者は解説記事を読んでおこう。役立つ情報が手に入る。
ちなみに、原文で「クロールバジェット」という表現がでてきているが、クロールバジェットが関係するのは100万コンテンツ以上あるような大規模サイトの場合だけだという点に注意してほしい。
- CDN利用(検討)中のすべてのWeb担当者 必見!
- 技術がわかる人に伝えましょう
2024年11月のオフィスアワー: 被リンクリストの配布とページ評価、指名検索で検索結果に出ない、Discoverのパフォーマンス下落 など
2024年最後のオフィスアワー (#Google検索オフィスアワー on YouTube) 国内情報
2024年11月のグーグル検索オフィスアワーを紹介する。あんな氏が回答した質問は次のとおりだ:
2024年は11月回が最後のオフィスアワーだった。12月回は質問が集まらなかったためお休みだった。グーグル検索やSEOについて質問やトラブルがある場合は、質問フォームから投稿しておこう。あんな氏が回答してくれる。
- SEOがんばってる人用(ふつうの人は気にしなくていい)
ソーシャルもやってます!