アクセス解析をはじめたら必ず設定すべき6つの項目 [アクセス解析tips]
前回に引き続いて、アクセス解析ツール導入のプロセスの2回目ということで、前回ご紹介できなかった、実際のいくつかの設定例やそれが必要な理由などを解説していく。
この記事で紹介する内容は、次の6点だ。
では、それぞれについて見ていこう。
集計対象の拡張子やページの決定
まずはページビューの計測対象とするファイルの絞り込みだ。JavaScriptタグ型なら計測対象のページにタグを実装するだけで済むが、サーバーログファイル型ではすべてのファイルのリクエストが記録されるので、どの拡張子を対象とするのか、あるいは対象としないのかなどを決めないと、必要ないページまで集計対象に含まれてしまう。
図1はサーバーログファイル型ツールであるSiteTrackerの「除外するページ」の設定画面である。画像ファイルの拡張子である.gif、.jpg、.pngやJavaScriptファイルの.js、CSSファイルの.cssなどは、あらかじめデフォルトとして設定されている。
デフォルトの設定以外にどのような拡張子やファイルを除外するべきなのかは、実際に集計してみないとわからないものだ。そのため、導入の際に完璧を目指すのではなく、とりあえずわかる範囲で設定した段階で、いったん集計してみることがお勧めだ。そうすると、デフォルトで除外されている拡張子以外にも、favicon.ico、robots.txtといったファイルは除いておこうといった判断ができるようになる。
サーバーログファイル型のツールでは、最初から一発で完成度の高い集計を出そうとしても難しい。データをきれいにするための準備として、こうしたテスト集計をすることは非常に重要である。2~3回の試行錯誤で、かなりきれいなデータにできる。
テスト集計では、集計する必要のないページやファイルの削除に加え、検索エンジンのロボットからのアクセスを排除する指定を行う。これは後でも述べるが、ロボットと思われるユーザエージェントを見つけて、そのデータを除くという処理を行うことで対処する。これでかなりきれいなデータになる。
内容が同じページのURLの統一
次に必要となる設定は、実質的に同じ内容のページのURLを1つにまとめることである。たとえば、トップページやコーナートップページのURLだが、URLの末尾が「/」と「/index.html」のどちらでリクエストされても、そのまま表示できるようになっている場合がある。このまま何も設定をしないと、同じページであるにもかかわらず、URLが異なるために別々に集計されてしまうといった事態が生じてしまう。
これはサーバーログファイル型でもJavaScriptタグ型でも生じる可能性がある問題だ。こういったケースでは、アクセス解析のツール側の設定で同一化処理をすることで対処できる。
クエリーパラメータの処理
クエリーパラメータの処理も大事だ。セッションIDなどのあまり意味のない変数(パラメータ)がある一方、非常に大事なパラメータもある。たとえば、ECのサイトで、商品カテゴリや商品を表すIDなどは重要な意味を持つパラメータなので、残しておかなければならないだろう。
図3は、Google Analyticsのプロファイル設定画面だが、ここにある「URLクエリパラメータを除外」という設定項目を使うと、意味のないパラメータを無視するように指定できる。ここで何も設定しない場合は、パラメータの異なるURLはすべて異なるURLとして集計する。
これとは逆に、基本的にはパラメータはすべて捨てる(無視する)のがデフォルトになっているツールもある。そのようなツールでは、特定のパラメータを残す、あるいは残したいパラメータをグルーピングするような処理を施すといった対処をする必要がある。具体的にどのようなパラメータを残すか、どのように設定するかについては、ベンダーと相談すべきだ。
ソーシャルもやってます!