“わからない”を解決するデータ分析の解釈【チャート】
データ分析に以下のような悩みを抱えているマーケターの皆さんは多いのではないでしょうか?
- データ分析をしてみたが、結果から何を読み取ればいいのかわからない
- データ分析の結果をもとに改善策を考えたり、原因を探ったりしたいが、どうしたらいいかわからない
データ分析はやるだけでは意味がなく、分析結果を正しく解釈し、次の打ち手につなげることが重要です。分析結果の解釈とは、背景の事象や目的を振り返り、アクションに繋げる方法を考えることです。解釈が正しいことを確認してから、次の打ち手に活用しましょう!
今回はYes/Noチャートでデータ解釈の仕方を解説します。
分析結果はどう解釈する?
データ分析の結果を解釈するには、Yes/Noチャートが便利です。
今回は以下のシチュエーションを例に、チャートを使って解釈してみましょう。
目的:ランディングページからリードを取りたい
課題:ランディングページのセッション数が少ない
仮説:ランディングページのセッション数が少ない要因は、テレビCMと動画広告をやめたことで、それぞれの影響は6割と2割くらいだろう
収集するデータの時期:
テレビCMの放映中と放映後
WEB広告の配信中と配信後
収集するデータ:
ランディングページの日別セッション数
ランディングページのセッション数に、影響を与えたと思われる施策(この場合はテレビCMの日別GRP、WEB広告の日別インプレッション数)のデータ
ランディングページの日別コンバージョン数
【A】分析結果が最初に立てた仮説に沿っている場合
分析結果の解釈をするときは、まず「分析結果が分析前に立てた仮説に沿っているか」を確認します。
【仮説】
ランディングページのセッション数が少ない要因は、テレビCMとWEB広告をやめたことで、それぞれの影響は6割と2割くらいだろう。
【分析結果】
ランディングページのセッション数が少ない要因は、テレビCMとWEB広告をやめたことで、それぞれの影響は6割と2割。
分析結果が最初に立てた仮説に沿っている場合は、次のアクションへ繋げることができます。
たとえば、テレビCMを再開すれば、ランディングページ経由のコンバージョン数の増加が見込めるかもしれません。予算配分をどうするか、施策を継続するかなど、次にどんな行動をとるべきか検討しましょう。
【B】収集データに誤りがある場合
分析結果が仮説と異なっていた場合は、収集したデータに誤りがないかを確認しましょう。
今回の例では、以下のデータを収集していました。
- ランディングページのセッション数
- ランディングページのセッション数に、影響を与えたと思われる施策(この場合はテレビCMの日別GRP)のデータ
- ランディングページの日別コンバージョン数
しかし、「ランディングページのセッション数が、テレビCMの放映中と放映後の期間と対応していない」「ランディングページのコンバージョン数が、コンバージョン率になってしまっている」など、収集したデータが誤っていました。
収集したデータに誤りがあった場合は、その誤りを修正し、データに間違いのないことを確認した上で、再度分析を行いましょう。
表記揺れの処理
データの誤りの原因には、表記揺れもあります。表記揺れとは、同じ事象について2つ以上の表記をしていることをいいます。表記揺れがあった場合は、表記を統一しましょう。
(例)同じ表の中に「℃」と「度」が混在している。
→ Excelの「検索と置換」を使って、表記を統一する。
【C】データに不足がない場合
収集データに誤りがない場合、収集したデータに不足がないか確認しましょう。データの取得期間や、データに抜けもれがないかなど、収集したデータをあらためて確認してみましょう。
データが不足していない場合、分析結果は正しく、仮説が間違っている可能性があります。最初に立てた仮説を疑ってみましょう。
今回の例では、もしかしたらランディングページのセッション数が減ったのはテレビCMとWEB広告をやめたからではなく、いつも回していた動画広告が設定のミスで配信されていなかったからかもしれません。
【分析前の仮説】
ランディングページのセッション数が少ない要因は、テレビCMとWEB広告を辞めたことで、それぞれの影響は6割と2割くらいだろう。
【分析結果】
テレビCMとWEB広告だけでは説明できない要因がありそう。
【新仮説】
ランディングページのセッション数が少ない要因は、動画広告の出稿量減少かもしれない。
最初に立てた仮説の間違いが確認できた場合は、新たに仮説を立てて、新仮説をもとにもう一度分析を行いましょう。
欠損値の処理
データの不足を確認する際、欠損値にも注意が必要です。あるべきデータがない状態を欠損値といいます。空欄だけではなく、NAなどの数値が入っている場合もあります。欠損値があった場合、欠損のある行を削除することをおすすめします。削除以外には、欠損のある行に0・平均値・中央値などを入れて補完する場合もあります。
(例)2023年4月のデータが欠損している。
外れ値・異常値の処理
収集したデータに誤りや不足がなくても、分析結果が仮説に沿わないことがあります。それは、他の数値から大きく離れた数値、つまり「外れ値」のせいかもしれません。ちなみに、外れ値の中でも、原因がわかっているものを「異常値」といいます。
外れ値が判明した場合
原因が分からない外れ値の場合は、分析対象から外すべきではありません。外れ値や異常値に対して適切な処理をせずに分析を進めると、間違った結果が導き出されてしまう恐れがあるので注意してください。
異常値が判明した場合
数値を正しいものに修正します。たとえば、ランディングページのセッション数が0になっている日があったとして、要因を確認するとランディングページの運用変更日でデータが取れていなかった場合。そのときはデータを補完するか、あるいは分析対象から除外しましょう。
【D】不足していたデータが取得可能な場合
もし、収集データが不足していて、必要なデータを取得できる場合は、そのデータを追加して再度分析を行いましょう。たとえば、以下のようなシチュエーションです。
【最初に収集する予定だったデータ】
- ランディングページの日別セッション数
→対象期間のデータが一部取れていなかった - ランディングページのセッション数に、影響を与えたと思われる施策(この場合はテレビCMの日別GRP、WEB広告の日別インプレッション数)のデータ
- ランディングページの日別コンバージョン数
【追加したデータ】
- ランディングページの日別セッション数
→ 不足していた期間のデータを追加
【E】不足していたデータが取得できない場合
求めるデータを取得できない場合、補強するデータがないか探してみましょう。社内のデータで準備できない場合、分析内容によっては公的機関のデータベースなどを使うことも可能です。
補強する情報が見つかった場合は、その情報をもとに分析結果を解釈し、次のアクションを考えるようにしましょう。
【F】不足データを補強する情報がない場合
不足しているデータを補強する情報が見つからない場合は、最初に立てた仮説が間違っている可能性があります。仮説を疑い、必要に応じて再度仮説を立てて分析を行うようにしましょう。
たとえば、以下のようなシチュエーションです。
【分析前の仮説】
ランディングページのセッション数が少ない要因は、テレビCMとWEB広告を辞めたことで、それぞれの影響は6割と2割くらいだろう。
【分析結果】
テレビCMとWEB広告だけでは説明できない要因がありそう。
【分析後の新仮説】
ランディングページのセッション数が少ない要因は、競合企業の大規模なマーケティングキャンペーンのせいで、その影響は5割くらいだろう。
分析結果の解釈で気をつけるポイント
分析結果を解釈する上で大事なことは、「仮説に合わせようとするバイアスを持っていないか常に疑うこと」です。
分析結果を解釈する際によくある初歩的な失敗として、仮説に合わせようとするバイアスがかかることで不十分な検証を行ってしまうことがあります。この失敗を防ぐために、まずは自分の中のバイアスを自覚することから始めましょう。目的・課題・仮説の設計、データ収集、分析、手法の中でバイアスをかけていないか、解釈の各フェーズにおいて、バイアスがかかっていないかを自分に問いかけながら進めることが重要です。
より具体的な対策としては、施策と結果を1対1で見ないようにすることです。たとえば、「テレビCMがランディングページに効いている」という仮説を立てた場合に、ランディングページとテレビCMの情報だけ集めるのはダメです。それ以外に、ランディングページに影響を及ぼすものはないか考えてみましょう。他のマーケティング施策や競合の動き、季節性や販促施策、PR施策なども影響を与えている可能性もあります。
分析を行う際には、できるだけ分析対象とその要因を1対1の関係で見ず、他に関係している要因がないかを疑うことが、正確な分析結果を導く肝になります。
※外部サイトの記事へ飛びます。
ソーシャルもやってます!