データはどう活用すべきか。「それで?」と言われないデータ分析
「データリテラシーは、Web担当者の必須スキル」と話すのは、Data Live Performerにして、Grand Master of DATA Saberの称号を持つKT氏。KT氏は、データクラウドを提供するSnowflakeのエバンジェリストでもある。
「Web担当者Forum ミーティング 2023 春」の本講演では、データの重要性やデータ活用の方法、生成AI時代のデータリテラシーについて取り上げられた。
なぜ、データが必要とされているのか?
「データはシステムが記録した結果であり、人々の行動そのもの。データを理解するのは、その向こう側にいる人を知ること」とKT氏は話す。そしてデジタルデータは、時空間を超えて即時共有でき、理解できるという特性がある。
データが必要とされている理由として、KT氏は次の3つをあげる。
理由1 業務がデジタル中心に記録されるようになった
かつては手作業で行われていた業務の多くがデジタル化されたことで、大量のデータが蓄積されるようになった。同時に、大規模なデータ処理によりたくさんの人に同時に販売するようなビジネスも可能である。反対に小規模ビジネスの迅速な展開も可能で、個人がハンドメイド作品をECサイトで限られた数だけ販売するような、店舗なしで個人のビジネスを実現できるようになった。
理由2 リアル世界の事象もデジタルデータ化が進んでいる
Webサイトに限らず、人流データ、天候データ、車の走行データ、工場の製造データなど、リアルの世界の事象がデジタルデータ化されている。さらには、リアルの世界の写し身となるようなバーチャルの世界であるデジタルツインの時代が到来しようとしている。データは世界を映す鏡のようになり、自分では見えない世界も客観視できるようになる。
理由3 データにアクセスする手段が以前より容易に
クラウドを始めとして、さまざまな技術が進化したおかげで、自社で物理的にサーバーを持たなくても、大量のデータを効率的に利用できるようになった。さらにノーコードで分析できるような技術も進化しており、スキルが高くなくてもデータを扱えるようになってきている。
こうした背景から「あらゆるデータが記録され、アクセスが容易になった現在、データを使わないという選択肢はない」とKT氏は主張する。
データをどう活用するのか。「それで?」と言われないデータ分析とは
では、データをどう活用していくのか。KT氏が紹介するのは、Tableauが提唱するビジュアル分析のサイクルだ。このサイクルでは「タスク」「データ取得」「データ視覚化方法の選定」「データを見る」「インサイト」「アクション」というプロセスを繰り返す。
ただし、順番に各プロセスを一回りするというよりも、「データを見たが、わからないこと」があるので視覚化をやり直す(グラフの形式を変更する)、あるいはインサイトを得てまた別のデータの取得に戻る、というように、結果によってはプロセスを逆戻りすることもあり得る。
このプロセスにおいて一番大事なことが、タスクとアクション。この2つがないと、データ分析は不可能です。しかし、この2つは忘れられがちでもあります(KT氏)
「タスク」がないと答えは得られない
データ分析は、「売上を上げたい」「コストを削減したい」などのタスクに合わせて行うべきものだ。タスクを決めないでデータ分析しようとすると、データがそろっていても「どこから分析しようかな?」となってしまう。
たとえば、次のようなデータがあった場合:
- 商品
- 販売日時
- 売上金額
- 利益
売上を上げたいというタスクであれば、「売れている時間」「売れている商品」を調べ、なぜ売れているのかを考え、売れているものをさらに売れるようにする。あるいは売れないものを売れるようにするなど、施策を考えていく。
利益を上げたいというタスクであれば、「利益率が高い商品」「利益率が高い商品が売れている時間」などを調べ、施策を考える。
タスクを設定しないと答えを得ることはできません。例に示したデータはシンプルですが、実際のデータは膨大で、タスクがないと全パターンを無限に調べることになり、意味がない分析をしてしまいかねません。『売上を上げる』というタスクなら、『売れる時間に合わせて、商品の表示回数を増やしましょう』というアクションが答えになります(KT氏)
「アクション」が次の「タスク」を生む
なおアクションはタスクと密接に関係する。「アクションがなければデータ分析は意味がない」とKT氏が言い切るように、データ分析は、現状を把握して、意思決定の材料を得るために行わなければならない。タスクとアクションがなければ、他の人からは分析した結果を見せても「それで?」といわれてしまうだろう。
施策を実施したら、その成果を検証します。失敗なら分析の間違いがあって、事象を読み切れていなかったということですし、成功であれば、そのメソッドは他にも展開できるということです。アクションは、次のタスクになるのです(KT氏)
これからの時代、自社データだけでは物足りない?!
Web担当者の場合は、Webサイトに関連するデータを見ることが多いだろう。しかし、Webサイトのデータは断片的なものに過ぎない。人の行動を理解するためには、他のアクティビティにも注目しないといけない。
例えば、Webサイトで購入した人は、その前に店舗で商品を見て購入を決め、持ち帰りが大変だからWebで買ったというケースがある。あるいはYouTuberが紹介しているのを見て購入を決めて、検索エンジン経由で購入したというケースもあるだろう。Webサイトのアクセス解析だけを見ていては、なぜその人が購入したのかまではわからない。
ありとあらゆるデータを見ないと、その人の行動の理由はわかりません。人が物理的に動くなら天気や人流データ、マップデータ、あるいはIoTデータなどを合わせて分析します。しかし、自分たちのデータだけでは必要なデータが欠落しているので、他の企業とコラボレーションして、個人情報の利用として問題ない範囲で活用していく必要があります(KT氏)
なお、欠落データを自分の過去の経験や知識だけで埋めようとすると失敗するとKT氏は警告する。パンデミックが発生して世界が変わったように、気候変動、物価高など、予測不能のことが日々起こるなかで、一人の経験やこれまでの常識、過去の業界の傾向では、立ち向かえなくなっている。
外部とのデータコラボレーションが“鍵”
そのため、あらゆるデータが必要になるわけだが、データ取得のプロセスは困難だ。「データ準備がデータ分析の8割」と言われるように、本来はデータ分析をして、インサイトを得てアクションを考えるところに時間を割くべきなのに、その前段階のデータ準備に時間がかかってしまう。新しいアイデアを得るためには、「自社のデータだけでなくあらゆる人、組織、そしてそれを写す鏡であるデータとのコラボレーションが必要」だとKT氏は言う。
パンデミックでは多くの外食産業が打撃を受けた。客足の落ち込み、回復は自社データだけでは予測不可能で、外部データをかけあわせる必要がある。いち早く対応したのがアメリカのレストランで、2021年には新型コロナウイルスの感染者数のデータと自社データをかけあわせて、最適な人材配置、仕入れを算出できるようにした。
KT氏は技術の進化により、外部データの取得は困難ではなく、自社データと同じように扱えるようになりつつあると話す。
外部データの必要性を理解するには、サプライチェーンのCO2排出量を考えるとよい。サプライチェーンのCO2排出量とは、自社での排出だけでなく、原料の生成、移動、消費者の廃棄方法など、プロダクトが一生のうちで排出したCO2を計測するもの。自社部分は簡単に計測できるが、他社の部分は計測できない。しかし、全体の排出量を確認されるケースも増えてくると考えられるため、他社にCO2排出量のデータを提供してもらうことになる。
これからは他社とのデータコラボレーションが必須の世界になります。コラボレーションしないことは、取引の停止などのリスクがありマイナスの影響があります。自社が求めるだけでなく、相手から求められることもあり、データを自社だけのものとしていては立ち行かなくなるでしょう(KT氏)
Snowflakeの国内企業の事例では、新潟のデータを公開している新潟オープンデータや、ウェザーニューズが提供する有料の天候データなどマーケットプレイスで販売されているデータなどがある。顧客同士でプライベートなデータの共有も可能だ。
タスクやアクションを支援するために様々なデータを活用する必要があります。コラボレーションを通していろいろなデータを使うことが重要で、世の中にはどんなデータがあるのか、誰が持っているのかを考えることで可能性が広がり、新しいアイデアを創出できます(KT氏)
生成AI時代の新たなデータリテラシー
最後に、最新トピックとして、ChatGPTに代表されるような生成AI時代の新たなデータリテラシーについて触れた。
生成AIを使って、例えばプログラムの実装のサポートができるだろう。エンジニアは、エンジニアリング、プログラミングがなくなるのでは、という期待感と危機感を持っている。
しかし、現状ではプログラムの構造や仕組み、データモデルなどのエンジニアの知識がないと生成AIに依頼ができない。そのため現状では代替ではなく、サポートにとどまると考えられる。また生成されたコードについてもそのままでは実装できないことが多く、再度生成AIに依頼して修正することになる。
生成AIから得られた結果の確からしさを判断する力が人には求められます。それっぽいものが出てくるので、みんなで見てディスカッションして改良することになります。いわば、生成AIは発起人のようなものなので、それを知らずに使ってしまうとリスクがあります(KT氏)
生成AIとともに働く
これから新入社員になる人にとっては、生成AIとともに働くことが当たり前になるだろう。これまでの人は、自分で構造を理解していたために生成AIを使いこなせるだろうが、新規の学習者には、きちんとした学習コンテンツがないと、AIを使える人/使えない人の差が出てしまう。KT氏はその学習コンテンツづくりに力を入れていきたいという。
仕事がなくなるのかという問いに対しては、意思決定をして責任を取るのが人間の仕事になると答えつつ、次のような人材が生き残るのではないだろうかと述べる。
- なにかのスペシャリスト、第一人者
- 複合的な知識を持って、誰も思いつかないような広い視点で考えられる人
前者の有識者がAIを訓練して、AIを支援するというのは、現在注目されている。後者は、それが終わってから注目されることになると言う。「これからの変革の世界においては、技術を学習し、それをどう適用するか思考し、実行する力が必要です」とKT氏は講演を締めくくった。なお、KT氏は自身のYouTubeでもデータ活用について発信している。
\参加無料 11/19火・20水 リアル開催/
「Web担当者Fourm ミーティング 2024 秋」全50講演超!
ソーシャルもやってます!