データ分析の注意点 データの出どころを意識しよう

この記事の対象読者:データ分析に係わる方(中級者~上級者)
この記事は、およそ6分で読めます。

今日はちょっとしたクイズから入ってみたい。まずは想像して欲しい。あなたは第二次世界大戦中の戦闘機の整備士である。あなたは整備士として、日々、戦闘から無事に帰還したゼロ戦を整備しているとしよう。あなたはあることに気づいた。たまたまだろうか、はたまた撃ちやすいからだろうか、もしくはプロペラが狙われやすいからだろうか。理由はともかく無事に帰還する戦闘機の多くが、特定の同じ箇所を撃たれている傾向があるのだ。(以下イメージの赤い矢印部)

攻撃されている箇所イメージ図

整備士として、よく撃たれている箇所の情報を把握したあなたは、ゼロ戦に続く次世代戦闘機を開発中の設計者に対し、どのようなフィードバックをするべきだろうか。次の戦闘機をさらに強くタフにする、防御力を高めて撃墜されにくくするためには、どの箇所を強化するように提案するべきだろうか。少し考えてみて欲しい。

さて、答えは浮かんだだろうか。先日、こちらの記事で商品の購入者に対して発送する商品にアンケート用紙を同梱、お客様の購入理由をヒアリングする手法を紹介した。そして購入して下さったお客様の声を分析して、ウェブサイトの改善につながる事例をお伝えした。この記事中で書いた注意点を再掲しておく。

ユーザアンケートと言うのはその性質上、購入に至ったユーザを中心とした声で構成されることになる。購入に至らなかったユーザの声がデータとしてあがってこないため、分析には注意が必要だ。なんらかの理由があり注文などの成果まで進んだユーザだけのサンプリングデータということだ。

戦闘機の話に戻ろう。次世代戦闘機の防御力強化にあたり、あなはたどのような提案を思いついただろうか。この質問をセミナーや勉強会などですると、『帰還する戦闘機の多くは矢印の部分が撃たれているのだから、その部分を強化してもっと強くすれば良いのではないか』という答えがある。

実はこの答えは典型的な誤りであり、ここにデータ分析の注意点が存在する。

もう一度、考えてみよう。この≪赤い矢印の部分を撃たれる傾向がある≫というデータはどのような条件の下、サンプリングしたデータだっただろうか。今回の例では「無事に帰還した」戦闘機ということだった。すなわち「無事に帰還することが出来た戦闘機に関しては、赤い矢印の部分を撃たれていることが多かった」ということである。逆説的に聞こえるかもしれないが、撃たれても帰還できるのだから、この赤い矢印の部分は強化しなくても問題ないと言えないだろうか。

帰還した戦闘機の損傷データをもとに考えられる本当に強化すべきポイントは、赤い矢印部分以外の撃たれていない箇所である。(赤い矢印の部分以外の箇所が撃たれている戦闘機が帰還していないということは、そこを撃たれることは致命傷であり、墜落してしまったために帰ってこれなかったと想像できる)

つまり、戦闘機の損傷データをもとに次世代機の強化すべき箇所を探る場合、無事に帰還した戦闘機ではなく(出来る、出来ないは別として)墜落した戦闘機を引き揚げて分析する必要があるのだ。

このようなデータ分析の罠はウェブサイト改善のためのデータ分析においても存在する。上述の、購入者に対して行うユーザアンケートによる改善方法などはまさしくそうだ。ユーザアンケート実施時、購入者に対して『なぜ他にも似たようなECサイトがある中で私たちの店舗を選んでくださいましたか?』という質問を行い店舗サイト改善のためのネタを探った。その中で購入者の声として、『定期的に店長ブログが更新されていて信頼できた』という声があったとする。ではこの声をもとに、もっと店長ブログを更新すれば良いのだろうか。もちろんそうではない。

商品を購入して下さった方は、ユーザアンケートの回答のように、現状のブログ更新頻度という要素には既に満足したから購入して下さっているのだ。さらに更新頻度を高めたとしても、すでに現状の更新頻度で満足して購入まで至ったユーザは変わらず購入するであろう。そして、いまの状態では購入完了まで至らない非購入ユーザのその原因が、ブログの更新頻度にあるとは誰も言っていないのだ。

ブログの更新頻度が購入率に与える影響を知りたければ、購入しなかったユーザの声こそ必要である。購入しなかったユーザが、『ブログの更新が止まっていて既に店舗運営していないと感じたため買わなかった』と言うのであれば、店長ブログの定期的な更新が購入率の改善のために重要だと判断できる。

商品の購入まで至ったユーザは、現状のサイト状況、具体的には商品価格・在庫・発送日といった基本的なスペックはもとより、他の購入者のレビュー・店長ブログ・返品制度など色々な条件を満たしたからこそ、購入してくれたと言える。そして、このような購入者に対するユーザアンケートにより収集できるデータは、あくまで≪購入という結果まで行きついたユーザ≫だけで構成されるデータであり、ユーザが購入というゴールまで到達するための必要条件のうちのたったの一つであり、十分条件ではないと意識する必要があるのだ。

データの有効活用のためには、そのデータの出どころはどこなのか、どういった前提条件を持つ母集団から抽出したデータなのかを明確に意識し、多面的に判断することが求められる。

ここまで述べてきたように、サイト改善のために活用しやすい情報は、購入完了といった事業者側が期待する成果地点まで至らなかったユーザから得られるのだ。帰還した戦闘機を見て、防御力をアップするべき箇所を探るよりも、墜落した戦闘機を見て、ここを撃たれると致命傷になるんだな、ではここを強化しよう、と判断する方が簡単だ。

しかし墜落した戦闘機を引き揚げることが難しいのと同様(そもそも木っ端微塵になって回収できないかもしれない)、購入まで至らなかったユーザに対して『なぜ購入してくれなかったんですか?』と聞くこともまた難しい。買わなかった人に質問するのは気が引けるとか、そういった問題ではなく、そもそも購入履歴がなければユーザアンケートの送付は不可能だ。

やはり購入者の声を集め、さまざまな分析上の罠を回避して多面的に判断し、じっくりと真理にたどりつくしか改善の糸口はないのだろうか。

実は、デジタル空間においては、購入に至らなかったユーザであっても、彼・彼女らの声にならない声を、サイト上に残した足跡(サイト上のユーザ行動履歴)をたどって分析することにより収集可能だ。

以下のキャプチャーは、ウェブサイトへの訪問ユーザの行動を調べることができるGoogle Analyticsというツールだ。このツールを使い、ちょっとした設定(アドバンスセグメント)を行うと、こちらの期待する行動をサイト上で行ったユーザと、行わなかったユーザを明確に区分けて両者の行動を可視化することができる。

カスタムセグメントによるユーザの区分け

このキャプチャーを取ったウェブサイトでは、100人訪問すると約22人がこちらの期待した成果地点まで到達し、約78人がそこまで至らなかったということである。このような形でユーザの集合体を大きな2つの異なる塊に分けて対比すると、購入まで至らなかった非購入ユーザの声にならない声を感じ取ることができる。例えば「購入しなかったユーザは、購入したユーザと比較すると相対的にスマホユーザが多い傾向がある」といった事が分かるのだ。

このようなデータから、「もしかしたら自身のスマホユーザ向けサイトがPCユーザ向けサイトと比較して使い勝手が悪いのかもしれない」といった仮説が立つ。(あえて分かりやすい仮説を立てたが、スマホ向けサイトの購入率がPC向けサイトの購入率と比較して劣っていることは、必ずしも悪いことではない。両端末の利用シーンが明らかに異なる以上、本来であれば比較のしようがないのだ)

ユーザアンケートによるサイト改善事例で述べた、「購入に至らないユーザは、購入完了したユーザよりも特定商取引法のページを見ようとする傾向が強く、またそっけない特定商取引法のページを見てサイトから離脱する傾向がある」という事実も、この対比により分かったことだ。

なぜ非購入ユーザばかりが特定商取引法ページで離脱するのだろうか。もしかして購入に至らないユーザは、私がECサイトで扱っている海外ブランド品が偽物でないかという不安を持ち、本物かどうかという真贋判定を、会社の実在性をもとに間接的に調べようとしているのかもしれない。「非購入ユーザは、商品が偽物かもしれないという気持ちで不安だった」このように購入に至らないユーザの声を、サイト上の特徴的な行動履歴と購入・非購入ユーザの対比により獲得することができた。そして、この購入に至らなかったユーザの声を、サイト上に残された行動履歴を元に収集・分析した結果、強力なサイト改善施策を実行することができたのだった。

デバイスカテゴリ別のCVと非CVユーザの行動対比
【成果に至らなかったユーザの特徴を見ることができる】

ここまで、データ分析における注意点として、取得しやすいデータから容易に判断してしまう罠について述べた。インターネットというデジタル空間においては、従来では取得することが難しかった、購入完了といった形で個人情報を残さなかったユーザの声すらも収集することが可能だ。

期待する成果に至らなかったユーザのサイト上での行動や特徴的な傾向を掴み、あなたのサイト改善に活かしていただけたら幸いである。

  • データを収集する際にはそのデータを抽出した母集団の背景を意識する
  • 購入・非購入といった属性対比を行うと改善点を見つけることができる

 


Leave a comment

Your email address will not be published. Required fields are marked *