Voicyでデータアナリストをしているたからっちです。
今回は、データ分析者の方に役立ちそうな「分析設計の始め方」について、簡単に紹介しようと思います。
5分くらいで読める内容ですが、即効性があって今後もずっと使える内容だと思うので、ほとんどデータ分析の経験がないのにやることになった方や、最近なんか分析の進め方が微妙だなと感じているデータ分析者の方は、ぜひサラッと読んでみてください。
そもそも分析設計とは?
分析設計とは、データ分析をする際に、これから行うデータ分析のそもそもの問題や目的を明確にし、必要な情報や分析すべき項目を事前に洗い出した上で分析に取り掛かるための設計図です。
なぜ分析設計が重要なのか?
分析を行う前に分析設計を立てておくことで、データ分析の精度やスピードが上がります。
イメージしてみてください。
Googleマップを見ながら目的地に向かうのと、Googleマップを見ずに目的地に向かうのは、どっちが早く目的地に着きそうでしょうか?
ほとんどの場合は、Googleマップを見ながら向かう方が早く正確に目的地に到着できると思います。
分析設計とはまさに、データ分析者にとってのGoogleマップのようなイメージです。
分析設計に必要な要素
分析設計に必要な要素は以下の4つです。
- タイトル
- 目的
- 仮説
- 集計項目
タイトル
タイトルは、必要なさそうで意外とあった方が役立つ時があります。 特にどういう時に役立つのかというと、分析依頼者とやり取りをする時です。
誰かに分析を依頼されて分析を行うときは、タイトルがある方が共有ややりとりもしやすいのでつけておくと吉です。
また、「過去にやったことあるような、あの分析ってどうだったっけ?」と後から必要になった時も、タイトルがついていると思い出しやすかったり、何かと検索しやすかったりするのでその点でもおすすめです。
目的
目的は、かなり重要です。
目的が明確にならないまま進めてしまうと、どこに向かっているのかわからないまま分析が続いてしまいます。
また、気が付いたら最初の分析と全然違う分析をやっていて、永遠に分析が終わらないみたいなことに陥ることもあるので、目的は記載しておきましょう。
仮説
仮説も分析設計に必要な要素でしょう。
例えば、ある期間にユーザーが増えていたのでその要因を分析したいとなった時に、仮説がないまま闇雲に分析を始めてしまうと泥沼に陥る可能性が大です。
「こういった理由でユーザーが増えたのではないか?」と、3つくらい仮説を立てて、それを検証するための分析をするというような流れで分析するとスムーズに進みやすいです。
(ちなみに個人的な経験では、ユーザー数の増減は大体明確な要因がわからなかったり、わかったとしても打ち手に繋がらないことが多いので、そもそもこの分析自体は避けたい気持ち笑。確かに、増減の要因が掴めていない状態の気持ち悪さはわかります)
集計項目
最後に必要な要素が、集計項目です。 目的と仮説を設定した上で、実際にどういった集計・分析を行えばいいのかを洗い出しておきます。
集計項目には、優先度・集計項目名・セグメント(新規、復帰など)・集計間隔(日単位、週単位など)・集計開始日付・集計終了日付・集計完了フラグ、この辺りを書いておくのがおすすめです。
補足
分析設計の説明は以上になりますが、ちょっとした補足です。
分析を始めたばかりの頃は毎回この分析設計を書くようにするのがおすすめですが、慣れてきたり、過去に似たような分析をしたことがある場合は、必ずしも書く必要はないでしょう。
とはいえ、またどこかのタイミングでうまく分析が進まなくなってきた時は、ぜひ初心にかえって分析設計を書いてみてください。
また、スムーズに分析が進むようになると思います。
終わりに
このブログを書いていて、自分でも、確かにそうだよなーと思い当たる節がいくつもあります。笑
最近は、ほとんど書かなかったり、すごい簡単にしか書かずに進めてしまっていたので、また初心にかえらないとなといい気づきになりました。