STEP 2(収集)その4|最重要なのはデータの前提

STEP 2(収集)その4|最重要なのはデータの前提

集めるデータのイメージが付いたら、次にデータを集めなければなりません

データ集める際にデータ品質が高いのが理想です。データ品質が低いと、後々のデータ分析やアクションなどに悪い影響を及ぼします。

データ品質を決めるのは、データの前提をきちんと認識しておくことです。

データの「収集」について全5回にわたってお話しいたします。

  • その1 データソースの種類
  • その2 まずはセカンダリーデータ
  • その3 より正確にはプライマリーデータ
  • その4 最重要なのはデータの前提 ⇒ 今回
  • その5 データは対で集める

今回は、その4の「最重要なのはデータの前提」というお話しをします。

外してはいけないポイント

データがプライマリーデータであろうがセカンダリーデータであろうが外してはいけないポイントがあります。

それは、「データの前提」です。

データの前提とは、データの履歴書です。7何(6W1H)で表現されます。

  • 誰が?:データを企画し集めた人・組織
  • 誰に対し:データ収集対象者
  • なぜ?:集めた目的
  • いつ?:集めた時期
  • どこで?:集めた場所(対象者のエリアなど)
  • 何を?:集めたデータの内容
  • どのように?:データの集め方

データの前提はデータ分析に多大なる影響がある

データ分析は、データの前提から大きな影響を受けます。

データの前提を把握していないデータ分析はありえません。

例えば……

  • 米国の売上データを分析しても日本の売上データを分析したことにはなりません。集めた場所が異なりまる。
  • 10年前のデータを分析して今を語ることはできません。集めた時期が異なります。

一番気を付けたほうが良いこと

一番気を付けたほうが良いのが「誰が企画し集めたか?」ということです。

不思議なことに、誰が企画し集めたかでデータが微妙に異なることがあります。

例えば、プライマリーデータセカンダリデータに比べ、時間とお金をより多くかけてデータを集めるます。

自分たちが欲しいデータを得たいがためです。その気持ちがデータ企画や収集に微妙に影響します。

最初にすべきこと

最初にすべきことは、本当に集めたいデータの前提を明らかにすることです。

本当に集めたいデータの前提が明らかになれば、どのようなデータを集めるべきか分かります。

プライマリーデータであっても、多くの場合、どんなに気を付けて集めたとしても、集めたいデータの前提集めたデータの前提ずれます。

セカンダリ―データの場合には、当然のごとく、集めたいデータの前提集めたデータの前提ずれます。

したがって、どんなに都合の良いセカンダリ―データでも、時間とお金をかけて集めたプライマリーデータであっても、データの前提がはっきりしないデータは避けましょう

前提なくしてデータを企画し集めることはできません

データの前提をしっかり把握しよう! となるとセカンダリ―データだけだろ…… と思われる方もいますが、プライマリーデータデータの前提は非常に重要です。

なぜならば、データの前提なくしてデータを企画し集めることはできないからです。

例えば、次のような流れになることでしょう。

  1. 本当に集めたいデータの前提を明らかにする
  2. そして、実際に自ら企画する
  3. 実際にデータを収集する

データの前提のずれはデータを集めた時にきちんと記録する

先ほどもお話ししましたが、多くの場合、どんなに気を付けて集めたとしても、集めたいデータの前提集めたデータの前提ずれます。

どの前提どれほどずれたのか、そのずれをきちんと認識しておきましょう。

そのためにも、データの前提ずれデータを集めた時にきちんと記録しておきましょう。

意外と、そこが抜け落ちているケースが多々あり、企画段階の前提と実際の得られたデータのずれを分析するところから始まるケースも少なくないです。

前提のずれを認識して解釈する

先ほども言いましたが、集めたいデータの前提集めたデータの前提ずれます。

実際にデータ分析をするときは、そのずれを認識データを分析すべきです。

特に、データ分析の結果を解釈するとき、その前提のずれを認識し解釈すべきです。

このことを怠ると、間違った解釈をする危険性があります。

間違った解釈からは間違ったアクションが導かれます。間違ったアクションで目的を達成することは困難になります。

つまり、データ品質で最重要なのは「データの前提」を明確にしておくということです。

次回

今回は、その3の「より正確にはプライマリーデータ」というお話しをしました。

  • その1 データソースの種類
  • その2 まずはセカンダリーデータ
  • その3 より正確にはプライマリーデータ
  • その4 最重要なのはデータの前提
  • その5 データは対で集める ⇒ 次回

次回は、その5の「データは対で集める」というお話しをします。

もっと知りたい方はこちら

14のフレームワークで考える
データ分析の教科書

かんき出版 (2014/9/18)

https://www.amazon.co.jp/dp/4761270241/