数字で表現するメリットは計り知れませんが、デメリットもあります。 一人歩きし誤った方向に誘導してしまうこともある、というデメリットです。 どの数字をどう見せるかで、向かう方向を誘導することができます。 恐ろしいことです。...
ビジネスの現場でデータ活用するには、現場の事情を知る必要もあるし、現場に寄り添わなければなりません。 ただ、データサイエンスの基礎的な部分が疎かなデータ分析者やデータサイエンティスト、機械学習エンジニアだと、現場に寄り添...
上手くいったものを横展開すると上手くいく、というのは、時と場合によっては幻想かもしれません。 少なくても、データ活用のケースでは、幻想であることが少なからずあります。 ある企業で上手くいったことをやったら上手くいかず……...
たまに、「折角だからこのデータを使って!」的なことがあります。 そのデータを溜めるまでに多大なる労力を要したのか、データ整備に多大なる時間を要したのか、ITシステム周りでコストが掛かったのか、何かは知りませんが、特定のデ...
データ活用を考えたとき、先ずはデータ活用する「現場のお困りごと」を考えるべきです。 しかし、「データのお困りごと」から入ってしまうケースが多々あります。 「データのお困りごと」とは、データが足りない、データが汚い、データ...
集計や分析、予測の結果をダッシュボードやレポートなどとして、データ活用する現場に提供することがあります。 どのようなダッシュボードやレポートを作ればいいのか? そう悩む人も多いことでしょう。 今回は、「データサイエンスレ...
データサイエンス系プロジェクトを成功裏に納めるためには、人の成長やチーム構成なども重要ですが、連携も重要です(当たり前といえば、当たり前ですが……)。 そこで、どう育成するのか、どうチーム構成するのか、ではなく、チームが...
異常とは、標準的な挙動から著しく逸脱した稀なデータのことである。 時系列の多くの異常値は、ある特定の時点における顕著なスパイクや、ある特定の期間だけ傾向が大きく異なるとかです。 そして、異常データの多くは、どのデータが異...
ビジネスの現場で登場するデータの多くは時系列データですが、通常のテーブルデータと同様に欠測値や外れ値なども、当然ながら発生します。 時系列データの一部に欠測値(データがない)がある場合、どうすればいいでしょうか。 テーブ...
売上などの時系列データには、周期性があります。 周期性の中で、期間の決まっているものを季節性と言ったりします。 例えば、1日単位の売上データであれば、週周期(7日間)や年周期(365.25日間)などです。 例えば、1時間...