データサイエンスと言う用語は、数十年前からありました。 2000年代初期のころ、私が所属していたコンサルティング会社の部署名に、「データサイエンス」という言葉がついていたぐらいでしたから。 データサイエンスが必要な理由は...
今あるデータで何をするか? これから取得するであろうデータで何をするのか? データ分析・活用を本格したい! と考えたとき非常に大きな問題でしょう。 そもそも、手段であるデータ分析・活用ありきであること自体、可笑しなことで...
良くも悪くもデータから逃れることのできない時代になってしまいました。 データにがんじがらめです。 逃れるすべは、あらゆるIT的な恩恵を切り捨て、無人島にでも住むほかありません。それほど、データは社会や生活の中に浸透してい...
データサイエンティストは何者なのか? 最近、エンジニアである機械学習エンジニア(もしくはデータエンジニア)と、データサイエンティストが混同される不幸が、ちょいちょい見受けられます。 似ているようで似ていない。そもそも、デ...
分析用データ、どのような視点で分析するかで、データセットの呼び名というか、データ分析の名称が変わったりします。 その1つが、クロスセクション、タイムシリーズ(時系列)、そしてコーホートという名称です。 営業や販売のCRM...
ビッグデータの時代と言うものの、データを眺めてみれば、何がビッグなのかわからない…… 少なくとも、勝手に溜まるデータがビッグになっている、ということは言えそうです。 勝手にビッグになっているデータの代表が、Webアクセス...
ここ最近、次にような質問をされることが、たびたびあります。 「機械学習と統計学のモデル、何が違うのですか?」 ここで言っている統計学のモデルとは、多変量解析などに代表される回帰モデルや判別モデル、クラスター分析、主成分分...
積極的にデータ分析がなされていない企業で、「さぁデータ分析するぞ!」と言ってデータを分析し始めたとき、必ずと言っていいほど整備されていないデータがあります。 それは、アクション系のデータです。一方で、それなりに蓄積し整備...
データ分析・活用といったとき、大きく2つの「型」があるのではないかと思います。 1つが「問題解決型データ分析」、もう1つが「運用型データ分析」。 それ以外にもあるかもしれませんが、大きくはこの2つの分類できると思います。...
受注予測や離反予測など、判別分析の出番が意外と多いのがビジネスデータ分析の特徴です。 受注や離反だけでなく、状態遷移(例:訪問→提案)の予測も判別分析の範疇です。 昔から色々な判別分析の手法があります。 共通しているのは...