今週の小ばなし

第228話|誰かが困っているところで、<br>データサイエンスのサーキュラーエコノミー(循環経済)を起こせ!

第228話|誰かが困っているところで、
データサイエンスのサーキュラーエコノミー(循環経済)を起こせ!

データサイエンスは、データとドメイン(データ活用の現場)の間の橋であり、その橋を走る汽車のようなものです。 ドメイン(データ活用の現場)を覗いてみれば、そこには何かに困っている人がいます。 何かに困っている人が、何に困っ...
第227話|完璧にデータを集めなければならないという勘違い

第227話|完璧にデータを集めなければならないという勘違い

いざデータ活用を始めようと考えたとき、データ収集から始めることがあります。 そのとき、完璧にデータを集めようと考える人も少なくありません。 しかし、データ分析・活用(データサイエンス実践)をする前に想像する必要そうなデー...
第226話|現場感とデータ分析(どちらかというと仮説探索型データ分析)

第226話|現場感とデータ分析(どちらかというと仮説探索型データ分析)

データから新たな知見を得たい! という要望は、昔からあります。 仮説発見をするぞという、データマイニングがその現れでしょう。 従来のメインが「仮説検証型データ分析」で、それを進化さえたような感じを与えるようなモノでした。...
第225話|見える化の魔力

第225話|見える化の魔力

データ活用をするとき、「見える化」というキーワードが多々出てきます。 取り急ぎ「見える化」するためにデータを集めよう DX(デジタルトランスフォーメーション)の初手として「見える化」から始めましょう データ環境を整備し「...
第224話|なぜ、開票率数%で当確なのか?

第224話|なぜ、開票率数%で当確なのか?

各報道機関の選挙速報で、よく開票率が数%なのに当確(当選確実)が出ることがあります。 データサイエンスっぽいアプローチとしては…… 出口調査を利用したもの 中間投票状況(開票率○○%)の結果を利用したもの ……を利用した...
第223話|機械学習的チャーン分析(離反分析)

第223話|機械学習的チャーン分析(離反分析)

営業活動やマーケティング活動にとって、顧客の離反対策は重要課題の1つでしょう。 顧客の離反などのイベントが発生するまでの期間を扱う分析手法があります。 生存時間分析(survival time analysis)というも...
第222話|パレート指数による売上分析

第222話|パレート指数による売上分析

所得分布の不均衡を研究したヴィルフレド・パレート(Vilfredo Pareto)から名付けられた、パレートの法則(20:80の法則もしくは80:20の法則)と呼ばれるものがあります。 この法則は…… 売上上位20%の商...
第221話|ワクチン有効率90%、離婚率35%ってなんだ? <br>指標の名称の付け方で印象操作ができてしまう

第221話|ワクチン有効率90%、離婚率35%ってなんだ?
指標の名称の付け方で印象操作ができてしまう

以下を見て、どのような印象を持つでしょうか? 90%の有効性のある新型コロナワクチンが登場しました! 日本の離婚率35%だから、今や3組に1組が離婚する時代だ! この「有効性」は「ワクチン有効率」という指標を指しています...
第219話|データによる効果検証とネクストアクション

第219話|データによる効果検証とネクストアクション

プロモーションを実施したとき、その効果を知りたくなるものです。 例えば、A群とB群に分け、A群には従来のプロモーションを実施し、B群には新しいプロモーションを試したとき、売上などがどう異なるのかを検証するといったものです...