データを得たとき、最初にすべきことの1つが、データ理解です。 データ理解とは、「手元にあるデータがどのようなデータなのか理解する」ということです。 データ理解が不十分なまま、より高度な分析を実施したり、数理モデルを構築し...
特徴量選択(変数選択)は、機械学習系の予測モデルなどを構築するとき、最初に行う重要なステップの1つです。 予測に寄与しない特徴量(説明変数)を取り除くことで、よりシンプルな予測モデルを構築を目指します。 色々な考え方や手...
データ活用の浸透とともに、ダッシュボードを利用する人や組織、企業などが増えてきました。 ダッシュボードには、指標をの推移やそれを集計した結果、それらを見やすくしたグラフ、検視した異常のアラート、今後の予測など多くの情報が...
SalesZineに掲載されたインタビュー記事です SFA/CRMの浸透で営業組織のデータ活用は本当に進んできたのか? 「使われないデータ」を復活させるデータ“ネクロマンサー”として企業のデータ活用を長年支援してきた高橋...
売上などの時系列データを予測するモデルは、基本となるのは1期先予測(1-Step ahead prediction)ですが、実務では複数先予測(Multi-Step ahead prediction)が求められます。 ニ...
sktimeに読み込めるデータフォーマットは次の4つです。 csvフォーマット tsフォーマット Weka ARFFフォーマット UCR .tsvフォーマット 前回は、最も利用頻度が高いと思われるCSVの読み込み方と、s...
BIツールの普及とともに、パワーポイントやワードなどのレポートの代替として利用する企業や組織などが増えてきました。 もちろん、今でもパワーポイントやワードなどのレポートは頻繁に利用されています。 ダッシュボードとレポート...
大人気の就活情報サイトである「就活の教科書」に掲載されている以下の記事の監修を行いました。 以下、記事の冒頭の抜粋になります。 「具体的な勉強法3選」や「データサイエンティストになるために必要なスキル」、「志望動機のポイ...
ここ10年、ダッシュボードがビジネスの現場に広まりました。 従来は、パワーポイントやワードなどのレポートが担っていた役割を、ダッシュボードが代替するようになったのです。 ただ、ダッシュボードが効果的に情報を伝達できている...
売上などの時系列データを予測するモデルは、基本となるのは1期先予測(1-Step ahead prediction)ですが、実務では複数先予測(Multi-Step ahead prediction)が求められます。 ニ...
売上などの時系列データを予測するモデルは、基本となるのは1期先予測(1-Step ahead prediction)ですが、実務では複数先予測(Multi-Step ahead prediction)が求められます。 ニ...
データサイエンティストや機械学習エンジニアなどの社会的需要が高まっています。 とは言え、急にタケノコのようにニョキニョキ増えることはありません。 通常は、最低でも実務経験を積みながら2,3年は必要でしょう。 その後、セン...
DXだのビッグデータだのAIだのデータサイエンスだの機械学習だのディープラーニングだの、データ活用を目論むことが多くなった昨今です。 ただデータ活用を過度に進めることで、ちょっとしたことが起こります。 データ活用の末路と...
時系列データをビジネス活用するとき、最も期待される活用方法の1つが「データで近未来を予測しこれからのビジネス活動に活かす」というものです。 これは、需要予測や受注予測、LTV予測、離反予測、故障予測などの「〇〇予測」と呼...
最近、ビジネスの世界で、売上などの時系列データを使い予測モデルを構築し、近未来を予測しながらビジネス活動する人や組織が増えてきました。 ただ、予測モデルを構築するとき…… どのモデル(アルゴリズム)がいいのか? どの説明...
高精度な予測モデルが使えるモデルとは限りません。 「使えるモデル」とは、ビジネスの現場で使い成果をだすモデルです。 ビジネスの現場で予測モデルが使えるかどうかを考えるとき、幾つかの視点があります。 今回は、「高精度な予測...