[For beginners] がんばれデータサイエンティスト!

Pythonで日時を扱うなら、とりあえずdatetimeモジュールを利用しよう

Pythonで日時を扱うなら、とりあえずdatetimeモジュールを利用しよう

ビジネス系のデータ分析には、時間という概念が付いて回ることが多いです。 必ずというわけではありませんが、場合によっては「時間」に関する情報を使用することもあるでしょう。 Pythonですと、datetimeモジュールを利...
さくっと機械学習のWebアプリを作りたくなったら<br>Pythonのstreamlitがとっても手軽だよ

さくっと機械学習のWebアプリを作りたくなったら
Pythonのstreamlitがとっても手軽だよ

データ分析・活用(データサイエンス実践)するとき、いつまでも手作業ベースで分析結果や予測結果を、データ分析者やデータサイエンティストなどが提供し続けるのは困難です。 そのため、データ活用の現場でも使えるように、何かしらツ...
Python の Explainer Dashboard で<br>予測モデル(分類問題・回帰問題)の結果を半自動分析しよう

Python の Explainer Dashboard で
予測モデル(分類問題・回帰問題)の結果を半自動分析しよう

ビジネスでデータ活用をするとき、何かを予測をするために、数理統計学や機械学習などの数理モデル(分類問題・回帰問題)を構築することは、少なくありません。 例えば…… 売上予測 受注予測 離反予測 アップセル予測 クロスセル...
データセットを手にしたら、Pythonでサクッと半自動EDA(探索的データ分析)をしよう

データセットを手にしたら、Pythonでサクッと半自動EDA(探索的データ分析)をしよう

データセット手にしたら、数理モデルを作ったりする前に、通常はEDA(探索的データ分析)を実施します。 端的に言うと、データと仲良くなるための会話です。 ざっくり次のような流れになります。 データコンディションチェック(欠...
Rで推定するパレート分布

Rで推定するパレート分布

「第222話|パレート指数による売上分析」でパレート分布についてお話ししました。 ビジネスはパレートな世界の住人でしょう。 例えば…… チェーン店であれば、極端に売上の大きい店舗はあります 営業パーソンであれば、極端に受...
時系列データならRのTSstudioパッケージでサクッと分析

時系列データならRのTSstudioパッケージでサクッと分析

ビジネス系データサイエンスの多くは、時系列データです。 RのTSstudioパッケージを使うと、サクッと時系列解析できます。「TSstudio」の「TS」はTime Series(時系列)の略です。 RのTSstudio...
Python時系列解析ライブラリー「Sktime」<br>その1<br>時系列モデルで数値予測

Python時系列解析ライブラリー「Sktime」
その1
時系列モデルで数値予測

発展途上ではありますが、個人的に注目している時系列解析のライブラリーがあります。Sktimeというライブラリーです。 名前から想像できる通り、Pythonの有名な機械学習ライブラリーScikit-learn(sklear...
Jupyter Notebookでグラフ化(matplotlib)するときの「3つ」のマジックコマンド(Python)

Jupyter Notebookでグラフ化(matplotlib)するときの「3つ」のマジックコマンド(Python)

Jupyter Notebook(IPython notebook)でライブラリー「matplotlib」を使いグラフ表示する人は多いと思います。 matplotlibを使いグラフ表示と言っても、幾つかのやり方があります...