[For beginners] がんばれデータサイエンティスト!

Python Pywedge を使ったお手軽<br>前処理・ベースモデル構築・ハイパーパラメータチューニング

Python Pywedge を使ったお手軽
前処理・ベースモデル構築・ハイパーパラメータチューニング

前回は、Pywedge を使ったお手軽データビジュアライゼーション(データの可視化)について簡単に説明しました。 Python Pywedge を使ったお手軽データビジュアライゼーション(データの可視化) Pywedge...
Python Pywedge を使ったお手軽データビジュアライゼーション(データの可視化)

Python Pywedge を使ったお手軽データビジュアライゼーション(データの可視化)

Pywedgeとは、Pythonの便利なライブラリーの1つです。主に以下のようなことができます。 データビジュアライゼーション(データの可視化) データの前処理支援 機械学習のベースラインモデルの作成支援 ノンコードでG...
pandasデータフレームのJupyter上の出力表示をちょっと変える方法

pandasデータフレームのJupyter上の出力表示をちょっと変える方法

Excelなどでセルに入っている数字を元に、セルを色分けしたり、棒グラフをセルの中に描いたりすることがります。 そのようなことを、pandasのデータフレームを、Jupyter Notebook上に表示させるときできない...
200以上のアルゴリズムを試せる<br>R Caret によるシンプル機械学習モデリング<br>その2(分類問題編)

200以上のアルゴリズムを試せる
R Caret によるシンプル機械学習モデリング
その2(分類問題編)

Caretは構築できる数理モデルが200種類を超え(2021年4月30日現在)、線形回帰モデルから、決定木系、ニューラルネット系と幅広いです。 前回は、Caretの概要とインストール、そして回帰問題を例に使い方を簡単に説...
pickle と joblib で 機械学習モデルを保存&読み込む(Python)

pickle と joblib で 機械学習モデルを保存&読み込む(Python)

scikit-learnなどで構築した機械学習モデル(オブジェクト)を、どのようにファイルに保存し、それを読み込み使うのか。 よくあるのが以下の2つです。 pickle:保存&読み込むスピードがjoblibより早い jo...
200以上のアルゴリズムを試せる<br>R Caret によるシンプル機械学習モデリング<br>その1(回帰問題編)

200以上のアルゴリズムを試せる
R Caret によるシンプル機械学習モデリング
その1(回帰問題編)

最近、機械学習系の数理モデルを構築する人も増えてきています。PythonですとScikit-Learn(sklearn)を使う人が多いようです。 では、Rではどうか? となりますが、Rで似たようなものですと、Caret(...
EDAのスピードを上げるインテリジェントなアシスタントEDAライブラリー Python Lux

EDAのスピードを上げるインテリジェントなアシスタントEDAライブラリー Python Lux

EDA(探索的データ分析)と称して、大量のグラフを作成し意味のあるグラフを探しながら見ていくという作業は、昔から行われてきました。 その作業が少しでも楽でにでもなれば、ということで Lux というPythonライブラリー...
R の ggplot2 をGUI上で操作しグラフ作成できる<br>超便利パッケージ「ggplotgui」「esquisse」「ggrapt」

R の ggplot2 をGUI上で操作しグラフ作成できる
超便利パッケージ「ggplotgui」「esquisse」「ggrapt」

Rでグラフ作成と言えば、ggplot2です。 ただ、ggplot2による可視化は綺麗だけど、その設定がちょっと面倒。もっとさくっとグラフ作成できなものだろうか。 と言うことで、パッケージ「ggplotgui」「esqui...
Lazy Predict(Python)で1コードで30以上の数理モデルの予測結果を得られる

Lazy Predict(Python)で1コードで30以上の数理モデルの予測結果を得られる

回帰問題や分類問題の予測モデルを構築するときに、色々なアルゴリズムで構築し比べたことがあるかと思います。 AutoML(自動機械学習)というわけではないですが、PythonのLazy Predictを使うと、1コードで色...
Python category_encodersでカテゴリカル変数をサクッと数字データに変換しよう

Python category_encodersでカテゴリカル変数をサクッと数字データに変換しよう

カテゴリカル変数は、数字で表現されているケースと、文字列で表現されているケースが多いです。 文字列で表現されているケースの場合、そのままモデル構築するとエラーが出ることも多いです。 そのような場合、文字列を数字にエンコー...