• Slide image
  • Slide image
  • Slide image

Sales Analytics, Co., Ltd.

データ分析・活用支援カンパニー

らくらくビジネスデータサイエンス
無料ツールでさくっとデータ分析し成果をだそう!

RECENT ARTICLES

pandasデータフレームのJupyter上の出力表示をちょっと変える方法

pandasデータフレームのJupyter上の出力表示をちょっと変える方法

Excelなどでセルに入っている数字を元に、セルを色分けしたり、棒グラフをセルの中に描いたりすることがります。 そのようなことを、pandasのデータフレームを、Jupyter Notebook上に表示させるときできない...
第241話|利益病とデータ活用

第241話|利益病とデータ活用

データを上手く活用することで、収益や利益などの安定化を図ることが出来ます。 旧来から使われているワードで表現すると、平準化とレベルシフトです。 平準化とは、収益や利益などのばらつきを抑えること。統計学っぽく言うと、標準偏...
200以上のアルゴリズムを試せる<br>R Caret によるシンプル機械学習モデリング<br>その2(分類問題編)

200以上のアルゴリズムを試せる
R Caret によるシンプル機械学習モデリング
その2(分類問題編)

Caretは構築できる数理モデルが200種類を超え(2021年4月30日現在)、線形回帰モデルから、決定木系、ニューラルネット系と幅広いです。 前回は、Caretの概要とインストール、そして回帰問題を例に使い方を簡単に説...
STEP 3(分析)その4-3|系統図法(ロジックツリー)

STEP 3(分析)その4-3|系統図法(ロジックツリー)

データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...
pickle と joblib で 機械学習モデルを保存&読み込む(Python)

pickle と joblib で 機械学習モデルを保存&読み込む(Python)

scikit-learnなどで構築した機械学習モデル(オブジェクト)を、どのようにファイルに保存し、それを読み込み使うのか。 よくあるのが以下の2つです。 pickle:保存&読み込むスピードがjoblibより早い jo...
第240話|DXはIT投資ではなく人財投資のほうがいい

第240話|DXはIT投資ではなく人財投資のほうがいい

なぜお金を使おうとするのだろうか? 行政機関もそうですが、大手企業も似たようなものだと感じているのが、お金をかけなくてもいいところに、お金をかけようとする。 例えば、「1円も払わずに社内に構築できるITシステム(データ利...
200以上のアルゴリズムを試せる<br>R Caret によるシンプル機械学習モデリング<br>その1(回帰問題編)

200以上のアルゴリズムを試せる
R Caret によるシンプル機械学習モデリング
その1(回帰問題編)

最近、機械学習系の数理モデルを構築する人も増えてきています。PythonですとScikit-Learn(sklearn)を使う人が多いようです。 では、Rではどうか? となりますが、Rで似たようなものですと、Caret(...
遺伝的アルゴリズムを使った<br>AutoML【TPOT】の仕組み

遺伝的アルゴリズムを使った
AutoML【TPOT】の仕組み

TPOTは、最適な機械学習の一連の流れ(パイプライン)を自動で構築する自動機械学習(AutoML)です。 では、どのようにして最適なパイプラインを得るのでしょうか? あらゆるパイプラインの構築パターンを試せば、最適なパイ...
EDAのスピードを上げるインテリジェントなアシスタントEDAライブラリー Python Lux

EDAのスピードを上げるインテリジェントなアシスタントEDAライブラリー Python Lux

EDA(探索的データ分析)と称して、大量のグラフを作成し意味のあるグラフを探しながら見ていくという作業は、昔から行われてきました。 その作業が少しでも楽でにでもなれば、ということで Lux というPythonライブラリー...
第239話|DXを阻む「鉛筆を舐めておけ文化」

第239話|DXを阻む「鉛筆を舐めておけ文化」

「鉛筆を舐めておけ文化」とは、数値の改ざんが当たり前のごとく行われている文化です。 データを活用し社会をより良くするDXとは、真逆の文化です。 DXを推進しながら、「鉛筆を舐めておけ文化」である組織は、その文化から脱却し...
Power BI Desktop の Tips(その2)<br> 列の分割・空白値の穴埋め・不要行の削除

Power BI Desktop の Tips(その2)
列の分割・空白値の穴埋め・不要行の削除

Power BI に読み込んだデータが、そのまますぐに使える状態になっているわけではありません。 何かしらの加工が必要になることがあります。例えば、列を分割したり、不要な行を削除したり、などなど。 今回は次の3つについて...
R の ggplot2 をGUI上で操作しグラフ作成できる<br>超便利パッケージ「ggplotgui」「esquisse」「ggrapt」

R の ggplot2 をGUI上で操作しグラフ作成できる
超便利パッケージ「ggplotgui」「esquisse」「ggrapt」

Rでグラフ作成と言えば、ggplot2です。 ただ、ggplot2による可視化は綺麗だけど、その設定がちょっと面倒。もっとさくっとグラフ作成できなものだろうか。 と言うことで、パッケージ「ggplotgui」「esqui...
STEP 3(分析)その4-2|親和図法(KJ法)とDEMATEL<br>– 古くて新しい新QC7つ道具 –

STEP 3(分析)その4-2|親和図法(KJ法)とDEMATEL
– 古くて新しい新QC7つ道具 –

データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...
Lazy Predict(Python)で1コードで30以上の数理モデルの予測結果を得られる

Lazy Predict(Python)で1コードで30以上の数理モデルの予測結果を得られる

回帰問題や分類問題の予測モデルを構築するときに、色々なアルゴリズムで構築し比べたことがあるかと思います。 AutoML(自動機械学習)というわけではないですが、PythonのLazy Predictを使うと、1コードで色...
第238話|DXしているぜ! という多大なる見栄の代償

第238話|DXしているぜ! という多大なる見栄の代償

世の中不思議なもので、誰も嬉しくもないし、得もしていないのに止められないことがあります。 その1つが、DX(デジタルトランスフォーメーション)を旗印に掲げ始めた無意味なデータ活用です。 DXを旗印のもと始めたデータ活用が...
Python category_encodersでカテゴリカル変数をサクッと数字データに変換しよう

Python category_encodersでカテゴリカル変数をサクッと数字データに変換しよう

カテゴリカル変数は、数字で表現されているケースと、文字列で表現されているケースが多いです。 文字列で表現されているケースの場合、そのままモデル構築するとエラーが出ることも多いです。 そのような場合、文字列を数字にエンコー...