らくらくビジネスデータサイエンス
無料ツールでさくっとデータ分析し成果をだそう!

RECENT ARTICLES

リーンスタートアップとは?

リーンスタートアップとは?

データ活用と相性がいいのは、既存の何かをより良くする(楽にする)ことです。 既にあるビジネス(事業)に対し、新規顧客の獲得・既存顧客の離反阻止・既存顧客のLTV拡大・業務効率化・生産性向上・コストダウンなどなど。 データ...
ノンコードで機械学習モデル構築 H2O Flow<br>その1(H2O Flow の起動)

ノンコードで機械学習モデル構築 H2O Flow
その1(H2O Flow の起動)

H2O(エイチツーオー)は、H2O.ai社によって開発された、インメモリ型の機械学習プラットフォームです。 教師あり学習や教師なし学習などの機械学習系の数理モデルを構築することができます。 嬉しいのが、ノンコードで機械学...
H2O AutoML とは?

H2O AutoML とは?

面倒な特徴量エンジニアリングやモデル選択、モデルのパラメータ調整などを全自動で実施してくれるAutoML(自動機械学習)が最近発達してきています。 自動機械学習(AutoML) Web講座の前シリーズでは、主にPytho...
Python Pywedge を使ったお手軽<br>前処理・ベースモデル構築・ハイパーパラメータチューニング

Python Pywedge を使ったお手軽
前処理・ベースモデル構築・ハイパーパラメータチューニング

前回は、Pywedge を使ったお手軽データビジュアライゼーション(データの可視化)について簡単に説明しました。 Python Pywedge を使ったお手軽データビジュアライゼーション(データの可視化) Pywedge...
第243話|現場に寄り添い過ぎる危険

第243話|現場に寄り添い過ぎる危険

DX(デジタルトランスフォーメーション)、AI(人工知能)、ML(機械学習)、DS(データサイエンス)などなど。 どんなにカッコいいワードで表現しようが、データを活用し成果を出すのは現場です。 現場無視でデータ活用を企画...
Python Pywedge を使ったお手軽データビジュアライゼーション(データの可視化)

Python Pywedge を使ったお手軽データビジュアライゼーション(データの可視化)

Pywedgeとは、Pythonの便利なライブラリーの1つです。主に以下のようなことができます。 データビジュアライゼーション(データの可視化) データの前処理支援 機械学習のベースラインモデルの作成支援 ノンコードでG...
STEP 3(分析)その4-4|一対比較法とAHP

STEP 3(分析)その4-4|一対比較法とAHP

データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...
第242話|バイアスとバリアンスのジレンマと正則化

第242話|バイアスとバリアンスのジレンマと正則化

ちょっと理論面と言うかテクニカルと言うか、そんな話題になります。 機械学習で予測モデルなどを構築するとき、ちょいちょい顔をだすキーワードに、バイアス(Bias)とバリアンス(Variance)、そして正則化などがあります...
pandasデータフレームのJupyter上の出力表示をちょっと変える方法

pandasデータフレームのJupyter上の出力表示をちょっと変える方法

Excelなどでセルに入っている数字を元に、セルを色分けしたり、棒グラフをセルの中に描いたりすることがります。 そのようなことを、pandasのデータフレームを、Jupyter Notebook上に表示させるときできない...
第241話|利益病とデータ活用

第241話|利益病とデータ活用

データを上手く活用することで、収益や利益などの安定化を図ることが出来ます。 旧来から使われているワードで表現すると、平準化とレベルシフトです。 平準化とは、収益や利益などのばらつきを抑えること。統計学っぽく言うと、標準偏...
200以上のアルゴリズムを試せる<br>R Caret によるシンプル機械学習モデリング<br>その2(分類問題編)

200以上のアルゴリズムを試せる
R Caret によるシンプル機械学習モデリング
その2(分類問題編)

Caretは構築できる数理モデルが200種類を超え(2021年4月30日現在)、線形回帰モデルから、決定木系、ニューラルネット系と幅広いです。 前回は、Caretの概要とインストール、そして回帰問題を例に使い方を簡単に説...
STEP 3(分析)その4-3|系統図法(ロジックツリー)

STEP 3(分析)その4-3|系統図法(ロジックツリー)

データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...
pickle と joblib で 機械学習モデルを保存&読み込む(Python)

pickle と joblib で 機械学習モデルを保存&読み込む(Python)

scikit-learnなどで構築した機械学習モデル(オブジェクト)を、どのようにファイルに保存し、それを読み込み使うのか。 よくあるのが以下の2つです。 pickle:保存&読み込むスピードがjoblibより早い jo...
第240話|DXはIT投資ではなく人財投資のほうがいい

第240話|DXはIT投資ではなく人財投資のほうがいい

なぜお金を使おうとするのだろうか? 行政機関もそうですが、大手企業も似たようなものだと感じているのが、お金をかけなくてもいいところに、お金をかけようとする。 例えば、「1円も払わずに社内に構築できるITシステム(データ利...
200以上のアルゴリズムを試せる<br>R Caret によるシンプル機械学習モデリング<br>その1(回帰問題編)

200以上のアルゴリズムを試せる
R Caret によるシンプル機械学習モデリング
その1(回帰問題編)

最近、機械学習系の数理モデルを構築する人も増えてきています。PythonですとScikit-Learn(sklearn)を使う人が多いようです。 では、Rではどうか? となりますが、Rで似たようなものですと、Caret(...
遺伝的アルゴリズムを使った<br>AutoML【TPOT】の仕組み

遺伝的アルゴリズムを使った
AutoML【TPOT】の仕組み

TPOTは、最適な機械学習の一連の流れ(パイプライン)を自動で構築する自動機械学習(AutoML)です。 では、どのようにして最適なパイプラインを得るのでしょうか? あらゆるパイプラインの構築パターンを試せば、最適なパイ...