自動機械学習(AutoML) Web講座

H2O AutoML とは?

H2O AutoML とは?

面倒な特徴量エンジニアリングやモデル選択、モデルのパラメータ調整などを全自動で実施してくれるAutoML(自動機械学習)が最近発達してきています。 自動機械学習(AutoML) Web講座の前シリーズでは、主にPytho...
遺伝的アルゴリズムを使った<br>AutoML【TPOT】の仕組み

遺伝的アルゴリズムを使った
AutoML【TPOT】の仕組み

TPOTは、最適な機械学習の一連の流れ(パイプライン)を自動で構築する自動機械学習(AutoML)です。 では、どのようにして最適なパイプラインを得るのでしょうか? あらゆるパイプラインの構築パターンを試せば、最適なパイ...
パイプラインに使う関数を指定し<br>AutoML【TPOT】構成(Config.)をカスタマイズ

パイプラインに使う関数を指定し
AutoML【TPOT】構成(Config.)をカスタマイズ

前回、精度やメモリ使用量、実行速度に応じたTPOTが用意した構成(Config.)を使う方法を説明しました。 構成名 内容 適用できる問題 Default TPOT 初期設定の構成です。 分類・回帰 TPOT light...
スピード or 精度、何を重視する?<br>AutoML【TPOT】の6構成(Config.)

スピード or 精度、何を重視する?
AutoML【TPOT】の6構成(Config.)

TPOTでは、あらかじめパイプラインに使う変換器やアルゴリズム、探索するパラメータの範囲が決まっています。 しかし、あまり探索に時間をかけたくないときや単純な変換器・アルゴリズムを使いたいときがあると思います。 逆に時間...
AutoML【TPOT】スタッキング関数「StackingEstimator」(回帰問題編)

AutoML【TPOT】スタッキング関数「StackingEstimator」(回帰問題編)

スタッキングは機械学習のアンサンブル学習の一つです。複数の学習器の出力を特徴量とし、さらに別の学習器で予測する方法です。 TPOTのスタッキングは、指定のアルゴリズムで予測した結果とそのアルゴリズムに入力した特徴量を組み...
AutoML【TPOT】スタッキング関数「StackingEstimator」(分類問題編)

AutoML【TPOT】スタッキング関数「StackingEstimator」(分類問題編)

スタッキングは機械学習のアンサンブル学習の一つです。複数の学習器の出力を特徴量とし、さらに別の学習器で予測する方法です。 TPOTのスタッキングは、指定のアルゴリズムで予測した結果とそのアルゴリズムに入力した特徴量を組み...
AutoML【TPOT】特有の関数「OneHotEncoder変換器」

AutoML【TPOT】特有の関数「OneHotEncoder変換器」

第9回「AutoML【TPOT】のパイプラインに使われる関数一覧」で、TPOTのパイプライン(特徴量生成・予測)で使われる関数の概要を説明しました。 その中には、TPOT独自の関数がいくつかありました。 分類問題・回帰問...
AutoML【TPOT】特有の関数「ZeroCount変換器」

AutoML【TPOT】特有の関数「ZeroCount変換器」

第9回「AutoML【TPOT】のパイプラインに使われる関数一覧」で、TPOTのパイプライン(特徴量生成・予測)で使われる関数の概要を説明しました。 その中には、TPOT独自の関数がいくつかありました。 分類問題・回帰問...
AutoML【TPOT】評価指標を自分で作る方法

AutoML【TPOT】評価指標を自分で作る方法

前回、パイプラインの評価指標を一覧にしました。 実際にTPOTを使うときに、使いたい評価指標が実装されていないこともあると思います。 例えば回帰問題でよく使われるRMSE(Root Mean Squared Error、...
AutoML【TPOT】パイプライン評価指標

AutoML【TPOT】パイプライン評価指標

これまでの例では…… 分類問題:F値(f1) 回帰問題:決定係数(r2) ……でパイプラインを評価してきました。 今回は他にどのような評価指標があるか説明します。 なお、評価指標はTPOTClassifierとTPOTR...