データ分析 Web講座

H2O AutoML とは?

H2O AutoML とは?

面倒な特徴量エンジニアリングやモデル選択、モデルのパラメータ調整などを全自動で実施してくれるAutoML(自動機械学習)が最近発達してきています。 自動機械学習(AutoML) Web講座の前シリーズでは、主にPytho...
遺伝的アルゴリズムを使った<br>AutoML【TPOT】の仕組み

遺伝的アルゴリズムを使った
AutoML【TPOT】の仕組み

TPOTは、最適な機械学習の一連の流れ(パイプライン)を自動で構築する自動機械学習(AutoML)です。 では、どのようにして最適なパイプラインを得るのでしょうか? あらゆるパイプラインの構築パターンを試せば、最適なパイ...
Power BI Desktop の Tips(その2)<br> 列の分割・空白値の穴埋め・不要行の削除

Power BI Desktop の Tips(その2)
列の分割・空白値の穴埋め・不要行の削除

Power BI に読み込んだデータが、そのまますぐに使える状態になっているわけではありません。 何かしらの加工が必要になることがあります。例えば、列を分割したり、不要な行を削除したり、などなど。 今回は次の3つについて...
Power BI Desktop の Tips(その1)<br> 読み込んだデータの行と列を入れ替える

Power BI Desktop の Tips(その1)
読み込んだデータの行と列を入れ替える

Power BI でデータを読み込んだとき、行と列を入れ替えたいと思うときがあるかもしれません。 今回は、データを読み込んだ後に、Power BI 上でデータの行と列の入れ替える方法について説明します。 以下、今回の流れ...
パイプラインに使う関数を指定し<br>AutoML【TPOT】構成(Config.)をカスタマイズ

パイプラインに使う関数を指定し
AutoML【TPOT】構成(Config.)をカスタマイズ

前回、精度やメモリ使用量、実行速度に応じたTPOTが用意した構成(Config.)を使う方法を説明しました。 構成名 内容 適用できる問題 Default TPOT 初期設定の構成です。 分類・回帰 TPOT light...
スピード or 精度、何を重視する?<br>AutoML【TPOT】の6構成(Config.)

スピード or 精度、何を重視する?
AutoML【TPOT】の6構成(Config.)

TPOTでは、あらかじめパイプラインに使う変換器やアルゴリズム、探索するパラメータの範囲が決まっています。 しかし、あまり探索に時間をかけたくないときや単純な変換器・アルゴリズムを使いたいときがあると思います。 逆に時間...
Power BI Desktop で Wikipedia データからレポート作成

Power BI Desktop で Wikipedia データからレポート作成

BI(ビジネスインテリジェンス)ツールで先ずすべきは、外部にあるデータの読み込み(データ取得)です。 前回は、Web上のデータを取得する方法と簡単なデータ加工について説明しました。 Web上にあるデータを取り込んだら、加...
Power BI Desktop で Web上のデータを取得

Power BI Desktop で Web上のデータを取得

BI(ビジネスインテリジェンス)ツールで先ずすべきは、外部にあるデータの読み込み(データ取得)です。 前回は、複数のCSVデータを取得し結合するやり方について説明しました。 最近は、ExcelやCSVファイル、データベー...
Power BI Desktop で 複数のCSVデータを取得し結合する

Power BI Desktop で 複数のCSVデータを取得し結合する

BI(ビジネスインテリジェンス)ツールで先ずすべきは、外部にあるデータの読み込み(データ取得)です。 前回は、データベース「PostgreSQL」のデータ取得について説明しました。 読み込むデータは、Excelファイルで...