らくらくビジネスデータサイエンス
無料ツールでさくっとデータ分析し成果をだそう!

RECENT ARTICLES

第265話|データの前処理とは何か?

第265話|データの前処理とは何か?

データを手に入れたとき、集計や分析、数理モデル構築などをする前に、前処理をしデータをキレイにする必要があります。 前処理を適切に行わないと、間違った何かを出力することになります。 では実際どのようなことをするのか? 今回...
量質混在データ(数値変数とカテゴリカル変数が混在)に対する<br>Gower距離による階層型クラスタリング(Python)

量質混在データ(数値変数とカテゴリカル変数が混在)に対する
Gower距離による階層型クラスタリング(Python)

クラスター分析で利用されるメジャーなアルゴリズムは、非階層型クラスタリングのk-means法か、階層型のWard法がよく使われます。 問題は、量的データ(数値変数)のみを使うというところにあります。質的データ(カテゴリカ...
ノンコードで機械学習モデル構築 H2O Flow<br>その6(H2O Flow で実施する教師なし学習(次元削減・集約))

ノンコードで機械学習モデル構築 H2O Flow
その6(H2O Flow で実施する教師なし学習(次元削減・集約))

H2O(エイチツーオー)は、H2O.ai社によって開発された、インメモリ型の機械学習プラットフォームです。 教師あり学習や教師なし学習などの機械学習系の数理モデルを構築することができます。 嬉しいのが、ノンコードで機械学...
第257話|データによる課題発見と課題解決

第257話|データによる課題発見と課題解決

問題解決は、取り組むテーマと言うか課題を設定する「課題発見フェーズ」と、その課題に取り組む「課題解決フェーズ」に分かれます。 そこでどのようにデータを絡ませるか? データの絡ませ方には4つのパターンがあります。 今回は、...