データ分析や予測モデル構築などをやってみたいが…… RやPythonだとの無料ツールはコーディングスキルがそれなりに必要になりハードルがある 有料ツールのSASやSPSSなどは使いやすそうだけど高額すぎる。 無料で使える...
データ分析や予測モデル構築などをやってみたいが…… RやPythonだとの無料ツールはコーディングスキルがそれなりに必要になりハードルがある 有料ツールのSASやSPSSなどは使いやすそうだけど高額すぎる。 無料で使える...
データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...
データ分析や予測モデル構築などをやってみたいが…… RやPythonだとの無料ツールはコーディングスキルがそれなりに必要になりハードルがある 有料ツールのSASやSPSSなどは使いやすそうだけど高額すぎる。 無料で使える...
データを活用することで、モノゴトの打率を左右することができます。 例えば、受注確度を上げるなどの、成功確度を上げる、などです。 実際は、それだけではありません。 例えば、打率の低いことをコツコツやり続ける、高い打率を下げ...
前回は、Web上にあるデータを取り込み、簡単なレポートを作成してみました。レポートを作成したら、みんなに共有です。 Power BI Desktop で Wikipedia データからレポート作成 PowerBIでは、作...
Pythonに幾つかの自動特徴量エンジニアリング(Automatic Feature Engineering)のためのパッケージがあります。 その中の1つに「AutoFeat」というものがあります。回帰問題と分類問題で利...
データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...
数理モデルを作る上で特徴量エンジニアリング(Feature Engineering)は地味に重要です。 例えば、より精度の高い予測モデルを構築したいのであれば、アルゴリズムのパラメータチューニングとともに特徴量エンジニア...
データ分析といっても色々なものがありますし、分類の仕方も様々です。 明確に区別すべき2つのデータ分析があります。 それは…… 課題発見型データ分析 課題解決型データ分析 今回は、「課題発見型データ分析と課題解決型データ分...
数理モデルを作る上で特徴量エンジニアリング(Feature Engineering)は地味に重要です。 例えば、より精度の高い予測モデルを構築したいのであれば、アルゴリズムのパラメータチューニングとともに特徴量エンジニア...
Excelのワークシートで、データセットを眺めたりインタラクティブに編集することに慣れている人は多いです。 そういう方にとって、RやPythonなどの無味乾燥なGUIに物足りなさというか、壁を感じる方もいるかもしれません...
データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...
前回、精度やメモリ使用量、実行速度に応じたTPOTが用意した構成(Config.)を使う方法を説明しました。 構成名 内容 適用できる問題 Default TPOT 初期設定の構成です。 分類・回帰 TPOT light...
特徴量エンジニアリング(feature engineering)は、私がデータ分析を始めた20数年前から非常に重要なものでした。 特徴量(feature)とは、数理モデルの説明変数Xを指します。 ドメイン(データ活用の現...
Rにはディープラーニング関連のパッケージは色々あります。R独自のものから、そうでないものもあります。 ディープライニングで有名なKeras(TensorFlow)はRStudio(R)上で使うことができます。 前回は分類...