らくらくビジネスデータサイエンス
無料ツールでさくっとデータ分析し成果をだそう!

RECENT ARTICLES

PythonのAutoFeatを使った自動特徴量エンジニアリング<br>(Automatic Feature Engineering)その3(特徴量選択だけ使う)

PythonのAutoFeatを使った自動特徴量エンジニアリング
(Automatic Feature Engineering)その3(特徴量選択だけ使う)

Pythonに幾つかの自動特徴量エンジニアリング(Automatic Feature Engineering)のためのパッケージがあります。 その中の1つに「AutoFeat」というものがあります。回帰問題と分類問題で利...
STEP 3(分析)その3-4|パレート図・特性要因図<br>– 古くて新しいQC7つ道具 –

STEP 3(分析)その3-4|パレート図・特性要因図
– 古くて新しいQC7つ道具 –

データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...
PythonのAutoFeatを使った自動特徴量エンジニアリング<br>(Automatic Feature Engineering)その2(分類問題)

PythonのAutoFeatを使った自動特徴量エンジニアリング
(Automatic Feature Engineering)その2(分類問題)

数理モデルを作る上で特徴量エンジニアリング(Feature Engineering)は地味に重要です。 例えば、より精度の高い予測モデルを構築したいのであれば、アルゴリズムのパラメータチューニングとともに特徴量エンジニア...
第233話|課題発見型データ分析と課題解決型データ分析

第233話|課題発見型データ分析と課題解決型データ分析

データ分析といっても色々なものがありますし、分類の仕方も様々です。 明確に区別すべき2つのデータ分析があります。 それは…… 課題発見型データ分析 課題解決型データ分析 今回は、「課題発見型データ分析と課題解決型データ分...
PythonのAutoFeatを使った自動特徴量エンジニアリング<br>(Automatic Feature Engineering)その1(回帰問題)

PythonのAutoFeatを使った自動特徴量エンジニアリング
(Automatic Feature Engineering)その1(回帰問題)

数理モデルを作る上で特徴量エンジニアリング(Feature Engineering)は地味に重要です。 例えば、より精度の高い予測モデルを構築したいのであれば、アルゴリズムのパラメータチューニングとともに特徴量エンジニア...
RでExcel風にインタラクティブにデータ編集するGUIパッケージ「DataEditR」

RでExcel風にインタラクティブにデータ編集するGUIパッケージ「DataEditR」

Excelのワークシートで、データセットを眺めたりインタラクティブに編集することに慣れている人は多いです。 そういう方にとって、RやPythonなどの無味乾燥なGUIに物足りなさというか、壁を感じる方もいるかもしれません...
STEP 3(分析)その3-3|散布図+α(相関・回帰線)の話題<br>– 古くて新しいQC7つ道具 –

STEP 3(分析)その3-3|散布図+α(相関・回帰線)の話題
– 古くて新しいQC7つ道具 –

データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...
パイプラインに使う関数を指定し<br>AutoML【TPOT】構成(Config.)をカスタマイズ

パイプラインに使う関数を指定し
AutoML【TPOT】構成(Config.)をカスタマイズ

前回、精度やメモリ使用量、実行速度に応じたTPOTが用意した構成(Config.)を使う方法を説明しました。 構成名 内容 適用できる問題 Default TPOT 初期設定の構成です。 分類・回帰 TPOT light...
第232話|3タイプの特徴量エンジニアリング(feature engineering)基礎テクニック

第232話|3タイプの特徴量エンジニアリング(feature engineering)基礎テクニック

特徴量エンジニアリング(feature engineering)は、私がデータ分析を始めた20数年前から非常に重要なものでした。 特徴量(feature)とは、数理モデルの説明変数Xを指します。 ドメイン(データ活用の現...
RStudio(R)×Keras(TensorFlow)によるお手軽ディープラーニングその2(回帰問題)

RStudio(R)×Keras(TensorFlow)によるお手軽ディープラーニングその2(回帰問題)

Rにはディープラーニング関連のパッケージは色々あります。R独自のものから、そうでないものもあります。 ディープライニングで有名なKeras(TensorFlow)はRStudio(R)上で使うことができます。 前回は分類...
STEP 3(分析)その3-2|ヒストグラム・管理図・散布図<br>– 古くて新しいQC7つ道具 –

STEP 3(分析)その3-2|ヒストグラム・管理図・散布図
– 古くて新しいQC7つ道具 –

データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...
比較的よく使うPandas Query(クエリ―)の簡単な条件指定例(Python)

比較的よく使うPandas Query(クエリ―)の簡単な条件指定例(Python)

PythonでEDA(探索的データ分析)を実施するとき、PandasのQuery(クエリ―)を使う方も多いことでしょう。 ここで紹介するQuery(クエリ―)は、Pandasの関数の1つで、データフレームに対し条件抽出す...
スピード or 精度、何を重視する?<br>AutoML【TPOT】の6構成(Config.)

スピード or 精度、何を重視する?
AutoML【TPOT】の6構成(Config.)

TPOTでは、あらかじめパイプラインに使う変換器やアルゴリズム、探索するパラメータの範囲が決まっています。 しかし、あまり探索に時間をかけたくないときや単純な変換器・アルゴリズムを使いたいときがあると思います。 逆に時間...
STEP 3(分析)その3-1|QC7つ道具の概要<br>– 古くて新しいQC7つ道具 –

STEP 3(分析)その3-1|QC7つ道具の概要
– 古くて新しいQC7つ道具 –

データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...