[For beginners] がんばれデータサイエンティスト!

PythonのAutoFeatを使った自動特徴量エンジニアリング<br>(Automatic Feature Engineering)その2(分類問題)

PythonのAutoFeatを使った自動特徴量エンジニアリング
(Automatic Feature Engineering)その2(分類問題)

数理モデルを作る上で特徴量エンジニアリング(Feature Engineering)は地味に重要です。 例えば、より精度の高い予測モデルを構築したいのであれば、アルゴリズムのパラメータチューニングとともに特徴量エンジニア...
PythonのAutoFeatを使った自動特徴量エンジニアリング<br>(Automatic Feature Engineering)その1(回帰問題)

PythonのAutoFeatを使った自動特徴量エンジニアリング
(Automatic Feature Engineering)その1(回帰問題)

数理モデルを作る上で特徴量エンジニアリング(Feature Engineering)は地味に重要です。 例えば、より精度の高い予測モデルを構築したいのであれば、アルゴリズムのパラメータチューニングとともに特徴量エンジニア...
RでExcel風にインタラクティブにデータ編集するGUIパッケージ「DataEditR」

RでExcel風にインタラクティブにデータ編集するGUIパッケージ「DataEditR」

Excelのワークシートで、データセットを眺めたりインタラクティブに編集することに慣れている人は多いです。 そういう方にとって、RやPythonなどの無味乾燥なGUIに物足りなさというか、壁を感じる方もいるかもしれません...
RStudio(R)×Keras(TensorFlow)によるお手軽ディープラーニングその2(回帰問題)

RStudio(R)×Keras(TensorFlow)によるお手軽ディープラーニングその2(回帰問題)

Rにはディープラーニング関連のパッケージは色々あります。R独自のものから、そうでないものもあります。 ディープライニングで有名なKeras(TensorFlow)はRStudio(R)上で使うことができます。 前回は分類...
比較的よく使うPandas Query(クエリ―)の簡単な条件指定例(Python)

比較的よく使うPandas Query(クエリ―)の簡単な条件指定例(Python)

PythonでEDA(探索的データ分析)を実施するとき、PandasのQuery(クエリ―)を使う方も多いことでしょう。 ここで紹介するQuery(クエリ―)は、Pandasの関数の1つで、データフレームに対し条件抽出す...
Rでシンプル半自動EDA(探索的データ分析)

Rでシンプル半自動EDA(探索的データ分析)

データセットを手にしたら、最初に実施するのがEDA(探索的データ分析)です。 端的に言うと、データと仲良くなるための会話です。 EDA(探索的データ分析)はほぼ半分は似たような分析を実施します。EDA(探索的データ分析)...
便利だけど分かりにくい<br>データフレームを再構築するPandasのMelt()関数のお話し

便利だけど分かりにくい
データフレームを再構築するPandasのMelt()関数のお話し

RだろうがPythonだろうが、データフレームを再構築することは少なくないでしょう。 例えば…… 縦持ち(Long)のデータフレームを、横持ち(Wide)のデータフレームに再構築 横持ち(Wide)のデータフレームを、縦...
2行追加するだけでPython Pandasを高速化するPandarallel

2行追加するだけでPython Pandasを高速化するPandarallel

Pythonでデータ分析をするとき、Pandasを使わない人はいないぐらいです。 Pandasの幾つかの機能を高速化するライブラリーがあります。 計算処理を並列化するPandaralellです。 ただ、すべての処理が高速...
Python PandasGUI(ノーコードEDA)で<br>Excelっぽい感じでグラフィカルにEDA(探索的データ分析)

Python PandasGUI(ノーコードEDA)で
Excelっぽい感じでグラフィカルにEDA(探索的データ分析)

データ分析を実施するとき、必ずと言っていいほど実施するのが、EDA(探索的データ分析)です。 Pythonだと、Pandasを使いEDAを実施する人も、多いのではないでしょうか。しかし、PythonでEDAを実施する場合...