• Slide image
  • Slide image
  • Slide image

Sales Analytics, Co., Ltd.

データ分析・活用支援カンパニー

データ分析・活用支援カンパニー
株式会社セールスアナリティクス

RECENT ARTICLES

パイプラインに使う関数を指定し<br>AutoML【TPOT】構成(Config.)をカスタマイズ

パイプラインに使う関数を指定し
AutoML【TPOT】構成(Config.)をカスタマイズ

前回、精度やメモリ使用量、実行速度に応じたTPOTが用意した構成(Config.)を使う方法を説明しました。 構成名 内容 適用できる問題 Default TPOT 初期設定の構成です。 分類・回帰 TPOT light...
第232話|3タイプの特徴量エンジニアリング(feature engineering)基礎テクニック

第232話|3タイプの特徴量エンジニアリング(feature engineering)基礎テクニック

特徴量エンジニアリング(feature engineering)は、私がデータ分析を始めた20数年前から非常に重要なものでした。 特徴量(feature)とは、数理モデルの説明変数Xを指します。 ドメイン(データ活用の現...
RStudio(R)×Keras(TensorFlow)によるお手軽ディープラーニング(回帰問題)

RStudio(R)×Keras(TensorFlow)によるお手軽ディープラーニング(回帰問題)

Rにはディープラーニング関連のパッケージは色々あります。R独自のものから、そうでないものもあります。 ディープライニングで有名なKeras(TensorFlow)はRStudio(R)上で使うことができます。 前回は分類...
STEP 3(分析)その3-2|ヒストグラム・管理図・散布図<br>– 古くて新しいQC7つ道具 –

STEP 3(分析)その3-2|ヒストグラム・管理図・散布図
– 古くて新しいQC7つ道具 –

データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...
比較的よく使うPandas Query(クエリ―)の簡単な条件指定例(Python)

比較的よく使うPandas Query(クエリ―)の簡単な条件指定例(Python)

PythonでEDA(探索的データ分析)を実施するとき、PandasのQuery(クエリ―)を使う方も多いことでしょう。 ここで紹介するQuery(クエリ―)は、Pandasの関数の1つで、データフレームに対し条件抽出す...
スピード or 精度、何を重視する?<br>AutoML【TPOT】の6構成(Config.)

スピード or 精度、何を重視する?
AutoML【TPOT】の6構成(Config.)

TPOTでは、あらかじめパイプラインに使う変換器やアルゴリズム、探索するパラメータの範囲が決まっています。 しかし、あまり探索に時間をかけたくないときや単純な変換器・アルゴリズムを使いたいときがあると思います。 逆に時間...
STEP 3(分析)その3-1|QC7つ道具の概要<br>– 古くて新しいQC7つ道具 –

STEP 3(分析)その3-1|QC7つ道具の概要
– 古くて新しいQC7つ道具 –

データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...
Rでシンプル半自動EDA(探索的データ分析)

Rでシンプル半自動EDA(探索的データ分析)

データセットを手にしたら、最初に実施するのがEDA(探索的データ分析)です。 端的に言うと、データと仲良くなるための会話です。 EDA(探索的データ分析)はほぼ半分は似たような分析を実施します。EDA(探索的データ分析)...
第230話|売上などの数値予測は少なくとも9つのシナリオで実施する

第230話|売上などの数値予測は少なくとも9つのシナリオで実施する

ビジネスの現場で売上などの数値を予測することは多いでしょう。 例えば、予測モデルを構築し予測したり、例年踏襲型で数値を予測したりします。 例年踏襲型とは、昨年と同額もしくは昨対比10%UPみたいな感じの予測というものです...
Power BI Desktop で Wikipedia データからレポート作成

Power BI Desktop で Wikipedia データからレポート作成

BI(ビジネスインテリジェンス)ツールで先ずすべきは、外部にあるデータの読み込み(データ取得)です。 前回は、Web上のデータを取得する方法と簡単なデータ加工について説明しました。 Web上にあるデータを取り込んだら、加...
便利だけど分かりにくい<br>データフレームを再構築するPandasのMelt()関数のお話し

便利だけど分かりにくい
データフレームを再構築するPandasのMelt()関数のお話し

RだろうがPythonだろうが、データフレームを再構築することは少なくないでしょう。 例えば…… 縦持ち(Long)のデータフレームを、横持ち(Wide)のデータフレームに再構築 横持ち(Wide)のデータフレームを、縦...
STEP 3(分析)その2|分析の基本は比較

STEP 3(分析)その2|分析の基本は比較

データを集めたら、次にデータを分析しなければなりません。 集めたデータと分析の関係は、食材と料理の関係に似ています。良い食材であっても料理人の腕に問題があると台無しになることがあります。不十分な食材でも調理しだいで美味し...
2行追加するだけでPython Pandasを高速化するPandarallel

2行追加するだけでPython Pandasを高速化するPandarallel

Pythonでデータ分析をするとき、Pandasを使わない人はいないぐらいです。 Pandasの幾つかの機能を高速化するライブラリーがあります。 計算処理を並列化するPandaralellです。 ただ、すべての処理が高速...
第229話|「相関」は曲がったことが大っ嫌い

第229話|「相関」は曲がったことが大っ嫌い

データ分析では、よく数理統計学の手法が使われます。 その中で、比較的高頻度で登場するのが「相関分析」です。 2つの変量の間の関係性を見るものです。 今回は、「『相関』は曲がったことが大っ嫌い」というお話しをします。 相関...