ノンコードでビジネスデータ分析を可能にするRパッケージRadiant
その4-2(RadiantでEDA – ピボット集計)

ノンコードでビジネスデータ分析を可能にするRパッケージRadiantその4-2(RadiantでEDA – ピボット集計)

データ分析や予測モデル構築などをやってみたいが……

  • RPythonだとの無料ツールはコーディングスキルがそれなりに必要になりハードルがある
  • 有料ツールのSASSPSSなどは使いやすそうだけど高額すぎる。

無料で使える使いやすさが有料級の分析ツールはないだろうか?

と言うことで、Radiantです。

Radiantは、ノンコードでビジネスデータ分析を可能にする無料で使える有料級Rパッケージです。

  • その1:Radiantのインストール・起動・終了
  • その2:Radiantのデータ読み込み
  • その3:Radiantでデータ抽出(絞り込み)
  • その4:RadiantでEDA(探索的データ分析)
    • その4-1 グラフ作成
    • その4-2 ピボット集計 ⇒ 今回
    • その4-3 記述統計量
  • その5:Radiantで予測モデル構築

前回は、その4-1の「グラフ作成」について簡単に説明しました。

ノンコードでビジネスデータ分析を可能にするRパッケージRadiantその4-1(RadiantでEDA – グラフ作成)

今回は、その4の「RadiantでEDA(探索的データ分析)」の「その4-2 ピボット集計」について簡単に説明します。

取り急ぎRadiantを起動

以下、コードです。

# 必要パッケージのロード
library(radiant)

# radiantの起動
radiant()

 

サンプルデータ

サンプルデータは、Radiantのサンプルデータである「diamonds」をそのまま使います。

  • price: price in US dollars
  • carat: weight of the diamond
  • clarity: measurement of how clear the diamond
  • cut: quality of the cut
  • color: diamond color
  • depth: total depth percentage
  • table: width of top of diamond relative to widest point
  • x: length in mm
  • y: width in mm
  • z: depth in mm

 

ピボット集計画面(Pivot)

データセットを読み込み、データ理解のために実施することと言えば……

  • 読み込んだデータそのものを眺める
  • データをグラフ化し視覚的に理解する
  • データを色々な軸で集計し特徴を掴む

……などがあげられることでしょう。前回と前々回に、読み込んだデータそのものを眺めるお話しと、データのグラフ化のお話しをしました。今回は、集計です。

Radiantのメニューにある「Pivot」ボタンをクリックすると、集計用の画面が現れ、色々な軸でデータを集計することができます。

 

集計用の画面で設定する主な内容

集計用の画面で主に設定する内容です。

  • Categorical variables:集計軸の設定(カテゴリカル変数)
  • Numeric variable:集計対象の設定(数値変数)
  • Apply function:集計方法の設定(カウント、平均、など)
  • Normalize by:正規化の設定(ヨコ計で割る or タテ計で割る or 全体計で割る)
  • Conditional formatting:集計結果のテーブルのセルの表現設定
  • Show table:集計結果をテーブル表現する場合に✔を入れる
  • Show plot:集計結果をグラフ表現する場合に✔を入れる

 

簡単なピボット集計例

以下、簡単なピボット集計例です。

  • Categorical variables:clarity、cut
  • Numeric variable:price
  • Apply function:mean
  • Normalize by:None
  • Conditional formatting:Color bar
  • Show table:✔
  • Show plot:✔

 

次回

今回は、その4の「RadiantでEDA(探索的データ分析)」の「その4-2 ピボット集計について簡単に説明しました。

  • その1:Radiantのインストール・起動・終了
  • その2:Radiantのデータ読み込み
  • その3:Radiantでデータ抽出(絞り込み)
  • その4:RadiantでEDA(探索的データ分析)
    • その4-1 グラフ作成
    • その4-2 ピボット集計
    • その4-3 記述統計量 ⇒ 次回
  • その5:Radiantで予測モデル構築

次回は、その4の「RadiantでEDA(探索的データ分析)」の「その4-3 記述統計量について説明します。

https://www.salesanalytics.co.jp/datascience/datascience035/