Python Pywedge を使ったお手軽データビジュアライゼーション(データの可視化)

Python Pywedge を使ったお手軽データビジュアライゼーション(データの可視化)

Pywedgeとは、Pythonの便利なライブラリーの1つです。主に以下のようなことができます。

  • データビジュアライゼーション(データの可視化)
  • データの前処理支援
  • 機械学習のベースラインモデルの作成支援

ノンコードでGUIを使い plotly ベースのグラフなどを、さくっと作ることができます。

今回は、データビジュアライゼーション(データの可視化)について簡単に説明します。

Pywedge のインストール

Pywedgeは、コマンドプロンプトで以下のコマンドを実行しインストールします。

pip install pywedge

 

サンプルデータ

サンプルデータは、みんな大好きアヤメ(iris)のデータセットになります。

今回は、seabornアヤメ(iris)データセットを使います。

アヤメ(iris)のデータセットの概要については、以下を参照ください。どういったデータセットなのかを、ちょっとだけ説明しています。

■データセットの概要説明
「予測モデルは機械学習パイプライン化しよう(Python)
 https://www.salesanalytics.co.jp/datascience/datascience007/

 

必要なライブラリーの読み込み

以下、コードです。

# ライブラリーの読み込み
import pandas as pd
import pywedge as pw
import seaborn as sns

 

データセットの読み込み

以下、コードです。

# データセットの読み込み
df = sns.load_dataset("iris")
df #確認用

 

以下、実行結果です。

 

Pywedgeを使ったデータの可視化
(データビジュアライゼーション)

Pywedge_Chartsで可視化します。

Pywedge_Chartsでは、次の3つの設定をする必要があります。

  • 対象のデータセット(dataframe)
  • 可視化しない列(c)
  • 目的変数(y)

以下、コードです。

# Pywedgeでデータの可視化
mc = pw.Pywedge_Charts(df,
                       c=None,
                       y="species" )
chart = mc.make_charts()

 

以下、実行結果です。

 

タブでビジュアライゼーションのタイプを選び、その後に変数や色などを選択します。

今(2021年7月29日現在)は、ビジュアライゼーションのタイプは以下の8つです。

  • Scatter Plot(散布図)
  • Pie Chart(円グラフ)
  • Bar Plot(棒グラフ)
  • Violin Plot(バイオリンプロット)
  • Box Plot(箱ひげ図)
  • Distribution Plot(分布プロット)
  • Histgram(ヒストグラム)
  • Correlation plot(相関行列ヒートマップ)

興味のある方は、実際に手を動かして、どのような感じになるのか確かめてみたください。

 

まとめ

今回は、Pywedge を使ったお手軽データビジュアライゼーション(データの可視化)について簡単に説明しました。

Pywedgeは、主に以下のようなことができます。

  • データビジュアライゼーション(データの可視化)
  • データの前処理支援
  • 機械学習のベースラインモデルの作成支援

Pywedgeはどちらかと言うと、データビジュアライゼーションのツールとして使った方がいいでしょう。興味のある方はデータビジュアライゼーションのついでに、以下の記事を参考にモデル構築にチャレンジしてみてください。非常に簡単です。

Python Pywedge を使ったお手軽前処理・ベースモデル構築・ハイパーパラメータチューニング