データ分析やデータサイエンス、機器学習などを絡めた業務を実施するとき、どうしてもツールが必要になります。
代表的なツールはPyhtonやRなどのフリーのものでしょう。
無料で使えるのはいいのですが、プログラミング言語を覚え使いこなすというハードルがあります。
実務でデータ活用する上で、このハードルは低いものではなく、ある程度のレベルに到達する時間がそれなりにかかります。
であれば、ノンコードな分析ツールを使って、さくっとデータ活用してもいいでしょう。
今回は、「惜しむことなくノンコードな分析ツールを使い倒そう!」というお話しです。
Excelアドイン「データ分析」
Excelはもっとも身近なデータ分析ツールでしょう。
Excelの凄いところは、Excelであれば現場の人が使ってくれるというハードの低さです。
他の分析ツールの方が簡単であっても、Excelをメインにした方が組織内に圧倒的に浸透し易いです。
最近のExcelには、それなりのデータ分析機能が最初からついています。
例えば、Excelに「データ分析」というアドインが標準的に備わっており、いつでもデータ分析できる状態になっています。
ただ、Excelアドイン「データ分析」は、Excelのアドインの設定画面で有効にしなければ使えません。
基本統計量や相関係数行例の出力、分散分析や差の検定、回帰分析などを実施することができます。もちろんノンコードです。
数式に強い方は、Excelアドイン「ソルバー」の機能を使うことで、色々な数理モデルを構築することができます。例えば、Excelアドイン「データ分析」に実装されていなかった、ロジスティック回帰やポアソン回帰、Ridge回帰などです。
ノンコードでビジネスデータ分析を実現する R Radiant
データサイエンティストがよく使うツールの1つに、Rというものがあります。
通常はR言語を覚えなければ使うことができません。
このR言語は、数日で覚え使いこなせるほど簡単なものではありません。
そのためなのかは知りませんが、Rコマンダー (R Commander) というGUI(グラフィカルユーザインターフェース)上で、マウス操作でデータ分析できる環境が登場しました。
Rコマンダー (R Commander) は、Rのパッケージの1つです。要するに、Rをインストール後にこのパッケージをインストールし実行させれば、GUIベースの分析環境が起動します。
最近では、ビジネスデータ分析用のパッケージとして、R Radiantというものが登場しました。
R Radiant
https://github.com/radiant-rstats/radiant
R Radiantは、Webブラウザ上でマウス操作で分析していくツールです。裏でRが実行されています。
ビジネス系のデータ分析で必要な機能が一通り揃っています。例えば、データ加工や可視化、ピボットテーブル、統計モデル、多変量解析などです。
R Radiantのインストールから最低限の使い方を、以下の記事にまとめていますので、気になる方は参考にして頂ければと思います。
[For beginners] がんばれデータサイエンティスト!ノンコードで ビジネスデータ 分析を可能にするRパッケージ Radiant
ちなみに、R Radiantの中に機械学習でよく登場するアルゴリズムが実装されています。例えば、線形回帰やロジスティック回帰、ニューラルネット、ランダムフォレスト、XGBoostなどです。
もう少し、アルゴリズムの種類が欲しいところですし、チューニングできるパラメータももう少し増やし欲しいところですし、モデル構築するときにサクッと学習データとテストデータに分けたりクロスバリデーション(交差検証)などを実施したいところです。
ノンコードで機械学習モデリングを実現する H2O Flow
H2O(エイチツーオー)は、H2O.ai社によって開発された機械学習プラットフォームです。
H2O
https://www.h2o.ai/products/h2o/
その中に、ノンコードで機械学習モデルを構築することのできるH2O FlowというGUIでモデル構築できる環境が用意されています。
このH2O Flow上で、機械学習系の数理モデルを構築することができます。
機械学習系の数理モデルを構築で必要な機能は一通り揃っていますし、アルゴリズムの細かいパラメータ調整もできます。
さらに嬉しいことに、AutoML(自動機械学習)機能があるため、面倒なパラメータ調整などを全自動で実施しモデル構築してくれる機能がついています。
H2O Flowのインストールなどを、以下の記事に記載していますので、気になる方は参考にして頂ければと思います。
ちなみに、H2Oの機能はRやPythonから使うことができます。
今回のまとめ
今回は、「惜しむことなくノンコードな分析ツールを使い倒そう!」というお話しをしました。
データ分析やデータサイエンス、機器学習などを絡めた業務を実施するとき、どうしてもツールが必要になります。
代表的なツールはPyhtonやRなどのフリーのものでしょう。無料で使えるのはいいのですが、プログラミング言語を覚え使いこなすというハードルがあります。
であれば、ノンコードな分析ツールを使って、さくっとデータ活用し成果を出した方ががいいでしょう。
例えば……
- Excelアドイン「データ分析」(+「ソルバー」)
- ノンコードでビジネスデータ分析を実現する R Radiant
- ノンコードで機械学習モデリングを実現する H2O Flow
興味のある方は試していてください。