TPOTをはじめとした「自動機械学習」(AutoML)が実施するのは、以下の2点です。 変換器(特徴量の生成と選択)の生成 予測器(予測モデル)の生成 自動機械学習(AutoML)によっては、予測モデルの生成のみのものも...
最もシンプルなデータ活用の1つがABテストです。 A案とB案のどちらがいいのかをデータで判断する、という感じのデータ分析・活用(データサイエンス実践)です。 この地味な、データ分析・活用(データサイエンス実践)は、明日か...
Power BI とは…… 様々なデータソースからデータを取得し 取得したデータを加工し レポートの作成し 共有する まで一貫して行うことのできる、Microsoft 社から提供されているBI(Business Inte...
機械学習で構築した数理モデルが、ブラックボックス化するケースは少なくありません。 そのような中、最近よく聞くキーワードに「XAI」というものがあります。 XAIとは「Explainable Artificial Inte...
第3回と第4回ではTPOTの基本的な動かし方を学びました。 ただし、これだけでは学習済モデルを使って別のデータを予測することができません。 TPOTで学習した数理モデルを他のプログラムで使う方法を説明します。 ここでは第...
最近、BI(ビジネスインテリジェンス)ツールを導入する企業が増えています。 BIツールそのものは昔からありますが、最近ではTableauやQlik Sense、Power BIなどが有名です。Power BI Deskt...
ここ数年、色々なAutoML(自動機械学習)が登場してきました。 有料版で勢いがあるのがDataRobotです。GoogleもIBMもMicrosoftなどでもAutoMLサービスを提供しています。 国内でもSONYのP...
あなたはデータを活用し、利益を生み出しつづけていますか? どうであろうかと思われた方は、財務諸表を見るといいでしょう。 財務諸表と聞くと大げさな感じがしますが、要は売上や利益、コストなどを見るといいということです。 上手...
TPOTは分類と回帰の問題を解くことができます。 前回の第3回は分類問題を扱いました。 今回は回帰問題に挑戦します。前回同様JupyterNotebookを使います説明しています。 回帰問題ですので、目的変数Yは…… 受...
せっかく、データ集計したり分析したり、予測モデルを作って予測値をアウトプットしても、現場で活用されないことは多々あります。 現場でのデータ活用の可能性の高め方は、色々なやり方があります。 その中で、私が最重要だと感じてい...
第2回で、TPOTを使う事前準備が終わりました。今回はいよいよ実際にTPOTでAutoMLを体験します。 TPOTは分類と回帰の問題を解くことができます。Jupyter Notebookを使いますので、WindowsもM...
データ分析・活用(データサイエンス実践)の「テーマ設定」の流れについて簡単に説明します。 テーマ設定の入口は、現場の「お困りごと」(問題)です 出口は、テーマ選定マトリクスを使ったテーマ候補の評価結果です その評価結果を...
ビジネス必須のスキルとしてロジカルシンキングというものがあります。 系統図法という名称で呼ばれていたもので、昔から日本の製造業で使われていたQC7つ道具の1つです。 ロジカルシンキングでは、系統図と呼ばれるロジックツリー...
TPOTとは? TPOT(http://epistasislab.github.io/tpot/)とは、pythonのライブラリのひとつです。 分類問題と回帰問題を解くことができます。 ペンシルバニア大学のRandal ...
データによる継続的改善を実現するには、どのような仕組みを作ればいいのでしょうか。 このような話しをすると、クラウドなどのアーキテクチャー(システムの設計思想)を思い浮かべる方もいますが、ここでお話しするのはもっとシンプル...
ビジネス系のデータ分析・活用(データサイエンス実践)を「ビジネスアナリティクス」という用語で表現したりします。 このビジネスアナリティクスは、ざっくりと「商品力を高めるアナリティクス」と「販売力を高めるアナリティクス」に...