ビジネス系のデータ分析・活用(データサイエンス実践)の進め方は、業界や企業など応じて色々なものがあります。 正解というものはありません。正直、成果さえ出せればそれで良いのです。 私が社内向けのデータ分析・活用(データサイ...
データを手にしたとき、データの理解のために、とりあえずデータを集計してみるということは多いです。 かっこよく言うと「探索的データ分析」(Exploratory data analysis)の1つです。 なんだかんだ言って...
ビジネス活動でよく目にするのが、時系列データです。 この時系列データを使ったデータ分析・活用(データサイエンス実践)には、いくつかの種類があります。 時系列の異常検知 時系列の分類 時系列の予測 他にもありかもしれません...
データを手にしたとき、とりあえずデータを集計してみる、という業務はよく発生します。 データ集計ツールは世の中にたくさんあります。その中で手軽に集計するなら、Excelのピボットテーブルなどでしょう。 Excelのピボット...
今回はTPOTと代表的な機械学習アルゴリズムであるRandomForestとの比較をしてみます。 もう少し説明すると、AutoML(自動機械学習)を活用し自動で構築した数理モデル(パイプライン含む)と、データセットに対し...
単純な売上データも、ウェブサイトのアクセス状況も、工場などのセンサーから収集すされるデータも、時系列データです。 多くのビジネスの現場で発生するデータは、「時間軸」の概念の付与された時系列データです。 ビジネスの現場でデ...
予算などの計画値を考えるとき、前年と同じや前年比1.1倍みたいな立て方がたまにあります。 例えば…… 前年これぐらい使っているから、来年も前年と同じぐらいでいこう! 前年よりも売上を伸ばしたいから、今年は前年比1.1倍ぐ...
さて、TPOTは自動で特徴量生成と選択、モデル選択をしてくれます。 実際にどのような特徴量が作られ、どのモデルが使われたのか確認したいときがあります。 今回は、第3回で取り上げた分類問題を題材に、TPOTが生成した特徴量...
前回までで、第1回「BI(ビジネスインテリジェンス)ツールとは何?」および第2回「Power BI Desktop のインストールのインストール方法」について説明しました。 BI(ビジネスインテリジェンス)ツールで先ずす...
最近のデータ分析やモデル構築では、「予測を当てればいい!」という風潮もありますが、確かに当てるだけであれば、それで問題ないでしょう。 画像処理などの世界では、それでいいかもしれません。 ただ、ビジネス系のデータ分析の場合...
TPOTをはじめとした「自動機械学習」(AutoML)が実施するのは、以下の2点です。 変換器(特徴量の生成と選択)の生成 予測器(予測モデル)の生成 自動機械学習(AutoML)によっては、予測モデルの生成のみのものも...
最もシンプルなデータ活用の1つがABテストです。 A案とB案のどちらがいいのかをデータで判断する、という感じのデータ分析・活用(データサイエンス実践)です。 この地味な、データ分析・活用(データサイエンス実践)は、明日か...
Power BI とは…… 様々なデータソースからデータを取得し 取得したデータを加工し レポートの作成し 共有する まで一貫して行うことのできる、Microsoft 社から提供されているBI(Business Inte...
機械学習で構築した数理モデルが、ブラックボックス化するケースは少なくありません。 そのような中、最近よく聞くキーワードに「XAI」というものがあります。 XAIとは「Explainable Artificial Inte...
第3回と第4回ではTPOTの基本的な動かし方を学びました。 ただし、これだけでは学習済モデルを使って別のデータを予測することができません。 TPOTで学習した数理モデルを他のプログラムで使う方法を説明します。 ここでは第...
最近、BI(ビジネスインテリジェンス)ツールを導入する企業が増えています。 BIツールそのものは昔からありますが、最近ではTableauやQlik Sense、Power BIなどが有名です。Power BI Deskt...