あなたは、AI(機械学習モデル)が下した判断に対して「なぜその結論になったの?」と疑問を持ったことはありませんか。 近年、機械学習やディープラーニングの技術が急速に発展し、AIは驚くほど高い精度で予測や分類を行えるように...
前回は、NumPyとPandasを使って大規模なデータを効率的に処理する方法を学びました。 Python入門とデータ処理の基礎第2回 – NumPyとPandasによるデータ操作 数万件のデータも瞬時に集計で...
前回は、Pythonの基本的な文法を学びました。 変数の使い方、条件分岐、繰り返し処理、そして関数の作り方など、プログラミングの基礎となる重要な概念を身につけることができました。 Python入門とデータ処理の基礎第1回...
まず、「プログラミング」とは何でしょうか。 プログラミングとは、コンピュータに「これをやってください」と指示を出すことです。 ただし、コンピュータは日本語を理解できません。そこで、コンピュータが理解できる特別な言葉、つま...
日々の売上やアクセス数といった時系列データは、ノイズや季節性の影響で「本当の流れ」が見えにくくなりがちです。 そんなときに役立つのが 移動平均(Moving Average)です。 シンプルながら、データのトレンドや周期...
これまでの2回の記事で、アップリフト分析の基礎とその可視化方法についてお話ししてきました。 第1回ではTwo-Model法を用いてアップリフトスコアを計算する方法を説明しました。 第2回では累積効果曲線やQini曲線を通...
データ分析をしていると、「数万行のデータなのに集計が遅い」「メモリ不足でエラーが出る」といった問題に直面することがあります。 実は、これらの問題の多くは、データ型を適切に設定するだけで解決できることをご存知でしょうか。 ...
前回の第1回の記事では、Two-Model法を用いてアップリフトスコアを計算する方法を学びました。 前回出力したアップリフトスコアの数値の羅列だけでは、どの顧客にアプローチすべきか、モデルがどの程度うまく機能しているかを...
ECサイトやアプリケーションでクーポンを配布したところ、売上が20%向上したという報告を受けたとします。 一見すると施策は成功のように思えますが、ここで重要な疑問が生じます。「そのお客様は、クーポンがなくても購入していた...
Python で時系列予測といえば Prophet。 しかし実務では、データ前処理やハイパーパラメータ調整、追加説明変数(外生変数)との組み合わせが欠かせません。 今回は Prophet を scikit-learn の...