データサイエンスの世界では、正確な分析と予測が成功の鍵となります。 しかし、多くの実際のデータセットは不均衡であり、これが特に分類問題において大きな課題となることがあります。 今回は、データ不均衡問題を解消するための強力...
機械学習のパイプラインとは、複数の処理を直列に連結したものです。 最小構成は、1つの変換器と1つの推定器(予測器)を連結したものです。 変換器:特徴量X(説明変数)などの欠測値処理や変数変換などの、特徴量変換(Trans...
機械学習のパイプラインとは、複数の処理を直列に連結したものです。 最小構成は、1つの変換器と1つの推定器(予測器)を連結したものです。 変換器:特徴量X(説明変数)などの欠測値処理や変数変換などの、特徴量変換(Trans...
データ分析における効率性と柔軟性は、高品質なインサイトを生み出す鍵です。 PythonのPandasライブラリはその強力な味方となりますが、その中でも特にapply関数とlambda式の組み合わせは、データサイエンスの作...
時系列予測モデルの、予測精度を向上させるために、外生変数(説明変数・特徴量)を利用することがあります。 例えば、需要予測のための価格や将来のプロモーション変数、電力負荷予測のための天気データなどです。 時系列データには、...
NeuralForecastは、時系列予測の分野で革新的な変化をもたらすツールです。 前回、NeuralForecastの概要について説明しました。 深層学習によるビジネス時系列分析ツール NeuralForecast(...
“データは新時代の石油” – この言葉が示すように、現代ビジネスにおけるデータの価値は計り知れません。 特に時系列予測は、ビジネスの成長と発展において中心的な役割を果たしています。 今...
Pandasは、データ分析にPythonを使うデータサイエンティストにとって、最もよく使われているツールの1つです。 GPU データフレームのライブラリーの1つに、pandasライクなRAPIDS cuDF(cuda b...
数理最適化と機械学習の融合は、ビジネスの意思決定に革命をもたらす可能性を秘めています。 具体的には、Scikit-learnで数理モデルを構築し、その数理モデルを目的変数としたSciPyを用い最適化問題を解きます。 例え...
今回は、数理最適化のさらに高度な領域である「整数最適化」と「組合せ最適化」に焦点を当てます。 これらの最適化手法は、現実の複雑な問題を解決するために広く用いられています。 有名なところでは、巡回セールスマン問題やナップサ...