[For beginners] がんばれデータサイエンティスト!

欠損値処理シリーズ 第6回:<br>単変量補完② — 平均・中央値・最頻値での補完

欠損値処理シリーズ 第6回:
単変量補完② — 平均・中央値・最頻値での補完

第5回で、欠損値を「決まった値」で埋める定数補完についてお話ししました。 そこで、age をゼロで埋めると分布が不自然に歪む様子を見ました。 その問題を解決するのが、今回扱う 平均値・中央値・最頻値による補完 です。 こ...
欠損値処理シリーズ 第5回:<br>単変量補完① — 定数・任意値での補完(pandas と SimpleImputer)

欠損値処理シリーズ 第5回:
単変量補完① — 定数・任意値での補完(pandas と SimpleImputer)

第3回・第4回では「欠損のある行や列を削除する」戦略を紹介しました。 今回からはいよいよ、欠損値処理のもう一つの大きな柱である 補完(imputation) に入っていきます。 補完にはさまざまな方法がありますが、まず押...