Pythonで学ぶコレスポンデンス分析入門
— 第1回 —
クロス集計表の「その先」へ ― コレスポンデンス分析って何？

私たちの身の回りには、数字では表せないデータがたくさんあります。たとえば「好きな食べ物は何ですか？」という質問に対する答えは、「カレー」や「パスタ」といった名前で表されるもので、平均を取ったり計算したりすることはできま...

f-stringだけじゃない！Python文字列フォーマットの小技

Pythonで文字列を扱うとき、多くの人が「f-string」を使っています。しかし、f-stringのフォーマット指定子を使いこなせば、データ分析のレポート作成や数値の表示が格段に楽になります。今回は、f-stri...

ある学習塾で、新しい教材Bを試験的に導入しました。 1ヶ月後、従来の教材Aを使ったクラスと、新教材Bを使ったクラスのテスト結果を比較したところ、次のような結果が得られました。教材Aクラス（25人）：平均68点教材Bク...

ある大学で「学生の1日の平均勉強時間」を調べたいとします。学生が1万人いるとしたら、全員にアンケートを取るのは現実的でしょうか？時間もコストも膨大にかかりますし、全員から回答を得るのは事実上不可能です。そこで私たち...

これまでの2回では、1つの変数について「代表値」や「ばらつき」を分析してきました。第1回：データの「代表値」を掴む — 平均・中央値・最頻値の話第2回：データの「ばらつき」を測る — 分散と標準偏差しかし、現実のデ...

前回、データを一つの数字で代表させる「代表値」を学びました。 Pythonで動かして身につける統計学はじめの一歩— 第1回 —データの「代表値」を掴む — 平均・中央値・最頻値の話しかし、平均...

友人から「最近のテストどうだった？」と聞かれたとき、あなたはどう答えますか？「数学85点、英語72点、物理78点、化学80点だったよ」と全科目を列挙する人は少ないでしょう。多くの人は「だいたい80点くらいかな」と答え...

こんにちは！「Pythonで始める分類モデル入門」もいよいよ最終回です。第1回 —分類問題ってなに？ロジスティック回帰で「合格予測」を作ろう第2回 —データの「形」から分ける — 線形判別分...

機械学習プロジェクトでは、「データの前処理」と「モデルの学習」を何度も繰り返します。このとき、前処理とモデルを別々に管理していると、コードが複雑になり、ミスも起きやすくなります。そこで活躍するのが scikit-le...

こんにちは！「Pythonで始める分類モデル入門」の第4回です。前回は決定木を学びました。 Pythonで始める分類モデル入門— 第3回 —「もし〜なら」で分ける — 決定木の仕組みと過学習対策...