[For beginners] がんばれデータサイエンティスト!

Pythonで学ぶ クラスター分析入門<br>— 第1回 —<br>「似てる」を数値化しよう ― 距離の考え方

Pythonで学ぶ クラスター分析入門
— 第1回 —
「似てる」を数値化しよう ― 距離の考え方

あなたは今日、無意識のうちに何回「似たものをまとめる」という行動をしたでしょうか。 朝起きてクローゼットを開ければ、シャツはシャツ、パンツはパンツでまとまっています。 本棚を見れば、小説、技術書、漫画がそれぞれのエリアに...
Pythonで体感する次元削減入門 – PCAと因子分析の基礎のキソ<br>— 第3回 —<br>次元はいくつ残す? 寄与率とスクリープロットの読み方

Pythonで体感する次元削減入門 – PCAと因子分析の基礎のキソ
— 第3回 —
次元はいくつ残す? 寄与率とスクリープロットの読み方

前回は、共分散行列の固有値分解によって「主成分の方向」と「その方向での分散」が求まることを学びました。 Pythonで体感する次元削減入門 – PCAと因子分析の基礎のキソ— 第2回 —...
Pythonで体感する次元削減入門 – PCAと因子分析の基礎のキソ<br>— 第2回 —<br>PCAのしくみを分散・共分散・固有値分解で理解する

Pythonで体感する次元削減入門 – PCAと因子分析の基礎のキソ
— 第2回 —
PCAのしくみを分散・共分散・固有値分解で理解する

前回は、「次元削減」の考え方と、PCAの基本的なアイデアをお話しいたしました。 具体的には、2次元の従業員評価データを使って、様々な角度に射影したときの分散を計算し、「データが最も広がっている方向」を探しました。 Pyt...
Pythonで体感する次元削減入門 – PCAと因子分析の基礎のキソ<br>— 第1回 —<br>なぜ「次元を減らす」のか? 情報の海で溺れないために

Pythonで体感する次元削減入門 – PCAと因子分析の基礎のキソ
— 第1回 —
なぜ「次元を減らす」のか? 情報の海で溺れないために

私たちは日々、膨大な情報に囲まれて生活しています。 スマートフォンには何百ものアプリがあり、ニュースサイトには無数の記事があふれ、SNSでは毎秒新しい投稿が生まれています。 この情報の洪水の中で、私たちは無意識のうちに「...