世上最生動的 PCA

直觀理解並應用主成分分析

李孟(Lee Meng)
2 min readJan 6, 2020
文中會分享實際分析線上遊戲《英雄聯盟》數據的 PCA 案例

萬物皆向量的時代,能夠了解事物本質的能力變得前所未有地重要。

主成分分析(Principal Component Analysis, 後簡稱為 PCA)在 100 年前由英國數學家卡爾·皮爾森發明,是一個至今仍在機器學習與統計學領域中被廣泛用來分析資料、降低數據維度以及去關聯線性降維方法。

因為其歷史悠久且相較其他降維手法簡單,網路上已有不少優質的機器學習課程以及部落格探討其概念。在這篇文章裡,我則將透過 Manim 動畫、NumPy 以及 scikit-learn,跟你一起用這世上最直觀的角度重新體會 PCA 之美以及其背後關鍵的線性代數(Linear Algrbra)統計(Statistic)精神。

我們後面會看到將共變異數矩陣視為一線性轉換並套用到數據上會增強其變異趨勢

閱讀完本文,我相信你將能夠:

  • 直觀且正確地理解 PCA 並欣賞其背後美麗的數學概念
  • 了解如何運用 PCA 分析個人遇到的問題或是企業數據
  • 具備能夠深入了解相關機器學習領域的基礎

希望你跟我一樣迫不及待地想要開始了!如同以往,這篇文章也是長到無法順利導入 Medium。還請前往我的部落格繼續閱讀此篇文章。沒有廣告,只有更好的閱讀體驗。我們那邊見!

文章連結:

https://leemeng.tw/essence-of-principal-component-analysis.html

--

--

李孟(Lee Meng)

資料科學家,現居東京。軟體工程出身,最近努力學習資料科學並加以應用。 假日在東京市區騎著腳踏車冒險、尋找美食。懶得動的時候就待在咖啡廳寫寫程式