因為要算協(xié)方差。單純的線性變換只是產(chǎn)生了倍數(shù)縮放,無法消除量綱對協(xié)方差的影響,而協(xié)方差是為了讓投影后方差最大。
在統(tǒng)計學(xué)中,主成分分析(PCA)是-種簡化數(shù)據(jù)集的技術(shù)。它是一個線性變換。
這個變換把數(shù)據(jù)變換,到一個新的坐標系統(tǒng)中,使得任何數(shù)據(jù)投影的第- -大方差在第一個坐標(稱為第-主成分)上,第二大方差在第二個坐標(第二主成分)上,依次類推。
主成分分析經(jīng)常用減少數(shù)據(jù)集的維數(shù),同時保持數(shù)據(jù)集的對方差貢獻最大的特征。這是通過保留低階主成分,忽略高階主成分做到的。
這樣低階成分往往能夠保留住數(shù)據(jù)的最重要方面。但是,這也不是一定的,要視具體應(yīng)用而定。