複製鏈接
請複製以下鏈接發送給好友

pca技術

鎖定
主成分分析技術,又稱主分量分析技術,旨在利用降維的思想,把多指標轉化為少數幾個綜合指標
中文名
pca技術
外文名
principal components analysis
中文全稱
主成分分析技術
中文別稱
主分量分析、主分量分析

pca技術產品介紹

PCA(principal components analysis)即主成分分析技術,又稱主分量分析,旨在利用降維的思想,把多指標轉化為少數幾個綜合指標。
在統計學中,主成分分析PCA是一種簡化數據集的技術。它是一個線性變換。這個變換把數據變換到一個新的座標系統中,使得任何數據投影的第一大方差在第一個座標(稱為第一主成分)上,第二大方差在第二個座標(第二主成分)上,依次類推。主成分分析經常用於減少數據集的維數,同時保持數據集的對方差貢獻最大的特徵。這是通過保留低階主成分,忽略高階主成分做到的。這樣低階成分往往能夠保留住數據的最重要方面。但是,這也不是一定的,要視具體應用而定。

pca技術變換的步驟

(1) 第一步計算矩陣 X 的樣本的協方差矩陣 S(此為不標準PCA,標準PCA計算相關係數矩陣C) :
(2) 第二步計算協方差矩陣S(或C)的特徵向量 e1,e2,…,eN和特徵值 , t = 1,2,…,N ;
(3)第三步投影數據到特徵向量的空間之中。利用公式
,其中BV值是原樣本中對應維度的值。
PCA 的目標是尋找 r ( r<n )個新變量,使它們反映事物的主要特徵,壓縮原有數據矩陣的規模,將特徵向量的維數降低,挑選出最少的維數來概括最重要特徵。每個新變量是原有變量的線性組合,體現原有變量的綜合效果,具有一定的實際含義。這 r 個新變量稱為“主成分”,它們可以在很大程度上反映原來 n 個變量的影響,並且這些新變量是互不相關的,也是正交的。通過主成分分析,壓縮數據空間,將多元數據的特徵在低維空間裏直觀地表示出來。