r 주성분 분석 예제

PCA는 특정 양의 공간에 대한 특정 수의 변수(좌표)에 대한 값이 있는 지정된 데이터 집합의 선형 변환 유형입니다. 이 선형 변환은 첫 번째 좌표에서 가장 중요한 분산이 발견되고 각 후속 좌표가 마지막 좌표의 직교이며 분산이 적은 방식으로 이 데이터 집합을 새 좌표계에 맞습니다. 이러한 방식으로 y 샘플에 대한 x 상관 변수 집합을 동일한 샘플에 대한 상관 관계가 없는 주 성분 집합으로 변환합니다. 첫 번째 구성 요소는 도팅, 퍼벌레이션, 인텔리전스 및 동력계와 긍정적으로 상관관계가 있습니다. 이 상관 관계는 다섯 변수가 서로 다르며 변수가 내려가면 다른 변수도 감소합니다. 구성 요소는 (.087)의 도팅과 가장 관련이 있으며 주로 도팅의 척도로 간주될 수 있습니다. 주 성분 분석(PCA)은 여러 변수에 의해 설명된 데이터 집합의 정보를 요약하는 데 사용됩니다. 4. prcomp() 함수는 또한 각 주성분의 표준 편차를 계산하는 기능을 제공한다.

sdev는 주 성분의 표준 편차를 나타냅니다. 원래 변수의 상관 관계와 (S) 및 (R) 행렬의 PC 간의 가장 명백한 변화는 구성 요소 2와 3에 있습니다. 첫 번째 주 성분은 여전히 도팅 및 Perservation 변수와 매우 밀접한 상관 관계가 있지만 이제 변수 인텔리전스 및 동력계는 훨씬 더 상관관계가 있으며 이전 두 변수가 감소함에 따라 후자의 두 가지 변수가 감소했음을 나타낼 수 있습니다. 증가. 파생의 목표는 (a`_ky)의 분산을 최대화하는 (a`_ky)을 찾는 것입니다. 이를 위해 (Var(a`_1y) = a`_1y Sigma a_1)를 최대화하는 첫 번째 벡터(a`_1y)를 고려합니다. 이 최대화를 수행하려면 (a_1)의 불필요하게 큰 값을 고삐를 정할 수 있는 제약 조건이 필요합니다. 이 예제의 제약 조건은 단위 길이 벡터 (a_1` a_1 = 1)입니다. 이 제약 조건은 Lagrange 승수 (lambda)와 함께 사용되므로 함수가 (g(x) = 0)의 같음 제약 조건에서 최대화됩니다. 따라서 Lagrangian 함수는 다음과 같이 정의됩니다: 주 성분 분석은 최대 분산과 최대 (k) 주 성분등으로 (a_1`y)와 상관관계가 없는 선형 함수 (a_2`y)를 계속 찾습니다. 2. 회전 측정값은 주 성분 하중을 제공합니다.

By | 2019-08-02T21:02:27+00:00 août 2nd, 2019|Non classé|Commentaires fermés sur r 주성분 분석 예제

About the Author: