PCA1 R 주성분 분석 1. 들어가며 주성분 분석(PCA : Principal Component Analysis)은 데이터에 변수가 많을 때 변수의 수를 축약하는 방법이다. 은 세 개의 데이터를 x축(공부시간), y축(성적)으로 표현한 그래프다. 세 개의 데이터(영희, 민주, 철이)는 x축 기준으로도 분산(값 차이)이 존재하고 y축으로도 분산이 존재하는 것을 알 수 있다. 그런데 이 데이터는 처럼 새로운 변수 Z1축과 Z2축을 만들어 그래프로 나타낼 수 있다. 를 보면 사실상 Z1 축으로 데이터의 차이를 거의 다 설명할 수 있고 Z2축으로는 세 데이터의 분산(차이)이 매우 작기 때문에 Z2 변수는 세 데이터의 차이를 드러내지 않는다. 즉 필요없는 변수라고 볼 수 있다. 이렇게 세 개의 데이터(영희, 민주, 철이)를 공부시간, .. 2022. 4. 7. 이전 1 다음