1. 기본개념
사회과학이나 심리학에서는 직접적으로 측정할 수 없는 변수를 잠재 변수(latent variable), 요인(factor), 구인(construct), 구성 개념 등으로 부른다. 데이터 분석 측면에서 보자면 보통 어떤 설문(척도)을 구성하는 문항들이 몇 개의 요인(구인)으로 묶이는지 결정하는 분석 방법이 요인 분석이다.
2. 요인분석의 종류
- 탐색적 요인분석(EFA : Exploratory Factor Analysis)
- 확인적 요인분석(CFA : Confirmatory Factor Analysis)
탐색적 요인분석은 어떤 이론이나 가설 없이 척도에 대한 응답 데이터를 분석해 설문 문항이 몇 개의 요인으로 구성되는지 살펴보는 방법이다. 반면 확인적 요인분석은 설문을 통해 얻은 데이터가 기존 이론이나 가설에 부합하는지, 즉 문항들이 미리 정해진 요인대로 묶이는지 확인한다.
3. 요인의 수 결정 방법
탐색적 요인분석은 이론이나 가설이 없기 때문에 당연히 설문 문항이 몇 개의 요인으로 묶이는지 모른다. 따라서 일차적으로 분석자가 요인의 수를 결정하는 것부터 시작이다. 세 가지 방법이 있다.
- 관측변수(설문 문항)간 상관행렬의 고윳값(eigenvalue) 기준, 고윳값이 1 이상인 값의 개수 = 요인의 개수, 이 방법을 카이저 규칙(Kaiser's rule)이라고 부른다.
- 스크리 도표 : X축이 요인의 개수, Y축이 고윳값인 스크리 도표에서 그래프의 기울기가 완만해지기 직전의 요인 개수로 결정. 그림 1에서는 요인의 개수가 2개이다.
- 평행분석(Parallel Analysis) : 실제 데이터와, 실제 데이터와 설문 문항 수와 표본 크기가 동일한 랜덤 데이터를 만들어 두 데이터의 고윳값이 비교해 실제 데이터가 랜덤 데이터보다 고윳값이 높은 지점의 요인 수로 결정. 그림 2에서 요인 수 2까지가 실제 데이터 고윳값 > 랜덤 데이터 고윳값이다.
3. 요인부하값(factor loading)
각 관측변수(문항)가 각 요인을 어느 정도 반영하고 있는지 나타내는 값이다. 그림 3은 요인분석 모델을 도식화한 것인데 예를 들어 관측변수 y1은 다음 식으로 표현할 수 있다.
여기서 y1의 요인1 부하값 = a1,
y1의 요인2 부하값 = a2 이다.
4. 요인회전
아래 표는 요인분석을 하면 나오는 전형적인 결과 값 테이블이다. 대략 보면 y1, y2는 요인1로 묶이고, y3, y4는 요인2로 묶이는 것처럼 보이는데 요인1, 2의 축을 회전하면 <그림 4 참고> 관측 변수들이 더 분명하게 요인1,2로 나누어짐을 알 수 있다.
관측 변수 | 요인부하값 | |
요인1 | 요인2 | |
y1 | 0.79 | 0.21 |
y2 | 0.55 | 0.45 |
y3 | 0.37 | 0.63 |
y4 | 0.29 | 0.71 |
<그림 4>에서 요인1과 요인2의 축을 회전할 때 두 축의 각도를 90도로 유지할 때를 직교회전이라고 하고 그렇지 않을 때를 사각회전이라고 한다. 회전 전(왼쪽) 그림에 비해 오른쪽 그림에서 ( y1, y2)와 (y3, y4)가 더 분명하게 요인1, 요인2 축으로 구분되는 것을 볼 수 있다.
이렇게 요인을 회전시키면 위의 요인부하량 값 표가 아래처럼 더 분명하게 도출된다.
관측 변수 | 요인부하값 | |
요인1 | 요인2 | |
y1 | 0.95 | 0.05 |
y2 | 0.85 | 0.15 |
y3 | 0.07 | 0.93 |
y4 | 0.11 | 0.89 |
관련글
'통계 이론' 카테고리의 다른 글
다중회귀 분석에서 상호작용의 의미 (5) | 2022.01.31 |
---|---|
QQ Plot 직관적으로 이해하기 (3) | 2022.01.30 |
도구의 신뢰도 측정(크론바흐 알파) (1) | 2022.01.26 |
1. 5 데이터 과학 (0) | 2020.06.22 |
1.4 인공지능 (0) | 2020.06.22 |
1.3 머신러닝 (3) | 2020.06.22 |
1.2 통계학 (0) | 2020.06.21 |
댓글