# naver search confirm # markdown number and equation 탐색적 요인분석(EFA : Exploratory Factor Analysis) //google adsense
본문 바로가기
통계 이론

탐색적 요인분석(EFA : Exploratory Factor Analysis)

by 노마드분석가 2022. 1. 22.

1. 기본개념

사회과학이나 심리학에서는 직접적으로 측정할 수 없는 변수를 잠재 변수(latent variable), 요인(factor), 구인(construct), 구성 개념 등으로 부른다. 데이터 분석 측면에서 보자면 보통 어떤 설문(척도)을 구성하는 문항들이 몇 개의 요인(구인)으로 묶이는지 결정하는 분석 방법이 요인 분석이다. 

 

2. 요인분석의 종류 

  •  탐색적 요인분석(EFA : Exploratory Factor Analysis)
  •  확인적 요인분석(CFA : Confirmatory Factor Analysis)

탐색적 요인분석은 어떤 이론이나 가설 없이 척도에 대한 응답 데이터를 분석해 설문 문항이 몇 개의 요인으로 구성되는지 살펴보는 방법이다. 반면 확인적 요인분석은 설문을 통해 얻은 데이터가 기존 이론이나 가설에 부합하는지, 즉 문항들이 미리 정해진 요인대로 묶이는지 확인한다.  

 

3. 요인의 수 결정 방법

탐색적 요인분석은 이론이나 가설이 없기 때문에 당연히 설문 문항이 몇 개의 요인으로 묶이는지 모른다. 따라서 일차적으로 분석자가 요인의 수를 결정하는 것부터 시작이다. 세 가지 방법이 있다. 

  • 관측변수(설문 문항)간 상관행렬의 고윳값(eigenvalue) 기준, 고윳값이 1 이상인 값의 개수 = 요인의 개수, 이 방법을 카이저 규칙(Kaiser's rule)이라고 부른다. 
  • 스크리 도표 : X축이 요인의 개수, Y축이 고윳값인 스크리 도표에서 그래프의 기울기가 완만해지기 직전의 요인 개수로 결정. 그림 1에서는 요인의 개수가 2개이다. 

[그림 1] 스크리 검사

  • 평행분석(Parallel Analysis) : 실제 데이터와, 실제 데이터와 설문 문항 수와 표본 크기가 동일한 랜덤 데이터를 만들어 두 데이터의 고윳값이 비교해 실제 데이터가 랜덤 데이터보다 고윳값이 높은 지점의 요인 수로 결정. 그림 2에서 요인 수 2까지가 실제 데이터 고윳값 > 랜덤 데이터 고윳값이다. 
     

[그림 2] 평행분석

3. 요인부하값(factor loading)

각 관측변수(문항)가 각 요인을 어느 정도 반영하고 있는지 나타내는 값이다.  그림 3은 요인분석 모델을 도식화한 것인데 예를 들어 관측변수 y1은 다음 식으로 표현할 수 있다.

 

[그림 3] 요인분석 모델

여기서  y1의 요인1 부하값 = a1,

          y1의 요인2 부하값 = a2 이다. 

 

4. 요인회전

아래 표는 요인분석을 하면 나오는 전형적인 결과 값 테이블이다. 대략 보면 y1, y2는 요인1로 묶이고, y3, y4는 요인2로 묶이는 것처럼 보이는데 요인1, 2의 축을 회전하면 <그림 4 참고> 관측 변수들이 더 분명하게 요인1,2로 나누어짐을 알 수 있다.  

관측 변수 요인부하값
요인1 요인2
y1 0.79 0.21
y2 0.55 0.45
y3 0.37 0.63
y4 0.29 0.71

[그림 4] 요인회전

<그림 4>에서 요인1과 요인2의 축을 회전할 때 두 축의 각도를 90도로 유지할 때를 직교회전이라고 하고 그렇지 않을 때를 사각회전이라고 한다. 회전 전(왼쪽) 그림에 비해 오른쪽 그림에서 ( y1, y2)와 (y3, y4)가 더 분명하게 요인1, 요인2 축으로 구분되는 것을 볼 수 있다.   

 

이렇게 요인을 회전시키면 위의 요인부하량 값 표가 아래처럼 더 분명하게 도출된다.  

관측 변수 요인부하값
요인1 요인2
y1 0.95 0.05
y2 0.85 0.15
y3 0.07 0.93
y4 0.11 0.89

 

관련글 

 

확인적 요인분석(CFA : Confirmatory Factor Analysis)

관련글 탐색적 요인분석(EFA : Exploratory Factor Analysis) 1. 기본개념 사회과학이나 심리학에서는 직접적으로 측정할 수 없는 변수를 잠재 변수(latent variable), 요인(factor), 구인(construct), 구성 개념..

diseny.tistory.com

 

R_요인분석(psych 패키지)

관련글 탐색적 요인분석(EFA : Exploratory Factor Analysis) 1. 기본개념 사회과학이나 심리학에서는 직접적으로 측정할 수 없는 변수를 잠재 변수(latent variable), 요인(factor), 구인(construct), 구성 개념..

diseny.tistory.com

 

반응형

'통계 이론' 카테고리의 다른 글

다중회귀 분석에서 상호작용의 의미  (5) 2022.01.31
QQ Plot 직관적으로 이해하기  (3) 2022.01.30
도구의 신뢰도 측정(크론바흐 알파)  (1) 2022.01.26
1. 5 데이터 과학  (0) 2020.06.22
1.4 인공지능  (0) 2020.06.22
1.3 머신러닝  (3) 2020.06.22
1.2 통계학  (0) 2020.06.21

댓글