지난글
1. 들어가며
지난 글에서 가설검증과 1종오류에 대해 다뤘다. 이제 2종 오류에 대해 생각해보자. 1종 오류는 귀무가설이 맞는데도 귀무가설을 기각하는 오류다. 반변, 2종 오류는 귀무가설이 틀렸는데 귀무가설을 기각하지 않는 오류다.
2. 유치한 외우기
1종오류와 2종오류는 설명을 들었을 때는 어렵지 않게 이해가 되는데 나중에 기억하려면 조금 헷갈린다. 그래서 유치하지만 아래와 같은 단어로 외워 두면 좋다. 더 깊은 이해는 핵심 개념의 탄탄한 암기가 바탕이 되면 좋다.^^
1종오류 : 귀맞기각(귀무가설이 맞았는데 귀무가설을 기각하는 오류)
2종오류 : 귀틀채택(귀무가설이 틀렸는데 귀무가설을 채택하는 오류)
-정확하게는 기각하지 않는 오류이지만 편의상 채택이라는 표현을 사용했다.
3. 우선 귀무가설이 틀린 경우를 상상해 보자. 귀무가설이 틀렸다면 대립(대안) 가설을 상정해야 한다. 그런데 문제가 발생한다. 대립가설은 무수히 많기 때문이다.
<그림 1>을 보면 귀무가설이 틀렸다고 가정했을 때, 대립가설은 여러가지 분포를 상정할 수 있다. 예를 들어 두 집단의 평균 차이가 없다는 귀무가설은 평균이 0인 지점에서 대칭인 정규분포를 생각하면 되지만 대립가설은 두 집단의 평균이 차이가 난다는 것이지만 그 차이가 평균적으로 얼마인지 알 수 없기 때문이다. 그래서 <그림 1>처럼 파란색 점선 분포도, 빨간색 점선 분포도 생각할 수 있는 것이다. 그렇기 때문에 가설 검증은 귀무가설을 기준으로 기각, 채택할 수 밖에 없는 이유이기도 하다.
3. 2종오류 베타 값
어찌되었건 <그림 2>처럼 가상의 대립가설 분포를 하나 생각해보자.
이 경우 파란색 점으로 표현되는 통계량 T 값을 얻었고 이 값을 얻을 확률이 0.05이상이면 귀무가설을 기각하지 않는다. 따라서 결과적으로 2종오류를 범하게 되었다. 그렇다면 2종오류(베타)값은 얼마일까? 이 값은 대립가설을 어떻게 세우느냐에 따라 다른다.
<그림 3>을 보면 대립가설을 어떻게 세우느냐(파란색 분포 또는 빨간색 분포)에 따라 베타 값이 다르다는 것을 알 수 있다.
'통계 이론' 카테고리의 다른 글
표준편차와 추론 통계 (0) | 2022.03.24 |
---|---|
ROC 곡선 아주 쉽게 이해하기 (2) | 2022.03.21 |
결정계수(R^2)의 이해 (0) | 2022.03.08 |
분산으로 평균차이 검증하기(분산분석) (2) | 2022.03.02 |
가설검증과 1종 오류 (0) | 2022.02.24 |
다중공선성(Multicollinearity)의 의미와 판별법 (0) | 2022.02.16 |
효과 크기(Effect Size)의 의미와 필요성 (2) | 2022.02.14 |
댓글