# naver search confirm # markdown number and equation 가설검증과 2종오류 //google adsense
본문 바로가기
통계 이론

가설검증과 2종오류

by 노마드분석가 2022. 3. 6.

지난글

 

가설검증과 1종 오류

1. 들어가며 가설을 검증한다는 말은 검증하는 사람(분석가)이 명확한 근거를 갖고 있거나 정답을 알고 있다는 뉘앙스를 가진다. 그러나 검증이라는 표현보다는 결단을 내린다는 말이 사실에 더

diseny.tistory.com

1. 들어가며

지난 글에서 가설검증과 1종오류에 대해 다뤘다. 이제 2종 오류에 대해 생각해보자. 1종 오류는 귀무가설이 맞는데도 귀무가설을 기각하는 오류다. 반변, 2종 오류는 귀무가설이 틀렸는데 귀무가설을 기각하지 않는 오류다. 

 

2. 유치한 외우기

1종오류와 2종오류는 설명을 들었을 때는 어렵지 않게 이해가 되는데 나중에 기억하려면 조금 헷갈린다. 그래서 유치하지만 아래와 같은 단어로 외워 두면 좋다. 더 깊은 이해는 핵심 개념의 탄탄한 암기가 바탕이 되면 좋다.^^ 

 

1종오류 : 귀맞기각(무가설이 았는데 귀무가설을 기각하는 오류)

2종오류 : 귀틀채택(무가설이 렸는데 귀무가설을 채택하는 오류)

             -정확하게는 기각하지 않는 오류이지만 편의상 채택이라는 표현을 사용했다.  

 

3. 우선 귀무가설이 틀린 경우를 상상해 보자. 귀무가설이 틀렸다면 대립(대안) 가설을 상정해야 한다. 그런데 문제가 발생한다. 대립가설은 무수히 많기 때문이다. 

[그림 1] 가능한 대립가설 분포

<그림 1>을 보면 귀무가설이 틀렸다고 가정했을 때, 대립가설은 여러가지 분포를 상정할 수 있다. 예를 들어 두 집단의 평균 차이가 없다는 귀무가설은 평균이 0인 지점에서 대칭인 정규분포를 생각하면 되지만 대립가설은 두 집단의 평균이 차이가 난다는 것이지만 그 차이가 평균적으로 얼마인지 알 수 없기 때문이다. 그래서 <그림 1>처럼 파란색 점선 분포도, 빨간색 점선 분포도 생각할 수 있는 것이다. 그렇기 때문에 가설 검증은 귀무가설을 기준으로 기각, 채택할 수 밖에 없는 이유이기도 하다.

 

3. 2종오류 베타 값

어찌되었건 <그림 2>처럼 가상의 대립가설 분포를 하나 생각해보자. 

[그림 2] 귀무가설과 대립가설 분포

 

이 경우 파란색 점으로 표현되는 통계량 T 값을 얻었고 이 값을 얻을 확률이 0.05이상이면 귀무가설을 기각하지 않는다. 따라서 결과적으로 2종오류를 범하게 되었다. 그렇다면 2종오류(베타)값은 얼마일까? 이 값은 대립가설을 어떻게 세우느냐에 따라 다른다. 

[그림 3] 알파와 베타값

<그림 3>을 보면 대립가설을 어떻게 세우느냐(파란색 분포 또는 빨간색 분포)에 따라 베타 값이 다르다는 것을 알 수 있다. 

반응형

댓글