1. 들어가며
설문조사 결과 “후보 A의 지지율은 52%, 신뢰구간 95%, ±3%”라는 말을 본 적이 있을 것이다. 또는 “이 제품의 평균 만족도는 4.1점이고, 95% 신뢰구간은 (3.8, 4.4)다”처럼 결과에 범위를 붙여 말하기도 한다.
이때 등장하는 신뢰구간(Confidence Interval) 은 통계 추론에서 핵심적인 개념이다. 하지만 “95% 확신한다”는 말이 '모집단 평균이 이 안에 있다'는 뜻인가? 아니면 '표본에서 이런 결과가 나올 확률이 95%라는 뜻인가?' 헷갈리기 쉽다.
이 글에서는 신뢰구간이 무엇이고, 왜 필요한지, 어떻게 해석해야 하는지를 정확하고 직관적으로 정리해본다.
2. 왜 신뢰구간이 필요한가
우리는 보통 전체 모집단을 조사하지 못하고 일부 표본만을 조사한다.
예를 들어, 전체 고객 10,000명 중 100명을 뽑아 평균 만족도를 계산한다면, 그 100명 평균이 진짜 전체 평균일 가능성은 낮다.
그래서 우리는 평균이 정확히 얼마인지 ‘하나의 수치’로 말하지 않고, 그 평균이 있을 것으로 추정되는 범위를 제시한다.
그게 바로 신뢰구간이다. 요약하면:
- 점 추정(point estimate) : "이 정도일 것이다"
- 구간 추정(interval estimate) : "이 안에 있을 가능성이 크다"
3. 신뢰구간의 정의
신뢰구간이란, 반복적으로 표본을 뽑았을 때 그 중 약 95%가 모집단의 진짜 평균을 포함하게 되는 구간이다.
$$ 신뢰구간= \text{표본평균} \pm \text{오차한계} $$
여기서 오차한계(Margin of Error)는 다음과 같이 계산된다:
$$오차한계= Z \times \frac{\sigma}{\sqrt{n}} $$
- Z는 신뢰수준(예: 95% → 약 1.96)의 임계값
- σ는 모집단의 표준편차 (모를 경우 표본 표준편차 사용)
- n은 표본 크기
예를 들어, 표본평균이 100이고 오차한계가 3이면 신뢰구간은 (97, 103)이다.
4. 직관적인 해석
많이들 하는 오해는 다음과 같다:
“이 신뢰구간 안에 모집단 평균이 들어있을 확률이 95%다.” → 틀린 표현이다!
올바른 해석은 이렇다:
"모집단에서 동일한 방식으로 표본을 100번 뽑아 신뢰구간을 만든다면, 그 중 약 95개는 실제 평균을 포함하게 될 것이다."
아래 위키피디아의 그림처럼 100번 반복하면 95번은 실제 평균을 포함한다는 의미다
5. 예제로 이해하기
예를 들어 한 고등학생의 수학 시험 평균 점수를 조사하기 위해 30명을 뽑았더니 평균은 75점, 표준편차는 10점이었다. 95% 신뢰구간을 구해보자.
$$오차한계= 1.96 \times \frac{10}{\sqrt{30}} ≈ 3.58 $$
→ 신뢰구간 = 75 ± 3.58 = (71.42, 78.58)
이 말은 “이 방식대로 조사했을 때, 진짜 평균 점수는 약 71점에서 79점 사이에 있을 가능성이 크다”는 뜻이다.
6. 신뢰수준과 구간의 관계
- 신뢰수준이 높을수록 → 신뢰구간이 넓어진다
- 표본 수가 많을수록 → 신뢰구간이 좁아진다
- 표준편차가 클수록 → 신뢰구간이 넓어진다
즉, 신뢰구간은 “불확실성”을 반영하는 지표이기도 하다.
7. 주의할 점
- 신뢰구간이 겹친다고 해서 두 평균이 같다고 할 수는 없다.
- 모수(예: 평균, 비율)를 포함할 수도, 포함하지 않을 수도 있다. 구간 하나에 확률을 부여하면 안 된다.
- 샘플 크기 n이 작으면 정규분포가 아닌 t분포를 써야 한다.
8. 마치며
신뢰구간은 단순히 “평균이 얼마다”라는 수치를 넘어, 그 수치에 대한 신뢰의 정도를 보여주는 중요한 도구다. 숫자 하나보다 더 많은 정보를 담고 있고, 그만큼 해석도 조심스럽게 해야 한다.
'통계 이론' 카테고리의 다른 글
t검정과 ANOVA의 연결 (0) | 2025.03.22 |
---|---|
p-value의 진짜 의미 (0) | 2025.03.22 |
표본 크기 결정법을 이해하는 가장 좋은 방법 (0) | 2025.03.22 |
카이제곱 검정을 이해하는 가장 좋은 방법 (0) | 2025.03.22 |
상관분석(Correlation Analysis)을 이해하는 가장 좋은 방법 (0) | 2025.03.22 |
예측 모델의 재현도(Recall)와 정밀도(Precision) (0) | 2025.01.11 |
평균의로의 회귀 (2) | 2024.10.18 |
댓글