통계 이론50 여론조사를 이해하는 쉬운 방법 대통령 직무수행 평가 결과, 진짜 민심일까?우리가 흔히 뉴스에서 보는 “대통령 국정수행 긍정평가 45%” 같은 수치는 어떻게 나온 것일까? 그리고 이 숫자를 정말 믿어도 되는 것일까? 조금 시기가 지난 것이지만 실제 발표된 여론조사 결과를 예로 들어, 그 이면에 숨겨진 통계 이야기를 살펴보자조사 대상: 전국 18세 이상 성인 1,002명조사 기간: 20XX년 2월 28일 ~ 3월 2일조사 방법: 전화 인터뷰 (무작위 추출)표본오차: ±3.1%p (95% 신뢰수준)응답률: 16.5%조사 기관: 한국갤럽이제 본격적으로 질문해 보자. 1,002명이면 전체 국민 의견이라 볼 수 있을까? 이 질문에 답하려면 ‘추론통계’ 개념을 알아야 한다. 추론통계란, 일부를 조사해서 전체를 추측하는 통계 방법이다. 설문조사를 .. 2025. 6. 29. 거짓말과 통계학(통계학의 오남용) 들어가며통계의 위험성에 대해 언급할 때 자주 인용되는 유명한 문구가 있다. “세상에는 세 종류의 거짓말이 있다. 거짓말과, 새빨간 거짓말, 그리고 통계” 톰소여의 모험이라는 소설로 유명한 미국 소설가 마크 트웨인이 다른 사람이 한 말을 재인용해서 유명해진 말이다. 이 말은 통계 자체가 거짓이라는 의미가 아니라, 통계는 잘못 이용되기 매우 쉽다는 사실을 강조하고, 경고하는 문구로 받아 들일 수 있다. 통계학을 배우기에 앞서 우선 통계는 잘못 이용되기 매우 쉽다는 점과, 구체적으로 잘 못 이용하는 대표적인 사례를 살펴 보도록 하자. 상관관계를 인과관계로 착각하기통계학이 잘못 사용될 수 있는 가장 대표적인 사례가 바로 섣부른 인과관계 설정이다. 상관관계는 두 현상이 서로 관련이 있다는 것이고 인과관계는 하나.. 2025. 6. 25. 반복측정 ANOVA를 사용해야 할 때 1. 들어가며이전 글에서는 서로 다른 집단 간의 평균을 비교할 때 사용하는 일원분산분석(One-way ANOVA)을 소개했다.예: A, B, C 세 그룹에게 각각 다른 약을 주고 효과를 비교. 그런데 다음과 같은 상황에서는 어떻게 분석할까?✔ 같은 사람에게 세 종류의 약을 순서대로 먹이고 반응을 측정했다면?✔ 한 학생에게 세 가지 학습법을 적용해 성적 변화를 측정했다면? 이런 경우, 집단 간 차이가 아니라 시간이나 조건에 따른 변화를 같은 대상에게 반복 측정한 것이므로,일반 ANOVA가 아니라 반복측정 ANOVA (Repeated Measures ANOVA) 를 사용해야 한다.2. 반복측정이 필요한 이유일반 ANOVA의 가정: 각 그룹은 서로 독립적이어야 함→ A 그룹의 사람과 B 그룹의 사람은 서로 아.. 2025. 3. 22. 이원분산분석(Two-way ANOVA)을 사용해야 할 때 1. 들어가며앞서 배운 일원분산분석(One-way ANOVA)은 하나의 기준(예: 그룹, 처리 방식)에 따라 평균 차이를 검정했다.하지만 실전에서는 이런 질문이 더 많다:성별과 광고 유형에 따라 구매율이 달라질까?약 종류와 복용 기간에 따라 치료 효과가 다를까?이처럼 두 개의 독립 요인이 종속 변수에 영향을 줄 때 사용하는 분석이 바로 이원분산분석 (Two-way ANOVA) 이다.2. 이원분산분석이 필요한 이유예시 상황:A, B, C 약물을 실험 (요인1: 약물 종류)남성과 여성에게 따로 적용 (요인2: 성별)반응: 통증 감소 수치✔ 약물에 따라 효과가 다른가?✔ 성별에 따라 효과가 다른가?✔ 약물과 성별의 조합에 따라 효과가 달라지는가? 이 세 가지 질문을 한꺼번에 검정할 수 있는 분석이 바로 이원분.. 2025. 3. 22. ANOVA 이후 사후분석 (Post-hoc Test)의 이해 1. 들어가며앞선 글에서 우리는 세 집단 이상을 비교할 때 ANOVA(분산분석) 를 사용하고,그 결과 F값이 충분히 커서 p-value가 작다면, "세 집단 중 어디엔가 평균 차이가 있다"는 결론을 내렸다.그런데 문제는 이거다:“어느 집단끼리 차이가 있는 거지?” ANOVA는 전체 평균 차이만 알려줄 뿐, 어떤 집단과 어떤 집단이 다르다는 정보는 주지 않는다. 이 궁금증을 해결하기 위해 사용하는 것이 바로 사후분석(Post-hoc test) 이다.2. 사후분석이란?사후분석은 말 그대로 ANOVA 이후(after the fact)에 구체적으로 어떤 집단들 사이에 차이가 있는지를 찾아내는 과정이다.예를 들어, 세 집단 A, B, C가 있고 ANOVA에서 유의한 차이가 나타났다면:A와 B 사이?A와 C 사이?.. 2025. 3. 22. t검정과 ANOVA의 연결 1. 들어가며두 집단의 평균 차이를 비교할 때는 t검정(t-test) 을, 세 집단 이상의 평균을 비교할 때는 분산분석(ANOVA) 을 쓴다고 배운다.그럼 이런 의문이 생긴다:“두 집단일 때 ANOVA 써도 되지 않나요?”“t검정과 ANOVA는 완전히 다른 건가요, 아니면 연결돼 있는 건가요?” 정답은: t검정과 ANOVA는 수학적으로 같은 방법에서 출발한다. 즉, 두 집단 비교에서는 t검정이나 ANOVA를 해도 같은 결론이 나온다.이번 글에서는 이 둘이 어떻게 연결되어 있는지를 쉽고 정확하게 풀어보자.2. 핵심 요약:구분t검정 ANOVA집단 수2개2개 이상 (3개 이상이 일반적)비교 기준평균의 차이평균 간 분산의 차이출력t값, p값F값, p값연결성F = t² (두 집단일 때)t² = F (두 집단일 때.. 2025. 3. 22. 이전 1 2 3 4 ··· 9 다음