추론통계13 여론조사를 이해하는 쉬운 방법 대통령 직무수행 평가 결과, 진짜 민심일까?우리가 흔히 뉴스에서 보는 “대통령 국정수행 긍정평가 45%” 같은 수치는 어떻게 나온 것일까? 그리고 이 숫자를 정말 믿어도 되는 것일까? 조금 시기가 지난 것이지만 실제 발표된 여론조사 결과를 예로 들어, 그 이면에 숨겨진 통계 이야기를 살펴보자조사 대상: 전국 18세 이상 성인 1,002명조사 기간: 20XX년 2월 28일 ~ 3월 2일조사 방법: 전화 인터뷰 (무작위 추출)표본오차: ±3.1%p (95% 신뢰수준)응답률: 16.5%조사 기관: 한국갤럽이제 본격적으로 질문해 보자. 1,002명이면 전체 국민 의견이라 볼 수 있을까? 이 질문에 답하려면 ‘추론통계’ 개념을 알아야 한다. 추론통계란, 일부를 조사해서 전체를 추측하는 통계 방법이다. 설문조사를 .. 2025. 6. 29. 거짓말과 통계학(통계학의 오남용) 들어가며통계의 위험성에 대해 언급할 때 자주 인용되는 유명한 문구가 있다. “세상에는 세 종류의 거짓말이 있다. 거짓말과, 새빨간 거짓말, 그리고 통계” 톰소여의 모험이라는 소설로 유명한 미국 소설가 마크 트웨인이 다른 사람이 한 말을 재인용해서 유명해진 말이다. 이 말은 통계 자체가 거짓이라는 의미가 아니라, 통계는 잘못 이용되기 매우 쉽다는 사실을 강조하고, 경고하는 문구로 받아 들일 수 있다. 통계학을 배우기에 앞서 우선 통계는 잘못 이용되기 매우 쉽다는 점과, 구체적으로 잘 못 이용하는 대표적인 사례를 살펴 보도록 하자. 상관관계를 인과관계로 착각하기통계학이 잘못 사용될 수 있는 가장 대표적인 사례가 바로 섣부른 인과관계 설정이다. 상관관계는 두 현상이 서로 관련이 있다는 것이고 인과관계는 하나.. 2025. 6. 25. 표본 크기 결정법을 이해하는 가장 좋은 방법 1. 들어가며“조사 대상은 몇 명이면 충분할까?”“샘플이 너무 적으면 통계적으로 의미가 없지 않을까?”“그렇다고 너무 많이 조사하면 시간도 비용도 낭비인데...” 통계 분석을 하다 보면 '얼마나 많은 데이터를 모아야 하는가?' 라는 질문에 자주 부딪힌다. 바로 이때 필요한 개념이 표본 크기 결정(Sample Size Calculation) 이다. 신뢰구간, 유의수준, 검정력 등과 깊이 연결된 개념으로, 데이터를 얼마나 모을지 전략적으로 결정하기 위해 꼭 알아야 할 통계 기초다.2. 왜 표본 크기 결정이 중요한가표본이 너무 적으면 결과가 흔들리고 신뢰할 수 없고, 표본이 너무 많으면 불필요한 시간을 쓰고, 자원을 낭비하게 된다.작은 표본 문제: 통계적 유의성을 확보하기 어렵고, 신뢰구간이 넓어진다.너무 큰.. 2025. 3. 22. 신뢰구간을 이해하는 가장 좋은 방법 1. 들어가며설문조사 결과 “후보 A의 지지율은 52%, 신뢰구간 95%, ±3%”라는 말을 본 적이 있을 것이다. 또는 “이 제품의 평균 만족도는 4.1점이고, 95% 신뢰구간은 (3.8, 4.4)다”처럼 결과에 어떤 범위를 붙여서 말할 때가 많다. 이때 등장하는 신뢰구간(Confidence Interval) 은 통계적 추론에서 매우 중요한 개념이다. 그런데 의외로 정확하게 어떤 의미인지는 헷갈리기 쉽다. 예를 들어 “95% 신뢰한다는”는 말이 '모집단 평균이 이 안에 있다'는 뜻인가? 아니면 '표본에서 이런 결과가 나올 확률이 95%라는 뜻인가?' 이 글에서는 신뢰구간이 무엇이고, 왜 필요한지, 어떻게 해석해야 하는지를 정확하고 직관적으로 소개하고자 한다. 2. 왜 신뢰구간이 필요한가우리는 보통 전체.. 2025. 3. 22. A/B 테스트를 통한 통계적 사고 과정 따라가기 1. 들어가며추론 통계는 기술 통계에서 얻은 결과를 전체 모집단 차원으로 확대해서 그 결과를 일반화할 수 있는지 타진해보는 과정이다. 개인적으로 추론 통계의 핵심을 이해하는데는 두 집단의 비교 사례가 가장 좋다고 생각한다. 실제로 통계를 잘 모르는 디자인 전공 학생들에게 통계의 핵심을 어떻게 잘 전달할까 고민하다가 다음과 같은 과정으로 설명하면 좋겠다고 생각해서 나온 글이다. 2. A/B 테스트에서 묻는 질문어떤 디자인이 더 좋은 디자인인가?에 대한 질문에는 과학적으로 답할 수 없다. 왜냐하면 주관적인 영역이기 때문이다. 하지만 어떤 디자인이 목표를 달성하는데 더 좋은가? 라는 질문으로 바뀌면 정답을 구할 수 있다. 여기서 목표란 쇼핑몰의 구매전환율, 특정 메뉴 클릭 비율, 사이트 재방문 비율 등이다... 2024. 10. 2. 출구조사는 왜 틀리는가? 최근 두 번의 선거(20대 대선, 22대 대선)에서 출구 조사가 화제였습니다. 이에 대해 브런치에 쓴 글입니다. 출구조사는 왜 틀리는가?통계를 잘 모르는 사람들도 표본(샘플)이라는 말은 잘 안다. 전체를 조사할 수 없으니 일부만 뽑아서 조사하기 위해 필요하다. 추출한다, 또는 뽑는다는 말이 사물에는 잘 적용된다. 예를 들어brunch.co.kr 2024. 4. 27. 이전 1 2 3 다음