전체 글94 반복측정 ANOVA를 사용해야 할 때 1. 들어가며이전 글에서는 서로 다른 집단 간의 평균을 비교할 때 사용하는 일원분산분석(One-way ANOVA)을 소개했다.예: A, B, C 세 그룹에게 각각 다른 약을 주고 효과를 비교. 그런데 다음과 같은 상황에서는 어떻게 분석할까?✔ 같은 사람에게 세 종류의 약을 순서대로 먹이고 반응을 측정했다면?✔ 한 학생에게 세 가지 학습법을 적용해 성적 변화를 측정했다면? 이런 경우, 집단 간 차이가 아니라 시간이나 조건에 따른 변화를 같은 대상에게 반복 측정한 것이므로,일반 ANOVA가 아니라 반복측정 ANOVA (Repeated Measures ANOVA) 를 사용해야 한다.2. 반복측정이 필요한 이유일반 ANOVA의 가정: 각 그룹은 서로 독립적이어야 함→ A 그룹의 사람과 B 그룹의 사람은 서로 아.. 2025. 3. 22. 이원분산분석(Two-way ANOVA)을 사용해야 할 때 1. 들어가며앞서 배운 일원분산분석(One-way ANOVA)은 하나의 기준(예: 그룹, 처리 방식)에 따라 평균 차이를 검정했다.하지만 실전에서는 이런 질문이 더 많다:성별과 광고 유형에 따라 구매율이 달라질까?약 종류와 복용 기간에 따라 치료 효과가 다를까?이처럼 두 개의 독립 요인이 종속 변수에 영향을 줄 때 사용하는 분석이 바로 이원분산분석 (Two-way ANOVA) 이다.2. 이원분산분석이 필요한 이유예시 상황:A, B, C 약물을 실험 (요인1: 약물 종류)남성과 여성에게 따로 적용 (요인2: 성별)반응: 통증 감소 수치✔ 약물에 따라 효과가 다른가?✔ 성별에 따라 효과가 다른가?✔ 약물과 성별의 조합에 따라 효과가 달라지는가? 이 세 가지 질문을 한꺼번에 검정할 수 있는 분석이 바로 이원분.. 2025. 3. 22. ANOVA 이후 사후분석 (Post-hoc Test)의 이해 1. 들어가며앞선 글에서 우리는 세 집단 이상을 비교할 때 ANOVA(분산분석) 를 사용하고,그 결과 F값이 충분히 커서 p-value가 작다면, "세 집단 중 어디엔가 평균 차이가 있다"는 결론을 내렸다.그런데 문제는 이거다:“어느 집단끼리 차이가 있는 거지?” ANOVA는 전체 평균 차이만 알려줄 뿐, 어떤 집단과 어떤 집단이 다르다는 정보는 주지 않는다. 이 궁금증을 해결하기 위해 사용하는 것이 바로 사후분석(Post-hoc test) 이다.2. 사후분석이란?사후분석은 말 그대로 ANOVA 이후(after the fact)에 구체적으로 어떤 집단들 사이에 차이가 있는지를 찾아내는 과정이다.예를 들어, 세 집단 A, B, C가 있고 ANOVA에서 유의한 차이가 나타났다면:A와 B 사이?A와 C 사이?.. 2025. 3. 22. t검정과 ANOVA의 연결 1. 들어가며두 집단의 평균 차이를 비교할 때는 t검정(t-test) 을, 세 집단 이상의 평균을 비교할 때는 분산분석(ANOVA) 을 쓴다고 배운다.그럼 이런 의문이 생긴다:“두 집단일 때 ANOVA 써도 되지 않나요?”“t검정과 ANOVA는 완전히 다른 건가요, 아니면 연결돼 있는 건가요?” 정답은: t검정과 ANOVA는 수학적으로 같은 방법에서 출발한다. 즉, 두 집단 비교에서는 t검정이나 ANOVA를 해도 같은 결론이 나온다.이번 글에서는 이 둘이 어떻게 연결되어 있는지를 쉽고 정확하게 풀어보자.2. 핵심 요약:구분t검정 ANOVA집단 수2개2개 이상 (3개 이상이 일반적)비교 기준평균의 차이평균 간 분산의 차이출력t값, p값F값, p값연결성F = t² (두 집단일 때)t² = F (두 집단일 때.. 2025. 3. 22. p-value의 진짜 의미 1. 들어가며가설검정 결과를 보고 "p-value가 0.03이니까 통계적으로 유의미하다", 혹은 "p-value가 0.07이라 아쉽게 유의하지 않다"는 말을 많이 들어봤을 것이다. 하지만 이때 자주 등장하는 질문이 있다:p-value가 0.03이면, 가설이 맞을 확률이 97%라는 뜻인가요?p-value가 0.05보다 작으면, 대립가설이 맞다는 뜻인가요?이 질문들, 모두 틀린 해석이다. p-value는 단순히 어떤 숫자 하나가 아니라, 가설을 검정하는 전체 논리 구조의 일부다.이번 글에서는 p-value가 정확히 무엇을 뜻하고, 무엇을 뜻하지 않는지, 통계적 사고 방식으로 이해해보자.2. p-value란 무엇인가?p-value는 귀무가설이 참이라고 가정했을 때, 지금 관찰된 통계량 이상으로 극단적인 결과가.. 2025. 3. 22. 표본 크기 결정법을 이해하는 가장 좋은 방법 1. 들어가며“조사 대상은 몇 명이면 충분할까?”“샘플이 너무 적으면 통계적으로 의미가 없지 않을까?”“그렇다고 너무 많이 조사하면 시간도 비용도 낭비인데...” 통계 분석을 하다 보면 '얼마나 많은 데이터를 모아야 하는가?' 라는 질문에 자주 부딪힌다. 바로 이때 필요한 개념이 표본 크기 결정(Sample Size Calculation) 이다. 신뢰구간, 유의수준, 검정력 등과 깊이 연결된 개념으로, 데이터를 얼마나 모을지 전략적으로 결정하기 위해 꼭 알아야 할 통계 기초다.2. 왜 표본 크기 결정이 중요한가표본이 너무 적으면 결과가 흔들리고 신뢰할 수 없고, 표본이 너무 많으면 불필요한 시간을 쓰고, 자원을 낭비하게 된다.작은 표본 문제: 통계적 유의성을 확보하기 어렵고, 신뢰구간이 넓어진다.너무 큰.. 2025. 3. 22. 신뢰구간을 이해하는 가장 좋은 방법 1. 들어가며설문조사 결과 “후보 A의 지지율은 52%, 신뢰구간 95%, ±3%”라는 말을 본 적이 있을 것이다. 또는 “이 제품의 평균 만족도는 4.1점이고, 95% 신뢰구간은 (3.8, 4.4)다”처럼 결과에 범위를 붙여 말하기도 한다. 이때 등장하는 신뢰구간(Confidence Interval) 은 통계 추론에서 핵심적인 개념이다. 하지만 “95% 확신한다”는 말이 '모집단 평균이 이 안에 있다'는 뜻인가? 아니면 '표본에서 이런 결과가 나올 확률이 95%라는 뜻인가?' 헷갈리기 쉽다.이 글에서는 신뢰구간이 무엇이고, 왜 필요한지, 어떻게 해석해야 하는지를 정확하고 직관적으로 정리해본다.2. 왜 신뢰구간이 필요한가우리는 보통 전체 모집단을 조사하지 못하고 일부 표본만을 조사한다.예를 들어, 전체 .. 2025. 3. 22. 카이제곱 검정을 이해하는 가장 좋은 방법 1. 들어가며데이터 분석을 하다 보면 "두 범주형 변수 사이에 관련이 있을까?"를 알고 싶은 경우가 생긴다. 예를 들어, 성별에 따라 제품 선호도가 다른가? 교육 수준에 따라 투표 성향이 다른가?와 같은 질문이다. 이때 사용하는 대표적인 통계적 방법이 카이제곱 검정(Chi-Square Test) 이다. 평균을 다루는 t검정이나 ANOVA와 달리, 카이제곱 검정은 빈도(frequency) 를 이용해 검정한다는 점에서 독특하다.2. 왜 평균 대신 빈도로 검정할까?t검정이나 ANOVA는 연속형 변수(예: 키, 몸무게, 점수 등)의 평균 차이를 비교할 때 사용한다. 하지만 범주형 변수는 '사과', '바나나', '포도'처럼 이산적이고 순서 없는 값이기 때문에 평균 자체가 의미 없다. 예를 들어 남자 30명 중 2.. 2025. 3. 22. 이전 1 2 3 4 ··· 12 다음