# naver search confirm # markdown number and equation '분산분석' 태그의 글 목록 //google adsense
본문 바로가기

분산분석7

반복측정 ANOVA를 사용해야 할 때 1. 들어가며이전 글에서는 서로 다른 집단 간의 평균을 비교할 때 사용하는 일원분산분석(One-way ANOVA)을 소개했다.예: A, B, C 세 그룹에게 각각 다른 약을 주고 효과를 비교. 그런데 다음과 같은 상황에서는 어떻게 분석할까?✔ 같은 사람에게 세 종류의 약을 순서대로 먹이고 반응을 측정했다면?✔ 한 학생에게 세 가지 학습법을 적용해 성적 변화를 측정했다면? 이런 경우, 집단 간 차이가 아니라 시간이나 조건에 따른 변화를 같은 대상에게 반복 측정한 것이므로,일반 ANOVA가 아니라 반복측정 ANOVA (Repeated Measures ANOVA) 를 사용해야 한다.2. 반복측정이 필요한 이유일반 ANOVA의 가정: 각 그룹은 서로 독립적이어야 함→ A 그룹의 사람과 B 그룹의 사람은 서로 아.. 2025. 3. 22.
ANOVA 이후 사후분석 (Post-hoc Test)의 이해 1. 들어가며앞선 글에서 우리는 세 집단 이상을 비교할 때 ANOVA(분산분석) 를 사용하고,그 결과 F값이 충분히 커서 p-value가 작다면, "세 집단 중 어디엔가 평균 차이가 있다"는 결론을 내렸다.그런데 문제는 이거다:“어느 집단끼리 차이가 있는 거지?” ANOVA는 전체 평균 차이만 알려줄 뿐, 어떤 집단과 어떤 집단이 다르다는 정보는 주지 않는다. 이 궁금증을 해결하기 위해 사용하는 것이 바로 사후분석(Post-hoc test) 이다.2. 사후분석이란?사후분석은 말 그대로 ANOVA 이후(after the fact)에 구체적으로 어떤 집단들 사이에 차이가 있는지를 찾아내는 과정이다.예를 들어, 세 집단 A, B, C가 있고 ANOVA에서 유의한 차이가 나타났다면:A와 B 사이?A와 C 사이?.. 2025. 3. 22.
분산분석(ANOVA) 이해하는 가장 좋은 방법(3) 1. 들어가며이전글(아래 참고)은 세 집단의 차이를 비교하는 일원분산분석(one way anova)을 설명했다.  분산분석(ANOVA) 이해하는 가장 좋은 방법(2)※ 이전글 분산분석(ANOVA) 이해하는 가장 좋은 방법(1) 1. 들어가며 세 집단 이상의 비교에는 아노바(ANOVA)를 이용하는데 ANOVA는 Analysis of Variance의 줄임말이며 우리말로는 분산분석이다. 두 집단이diseny.tistory.com 이번에는 세 집단마다 하위 범주가 있는 경우를 생각해 보자. 통계학 용어로 하자면 독립변수가 2개 존재하는 이원분산분석(two way nova)을 의미한다. 아래 표를 보면 A, B, C 세 집단에 하위 범주인 성별(남, 녀)이 구분되어 있다. A, B, C를 편의상 혈액형이라고 하.. 2022. 4. 25.
분산분석(ANOVA) 이해하는 가장 좋은 방법(2) ※ 이전글 분산분석(ANOVA) 이해하는 가장 좋은 방법(1)1. 들어가며 세 집단 이상의 비교에는 아노바(ANOVA)를 이용하는데 ANOVA는 Analysis of Variance의 줄임말이며 우리말로는 분산분석이다. 두 집단이든 세 집단이든 각 집단의 평균을 비교해 어디가 제일diseny.tistory.com1. 들어가며(1)편에서는 논리적인 흐름을 깨지 않기 위해 그냥 분산이라고만 언급했지만 이제 집단간 분산과 집단내 분산을 구체적으로 계산해 보자. 계산 방법을 몰라도 분산분석의 대략적인 개념을 이해하는데는 문제가 없지만 데이터의 변동성을 정확하게 이해하는 것이 언제나 유익하다. 수식을 이해할 때는 아주 작은 규모의 데이터가 좋다. 아래 표는 A, B, C 세 집단이 각기 3개의 .. 2022. 4. 22.
분산분석(ANOVA) 이해하는 가장 좋은 방법(1) 1. 들어가며세 집단 이상의 비교에는 아노바(ANOVA)를 이용하는데 ANOVA는 Analysis of Variance의 줄임말이며 우리말로는 분산분석이다. 두 집단이든 세 집단이든 각 집단의 평균을 비교해, 어디가 제일 높고 낮은지 확인하면 충분하다. 그런데 표본 데이터에서의 차이가 통계적으로 유의한지 검증해야 표본의 결과를 일반화할 수 있는데 이때 분산을 이용해 통계적 유의성을 검증하기 때문에 분산분석이라고 부른다.  두 집단 비교에서는 평균 차이를 이용했지만 세 집단 이상에서는 분산으로 통계적 유의성을 확인한다는 것에 유의해야 한다.  2. 두 집단의 평균 차이를 여러 번 하지 못하는 이유A, B, C 세 집단이 있다면 A : B,  A : C,  B : C를 각각 비교하면 되지 않겠냐고 생각할 수.. 2022. 4. 22.
F분포 어디에 쓰일까? ※이전글 카이제곱 분포 관련글 확률, 확률변수 그리고 확률분포 1. 들어가며 통계학은 기술통계와 추론통계로 구분되는데, 기술통계와 추론통계를 연결해주는 것이 확률분포이다. 그런데 확률분포를 이해하기 위해서 diseny.tistory.com 1. 들어가며 당연한 말이지만 F분포는 F값의 확률분포라는 의미다. 그럼 F값이 무엇인지부터 알아야 한다. 2개의 확률변수 X, Y에 대해 각 확률변수를 다음과 같이 정의한다. 위의 식1, 식2에서 X, Y는 카이제곱 값을 자유도로 나눈 형태다. ※관련글 자유도(Degree of Freedom)에서 자유로워 지기 1. 들어가며 자유도는 통계학을 공부하다 보면 아마 제일 처음 만나는 알쏭달쏭한 개념이다. 최초로 등장하는 시기는 표본분산을 구할 때다. 표본으로 모분산을 추.. 2022. 4. 21.