카이제곱3 카이제곱 검정을 이해하는 가장 좋은 방법 1. 들어가며데이터 분석을 하다 보면 "두 범주형 변수 사이에 관련이 있을까?"를 알고 싶은 경우가 생긴다. 예를 들어, 성별에 따라 제품 선호도가 다른가? 교육 수준에 따라 투표 성향이 다른가?와 같은 질문이다. 이때 사용하는 대표적인 통계적 방법이 카이제곱 검정(Chi-Square Test) 이다. 평균을 다루는 t검정이나 ANOVA와 달리, 카이제곱 검정은 빈도(frequency) 를 이용해 검정한다는 점에서 독특하다.2. 왜 평균 대신 빈도로 검정할까?t검정이나 ANOVA는 연속형 변수(예: 키, 몸무게, 점수 등)의 평균 차이를 비교할 때 사용한다. 하지만 범주형 변수는 '사과', '바나나', '포도'처럼 이산적이고 순서 없는 값이기 때문에 평균 자체가 의미 없다. 예를 들어 남자 30명 중 2.. 2025. 3. 22. F분포 어디에 쓰일까? ※이전글 카이제곱 분포 관련글 확률, 확률변수 그리고 확률분포 1. 들어가며 통계학은 기술통계와 추론통계로 구분되는데, 기술통계와 추론통계를 연결해주는 것이 확률분포이다. 그런데 확률분포를 이해하기 위해서 diseny.tistory.com 1. 들어가며 당연한 말이지만 F분포는 F값의 확률분포라는 의미다. 그럼 F값이 무엇인지부터 알아야 한다. 2개의 확률변수 X, Y에 대해 각 확률변수를 다음과 같이 정의한다. 위의 식1, 식2에서 X, Y는 카이제곱 값을 자유도로 나눈 형태다. ※관련글 자유도(Degree of Freedom)에서 자유로워 지기 1. 들어가며 자유도는 통계학을 공부하다 보면 아마 제일 처음 만나는 알쏭달쏭한 개념이다. 최초로 등장하는 시기는 표본분산을 구할 때다. 표본으로 모분산을 추.. 2022. 4. 21. 카이제곱 분포 이해하기 확률, 확률변수 그리고 확률분포1. 들어가며 통계학은 기술통계와 추론통계로 구분되는데, 기술통계와 추론통계를 연결해주는 것이 확률분포이다. 그런데 확률분포를 이해하기 위해서는 먼저 확률을 알아야 하고 그 다음에 확diseny.tistory.com 1. 들어가며위의 관련글에서 확률분포는 추론 통계를 위해 필요한 이론이라고 설명했다. 기초 통계 수준에서 가장 많이 쓰이는 확률분포는 정규분포와 t분포, 카이제곱분포, F분포이다. 상대적으로 정규분포와 t분포는 이해하기 어렵지 않은데 카이제곱분포와 F분포는 조금 생각을 해봐야 한다. 이번 포스팅에서는 카이제곱 분포에 대해 알아보자. 2. 카이제곱 분포처럼 표준정규분포를 따르는 확률변수 집합에서 m개의 확률변수를 “독립적”으로 추출하는 경우를 생각해 보자. 독립.. 2022. 4. 19. 이전 1 다음