1. 들어가며
노벨 경제학상을 수상하기도 했던 심리학자 대니얼 카너먼(Daniel Kahneman)은 명저 '생각에 관한 생각(Thinking, Fast and Slow)'에서 평균으로의 회귀 현상에 대한 좋은 사례를 소개합니다.
그가 이스라엘 공군사관학교에서 강의를 할 때였는데, 베테랑 교관 한 명이생도들이 비행을 잘못했을 때 벌을 주면 대개 다음 비행에서 잘 한다며 보상보다 벌이 더 효과가 좋다는 주장을 합니다. 하지만 대니얼 카너먼은 그런 현상은 단지 평균으로의 회귀 현상일뿐이라고 설명합니다.
평균으로의 회귀(Regression) 현상은 '회귀분석'이라는 이름의 유래이기도 한데, 회귀분석 결과 해석과도 밀접한 관련이 있습니다.
평균으로의 회귀 현상을 설명하기 위해 가상의 데이터로 실험하고 그 결과를 설명하면 다음과 같습니다.
2. 모의 실험 데이터 생성
1️⃣ 생도들의 평균 비행 점수는 50점, 표준편차가 10점이라고 가정
2️⃣ 무작위 추출한 생도 1,000명의 첫번째 비행점수와 두번째 비행점수는 다음과 같다.
✔️ 첫번째 비행점수 = 진짜 실력 + 행운/불운(랜덤오차 10점)
✔️ 두번째 비행점수 = 진짜 실력 + 행운/불운(랜덤오차 10점)
3️⃣ 첫번째 비행점수와 두번째 비행점수의 회귀분석 결과
✔️ 두번째 비행점수 = 0.49 X (첫번째 비행점수) + 25.37점
3. 회귀분석 결과 해석
모의 실험 결과에서 중요한 것은 회귀선의 기울기가 약 0.5라는 것입니다.
❎ 첫번째 비행점수(X축)에서 높은 점수를 받았던 생도들 중에서 두번째 점수가 첫번째 점수보다 낮은 경우가 많아 회귀선의 기울기 끌어 내리는 하방 압력으로 작용하고,
❎ 반대로 첫번째 비행점수가 낮았던 생도들의 두번째 점수는 첫번째 점수보다 높은 경우가 많아 기울기를 위로 올리는 압력이 존재하므로 최종적으로 회귀선의 기울기는 1보다 작아집니다.
결국 비행을 여러 번 하면 생도들의 비행 점수는 본 실력에 수렴해 간다는 의미입니다.
4. 여담
카지노에서 초심자의 행운도 마찬가지입니다. 여러 번 하면 결국 카지노에서 미리 세팅한 승률에 근접해 갑니다. 그렇게 되려면 행운으로 얻었던 돈을 다음번에 토해내야 평균 승률에 맞추게 되겠죠. 😂
평균으로의 회귀 현상은 인과적 해석을 시도할 때 주의해야 할 중요한 요소입니다. 이 현상을 이해하지 못하면, 단순히 데이터에서 관찰된 변동성을 인과 관계로 잘못 해석할 수도 있습니다.
예를 들어, 교육적 개입 후, 학생의 성적이 올라갔거나 환자들이 시간이 지나면서 건강이 호전되었다고 해서 특정 치료법이 효과가 있다고 결론 내리기 전에 먼저 평균으로 회귀가 아닌지 생각해 봐야 하는 것이죠. 🤓
'통계 이론' 카테고리의 다른 글
대격변 AI 시대, 한 권으로 끝내는 데이터과학, 확률, 통계, AI 특강 (0) | 2024.05.22 |
---|---|
상관계수의 크기에 대한 감 잡기 (0) | 2024.04.22 |
로지스틱회귀와 친구되기(2) (0) | 2022.04.26 |
로지스틱회귀와 친구되기(1) (0) | 2022.04.26 |
분산분석(ANOVA) 이해하는 가장 좋은 방법(3) (0) | 2022.04.25 |
분산분석(ANOVA) 이해하는 가장 좋은 방법(2) (4) | 2022.04.22 |
분산분석(ANOVA) 이해하는 가장 좋은 방법(1) (4) | 2022.04.22 |
댓글