# naver search confirm # markdown number and equation '통계 이론' 카테고리의 글 목록 (3 Page) //google adsense
본문 바로가기

통계 이론37

이상값과 영향력 있는 관측값 탐지 관련글 회귀진단 관련글 선형회귀분석 밑바닥부터 이해하기 선형회귀분석 밑바닥부터 이해하기 관련글 상관관계와 상관계수 1. 들어가며 두 연속형 변수 X, Y에서 X가 변함에 따라 Y가 어떻게 변하는지 분석한다 diseny.tistory.com 1. 들어가며 회귀모델은 표본 데이터에 가장 잘 적합(fitted)된 모델이다. 이 말은 표본 데이터를 구성하는 모든 관측값이 회귀 모델을 구축하는데 사용되었다는 의미이다. 그런데 표본 중에 표본 데이터의 전체적인 특징과 크게 벗어나는 관측값이 포함되어 있다면 이런 값들을 모델을 만드는데 사용해야 할지 고민해 보아야 한다. 예를 들어 대한민국 20대의 평균 생활비를 추정하기 위해 표본을 1,000명 뽑았을 때, 그 표본에 재벌 자녀가 포함되어 있다면 표본으로 만든 회귀.. 2022. 4. 14.
회귀진단 선형회귀분석 밑바닥부터 이해하기관련글 상관관계와 상관계수 1. 들어가며 두 연속형 변수 X, Y에서 X가 변함에 따라 Y가 어떻게 변하는지 분석한다면 Y는 결과변수(반응변수)로 부르고 X는 설명변수(독립변수)로 부른다. 회귀 분diseny.tistory.com R 회귀분석관련글 선형회귀분석 밑바닥부터 이해하기 선형회귀분석 밑바닥부터 이해하기 관련글 상관관계와 상관계수 1. 들어가며 두 연속형 변수 X, Y에서 X가 변함에 따라 Y가 어떻게 변하는지 분석한다diseny.tistory.com 1. 들어가며회귀모델을 만들었다면 회귀분석을 하기 위한 기본 가정을 점검해야 한다. 보통은 회귀모델의 예측값과 실제 값과의 오차인 잔차(residual)를 분석하여 진단한다. 회귀분석모델에서 잔차에 대한 기본 가정은 다.. 2022. 4. 13.
선형회귀분석 밑바닥부터 이해하기 관련글 상관관계와 상관계수1. 들어가며 연속형 변수 x, y의 관계는 상관관계(correlation) 분석을 통해 2가지 사실을 알 수 있다. 관계의 방향 관계의 강도 보통 관계의 방향은 그래프를 그려 확인하고, 관계의 강도는 그래프로diseny.tistory.com  평균의로의 회귀1. 들어가며 노벨 경제학상을 수상하기도 했던 심리학자 대니얼 카너먼(Daniel Kahneman)은 명저 '생각에 관한 생각(Thinking, Fast and Slow)'에서 평균으로의 회귀 현상에 대한 좋은 사례를 소개합니다.diseny.tistory.com 1. 들어가며두 연속형 변수 X, Y에서 X가 변함에 따라 Y가 어떻게 변하는지 분석한다면 Y는 결과변수(반응변수)로 부르고 X는 설명변수(독립변수)로 부른다. 회귀.. 2022. 4. 1.
상관관계와 상관계수 1. 들어가며연속형 변수 x, y의 관계는 상관관계(correlation) 분석을 통해 2가지 사실을 알 수 있다. 관계의 방향관계의 강도 보통 관계의 방향은 그래프를 그려 확인하고, 관계의 강도는 그래프로도 확인 가능하지만 구체적인 값을 계산한다. 관계의 방향과 강도를 파악하는 방법에 대해 살펴보자.  2. 관계의 방향관계의 방향은 3가지 경우로 나뉜다. 은 일반적인 3가지 경우의 관계를 나타내고 있다.  산점도를 그리고 추세선을 그어보면 대략의 방향성이 나오는데 제일 왼쪽 그래프는 x, y가 양의 상관관계(postive), 두 번째 그래프는 x, y가 음의 상관관계(negative), 제일 오른쪽 그래프는 x, y가 아무런 상관성이 없다는 의미다.   3. 관계의 강도관계의 방향성을 알았다면 어느 정.. 2022. 3. 31.
확인적 요인분석(CFA : Confirmatory Factor Analysis) 관련글 탐색적 요인분석(EFA : Exploratory Factor Analysis) 1. 기본개념 사회과학이나 심리학에서는 직접적으로 측정할 수 없는 변수를 잠재 변수(latent variable), 요인(factor), 구인(construct), 구성 개념 등으로 부른다. 데이터 분석 측면에서 보자면 보통 어떤 diseny.tistory.com R_요인분석(psych 패키지) 관련글 탐색적 요인분석(EFA : Exploratory Factor Analysis) 1. 데이터 생성 아래의 코드로 샘플 데이터 프레임을 생성한다. A = c(87, 55, 81, 42, 45, 54) B = c(92, 72, 95, 55, 87, 66) C = c(67, 82, 38, 55.. diseny.tistory.co.. 2022. 3. 30.
혼동행렬(confusion matrix) 1. 들어가며 이분형 예측 통계(머신러닝) 모델은 예측의 성능을 측정하는 기준이 필요하다. 이때 가장 대표적으로 이용되는 측정 지표가 혼동행렬표이다. 혼동행렬표로부터 모델의 성능을 측정하는 4가지 값을 얻을 수 있다. 하나씩 살펴보자 2. 혼동행렬표 아래 은 혼동행렬표를 나타낸다. 왼쪽 그림의 2X2행렬표에서 [1,1]셀은 A라고 예측했는데 실제 데이터도 A인 것을 의미하고 [2,2]셀은 B라고 예측했는데 실제 데이터도 B인 경우다. 즉 O표는 예측값과 실제값이 일치하는 경우다. 반대로 X표는 예측값과 실제값이 다른 경우다. 따라서 O셀의 숫자가 많을 수록 그 모델은 성능이 좋다고 말할 수 있다. 이때 관심범주라는 개념을 알아야 한다. 관심범주란 분석가가 더 관심이 있는 범주를 의미한다. 모델이 A를 더.. 2022. 3. 30.