# naver search confirm # markdown number and equation '통계학' 태그의 글 목록 //google adsense
본문 바로가기

통계학15

선형회귀분석 밑바닥부터 이해하기 관련글 상관관계와 상관계수1. 들어가며 연속형 변수 x, y의 관계는 상관관계(correlation) 분석을 통해 2가지 사실을 알 수 있다. 관계의 방향 관계의 강도 보통 관계의 방향은 그래프를 그려 확인하고, 관계의 강도는 그래프로diseny.tistory.com1. 들어가며두 연속형 변수 X, Y에서 X가 변함에 따라 Y가 어떻게 변하는지 분석한다면 Y는 결과변수(반응변수)로 부르고 X는 설명변수(독립변수)로 부른다. 회귀 분석은 결과변수와 설명변수의 관계를 선형(linear)으로 분석하는 방법이다. 설명변수가 하나일 때는 단순회귀분석 둘 이상일 때는 다중회귀라고 부른다.  2. 상관관계와 회귀분석상관계수(관련글 : 상관관계와 상관계수) 를 통해 두 연속형 변수의 관계 유무관계 방향성관계 강도파악하.. 2022. 4. 1.
상관관계와 상관계수 1. 들어가며연속형 변수 x, y의 관계는 상관관계(correlation) 분석을 통해 2가지 사실을 알 수 있다. 관계의 방향관계의 강도 보통 관계의 방향은 그래프를 그려 확인하고, 관계의 강도는 그래프로도 확인 가능하지만 구체적인 값을 계산한다. 관계의 방향과 강도를 파악하는 방법에 대해 살펴보자.  2. 관계의 방향관계의 방향은 3가지 경우로 나뉜다. 은 일반적인 3가지 경우의 관계를 나타내고 있다.  산점도를 그리고 추세선을 그어보면 대략의 방향성이 나오는데 제일 왼쪽 그래프는 x, y가 양의 상관관계(postive), 두 번째 그래프는 x, y가 음의 상관관계(negative), 제일 오른쪽 그래프는 x, y가 아무런 상관성이 없다는 의미다.   3. 관계의 강도관계의 방향성을 알았다면 어느 정.. 2022. 3. 31.
확인적 요인분석(CFA : Confirmatory Factor Analysis) 관련글 탐색적 요인분석(EFA : Exploratory Factor Analysis) 1. 기본개념 사회과학이나 심리학에서는 직접적으로 측정할 수 없는 변수를 잠재 변수(latent variable), 요인(factor), 구인(construct), 구성 개념 등으로 부른다. 데이터 분석 측면에서 보자면 보통 어떤 diseny.tistory.com R_요인분석(psych 패키지) 관련글 탐색적 요인분석(EFA : Exploratory Factor Analysis) 1. 데이터 생성 아래의 코드로 샘플 데이터 프레임을 생성한다. A = c(87, 55, 81, 42, 45, 54) B = c(92, 72, 95, 55, 87, 66) C = c(67, 82, 38, 55.. diseny.tistory.co.. 2022. 3. 30.
1. 네트워크 분석 개요 1. 들어가며 네트워크 분석은 다수의 점(노드)들이 선으로 연결되어 있는 망을 분석하는 방법이다. 점(노드)은 개인, 국가, 회사 등을 의미하고 점들이 선으로 연결이 되었다는 것은 거래 관계가 있거나, 친구 관계를 맺고 있다거나 하는 등의 특정한 관계가 형성되어 있음을 의미한다. 2. 노드(node)와 엣지(edge) 노드는 네트워크를 구성하는 개체, 엣지는 개체 간의 연결 상태를 의미한다. 아래 에서는 네트워크에 A, B, C 노드가 존재하고 B와 C는 연결되어 있다. 3. 네트워크의 특징을 나타내는 개념들 아래 는 두 개의 서로 다른 네트워크 A, B이다. 이 둘은 생김새를 보면 다르다는 것이 분명하지만 구체적으로 그 다름(difference)을 어떤 수치로 표현할 수 있을지 살펴 보자. (1) 노드.. 2022. 3. 17.
결정계수(R^2)의 이해 관련글 선형회귀분석 밑바닥부터 이해하기 관련글 상관관계와 상관계수 상관관계와 상관계수 1. 들어가며 연속형 변수 x, y의 관계는 상관관계(correlation) 분석을 통해 2가지 사실을 알 수 있다. 관계의 방향 관계의 강도 보통 관계의 방향은 diseny.tistory.com 1. 들어가며 선형회귀분석에서 모델의 적합도를 판단할 때, 결정계수(R^2)값이 중요한 판단 근거가 된다. 결정계수(R squared)의 의미에 대해 살펴보자. 2. 모델의 의미 예를 들어 과 같이 A ~ G(7명) 학생의 수학성적을 Y라고 했을 때 이 값들을 Y축 기준으로 나열해보자. 수학성적(Y)이라는 데이터를 이용해 구할 수 있는 것은 평균(88)과 표준편차(5.8)뿐이다. 그런데 각 학생들의 공부시간 데이터가 존재하고 .. 2022. 3. 8.
가설검증과 2종오류 지난글 가설검증과 1종 오류 1. 들어가며 가설을 검증한다는 말은 검증하는 사람(분석가)이 명확한 근거를 갖고 있거나 정답을 알고 있다는 뉘앙스를 가진다. 그러나 검증이라는 표현보다는 결단을 내린다는 말이 사실에 더 diseny.tistory.com 1. 들어가며 지난 글에서 가설검증과 1종오류에 대해 다뤘다. 이제 2종 오류에 대해 생각해보자. 1종 오류는 귀무가설이 맞는데도 귀무가설을 기각하는 오류다. 반변, 2종 오류는 귀무가설이 틀렸는데 귀무가설을 기각하지 않는 오류다. 2. 유치한 외우기 1종오류와 2종오류는 설명을 들었을 때는 어렵지 않게 이해가 되는데 나중에 기억하려면 조금 헷갈린다. 그래서 유치하지만 아래와 같은 단어로 외워 두면 좋다. 더 깊은 이해는 핵심 개념의 탄탄한 암기가 바탕이 되.. 2022. 3. 6.