# naver search confirm # markdown number and equation 'R_데이터 분석 기술' 카테고리의 글 목록 //google adsense
본문 바로가기

R_데이터 분석 기술18

편상관계수(partial correlation) 구하기 1. 들어가며 일반적으로 두 변수의 상관관계는 인과관계를 의미하지 않는다. 따라서 논리적으로 인과관계가 없는 변수들 간에도 기계적으로 상관계수를 구하면 높은 상관계수가 나올 수 있다. 상관관계와 상관계수 1. 들어가며 연속형 변수 x, y의 관계는 상관관계(correlation) 분석을 통해 2가지 사실을 알 수 있다. 관계의 방향 관계의 강도 보통 관계의 방향은 그래프를 그려 확인하고, 관계의 강도는 그래프로 diseny.tistory.com 예를 들면 통계학 교과서에 가끔 인용되는 교회수와 범죄자수의 상관관계가 그렇다. 도시의 교회수와 범죄자수의 관계에서는 두 변수 사이에 숨어 있는 제3의 변수 "인구수"가 있다. 교회수가 많으면 당연히 인구가 많을 것이고 인구가 많으면 당연히 범죄자수도 많을 수 있.. 2022. 6. 19.
리커트(likert) 척도 데이터 분석 1. 들어가며 몸무게나, 키와 같이 실재하는 속성을 측정하려면 kg, cm 등의 단위로 만들어진 척도(scale)를 사용하면 된다. 그러나 추상적인 개념이나 특정 의견에 대해 어떻게 생각하는지 측정하려면 인위적으로 간격을 나눈 리커트 척도를 사용한다. 그 간격의 수에 따라 적게는 3첨 척도 많게는 7점 척도까지 사용하지만 일반적으로 4점 또는 5점 척도를 사용한다. 2. 리커트 데이터의 성질 리커트 척도로 측정된 데이터가 순서(ordinal) 데이터인지 비율(ratio)데이터인지에 대해서는 의견이 분분하지만 분석의 관점에서는 순서 데이터로도, 비율 데이터로도 분석한다. R을 이용해 리커트 척도 데이터를 분석하는 방법에 대해 알아보자. 3. 예제 데이터 준비 A=c(2,1,3,2,2,4,4,4,5) B=c.. 2022. 6. 11.
R 확인적 요인분석(CFA) 1. 들어가며 R을 이용해 확인적 요인분석(Comfirmatory Factor Analysis)을 해보자. 데이터는 설문 조사 데이터를 이용한다. 2. 데이터 구조 파악 예제 데이터는 68개의 행 데이터와 12개의 변수로 구성된 데이터프레임이다. 요인과 관측변수의 관계는 다음과 같다. 요인A = A1 + A2 + A3 + A4 + A5 + A6 요인B = B1 + B2 + B3 + B4 + B5 + B6 3. R 코드 실행 library(lavaan) # CFA 분석을 위한 패키지 library(semPlot) # 구조도를 그리기 위한 패키지 cfa_sample = read.csv("cfa_sample.csv") # 데이터 입력 cfa_model = ' Construct_A =~ A1 + A2 + A3 .. 2022. 5. 13.
R 크론바흐 알파 값 계산 관련글 도구의 신뢰도 측정(크론바흐 알파) 관련글 탐색적 요인분석(EFA : Exploratory Factor Analysis) 1. 기본개념 사회과학이나 심리학에서는 직접적으로 측정할 수 없는 변수를 잠재 변수(latent variable), 요인(factor), 구인(construct), 구성 개념.. diseny.tistory.com 1. 들어가며 R을 이용해 Cronbach alpha(내적 일치도) 값을 구하는 방법은 다양하지만 가장 많이 사용하는 psych 패키지를 이용하는 방법을 살펴보자. 2. 예제 데이터 실제 설문 조사 데이터를 활용해 보자. 샘플은 68개의 행 데이터와 5개의 변수를 포함하는 설문 조사 데이터다. 다섯개의 변수(Q1 ~ Q5)는 하나의 구성개념(construct)을 묻는 .. 2022. 5. 13.
R을 이용한 t-test와 효과 크기 계산 관련글 t-test 밑바닥부터 이해하기 ※ 관련글 확률, 확률변수 그리고 확률분포 1. 들어가며 통계학은 기술통계와 추론통계로 구분되는데, 기술통계와 추론통계를 연결해주는 것이 확률분포이다. 그런데 확률분포를 이해하기 위해 diseny.tistory.com 1. 들어가며 위의 관련글에서 두 표본(독립표본)의 평균 차이 검증에 대한 이론을 살펴보았다. 이제 R을 이용해 t-test를 실행하고 효과 크기(effect size)를 간편하게 산출해보자. 2. 예제 데이터 데이터는 UC Irvine Machine Learning Repository에서 제공하는 adult 데이터를 활용한다. 아래 코드는 웹 사이트에서 데이터를 읽어 들이고 변수 이름을 지정한다. adult 2022. 5. 4.
R 랜덤포레스트(randomforest) 관련글 R_의사결정나무 분석(rpart) 관련글 의사결정나무(decision tree) 관련글 선형회귀분석 밑바닥부터 이해하기 관련글 상관관계와 상관계수 상관관계와 상관계수 1. 들어가며 연속형 변수 x, y의 관계는 상관관계(correlation) 분석을 diseny.tistory.com 1. 들어가며 실전에서 분류 목적으로 의사결정나무 알고리즘을 사용하는 경우는 드물다. 왜냐하면 과적합면에서 다소 취약하기 때문이다. 따라서 이를 보완하는 방법 중에 하나인 랜덤포레스트를 많이 이용한다. 실제 R을 이용해 랜덤포레스트 모델을 구축하는 방법을 알아보자. 2. 예제 데이터 library(caret) # GermanCredit 데이터를 활용하기 위해 library(randomForest) data(German.. 2022. 5. 3.