# naver search confirm # markdown number and equation '분류 전체보기' 카테고리의 글 목록 (3 Page) //google adsense
본문 바로가기

분류 전체보기84

리커트(likert) 척도 데이터 분석 1. 들어가며 몸무게나, 키와 같이 실재하는 속성을 측정하려면 kg, cm 등의 단위로 만들어진 척도(scale)를 사용하면 된다. 그러나 추상적인 개념이나 특정 의견에 대해 어떻게 생각하는지 측정하려면 인위적으로 간격을 나눈 리커트 척도를 사용한다. 그 간격의 수에 따라 적게는 3첨 척도 많게는 7점 척도까지 사용하지만 일반적으로 4점 또는 5점 척도를 사용한다. 2. 리커트 데이터의 성질 리커트 척도로 측정된 데이터가 순서(ordinal) 데이터인지 비율(ratio)데이터인지에 대해서는 의견이 분분하지만 분석의 관점에서는 순서 데이터로도, 비율 데이터로도 분석한다. R을 이용해 리커트 척도 데이터를 분석하는 방법에 대해 알아보자. 3. 예제 데이터 준비 A=c(2,1,3,2,2,4,4,4,5) B=c.. 2022. 6. 11.
R 중복값을 갖는 행(row) 데이터 제거 이전글 R 결측값 시각화 1. 들어가며 일반적으로 summary(데이터프레임) 명령어로 각 변수의 결측값(Na's) 수를 확인할 수 있지만 변수별 결측값 수 또는 비율을 간편하게 시각화할 수 있는 패키지가 있다. 그러한 기능을 제 diseny.tistory.com 1. 들어가며 데이터 분석과정에서 중복된 값을 제거해야 할 일이 종종있다. 이런 작업을 수행하는 방법은 다양하지만 dplyr 패키지의 distinct 함수를 이용한 방법을 소개한다. 2. 샘플 데이터 생성 library(dplyr) A = c(2,2,4,4,4,5) B = c(2,2,4,4,8,10) C = c(2,2,5,6,7,5) ABC = data.frame(A,B,C) ABC 코드를 실행하면 다음과 같은 데이터 프레임을 얻을 수 있다. .. 2022. 5. 16.
R 확인적 요인분석(CFA) 1. 들어가며 R을 이용해 확인적 요인분석(Comfirmatory Factor Analysis)을 해보자. 데이터는 설문 조사 데이터를 이용한다. 2. 데이터 구조 파악 예제 데이터는 68개의 행 데이터와 12개의 변수로 구성된 데이터프레임이다. 요인과 관측변수의 관계는 다음과 같다. 요인A = A1 + A2 + A3 + A4 + A5 + A6 요인B = B1 + B2 + B3 + B4 + B5 + B6 3. R 코드 실행 library(lavaan) # CFA 분석을 위한 패키지 library(semPlot) # 구조도를 그리기 위한 패키지 cfa_sample = read.csv("cfa_sample.csv") # 데이터 입력 cfa_model = ' Construct_A =~ A1 + A2 + A3 .. 2022. 5. 13.
R 크론바흐 알파 값 계산 관련글 도구의 신뢰도 측정(크론바흐 알파) 관련글 탐색적 요인분석(EFA : Exploratory Factor Analysis) 1. 기본개념 사회과학이나 심리학에서는 직접적으로 측정할 수 없는 변수를 잠재 변수(latent variable), 요인(factor), 구인(construct), 구성 개념.. diseny.tistory.com 1. 들어가며 R을 이용해 Cronbach alpha(내적 일치도) 값을 구하는 방법은 다양하지만 가장 많이 사용하는 psych 패키지를 이용하는 방법을 살펴보자. 2. 예제 데이터 실제 설문 조사 데이터를 활용해 보자. 샘플은 68개의 행 데이터와 5개의 변수를 포함하는 설문 조사 데이터다. 다섯개의 변수(Q1 ~ Q5)는 하나의 구성개념(construct)을 묻는 .. 2022. 5. 13.
R 결측값 시각화 이전글 createDummyFeatures 이전글 DataExplorer 1. 들어가며 탐색적 데이터 분석(EDA : Exploratory Data Analysis)는 데이터 분석 초기 단계에서 매우 중요하다. 분석가가 데이터를 받아 처음 작업할 때는 데이터의 구조와, 특징, 분포, diseny.tistory.com 1. 들어가며 일반적으로 summary(데이터프레임) 명령어로 각 변수의 결측값(Na's) 수를 확인할 수 있지만 변수별 결측값 수 또는 비율을 간편하게 시각화할 수 있는 패키지가 있다. 그러한 기능을 제공하는 naniar 패키지 활용법에 대해 알아보자. 2. 패키지 및 문법 library(ggplot2) library(naniar) gg_miss_var(airquality) R 내장 데이터.. 2022. 5. 13.
R을 이용한 t-test와 효과 크기 계산 관련글 t-test 밑바닥부터 이해하기 ※ 관련글 확률, 확률변수 그리고 확률분포 1. 들어가며 통계학은 기술통계와 추론통계로 구분되는데, 기술통계와 추론통계를 연결해주는 것이 확률분포이다. 그런데 확률분포를 이해하기 위해 diseny.tistory.com 1. 들어가며 위의 관련글에서 두 표본(독립표본)의 평균 차이 검증에 대한 이론을 살펴보았다. 이제 R을 이용해 t-test를 실행하고 효과 크기(effect size)를 간편하게 산출해보자. 2. 예제 데이터 데이터는 UC Irvine Machine Learning Repository에서 제공하는 adult 데이터를 활용한다. 아래 코드는 웹 사이트에서 데이터를 읽어 들이고 변수 이름을 지정한다. adult 2022. 5. 4.