# naver search confirm # markdown number and equation 'R_데이터 분석 기술' 카테고리의 글 목록 (3 Page) //google adsense
본문 바로가기

R_데이터 분석 기술19

wide & long 데이터 형태 전환 1. 들어가며 데이터를 분석하기 전에 데이터의 형태를 변환해야 하는 일은 매우 빈번하게 발생한다. 특히 ggplot2 패키지를 이용해 데이터를 시각화할 때는 데이터의 형태를 긴(long) 형태로 바꿔야 하는 일이 많다. 데이터 전처리에서 필수적으로 익혀야 wide & long 데이터 프레임 변환에 대해 알아보자. 2. wide & long 형태란? 하나의 행에 여러가지 값을 담고 있는 데이터 프레임을 wide 형태라고 볼 수 있다. 아래 은 wide 형태와 long 형태의 데이터 프레임 예를 보여준다. 일반적으로 wide 형태의 포맷에 익숙하지만 분석의 목적에 따라 long 형태로 바꿔야 할 일이 자주 발생한다. 이때 사용할 수 있는 R 패키지는 다양한데, 가장 대표적인 reshape2 패키지를 이용해 .. 2022. 4. 4.
R을 이용해 상관계수 구하기 관련글 상관관계와 상관계수 1. 들어가며 연속형 변수 x, y의 관계는 상관관계(correlation) 분석을 통해 2가지 사실을 알 수 있다. 관계의 방향 관계의 강도 보통 관계의 방향은 그래프를 그려 확인하고, 관계의 강도는 그래프로 diseny.tistory.com 1. 들어가며 상관계수의 개념에 대해서는 관련글을 참고하기 바란다. 이제 R을 이용해 상관계수를 구하고 간단하게 시각화하는 방법을 정리해보자. 피어슨 상관계수는 연속형 변수간에서만 구할 수 있다. 연속형이 아닌 변수간의 상관관계를 구하는 방법도 있지만 이번 포스팅에서는 연속형 변수만을 다룬다. 예제 데이터로 iris 데이터를 이용하겠다. 우선 iris 데이터의 변수 구조를 살펴보자. 4개의 연속형 변수와 하나의 factor 변수로 구성되.. 2022. 4. 1.
데이터 결합(join) by dplyr 패키지 관련글 R 전처리 최강자 dplyr 패키지 1. 들어가며 본격적인 데이터 분석에 들어가기 전에 분석가의 요구와 필요에 맞게 데이터를 조작할 필요가 있다. 이런 과정을 데이터 전처리(data pre processing)이라고 하는데, R은 풍부한 기본 기능 diseny.tistory.com 변수별 부분 집계 by dplyr 이전글 R 전처리 최강자 dplyr 패키지 1. 들어가며 이전 글에서 R 데이터 전처리에 많이 활용되는 dplyr 패키지의 기본적인 용법 5가지를 살펴보았다. 이번에는 dplyr 패키지에서 특정한 변수를 기준 diseny.tistory.com 1. 들어가며 두 개의 데이터프레임을 결합해야하는 일은 데이터 분석 과정에서 매우 흔하게 발생하는 일이다. 이 작업 역시 R의 기본 함수로 가능하.. 2022. 4. 1.
변수별 부분 집계 by dplyr 이전글 R 전처리 최강자 dplyr 패키지 1. 들어가며 본격적인 데이터 분석에 들어가기 전에 분석가의 요구와 필요에 맞게 데이터를 조작할 필요가 있다. 이런 과정을 데이터 전처리(data pre processing)이라고 하는데, R은 풍부한 기본 기능 diseny.tistory.com 1. 들어가며 이전 글에서 R 데이터 전처리에 많이 활용되는 dplyr 패키지의 기본적인 용법 5가지를 살펴보았다. 이번에는 dplyr 패키지에서 특정한 변수를 기준으로 부분 집계(aggregation)를 하는 방법에 대해 알아보자. 부분 집계는 의외로 데이터 분석에서 많이 사용되는 작업이다. 2. 데이터 프레임에서 랜덤하게 행 데이터 추출 dplyr 패키지는 데이터 프레임에서 랜덤하게 행(row)을 추출하는 아주 간편.. 2022. 3. 31.
R 전처리 최강자 dplyr 패키지 1. 들어가며 본격적인 데이터 분석에 들어가기 전에 분석가의 요구와 필요에 맞게 데이터를 조작할 필요가 있다. 이런 과정을 데이터 전처리(data pre processing)이라고 하는데, R은 풍부한 기본 기능과 함수를 제공하지만 초보자들에게는 dplyr 패키지가 가장 직관적이고 배우기 쉽다. 따라서 R의 기본 기능보다 먼저 dplyr 패키지를 활용법을 학습하는 것을 강력하게 권장한다. 아울러 SQL 문법과도 비슷해 개발자 출신 분석가들은 더 익숙할 수도 있다. 2. dplyr 패키지의 주요 기능 filter : 데이터 프레임에서 필요한 행(row)만 추출하는 기능 select : 데이터 프레임에서 필요한 열(column)만 추출하는 기능 arrange : 데이터 프레임을 기준 열(column)에 맞춰.. 2022. 3. 31.
R_요인분석(psych 패키지) 관련글 탐색적 요인분석(EFA : Exploratory Factor Analysis) 1. 기본개념 사회과학이나 심리학에서는 직접적으로 측정할 수 없는 변수를 잠재 변수(latent variable), 요인(factor), 구인(construct), 구성 개념 등으로 부른다. 데이터 분석 측면에서 보자면 보통 어떤 diseny.tistory.com 1. 데이터 생성 아래의 코드로 샘플 데이터 프레임을 생성한다. A = c(87, 55, 81, 42, 45, 54) B = c(92, 72, 95, 55, 87, 66) C = c(67, 82, 38, 55, 50, 82) D = c(40, 88, 35, 39, 57, 80) E = c(50, 88, 45, 50, 62, 90) color = data.fra.. 2022. 3. 3.