# naver search confirm # markdown number and equation 'DPLYR' 태그의 글 목록 //google adsense
본문 바로가기

DPLYR4

R 중복값을 갖는 행(row) 데이터 제거 이전글 R 결측값 시각화 1. 들어가며 일반적으로 summary(데이터프레임) 명령어로 각 변수의 결측값(Na's) 수를 확인할 수 있지만 변수별 결측값 수 또는 비율을 간편하게 시각화할 수 있는 패키지가 있다. 그러한 기능을 제 diseny.tistory.com 1. 들어가며 데이터 분석과정에서 중복된 값을 제거해야 할 일이 종종있다. 이런 작업을 수행하는 방법은 다양하지만 dplyr 패키지의 distinct 함수를 이용한 방법을 소개한다. 2. 샘플 데이터 생성 library(dplyr) A = c(2,2,4,4,4,5) B = c(2,2,4,4,8,10) C = c(2,2,5,6,7,5) ABC = data.frame(A,B,C) ABC 코드를 실행하면 다음과 같은 데이터 프레임을 얻을 수 있다. .. 2022. 5. 16.
데이터 결합(join) by dplyr 패키지 관련글 R 전처리 최강자 dplyr 패키지 1. 들어가며 본격적인 데이터 분석에 들어가기 전에 분석가의 요구와 필요에 맞게 데이터를 조작할 필요가 있다. 이런 과정을 데이터 전처리(data pre processing)이라고 하는데, R은 풍부한 기본 기능 diseny.tistory.com 변수별 부분 집계 by dplyr 이전글 R 전처리 최강자 dplyr 패키지 1. 들어가며 이전 글에서 R 데이터 전처리에 많이 활용되는 dplyr 패키지의 기본적인 용법 5가지를 살펴보았다. 이번에는 dplyr 패키지에서 특정한 변수를 기준 diseny.tistory.com 1. 들어가며 두 개의 데이터프레임을 결합해야하는 일은 데이터 분석 과정에서 매우 흔하게 발생하는 일이다. 이 작업 역시 R의 기본 함수로 가능하.. 2022. 4. 1.
변수별 부분 집계 by dplyr 이전글 R 전처리 최강자 dplyr 패키지 1. 들어가며 본격적인 데이터 분석에 들어가기 전에 분석가의 요구와 필요에 맞게 데이터를 조작할 필요가 있다. 이런 과정을 데이터 전처리(data pre processing)이라고 하는데, R은 풍부한 기본 기능 diseny.tistory.com 1. 들어가며 이전 글에서 R 데이터 전처리에 많이 활용되는 dplyr 패키지의 기본적인 용법 5가지를 살펴보았다. 이번에는 dplyr 패키지에서 특정한 변수를 기준으로 부분 집계(aggregation)를 하는 방법에 대해 알아보자. 부분 집계는 의외로 데이터 분석에서 많이 사용되는 작업이다. 2. 데이터 프레임에서 랜덤하게 행 데이터 추출 dplyr 패키지는 데이터 프레임에서 랜덤하게 행(row)을 추출하는 아주 간편.. 2022. 3. 31.
R 전처리 최강자 dplyr 패키지 1. 들어가며 본격적인 데이터 분석에 들어가기 전에 분석가의 요구와 필요에 맞게 데이터를 조작할 필요가 있다. 이런 과정을 데이터 전처리(data pre processing)이라고 하는데, R은 풍부한 기본 기능과 함수를 제공하지만 초보자들에게는 dplyr 패키지가 가장 직관적이고 배우기 쉽다. 따라서 R의 기본 기능보다 먼저 dplyr 패키지를 활용법을 학습하는 것을 강력하게 권장한다. 아울러 SQL 문법과도 비슷해 개발자 출신 분석가들은 더 익숙할 수도 있다. 2. dplyr 패키지의 주요 기능 filter : 데이터 프레임에서 필요한 행(row)만 추출하는 기능 select : 데이터 프레임에서 필요한 열(column)만 추출하는 기능 arrange : 데이터 프레임을 기준 열(column)에 맞춰.. 2022. 3. 31.