# naver search confirm # markdown number and equation 'R패키지' 태그의 글 목록 //google adsense
본문 바로가기

R패키지3

R 전처리 최강자 dplyr 패키지 1. 들어가며 본격적인 데이터 분석에 들어가기 전에 분석가의 요구와 필요에 맞게 데이터를 조작할 필요가 있다. 이런 과정을 데이터 전처리(data pre processing)이라고 하는데, R은 풍부한 기본 기능과 함수를 제공하지만 초보자들에게는 dplyr 패키지가 가장 직관적이고 배우기 쉽다. 따라서 R의 기본 기능보다 먼저 dplyr 패키지를 활용법을 학습하는 것을 강력하게 권장한다. 아울러 SQL 문법과도 비슷해 개발자 출신 분석가들은 더 익숙할 수도 있다. 2. dplyr 패키지의 주요 기능 filter : 데이터 프레임에서 필요한 행(row)만 추출하는 기능 select : 데이터 프레임에서 필요한 열(column)만 추출하는 기능 arrange : 데이터 프레임을 기준 열(column)에 맞춰.. 2022. 3. 31.
범주별 다변수 통계량 계산(by 함수) 1. 들어가며 다변수를 범주별로 평균, 분산 등의 값을 계산하고 싶을 때가 있다. 예를 들어 R 내장 데이터 mtcars의 경우 cyl별(4, 6, 8) mpg, disp, hp 변수의 평균을 계산해야 하는 경우다. by 함수를 이용해 간단하게 계산 가능하다 2. 코드 cars = mtcars[ , c("mpg","disp","hp")] # mpg, disp, hp 변수 추출 후 cars에 저장 by(cars, mtcars$cyl, apply, 2, mean) # (2) (2) 코드의 주석 # by = 함수, # cars = 분석할 데이터 프레임 # mtcars$cyl =범주, # apply = 데이터 프레임의 열 또는 행에 특정 함수 일괄 적용 # 2 = 데이터 프레임 열에 적용, 1은 행에 적용 # .. 2022. 3. 3.
excel.link 1. 들어가며 R에서 전처리된 데이터, 또는 분석 결과를 엑셀로 이동해 리포트를 완성해야 할 경우가 많다. 이때 "excel.link"는 매우 간편하게 활용할 수 있는 패키지다. 2. 코드 library(excel.link) # (1) xl.sheet.add('new') # (2) xlrc[["a1"]] = mtcars # (3) 3. 코드 설명 # (1) 패키지 로드 # (2) 엑셀에 'new'라는 시트 생성. 시트를 지정하지 않으면 자동으로 Sheet1에 데이터가 저장된다. 이 말은 기존 엑셀 Sheet1에 어떤 데이터가 있으면 덮어 쓴다는 말이므로 주의 요망!! # (3) 엑셀의 new 시트, a1 셀을 기준으로 mtcars 데이터 이동 그 밖에 다양한 기능이 있지만 어차피 분석은 R에서하고 보고서.. 2022. 3. 2.