# naver search confirm # markdown number and equation 'R_패키지' 카테고리의 글 목록 //google adsense
본문 바로가기

R_패키지5

R 중복값을 갖는 행(row) 데이터 제거 이전글 R 결측값 시각화 1. 들어가며 일반적으로 summary(데이터프레임) 명령어로 각 변수의 결측값(Na's) 수를 확인할 수 있지만 변수별 결측값 수 또는 비율을 간편하게 시각화할 수 있는 패키지가 있다. 그러한 기능을 제 diseny.tistory.com 1. 들어가며 데이터 분석과정에서 중복된 값을 제거해야 할 일이 종종있다. 이런 작업을 수행하는 방법은 다양하지만 dplyr 패키지의 distinct 함수를 이용한 방법을 소개한다. 2. 샘플 데이터 생성 library(dplyr) A = c(2,2,4,4,4,5) B = c(2,2,4,4,8,10) C = c(2,2,5,6,7,5) ABC = data.frame(A,B,C) ABC 코드를 실행하면 다음과 같은 데이터 프레임을 얻을 수 있다. .. 2022. 5. 16.
R 결측값 시각화 이전글 createDummyFeatures 이전글 DataExplorer 1. 들어가며 탐색적 데이터 분석(EDA : Exploratory Data Analysis)는 데이터 분석 초기 단계에서 매우 중요하다. 분석가가 데이터를 받아 처음 작업할 때는 데이터의 구조와, 특징, 분포, diseny.tistory.com 1. 들어가며 일반적으로 summary(데이터프레임) 명령어로 각 변수의 결측값(Na's) 수를 확인할 수 있지만 변수별 결측값 수 또는 비율을 간편하게 시각화할 수 있는 패키지가 있다. 그러한 기능을 제공하는 naniar 패키지 활용법에 대해 알아보자. 2. 패키지 및 문법 library(ggplot2) library(naniar) gg_miss_var(airquality) R 내장 데이터.. 2022. 5. 13.
createDummyFeatures 이전글 DataExplorer 1. 들어가며 탐색적 데이터 분석(EDA : Exploratory Data Analysis)는 데이터 분석 초기 단계에서 매우 중요하다. 분석가가 데이터를 받아 처음 작업할 때는 데이터의 구조와, 특징, 분포, 결측값 등에 대 diseny.tistory.com 1. 들어가며 통계분석이나 머신러닝에서 범주형 변수(질적변수)를 더미 변수로 변경해야 할 일이 많다. 이때 간편하게 활용할 수 있는 패키지가 "mlr"이며 createDummyFeatures 함수가 그 기능을 한다. 2. 예제 데이터 iris 데이터를 활용해 보자. 많이 알려져 있듯이 iris 데이터에는 Species라는 범주형 변수가 존재한다. 이 범주형 변수를 더미 변수로 바꿔보자. head(iris) iris 데.. 2022. 5. 2.
DataExplorer 이전글 excel.link 1. 들어가며 R에서 전처리된 데이터, 또는 분석 결과를 엑셀로 이동해 리포트를 완성해야 할 경우가 많다. 이때 "excel.link"는 매우 간편하게 활용할 수 있는 패키지다. 2. 코드 library(excel.link) # (1) xl diseny.tistory.com 1. 들어가며 탐색적 데이터 분석(EDA : Exploratory Data Analysis)는 데이터 분석 초기 단계에서 매우 중요하다. 분석가가 데이터를 받아 처음 작업할 때는 데이터의 구조와, 특징, 분포, 결측값 등에 대해 재빨리 파악을 하고 더 깊이 분석해야 할 사항을 판단해야 한다. R을 이용해 다양한 방법으로 EDA 수행할 수 있는데, 그래픽 도구 위주의 유용한 패키지를 소개한다. 2. DataE.. 2022. 4. 8.
excel.link 1. 들어가며 R에서 전처리된 데이터, 또는 분석 결과를 엑셀로 이동해 리포트를 완성해야 할 경우가 많다. 이때 "excel.link"는 매우 간편하게 활용할 수 있는 패키지다. 2. 코드 library(excel.link) # (1) xl.sheet.add('new') # (2) xlrc[["a1"]] = mtcars # (3) 3. 코드 설명 # (1) 패키지 로드 # (2) 엑셀에 'new'라는 시트 생성. 시트를 지정하지 않으면 자동으로 Sheet1에 데이터가 저장된다. 이 말은 기존 엑셀 Sheet1에 어떤 데이터가 있으면 덮어 쓴다는 말이므로 주의 요망!! # (3) 엑셀의 new 시트, a1 셀을 기준으로 mtcars 데이터 이동 그 밖에 다양한 기능이 있지만 어차피 분석은 R에서하고 보고서.. 2022. 3. 2.