[R] 데이터 전처리
데이터 전처리
분석에 적합하게 데이터를 가공하는 작업
패키지 dplyr
%>%
기호 이용해 함수 나열
dplyr 함수 | 기능 |
---|---|
filter() | 행 추출 |
select() | 열 추출 |
arrange() | 정렬 |
mutate() | 변수 추가 |
summarise() | 통계치 산출 |
group_by() | 집단별 나누기 |
left_join() | 데이터 합치기(열) |
bind_rows() | 데이터 합치기(행) |
filter() - 조건에 맞는 데이터만 추출
변수명 %>% filter(조건)
select() - 필요한 변수 추출
변수명 %>% select(추출할변수)
# 제외
변수명 %>% select(-제외할변수)
arrange() - 정렬
# 오름차순
변수명 %>% arrange(기준변수)
#내림차순
변수명 %>% arrange(desc(기준변수))
mutate() - 파생변수 추가
변수명 %>%
mutate(생성할변수명 = 파생변수조건)
group_by(), summarise() - 집단 요약
변수 %>%
group_by(기준) %>%
summarise(새변수 = 조건)
left_join(), bind_rows() - 데이터 병합
# 가로
변수 <- left_join(변수1, 변수2, by="기준")
# 세로, 변수명 통일 필요
변수 <- bind_rows(변수, 변수)
Author And Source
이 문제에 관하여([R] 데이터 전처리), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://velog.io/@atmolysis/R-데이터-전처리저자 귀속: 원작자 정보가 원작자 URL에 포함되어 있으며 저작권은 원작자 소유입니다.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)