데이터 처리 패키지 dplyr 에 대한 함수 용법 총화

dplyr 는 dataframe 대상 을 처리 하 는 데 전념 하고 다른 데이터베이스 대상 과 의 인 터 페 이 스 를 제공 합 니 다.
1.5 개의 관건 적 인 데이터 처리 함수:
select()열 을 되 돌려 주 는 부분 집합
filter()줄 의 부분 집합 을 되 돌려 줍 니 다.
arrange()는 하나 이상 의 변수 에 따라 줄 을 정렬 합 니 다.
mutate()기 존 데이터 로 새 열 만 들 기
summarise()는 각 그룹 에 대해 종합 적 으로 계산 하고 1 차원 결 과 를 되 돌려 줍 니 다.
Tips:
1、select()
Dplyr 패 키 지 는 select()에서 변 수 를 선택 할 때 다음 과 같은 보조 함수 가 있 습 니 다.
starts_with("X"):"X"로 시작 하 는 변수 이름
ends_with("X"):"X"로 끝 나 는 변수 이름
contains("X"):"X"를 포함 하 는 변수 이름
matches("X"):정규 표현 식"x"와 일치 하 는 변수 이름
num_range("x",1:5):변 수 는 x01,x02,x03,x04 and x05 입 니 다.
one_of(x):문자 벡터 x 에 나타 난 모든 변수 이름
select()에서 열 을 직접 사용 할 때""를 인용 할 필요 가 없 지만,상기 보조 함 수 를 사용 할 때 는""을 인용 해 야 합 니 다.
2、filter()
R 은 filter()에 사용 할 수 있 는 일련의 논리 표현 식 이 있 습 니 다.
x < y;x <= y;x == y;x != y;x >= y;x > y;x %in% c(a, b, c)
예시:
filter(df, a > 0, b > 0)
filter(df, !is.na(x))
3、arrange()
arrange()는 기본적으로 작은 것 부터 큰 것 까지 정렬 합 니 다.arrange()에서 desc()를 사용 하면 큰 것 부터 작은 것 까지 정렬 할 수 있 습 니 다.
4、mutate()
mutate()는 같은 호출 에서 새로운 변 수 를 사용 하여 다음 변 수 를 만 들 수 있 습 니 다.예 를 들 어:
mutate(my_df, x = a + b, y = x + c)
5、 summarise()
R 의 다음 집합 함 수 는 summarise()에 사용 할 수 있 습 니 다.
  • min(x)-최소 치.
  • max(x)-최대 치
  • mean(x)-평균치
  • median(x)-중위 수
  • quantile(x,p)-x 의 P 번 째 분 위수
  • sd(x)-표준 차
  • var(x)-분산
  • IQR(x)-4 분 위수
  • diff(range(x))-x 값 의 범위
  • dplyr 패키지 자체 가 유용 한 집합 함 수 를 제공 합 니 다:
  • first(x)-벡터 x 의 첫 번 째 요소
  • last(x)-벡터 x 의 마지막 요소
  • th(x,n)-벡터 x 중의 n 번 째 요소
  • n()-data.frame 의 줄 수 또는 summarise()가 묘사 한 관측 팀 의 수량
  • n_distinct(x)-벡터 x 의 유일한 값 의 수량
  • 2.파이프 함수%>%
    dplyr 패키지 에 있 는 특유 의 파이프 함수%>%,이전 함수 의 출력 을 다음 함수 의 입력 으로 합 니 다.
    %>%연산 자 는 매개 변수 목록 에서 함수 의 첫 번 째 매개 변 수 를 추출 하고%>%앞 에 놓 을 수 있 습 니 다.
    다음 두 명령 은 같다.
    mean(c(1, 2, 3, NA), na.rm = TRUE)
    c(1, 2, 3, NA) %>% mean(na.rm = TRUE)
    3.그룹 함수 groupby()
    데이터 세트 에 그룹 을 정의 합 니 다.그리고 각 그룹 에 대해 각각 집계 통 계 를 진행 할 수 있다.
    그룹 통과by()그룹 정 보 를 추가 하면 mutate(),arrange(),summarise()함수 가 자동 으로 이 tbl 류 데이터 에 대해 그룹 작업 을 수행 합 니 다.
    group_by(dataframe,colnames1,colnames2,…)
    4.연결 데이터(joins)
    1.6 가지 연결 함 수 는 다음 과 같다.
    left_join(dataset1,dataset2)
    right_join(dataset1,dataset2)
    inner_join(dataset1,dataset2,by=c(“”))
    full_join(dataset1,dataset2, by = c("first", "last"))
    semi_join(dataset1,dataset2, by = c("first", "last"))
    anti_join(dataset1,dataset2, by = c("first", "last"))
    앞의 4 가 지 는 변형 연결(mutting joins)에 속 하고,뒤의 2 가 지 는 필터 연결(filtering joins)에 속한다.
    semi-joins 는 두 번 째 데이터 세트 의 정 보 를 바탕 으로 첫 번 째 데이터 세트 의 데 이 터 를 걸 러 냅 니 다.안 티-joins 는 합병 할 때 두 번 째 데이터 세트 와 일치 하지 않 는 줄 을 찾 습 니 다.

    2.key 값
    R 언어의 data frames 는 row.names 속성 에 중요 한 정 보 를 저장 할 수 있 습 니 다.데 이 터 를 저장 하 는 좋 은 방법 은 아니 지만 흔 합 니 다.데이터 세트 의 주 키워드 가 row.names 에 있 으 면 다른 데이터 세트 와 연결 하기 어 려 울 것 입 니 다.tibble 패키지(tibble:a data frame with class tbldf)의 rownamesto_column()함수,이 데이터 세트 의 사본 을 되 돌려 주 고 줄 이름 을 한 열 로 이 데이터 에 추가 합 니 다.
    library(tibble)
    rownames_to_column(data, var="name")
    두 데이터 세트 에 같은 열 이름 이 있 지만 대표 하 는 것 이 다 르 고 by 매개 변수 에 중복 되 는 열 이름 이 포함 되 어 있 지 않 으 면 dplyr 는 이 열 이름 을 무시 하고 같은 열 이름 에.x 와.y 를 추가 하여 열 을 나 누 는 데 도움 을 줄 것 입 니 다.
    두 데이터 가 같은 사물 에 집 중 될 때 서로 다른 열 이름 이 있 습 니 다.합병 을 완료 하려 면 by 를 하나의 이름 벡터 로 설정 합 니 다.벡터 의 이름 은 데이터 집중 의 열 이름 이 고 벡터 의 값 은 두 번 째 데이터 집중 의 열 이름 입 니 다.예 를 들 면:
    x %>% left_join(y, by = c("x.name" = "y.name"))
    연결 이 끝 난 후 메 인 데이터 가 집 중 된 열 이름 을 유지 합 니 다.
    3.여러 데이터 세트 의 연결
    Purrr 패키지 의 reduce()함 수 는 여러 데이터 세트 에 한 함 수 를 반복 적 으로 적용 합 니 다.여러 데이터 세트 를 연결 하여 dplyr 의 join 류 함수 와 결합 하여 사용 할 수 있 습 니 다.예 를 들 어:
    library(purrr)
    list(data1,data2,data3) %>% reduce(left_join,by = c("first","last"))
    5.집합 작업(set operations)
    dplyr 는 intersection,union,setdiff 를 제공 하여 데이터 세트 의 교 집합,병렬 집합 과 차 집합 을 얻 을 수 있 습 니 다.

    6.조립 데이터 assembling data
    다음 함수 사용:
    bind_rows()
    bind_cols():여러 개의 data frame 을 하나의 data frame 으로 합성 합 니 다.
    data_frame():일련의 벡터 를 data frame 으로 조합 합 니 다.
    as_data_frame():list 를 data frame 으로 변환
    이상 의 이 데이터 처리 패키지 dplyr 에 관 한 함수 용법 정 리 는 바로 편집장 이 여러분 에 게 공유 한 모든 내용 입 니 다.여러분 께 참고 가 되 고 저희 도 많이 응원 해 주 셨 으 면 좋 겠 습 니 다.

    좋은 웹페이지 즐겨찾기