R 언어tidyr 패키지 데이터 변환 함수 (dplyr 패키지 조합 사용, 완벽)

일상적인 데이터 예처리에서 데이터의 각종 변형, 변환을 피할 수 없다. R 언어의tidyr 패키지 함수는 데이터 변형의 문제, 변수, 열의 변환을 해결했다.

1. 넓은 데이터, 긴 데이터

gather(data, key = "key", value = "value", ..., na.rm = FALSE,convert = FALSE, factor_key = FALSE)

파라미터 설명: 데이터 데이터;
키는 원 데이터의 모든 열에 새 변수를 부여합니다. 이 새 변수가 바로 이곳의 키입니다. 따라서 이 인자에 이름을 붙이는 것은 그 의미를 주의해야 합니다.
value는 원 데이터의 모든 값을 새 변수에 부여합니다. 이 새 변수가 바로 여기의value입니다. 따라서 이 인자에 이름을 붙이는 것은 그 의미를 주의해야 합니다.
                  ...이 생략호는 주의해야 할 부분이다. 이것은 당신이 전환해야 할 열을 선택한 것이다. 만약 당신이 이곳을 생략한다면 모든 열을 전환할 것이다. 그리고 열의 이름 앞에 있는 열을 제외하면 된다.
                  na.rm=FALSE 부족한 값을 삭제하시겠습니까?
convert=FALSE에 유형 변환이 필요한지 여부;
                  factor_key=FALSE가 문자 벡터로 저장되는지 여부입니다. 그렇지 않으면 인자로 저장되어 원시 순서대로 배열됩니다.

2. 긴 데이터가 넓은 데이터

spread(data, key, value, fill = NA, convert = FALSE, drop = TRUE,sep = NULL)

파라미터 설명: 데이터 데이터;
key에서 변수 값을 필드 변수로 변환하기;
value 분리해야 할 값;
fill은 변환 후의 부족한 값에 fill 값을 부여할 수 있다.

3. 다열 데이터 병합

unite(data, col, ..., sep = "_", remove = TRUE)

파라미터 설명: 데이터 데이터;
col은 새 열의 이름을 구성합니다.
                   ...조합할 열 선택하기;
sep 값 사이의 구분자, 기본값은 ""입니다.
remove에서 조합된 열을 삭제할 지 여부입니다.

4. 열 데이터 분할

separate(data, col, into, sep = "[^[:alnum:]]+", remove = TRUE,convert = FALSE, 
extra = "warn", fill = "warn", ...)

파라미터 설명: 데이터 데이터;
col에서 분리해야 할 열;
into에서 새로 생성한 열 이름입니다. 형식을 잘못 쓰지 마십시오.
sep는 분리열의 구분자입니다. 이것은 절대로 틀려서는 안 됩니다.
remove가 분리된 열을 삭제할지 여부는 상황에 따라 결정됩니다.            
                
 
현재의 글은 점점 더 적절하고 기초적으로 쓰여지고 있습니다. 다음에 좀 더 깊은 글을 써서 지식을 공유하고 즐거움을 나누세요!

좋은 웹페이지 즐겨찾기