R 벌크 처리 파일 사용 방법

면책 성명: 아래의 코드를 실행하면 당신의 컴퓨터와 파일에 회복할 수 없는 손해를 입힐 수 있습니다. 코드의 의미를 확인한 후에 실행하세요!본 주인은 코드 운행의 결과에 대해 어떠한 책임도 지지 않습니다.

1 기본 함수


1.1 파일 작업 함수


이러한 함수는 매우 많은데 다음은 기본 설치 패키지(base)의 일부입니다.
ls("package:base", pattern="^file\\.")
##  [1] "file.access"  "file.append"  "file.choose"  "file.copy"   
##  [5] "file.create"  "file.exists"  "file.info"    "file.link"   
##  [9] "file.mode"    "file.mtime"   "file.path"    "file.remove" 
## [13] "file.rename"  "file.show"    "file.size"    "file.symlink"

일반적인 용도:
  • file.exists: 파일이 있는지 확인
  • file.copy: 파일 복제본
  • file.remove: 파일 삭제
  • file.rename: 파일 이름 바꾸기
  • file.크기: 파일 크기 가져오기 (B)
  • file.info: 파일 정보 가져오기 (파일 크기 포함), 결과는 목록이나 데이터 상자
  • file.path: 구성 파일 경로
  • 그러나 가장 자주 사용하는 함수는list일 수 있습니다.files 이 함수는 지정된 디렉토리(경로)에 있는 파일을 나열하는 역할을 합니다.
    str(list.files)
    
    ## function (path = ".", pattern = NULL, all.files = FALSE, full.names = FALSE, 
    ##     recursive = FALSE, ignore.case = FALSE, include.dirs = FALSE, 
    ##     no.. = FALSE)
    
  • path: 파일 경로, 기본값은.현재 작업 디렉터리 (getwd () 획득)
  • pattern: 파일 이름 필터 모드, 정규 표현식 사용
  • all.files: 숨겨진 파일을 포함하는 모든 파일을 열거할지 여부
  • full.names: 파일 이름이 파일 경로를 포함하는 '전체 이름' 형식으로 표시될지 여부
  • recursive: 디렉터리 찾기 (하위 디렉터리 찾기)
  • ignore.case: 지정한 모드 (pattern 매개 변수) 대소문자 무시 여부
  • include.dirs: 디렉터리 이름을 포함할지 여부 (대부분의 시스템은 '디렉터리' 도 '파일' 이라고 여긴다)
  • 1.2 문자열 작업 함수


    여기는 두 개만 소개합니다: gsub와strsplit.
    우리는 gsub라는 함수로 파일 이름에서 필요한 정보를 추출할 것입니다.용도는 다음과 같습니다.
    str(gsub)
    
    ## function (pattern, replacement, x, ignore.case = FALSE, perl = FALSE, 
    ##     fixed = FALSE, useBytes = FALSE)
    
  • pattern: 검색 모드, 정규 표현식 사용
  • replacement: 교체 모드, 정규 표현식
  • 사용 가능
  • x: 처리할 문자(직렬) 벡터
  • ignore.case: 지정한 모드 (pattern 매개 변수) 대소문자 무시 여부
  • fixed: 모드(pattern 매개 변수)는 정규 표현식을 사용하지 않습니다
  • strsplit의 역할은 지정된 구분자를 사용하여 문자열을 가공하는 것입니다.
    str(strsplit)
    
    ## function (x, split, fixed = FALSE, perl = FALSE, useBytes = FALSE)
    

    그 결과는 문자열 벡터에 적용되면 apply 함수와 함께 사용하는 것이 가장 좋은 목록입니다.
    xnames 
    ## [[1]]
    ## [1] "T" "1" "a"
    ## 
    ## [[2]]
    ## [1] "T" "2" "b"
    
    apply(cbind(xnames), 1, FUN = function(x) strsplit(x, "-")[[1]])
    
    ##      [,1] [,2]
    ## [1,] "T"  "T" 
    ## [2,] "1"  "2" 
    ## [3,] "a"  "b"
    

    2 파일 이름에서 정보 추출


    strsplit 함수를 사용할 수 있습니다.예를 들어 파일 확장자를 가져오는 방법:
    ffs 

    물론 gsub 함수도 사용할 수 있습니다.
    gsub("^.+\\.([^\\.]+$)", "\\1", ffs)
    

    파일 이름에서 유용한 정보를 추출하려면 먼저 파일 이름에 유용한 정보가 있어야 한다. 이것은 파일 이름 습관에 달려 있다.만약 당신이 과학을 하는 사람이라면, 문서 이름에 샘플, 중복, 시간 등의 정보를 포함하는 것을 권장합니다.일정한 규칙을 사용하여 파일을 명명하는 것은 후기 데이터 처리에 매우 유용하다.

    3 벌크 파일 이름 바꾸기


    기본 절차는 다음과 같습니다.
  • list를 사용합니다.파일 함수 원본 파일 이름 가져오기
  • 새 파일 이름 만들기
  • file로.rename 파일 이름 바꾸기
  • 다음 코드는 현재 디렉토리의 Temp 하위 디렉토리에 있는 txt 파일의 이름을 번호로 바꿉니다.
    ffo  0) {
        ffn 

    다음 코드는 현재 디렉토리의 파일 이름 확장자를 대문자로 바꿉니다.
    ffo 

    4 벌크 파일 선택 및 삭제


    파일 정보에 따라 파일을 선택한 다음 삭제할 수 있습니다.이때 파일.info 함수가 유용합니다.
    xsel  0) file.remove(ffs[xsel])
    

    5 대량 파일 데이터 읽기


    일반적으로 for 순환을 사용하여 읽습니다. 예를 들어:
    dtx 

    하지만 이것은 당신의 파일과 데이터에 달려 있습니다.파일 이름의 명명은 규칙을 중시하고 저장 형식도 표준화해야 한다!만약 이 점을 할 수 없다면, 네가 과학을 하고 있다고 말하지 마라.
    작성자:ZGUANG@LZU
    Created: 2018-10-24 3 10:29

    좋은 웹페이지 즐겨찾기