하나.파일 읽기

2659 단어

csv 형식 읽기


명령:pd.read_csv() 일반 매개 변수:
  • path 파일 경로, 네트워크 데이터일 수 있습니다
  • 인코딩 지정 인코딩..pd.read_csv('example.csv', encoding='gb2312')
  • sep는 줄의 각 필드의 구분자를 지정합니다.read_csv () 시 기본값은 쉼표입니다
  • 헤더는 열 인덱스로 사용할 줄을 지정합니다. 기본값은 0, 즉 첫 번째 줄입니다.None을 지정하면 pandas는 기본적으로 숫자 인덱스를 제공합니다.주의해야 할 것은, 만약 첫 번째 줄이 아니라면, 당신이 지정한 이 줄 이전의 데이터는 무시될 것입니다pd.read_csv('example.csv', header=None, encoding='gb2312')
  • index_col는 어떤 열을 줄 인덱스로 지정합니까,pandas의 기본 줄 인덱스는 0부터 계속 아래로 점차적으로 증가하지만, 어떤 열을 줄 인덱스로 지정할 수 있습니다. 이곳의 지정은 숫자 형식일 수도 있고, 구체적으로 줄 이름일 수도 있습니다
    pd.read_csv('example.csv', index_col=0)  #  0 
    pd.read_csv('example.csv', index_col='company')  #  'company' 
    
  • names 스스로 열 인덱스를 추가하는 목록 형식입니다.pd.read_csv('example.csv', names=[' ',' ', ' ', ' ']) 원본 데이터에 인덱스가 있습니다. 인덱스를 다시 사용자 정의하려면 추가할 수 있습니다header=0 인자,names라는 새로운 인덱스를 사용하여 원래의 인덱스를 대체하는 것을 의미합니다..
  • parse_날짜는 어떤 열을 날짜 형식으로 변환합니다
  • skiprows는 무시된 줄 수나 건너뛸 줄 번호를 지정합니다.숫자인 경우 0행부터 시작하여 앞의 행을 무시하고 목록인 경우 특정 행을 무시합니다..
  • na_values 만약 na_values 뒤에 목록이 있습니다. 목록에 있는 데이터는 NaN이 됩니다.하면, 만약, 만약...values 뒤에 사전이 있습니다. 사전의 키는 열 이름이고 값은 Nan이 되고 싶은 데이터입니다
  • comment는 주석 정보를 줄 끝에서 분리한 문자입니다.(하나 이상)
  • nrows가 읽은 줄 수입니다.(파일로부터 계산)
  • thousands는 천위 구분자를 지정합니다. 예를 들어,'..
  • chunksize 파일 블록의 크기는 블록별로 파일을 읽을 때 사용됩니다pd.read_csv('example.csv', chunksize=10)
  • iterator는 파일을 한 블록씩 읽을 수 있도록 TextParser를 되돌려줍니다

  • csv 형식 쓰기


    명령:df.to_csv() 매개 변수:
  • index는 기본적으로 index 인덱스를 함께 쓰지만, 인자, index=False를 지정하여 인덱스 쓰기를 취소할 수 있습니다
  • 헤더가 False로 지정되면 columns 인덱스에 기록되지 않습니다
  • columns는columns=[]로 쓸 열을 지정할 수 있습니다..

  • excel 형식 읽기


    명령:pd.read_excel () 매개변수:
  • sheet_name excel 작업표를 지정합니다
  • converters는 칸을 변환하여 함수를 사용할 수 있습니다

  • excel 형식 쓰기


    명령:pd.to_excel () 매개변수:
  • sheet_name excel 작업표를 지정합니다
  • index가 False일 때 index 인덱스를 쓰지 않습니다
  • startrow는 excel의 몇 번째 줄부터 지정합니다. 이것은 excel 작업표의 몇 번째 줄을 가리키는 것이지 우리의 df 데이터가 아닙니다.예를 들면, startrow=1, 그러면 excel을 열면 시작하는 줄은 2..
  • startcol와 같이 여기가 열입니다. 예를 들어 startcol=1입니다. 그러면 excel은 B열부터 쓸 것입니다
  • 두 DataFrame을 같은 excel 파일의 두 개의 다른 sheet에 기록합니다. 방법은 다음과 같습니다
  • with pd.ExcelWriter('Excelname.xlsx') as writer:
        df1.to_excel(writer, sheet_name='sheet1')
        df2.to_excel(writer, sheet_name='sheet2')
    

    좋은 웹페이지 즐겨찾기