Python 에서 pandas 를 사용 하여 CSV 파일 을 처리 하 는 실례 설명

2082 단어 pandasCSVPython
Python 에는 데이터 처리 에 사용 할 수 있 는 편리 한 라 이브 러 리 가 많 습 니 다.특히 Numpy 와 Pandas 는 matplot 그래 픽 전용 모듈 을 조합 하여 기능 이 매우 강 합 니 다.
CSV(Comma-Separated Values)형식의 파일 은 일반 텍스트 로 저 장 된 표 데 이 터 를 말 하 는데 이것 은 엑셀 표 도 구 를 간단하게 사용 하여 처리 할 수 없고 엑셀 표 처리 의 데 이 터 량 이 매우 제한 적 이 며 Pandas 를 사용 하여 데 이 터 량 이 많은 CSV 파일 을 처리 하 는 것 이 훨씬 쉽다 는 것 을 의미한다.
제 가 사용 한 것 은 다른 하드웨어 도구 로 데 이 터 를 얻 는 것 입 니 다.하드웨어 환경 은 Linux 플랫폼 에서 구축 되 었 습 니 다.그 당시 데 이 터 는 스 크 립 트 를 실행 한 후에 terminal 에 직접 출력 되 었 고 데 이 터 량 이 매우 많 습 니 다.얻 은 데 이 터 를 저장 하기 위해 Linux 에서 데이터 흐름 을 재 설정 하여 데 이 터 를 모두 텍스트 파일 에 저장 하여 로 컬 csv 파일 을 만 들 었 습 니 다.
Pandas 는 로 컬 CSV 파일 을 읽 고 Dataframe(데이터 형식)을 설정 합 니 다.

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename         ,           csv  ,header=None      ,sep=' '              ,        ,     ‘,'  。
print df.head()
print df.tail()
#    ,  CSV    5    5 ,  pandas     5 ,                

데이터 읽 기 예제
그림 에 제 로 컬 데이터 의 앞 5 줄 과 마지막 5 줄 이 표시 되 어 있 습 니 다.맨 앞 에 표 시 된 줄 이 없 는 것 은 줄 번호 입 니 다.데 이 터 는 모두 13 열 입 니 다.레이 블 은 0 에서 12 까지 한 줄 이 완전 하지 않 고 9 열 이후 에 줄 을 바 꾸 었 습 니 다.그리고 역 슬 래 쉬'\'로 표시 되 었 습 니 다.
2017 년 4 월 28 일 업데이트
pandas 를 사용 하여 로 컬 csv 파일 을 직접 읽 은 후 csv 파일 의 열 색인 은 기본적으로 0 에서 시작 하 는 숫자 입 니 다.열 색인 을 다시 정의 하 는 문 구 는 다음 과 같 습 니 다.

import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df
이 때 인쇄 된 파일 정 보 는 다음 과 같 습 니 다.열 색인 은 이름 이 바 뀌 었 습 니 다.

이상 의 Python 에서 pandas 를 사용 하여 CSV 파일 을 처리 하 는 실례 설명 은 바로 편집장 이 여러분 에 게 공유 한 모든 내용 입 니 다.여러분 에 게 참고 가 되 고 많은 응원 을 바 랍 니 다.

좋은 웹페이지 즐겨찾기