Python 에서 pandas 를 사용 하여 CSV 파일 을 처리 하 는 실례 설명
CSV(Comma-Separated Values)형식의 파일 은 일반 텍스트 로 저 장 된 표 데 이 터 를 말 하 는데 이것 은 엑셀 표 도 구 를 간단하게 사용 하여 처리 할 수 없고 엑셀 표 처리 의 데 이 터 량 이 매우 제한 적 이 며 Pandas 를 사용 하여 데 이 터 량 이 많은 CSV 파일 을 처리 하 는 것 이 훨씬 쉽다 는 것 을 의미한다.
제 가 사용 한 것 은 다른 하드웨어 도구 로 데 이 터 를 얻 는 것 입 니 다.하드웨어 환경 은 Linux 플랫폼 에서 구축 되 었 습 니 다.그 당시 데 이 터 는 스 크 립 트 를 실행 한 후에 terminal 에 직접 출력 되 었 고 데 이 터 량 이 매우 많 습 니 다.얻 은 데 이 터 를 저장 하기 위해 Linux 에서 데이터 흐름 을 재 설정 하여 데 이 터 를 모두 텍스트 파일 에 저장 하여 로 컬 csv 파일 을 만 들 었 습 니 다.
Pandas 는 로 컬 CSV 파일 을 읽 고 Dataframe(데이터 형식)을 설정 합 니 다.
import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ') #filename , csv ,header=None ,sep=' ' , , ‘,' 。
print df.head()
print df.tail()
# , CSV 5 5 , pandas 5 ,
데이터 읽 기 예제
그림 에 제 로 컬 데이터 의 앞 5 줄 과 마지막 5 줄 이 표시 되 어 있 습 니 다.맨 앞 에 표 시 된 줄 이 없 는 것 은 줄 번호 입 니 다.데 이 터 는 모두 13 열 입 니 다.레이 블 은 0 에서 12 까지 한 줄 이 완전 하지 않 고 9 열 이후 에 줄 을 바 꾸 었 습 니 다.그리고 역 슬 래 쉬'\'로 표시 되 었 습 니 다.
2017 년 4 월 28 일 업데이트
pandas 를 사용 하여 로 컬 csv 파일 을 직접 읽 은 후 csv 파일 의 열 색인 은 기본적으로 0 에서 시작 하 는 숫자 입 니 다.열 색인 을 다시 정의 하 는 문 구 는 다음 과 같 습 니 다.
import pandas as pd
import numpy as np
df=pd.read_csv('filename',header=None,sep=' ',names=["week",'month','date','time','year','name1','freq1','name2','freq2','name3','data1','name4','data2'])
print df
이 때 인쇄 된 파일 정 보 는 다음 과 같 습 니 다.열 색인 은 이름 이 바 뀌 었 습 니 다.이상 의 Python 에서 pandas 를 사용 하여 CSV 파일 을 처리 하 는 실례 설명 은 바로 편집장 이 여러분 에 게 공유 한 모든 내용 입 니 다.여러분 에 게 참고 가 되 고 많은 응원 을 바 랍 니 다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
【Pandas】DatetimeIndex란? no.29안녕하세요, 마유미입니다. Pandas에 대한 기사를 시리즈로 작성하고 있습니다. 이번은 제29회의 기사가 됩니다. 에서 Pandas의 시간에 대한 모듈에 대해 씁니다. 이번 기사에서는, 「DatetimeIndex」...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.