numpy 와 pandas 를 이용 하여 csv 파일 을 처리 하 는 시간 방법

환경:numpy,pandas,python 3
기계 학습 과 깊이 있 는 학습 과정 에서 예측,회귀 문 제 를 처리 할 때 가끔 변 수 는 시간 이 므 로 적당 한 전환 처 리 를 해 야 학습 분석 을 할 수 있 습 니 다.시간 에 관 한 변 수 는 다음 과 같 습 니 다.pandas 와 numpy 를 이용 하여 csv 파일 의 시간 을 처리 합 니 다.

date (UTC) Price 
01/01/2015 0:00 48.1 
01/01/2015 1:00 47.33 
01/01/2015 2:00 42.27

#coding:utf-8
import datetime
import pandas as pd
import numpy as np
import pickle
# pandas         
dateparse = lambda dates: pd.datetime.strptime(dates,'%d/%m/%Y %H:%M')
#      ,         
rawdata = pd.read_csv('RealMarketPriceDataPT.csv',parse_dates={'timeline':['date','(UTC)']},date_parser=dateparse)
#              ,s    
def datestr2num(s):
 #toordinal()            
 return datetime.datetime.strptime(s,'%Y-%m-%d %H:%M:%S').toordinal()
x = []
y = []
new_date = []
for i in range(rawdata.shape[0]):
 x_convert = int(datestr2num(str(rawdata.ix[i,0])))
 new_date.append(x_convert)
 y_convert = rawdata.ix[i,1].astype(np.float32)
 x.append(x_convert)
 y.append(y_convert)
x = np.array(x).astype(np.float32)
"""
with open('price.pickle','wb') as f:
 pickle.dump((x,y),f)
"""
print(datetime.datetime.fromordinal(new_date[0]),'------>>>>>>',new_date[0])
print(datetime.datetime.fromordinal(new_date[10]),'------>>>>>>',new_date[10])
print(datetime.datetime.fromordinal(new_date[20]),'------>>>>>>',new_date[20])
print(datetime.datetime.fromordinal(new_date[30]),'------>>>>>>',new_date[30])
print(datetime.datetime.fromordinal(new_date[40]),'------>>>>>>',new_date[40])
print(datetime.datetime.fromordinal(new_date[50]),'------>>>>>>',new_date[50])
결실
csv 파일 의 시간 표시 줄 을 한 열 로 합 쳐 데이터 분석 이 편리 한 float 또는 int 형식 으로 변환 합 니 다.

이상 은 numpy 와 pandas 를 이용 하여 csv 파일 을 처리 하 는 시간 방법 은 바로 작은 편집 이 여러분 에 게 공유 하 는 모든 내용 입 니 다.여러분 께 참고 가 되 고 저희 도 많이 응원 해 주 셨 으 면 좋 겠 습 니 다.

좋은 웹페이지 즐겨찾기