Pandas : 자주 사용하는 날짜,시간 함수

제가 치매가있어서 자주사용 하는거 적는중

Use function list

1.date_range
2.to_datetime

date_range

  • 임의 기간 날짜 데이터 만들기
    2021-11-15 ~ 2021-11-30 까지 15분단위 데이터 생성 후 1초 더하기
test_date = pd.date_range(start="2021-11-15",end="2021-11-30" , freq='15T') +
datetime.timedelta(seconds=1)

**return **
0	2021-11-15 00:00:01
1	2021-11-15 00:15:01
2	2021-11-15 00:30:01
3	2021-11-15 00:45:01
4	2021-11-15 01:00:01
5	2021-11-15 01:15:01
6	2021-11-15 01:30:01
7	2021-11-15 01:45:01
8	2021-11-15 02:00:01
9	2021-11-15 02:15:01
10	2021-11-15 02:30:01
11	2021-11-15 02:45:01
12	2021-11-15 03:00:01
13	2021-11-15 03:15:01

freq 참고 자료
https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#timeseries-offset-aliases

to_datetime

  • pandas 데이터 타입을 임의 날짜형식으로 변환
date_time = pd.to_datetime(data['INPUT_DATE'], format='%d.%m.%Y %H:%M:%S')
date_time.values

**return **
array(['2021-05-01T00:00:01.000000000', '2021-05-01T00:15:01.000000000',
       '2021-05-01T00:30:01.000000000', ...,
       '2021-12-06T16:15:01.000000000', '2021-12-06T16:30:01.000000000',
       '2021-12-06T16:45:01.000000000'], dtype='datetime64[ns]')

데이터 시간 별로 합치기

data = data.set_index('date_time') # 해당 컬럼을 인덱스로
data_1h = data.resample('60T').mean() # 1분단위 데이터가 60분 단위 평균값으로 

좋은 웹페이지 즐겨찾기