python_pandas_도로 행정구역 등급의 데이터를 그룹으로 나누어 화합시키다
19308 단어 python 데이터 처리python 데이터 발굴
# -*- coding: utf-8
import pandas as pd
'''
population|gender|age|district_O|street_O|district_D|street_D
01|10|1| | | |
'''
def get_bus_station():
file = 'gender_age.txt'
Street_OD = pd.read_csv(od_src + file,encoding='gbk',usecols=[0,1,2,3,5],sep='|',names=['gender','age','od','district_O','district_D'])
df3 = Street_OD.groupby(['gender','age','district_O','district_D']).agg({'od':sum})
df3.name = 'od_count'
df3.to_csv(od_src + 'od_district_gender_age_201911.csv', index=True,header=True)
Street_OD = pd.read_csv(od_src + file,encoding='gbk',usecols=[0,1,2,4,6],sep='|',names=['gender','age','od','street_O','street_D'])
df3 = Street_OD.groupby(['gender','age','street_O','street_D']).agg({'od':sum})
df3.name = 'od_count'
df3.to_csv(od_src + 'od_street_gender_age_201911.csv', index=True,header=True)
gender = pd.read_csv(od_src + 'od_district_gender_age_201911.csv')
age = gender[gender['age']>3]
age = age[age['age']<14]
age.to_csv(od_src + 'od_district_age_gender_201911.csv', index=False)
gender = pd.read_csv(od_src + 'od_street_gender_age_201911.csv')
age = gender[gender['age']>3]
age = age[age['age']<14]
age.to_csv(od_src + 'od_street_age_gender_201911.csv', index=False)
# ,01,06,1, , , ,
def get_bus_station_202004():
file = 'flow_age_202004.csv'
Street_OD = pd.read_csv(od_src + file,usecols=[1,2,3,4,6],sep=',',names=['gender','age','od','district_O','district_D'])
df3 = Street_OD.groupby(['gender','age','district_O','district_D']).agg({'od':sum})
df3.name = 'od_count'
df3.to_csv(od_src + 'od_district_gender_age_202004.csv', index=True,header=True)
Street_OD = pd.read_csv(od_src + file,usecols=[1,2,3,5,7],sep=',',names=['gender','age','od','street_O','street_D'])
df3 = Street_OD.groupby(['gender','age','street_O','street_D']).agg({'od':sum})
df3.name = 'od_count'
df3.to_csv(od_src + 'od_street_gender_age_202004.csv', index=True,header=True)
gender = pd.read_csv(od_src + 'od_district_gender_age_201911.csv')
age = gender[gender['age']>3]
age = age[age['age']<14]
age.to_csv(od_src + 'od_district_age_gender_202004.csv', index=False)
gender = pd.read_csv(od_src + 'od_street_gender_age_201911.csv')
age = gender[gender['age']>3]
age = age[age['age']<14]
age.to_csv(od_src + 'od_street_age_gender_202004.csv', index=False)
if __name__ == '__main__':
od_src = r'D:\201911\\'
get_bus_station_202004()
데이터가 필요하거나 데이터 처리를 도와주신다면 제 얘기를 좀 해주세요.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
AttributeError: 'Series' object has no attribute 'reshape'오류 보고: AttributeError: 'Series' object has no attribute' reshape ' 원인: data 는 dataFrame 데이터 구조 입 니 다. data ['Amount'] 는 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.