팬더의 카테고리 유형
팬더의 카테고리 데이터 유형은 무엇입니까?
카테고리 사용의 장점:
팬더 데이터 프레임에서 범주를 사용하는 방법:
- CSV 파일을 읽는 동안:
아래와 같이 파일을 읽으면서 열을 객체에서 카테고리로 변환할 수 있습니다.
filename = "~/Downloads/US_Accidents_Dec20.csv"
# Converting into category data type while reading CSV file
us_accidents_dec20_cat = pd.read_csv(filename, dtype = {'State' : 'category', 'City' : 'category'})
- 열을 카테고리 유형으로 변환:
아래와 같이 즉석에서 열을 변환할 수 있습니다.
# Loading csv file into data frame
filename = "~/Downloads/US_Accidents_Dec20.csv"
us_accidents_dec20_cat = pd.read_csv(filename,)
# Normal column access
us_accidents_dec20['State']
# Converting to category data type
us_accidents_dec20['State'].astype('category')
개체와 범주 데이터 유형 간의 메모리 비교:
us_accidents_dec20['State'].memory_usage(deep=True) / 1e6
결과:
249.720047
us_accidents_dec20['State'].astype('category').memory_usage(deep=True) / 1e6
결과:
4.23684
저장 공간이 249에서 4로 줄어든 것을 분명히 확인할 수 있습니다. 이는 매우 큰 차이입니다.
카테고리 데이터 유형으로 변환하면 많은 데이터 세트의 처리 속도와 공간을 개선하는 데 확실히 도움이 됩니다.
행복한 배움!!
추신: 미국에서 2020년 12월의 중고 사고 데이터, 이 데이터는 kaggle에서 얻을 수 있습니다.
Reference
이 문제에 관하여(팬더의 카테고리 유형), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/chanduthedev/category-type-in-pandas-3h73텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)