pandas 사용 getdummies 원-hot 인 코딩 하 는 방법
1.분 산 된 특징의 수치 간 에 크기 의 의미 가 없습니다.예 를 들 어 color:[red,blue]는 one-hot 인 코딩 을 사용 합 니 다.
2.분 산 된 특징의 수 치 는 크기 의 의미 가 있 습 니 다.예 를 들 어 size:[X,XL,XXL]는 수치의 맵{X:1,XL:2,XXL:3}을 사용 합 니 다.
pandas 를 사용 하면 분 산 된 특징 에 대해 원-hot 인 코딩 을 편리 하 게 할 수 있 습 니 다.
import pandas as pd
df = pd.DataFrame([
['green', 'M', 10.1, 'class1'],
['red', 'L', 13.5, 'class2'],
['blue', 'XL', 15.3, 'class1']])
df.columns = ['color', 'size', 'prize', 'class label']
size_mapping = {
'XL': 3,
'L': 2,
'M': 1}
df['size'] = df['size'].map(size_mapping)
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)
설명:크기 의 의미 가 있 는 분 산 된 특징 에 대해 서 는 맵 을 직접 사용 하면 됩 니 다.{'XL':3,'L':2,'M':1}
Using the get_dummies will create a new column for every unique string in a certain column: get_dummies one-hot
pd.get_dummies(df)
이상 이 pandas 사용 getDummies 가 one-hot 인 코딩 을 하 는 방법 은 바로 편집장 이 여러분 에 게 공유 하 는 모든 내용 입 니 다.여러분 께 참고 가 되 고 많은 응원 부 탁 드 리 겠 습 니 다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
【Pandas】DatetimeIndex란? no.29안녕하세요, 마유미입니다. Pandas에 대한 기사를 시리즈로 작성하고 있습니다. 이번은 제29회의 기사가 됩니다. 에서 Pandas의 시간에 대한 모듈에 대해 씁니다. 이번 기사에서는, 「DatetimeIndex」...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.