pandas 사용 getdummies 원-hot 인 코딩 하 는 방법

1586 단어 pandasgetdummies
분 산 된 특징의 인 코딩 은 두 가지 상황 으로 나 뉜 다.
1.분 산 된 특징의 수치 간 에 크기 의 의미 가 없습니다.예 를 들 어 color:[red,blue]는 one-hot 인 코딩 을 사용 합 니 다.
2.분 산 된 특징의 수 치 는 크기 의 의미 가 있 습 니 다.예 를 들 어 size:[X,XL,XXL]는 수치의 맵{X:1,XL:2,XXL:3}을 사용 합 니 다.
pandas 를 사용 하면 분 산 된 특징 에 대해 원-hot 인 코딩 을 편리 하 게 할 수 있 습 니 다.

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)
설명:크기 의 의미 가 있 는 분 산 된 특징 에 대해 서 는 맵 을 직접 사용 하면 됩 니 다.{'XL':3,'L':2,'M':1}

Using the get_dummies will create a new column for every unique string in a certain column:  get_dummies  one-hot  

pd.get_dummies(df)

이상 이 pandas 사용 getDummies 가 one-hot 인 코딩 을 하 는 방법 은 바로 편집장 이 여러분 에 게 공유 하 는 모든 내용 입 니 다.여러분 께 참고 가 되 고 많은 응원 부 탁 드 리 겠 습 니 다.

좋은 웹페이지 즐겨찾기