scikit-learn#0 쉽게 잊는 것들 링크로 모아보기

train-test split

https://jimmy-ai.tistory.com/115

핵심 label의 비율이 안맞을 경우 이를 맞춰주어야할 필요가 있을 때가 있다.
이것을 구현한 method는 찾기가 힘들었고, 대신 직접 코드로 구현을 했다.
이 과정을 거치면 이 비율을 맞춰줄 수 가 있다.

label1 = data_full[data_full['labels']==1].iloc[:22229]
label0 = data_full[data_full['labels']==0].iloc[:22229]

data_count = pd.concat([label0, label1])

data_train, data_test = train_test_split(data_count, test_size = 0.1, shuffle=True)

좋은 웹페이지 즐겨찾기