AutoML을 사용하여 30분 내에 Signate-Intermediate로 승격

머리



Signate에서는 콘페티션의 성적으로 7단계로 칭호가 할당되고 있습니다만, 1개 올리는 것만으로도 꽤 허들이 높은 것이라고 생각하고 있었습니다. 레벨이 높은 것은 물론, 대회가 많이 있는 것은 아니기 때문에 승격하는데 시간이 걸리는 것이라고 결정해 붙었습니다만, 의외로 그렇지 않았습니다.
칭호 첨부 콤페나 SOTA Challenge 등, 승격할 기회를 마련해 주고 있어, 운영의 분들에게는 감사입니다.
시험에 칭호가 붙은 대회에 참가를 하고, 처음으로 AutoML을 사용해 보았던 곳, 안내외 순간 임계치를 넘을 수 있어 Intermediate에 승격했습니다.
30분 걸리지 않고 할 수 있었기 때문에 모처럼이라고 생각해, 기사를 작성했습니다.

↓ SignateHP에서 인용 (h tps : // / g. jp/우세 rs/란킨 gs/에 lp)


참여 대회



2021년 10월에만 개최되는 대회입니다.

코드



라이브러리 가져오기


import pandas as pd
!pip install pycaret
from pycaret.classification import *

데이터 로드


train_data = pd.read_csv("train.csv")
train_data


test_data = pd.read_csv("test.csv")
test_data



학습 데이터의 정답 라벨 비율
len(train_data[train_data["loan_status"]==1])/len(train_data)



Pycaret


model = setup(data=train_data, target="loan_status")


compare_models()



개인적으로 LightGBM을 좋아하기 때문에 우선 사용하고 있습니다.
model = create_model("lightgbm")



F1 점수가 최적이 되도록 매개변수 조정


tuned_model = tune_model(model, optimize="F1")



※ Accuracy Ver.

evaluate_model(tuned_model)



우선, 학습 데이터의 정답 라벨의 비율을 임계치로서 채용
test_pred = predict_model(tuned_model, probability_threshold= 0.2148, data=test_data)
test_pred



제출


sample = pd.read_csv("submit.csv", header=None)
submission = sample.drop(columns=[1])

submission[0] = test_pred["Label"]
submission.to_csv("submission.csv", header=None)

후기



Intermediate로 승격함으로써 자기 어필로 이어지면 좋겠다고 생각합니다.
다음은 Advanced나 Expert로 승격할 수 있도록 SOTA Challenge에 참가하여 메달 획득할 수 있도록 노력하고 싶습니다.

좋은 웹페이지 즐겨찾기