Kaggle House Prices ③ ~ 예측·제출 ~
Kaggle House Prices ② ~ 모델 작성 ~
라이브러리 로드
import numpy as np
from sklearn.externals import joblib
데이터 로드
def load_x_test() -> pd.DataFrame:
"""事前に作成したテストデータの特徴量を読み込む
:return: テストデータの特徴量
"""
return joblib.load('test_x.pkl')
def load_model(i_fold):
"""事前に作成したモデルを読み込む
:return: 対象foldのモデル
"""
return joblib.load(f'model-{i_fold}.pkl')
def load_pred_test():
"""事前に作成したテストデータの予測結果を読み込む
:return: テストデータの予測結果
"""
return joblib.load('pred-test.pkl')
테스트 데이터 예측 수행
# クロスバリデーションで学習した各foldのモデルの平均により、テストデータの予測を行う
test_x = load_x_test()
preds = []
n_fold = 4
# 各foldのモデルで予測を行う
for i_fold in range(n_fold):
print(f'start prediction fold:{i_fold}')
model = load_model(i_fold)
pred = model.predict(test_x)
preds.append(pred)
print(f'end prediction fold:{i_fold}')
# 予測の平均値を取得する
pred_avg = np.mean(preds, axis=0)
# 予測結果の保存
joblib.dump(pred_avg, 'pred-test.pkl')
제출용 submission 파일 작성
pred = load_pred_test()
print(len(pred))
print(load_x_test())
submission = pd.DataFrame(pd.read_csv('test.csv')['Id'])
submission['SalePrice'] = np.exp(pred)
submission.to_csv(
'submission.csv',
index=False
)
제출 결과
Reference
이 문제에 관하여(Kaggle House Prices ③ ~ 예측·제출 ~), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/jun-16/items/1eb26dc30a507bbfa20e텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)