R: Kaggle Titanic

R에서 Kaggle에 Submit 해 보았습니다.
거의 다음 기사와 동일합니다.
【초보자용】kaggle의 타이타닉호 승객의 생존 예측 모델을 R로 바삭바삭하게 만든다
그러나 Score는 달랐습니다. 0.70334였습니다.

In [1]:

library('randomForest') 

list.files(path = "../input/titanic")

train_path <- '../input/titanic/train.csv'
test_path <- '../input/titanic/test.csv'
train <- read.csv(train_path, stringsAsFactors = F )
test  <- read.csv(test_path, stringsAsFactors = F )
#

In [2]:

# 乱数種を設定することで、毎回、同じモデルが生成される
set.seed(754)

# Survivedが目的変数（知りたい結果）で、~以降が説明変数
# 与えられた全ての変数を利用するわけではない
rf_model <- randomForest(factor(Survived) ~　Pclass + SibSp + Parch + Parch,　data = train)

# OOB estimate of  error rateが30.75%、これは
print(rf_model)

In [3]:

# 作成したモデルを利用して、testファイルのPclass + SibSp + Parch + ParchからSurvivedを計算する
prediction <- predict(rf_model, test)

# 提出用にPassengerIdと予想したpredictionの列を持つdata.frameを作成する
solution <- data.frame(PassengerID = test$PassengerId, Survived = prediction)

# testの結果をcsvファイルに書き込む
write.csv(solution, file = 'r_titanic_aug2701.csv', row.names = F)

Reference

이 문제에 관하여(R: Kaggle Titanic), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/ekzemplaro/items/b3bf701c5d297be4e481

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다