Curso de Data Science
Aula 04 – Data Science – R – Caso do Titanic – Kaggle
Continuando com o problema do Titanic proposto pelo Kaggle.
Antes de juntar as bases de treino e de teste, vamos igualá-las. No conjunto de teste falta o campo Survived, vamos criá-lo então e atribuir o valor NA(Not Available) a todos os registros do test set.
Para criar esse campo, vamos usar o código:
#Cria o campo survived, o campo da predição
titanic.test$Survived <- NA
Agora podemos juntar os dois conjuntos e atribuir a variável titanic.full, mas, vamos fazer isso na próxima aula.