Curso de Data Science

Aula 07 – Data Science – R – Caso do Titanic – Kaggle

kaggle - Caso do Titanic - Data Science

Caso do Titanic – Kaggle

Continuando com o problema do Titanic proposto pelo Kaggle.

Já limpamos os campos Embarked e Age, agora vamos limpar o campo Fare.

Verificação agora do campo Fare (tarifa):

table(is.na(titanic.full$Fare))

Saída:

FALSE  TRUE

1308     1

Ou seja, 1 registro não tem essa informação.

Vamos preencher o registro que falta essa informação com a mediana das tarifas.

#Pega a mediana das tarifas do conjunto total (titanic.full) desconsiderando

#os registros sem essa informação e atribuindo a variável fare.median

fare.median <- median(titanic.full$Fare, na.rm = TRUE)

#preenche os registros sem a informação de Fare com a mediana

titanic.full[is.na(titanic.full$Fare), “Fare"] <- fare.median

Rodando novamente:

table(is.na(titanic.full$Fare))

Saída:

FALSE

1309

Agora todos os registros tem a informação Fare.

Obrigado, até mais.

Aula 07 – Data Science – R – Caso do Titanic – Kaggle

About The Author
-

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>