Curso de Data Science Aula 01 – Data Science – R – Conhecendo a plataforma Kaggle. O que é o Kaggle? É uma plataforma fundada em 2010 para competições de modelagem preditiva e analítica. Empresas e pesquisadores postam seus dados e estatísticas para que mineradores, analistas e cientistas de dados de todo o mundo possam […]
Curso de Data Science Aula 02 – Data Science – R – Caso do Titanic – Kaggle Continuando com o problema do Titanic proposto pelo Kaggle. Agora é hora de abrir o RStudio e configurar o work directory, sua pasta de trabalho, depois ler os arquivos train.csv e test.csv e atribuí-los as variáveis titanic.train e titanic.test respectivamente. Configurando o Workdirectory #Define […]
Curso de Data Science Aula 04 – Data Science – R – Caso do Titanic – Kaggle Continuando com o problema do Titanic proposto pelo Kaggle. Antes de juntar as bases de treino e de teste, vamos igualá-las. No conjunto de teste falta o campo Survived, vamos criá-lo então e atribuir o valor NA(Not Available) […]
Curso de Data Science Aula 07 – Data Science – R – Caso do Titanic – Kaggle Continuando com o problema do Titanic proposto pelo Kaggle. Já limpamos os campos Embarked e Age, agora vamos limpar o campo Fare. Verificação agora do campo Fare (tarifa): table(is.na(titanic.full$Fare)) Saída: FALSE TRUE 1308 1 Ou seja, 1 registro não […]