Curso de Data Science Aula 01 – Data Science – R – Conhecendo a plataforma Kaggle. O que é o Kaggle? É uma plataforma fundada em 2010 para competições de modelagem preditiva e analítica. Empresas e pesquisadores postam seus dados e estatísticas para que mineradores, analistas e cientistas de dados de todo o mundo possam […]
Curso básico de programação em R. Aula 01 – Instalação do R e do RStudio. SOBRE R R é uma linguagem de programação de código aberto em um ambiente de software voltado para computação estatística e gráficos, é mantido pela R Foundation for Statistical Computing. A linguagem R é amplamente utilizada entre os estatísticos, analistas, mineradores […]
Curso básico de programação em R. Aula 02 – Criando, listando e excluindo objetos na memória COMO R TRABALHA Criando, listando e excluindo objetos na memória. R é uma linguagem de script, não é compilada, os comandos são executados diretamente, sem a necessidade de construir um programa completo como nas linguagens C, Fortran, Pascal, etc. […]
Curso básico de programação em R. Aula 03 – Criando, listando e excluindo objetos na memória COMO R TRABALHA Criando, listando e excluindo objetos na memória. x <- 1 X <- 10 x [1] 1 X [1] 10 X e x são variáveis diferentes, já que R é case sensitive. Você pode fazer cálculos no […]
Curso de Data Science Aula 03 – Data Science – R – Caso do Titanic – Kaggle Continuando com o problema do Titanic proposto pelo Kaggle. A ideia agora é juntar os dois conjuntos ( titanic.train e titanic.test) em uma variável titanic.full, mas para poder fazer isso, é preciso criar um campo nos dois conjuntos, […]
Curso básico de programação em R. Aula 04 – Acessando o Help on-line do R por linha de comando Acessando o Help on-line do R por linha de comando O help on-line de R fornece informações muito úteis sobre como usar as funções. A ajuda está disponível diretamente para uma determinada função, por exemplo: ?lm Esse […]
Curso básico de programação em R. Aula 05 – Colocando o R no PATH do sistema. Essa não é exatamente uma aula de R, mas sim, uma dica de como colocar a pasta onde o R está instalado no PATH do sistema, para poder acessar o R pelo terminal tanto do windows como do linux, […]
Curso de Data Science Aula 05 – Data Science – R – Caso do Titanic – Kaggle Continuando com o problema do Titanic proposto pelo Kaggle. Na última aula foi criado o campo Survived no titanic.test e atribuído valor NA ao campo, em todos os registros do titanic.test, agora vamos juntar o titanic.train e o […]
Curso de Data Science Aula 06 – Data Science – R – Caso do Titanic – Kaggle Continuando com o problema do Titanic proposto pelo Kaggle. Agora que o campo Embarked está devidamente limpo, vamos olhar agora para o campo Age. Rodando: table(is.na(titanic.full$Age)) Saída: FALSE TRUE 1046 263 Existem 263 registros sem a informação age […]
Aula 06 – Curso básico de programação em R. Objetos, atributos e tipos de dados no R. R funciona trabalha com objetos Objetos são caracterizados por seus nomes e seu conteúdo, e também por atributos que especificam os tipos de dados representados pelo objeto. Objetos têm dois atributos intrínsecos: mode (modo) e o length (comprimento). […]
Curso de Data Science Aula 07 – Data Science – R – Caso do Titanic – Kaggle Continuando com o problema do Titanic proposto pelo Kaggle. Já limpamos os campos Embarked e Age, agora vamos limpar o campo Fare. Verificação agora do campo Fare (tarifa): table(is.na(titanic.full$Fare)) Saída: FALSE TRUE 1308 1 Ou seja, 1 registro não […]
Aula 07 – Curso básico de programação em R. Pacote dplyr, função near( ), precisão em comparação lógica no R SAÍDAS INESPERADAS sqrt(2) ^ 2 == 2 > [1] FALSE 1/49 * 49 == 1 > [1] FALSE Porque isso acontece? Os computadores usam a aritmética de precisão finita (eles obviamente não conseguem armazenar um […]
Curso de Data Science Aula 08 – Data Science – R – Caso do Titanic – Kaggle Continuando com o problema do Titanic proposto pelo Kaggle. Agora que todos os registros tem a informação de Age, Embarked e Fare, vamos agora transformar algumas variáveis em variáveis categóricas, também conhecidas como qualitativas. Exemplos de variáveis qualitativas […]
Aula 09 – Curso básico de programação em R Leitura de arquivo com read table na prática Endereço para baixar os arquivos e o script: https://github.com/toticavalcanti/curso_r LEITURA DE ARQUIVO COM READ TABLE Para ler e escrever em arquivos, R usa working directory O comando getwd() obtém o diretório de trabalho e o setwd() define […]
Aula 10 – Curso de programação em R Leitura de arquivo no R com scan e read.fwf Endereço para baixar os arquivos e o script: https://github.com/toticavalcanti/curso_r Antes de começar, quero deixar meu link de afiliados na Hostinger, tá valendo a pena, dêem uma olhada: Hostinger Dêem um joinha ? na página do Código Fluente no […]
Curso de Data Science Aula 10 – Data Science – R – Caso do Titanic – Kaggle Continuação da aula 09, agora rodando os comandos no RStudio Continuando com o problema do Titanic proposto pelo Kaggle. CONSTRUÇÃO DO MODELO Random Forest é um método de aprendizado sobre conjuntos de dados (ensemble learning) para construir modelos […]
Aula 12 – Curso de programação em R Gerando dados no R Antes, quero deixar meus links de afiliados pra vocês: Hostinger One.com DigitalOcean Se cadastrando, vocês poderão conhecer, usar e testar gratuitamente alguns recursos dos serviços oferecidos por eles. Por favor, dêem um joinha 👍, curtam e compartilhem a página do Código Fluente no […]