Aula 06 – Curso básico de programação em R.
Objetos, atributos e tipos de dados no R.
R funciona trabalha com objetos
Objetos são caracterizados por seus nomes e seu conteúdo, e também por atributos que especificam os tipos de dados representados pelo objeto.
Objetos têm dois atributos intrínsecos: mode (modo) e o length (comprimento).
O modo é o tipo básico do objeto, existem quatro modos principais:
- Numérico
- Caractere
- Complexo
- Lógico (FALSO ou VERDADEIRO)
Existem outros modos, mas não representam dados, por exemplo, função ou expressão.
O comprimento (length) é o número de elementos do objeto.
Para exibir o modo e o comprimento de um objeto, pode-se usar as funções mode e length respectivamente:
x <- 1
mode(x)
Saída:
[1] “numeric”
length(x)
Saída:
[1] 1
A <- "Olá mundo"; compar <- TRUE; z <- 1i
mode(A); mode(compar); mode(z)
Saída:
[1] “character”
[1] “logical”
[1] “complex”
Seja qual for o modo, os dados ausentes são representados por NA (not available).
Um valor numérico muito grande pode ser especificado com uma notação exponencial:
N <- 2.1e23
N
Saída:
[1] 2.1e+23
R representa ±∞ com Inf e – Inf
x <- 5/0
x
Saída:
[1] Inf
exp(x)
Saída:
[1] Inf
E representa valores que não são números com NaN (not a number)
exp(-x)
Saída:
[1] 0
x – x
Saída:
[1] NaN
Um valor do modo caractere, ou seja, uma string, é inserido entre aspas duplas ( ” ).
Se quiser inserir o símbolo de aspas duplas na string, tem que colocar antes a barra invertida.
Os dois caracteres juntos \” serão tratados de maneira específica por algumas funções, como por exemplo: cat, para exibição na tela, ou write.table para gravar no disco.
x <- “Aspas duplas \” delimita strings em R“
x
Saída:
Aspas duplas \” delimita strings em R.
cat(x)
Saída:
Aspas duplas “ delimita strings em R.
Variáveis do modo caractere, isto é, string, podem ser delimitadas com aspas simples também( ‘ ), nesse caso, não é necessário escapar de aspas duplas com barra invertida.
(Mas as aspas simples devem ser!), vejam:
x <- ‘Aspas duplas ” delimita strings em R.’
x
Saída:
Aspas duplas \” delimita strings em R.
A tabela a seguir apresenta uma visão geral dos tipos de objetos que representam dados.
- Vector é um tipo de variável que pode guardar uma coleção de objetos de um mesmo tipo;
- Factor é um tipo de variável conhecida como categórica ou qualitativa;
- Array é uma tabela com k dimensões;
- Matrix é um caso particular de array com k = 2, isto é, um array de array;
- Os elementos de um array ou de uma matriz são todos do mesmo tipo;
- Data frame é uma tabela composta com um ou vários vetores e / ou fatores, todos do mesmo comprimento, mas possivelmente de tipos diferentes;
- Um ‘ ts ‘ é um conjunto de dados de série temporal e, portanto, contém atributos adicionais como frequência e datas;
- Lista pode conter qualquer tipo de objeto, inclusive outras listas.
- Para um vetor, seu tipo (modo) e comprimento são suficientes para descrever os dados
- Para outros objetos, são necessárias outras informações que são fornecidas por atributos não-intrínsecos
- Entre esses atributos, podemos citar a dim, que corresponde às dimensões de um objeto. Por exemplo, uma matriz com 2 linhas e 2 colunas tem para dim o par de valores [2, 2], mas, seu comprimento é 4.