3.1 Clasificación de variables
Toda variable cuenta con dos atributos: clase y estructura. Para entender cómo se almacenan los datos en R, se necesita conocerlas a detalle.

Figura 3.2: Analogía del gato en la caja para entender a las variables. Aquí, el gato es el contenido; la caja, la estructura. Esta “variable” podría ser considerada de la clase “contenedora de gatos” y de estructura “cúbica”. De igual manera, en R reconoceremos variables contenedoras de números, de caracteres, de valores lógicos, mismos que podrán estar ordenados en estructuras de una, dos, tres o N dimensiones.
3.1.1 Clases atómicas
Según su contenido, en R existen seis clases básicas (o atómicas) de variables:
- Clase lógica: identificado con el nombre
logical
- Clase carácter o texto: identificado con el nombre
character
- Clase número con decimales: conocidos como doubles, identificado con el nombre
numeric
- Clase número entero: identificado con el nombre
integer
- Clase número complejo: identificado con el nombre
complex
- Clase crudo o en bits: identificado con el nombre
raw
De estos, los últimos tres no serán utilizando a lo largo de este libro. Quizá surja la pregunta de por qué no usar números enteros. En realidad una variable del tipo numeric
ya incluye enteros y con decimales (es decir, todos los números reales). Para efectos de una gran cantidad de funciones estadísticas, en R no es relevante brindarle números enteros como integer
, o diferenciarlos de numeric
.
3.1.2 Estructuras de datos
Según su estructura, las variables pueden tener una forma de almacenamiento con diferente dimensionalidad.
- La estructura más básica de R es el vector, con una sola dimensión.
- El vector se convierte en un factor si es que contiene información categorizada, y sigue teniendo una dimensión.
- Si vectores se colocan verticalmente, y se apilan lado a lado, se convierten en una estructura de dos dimensiones. Dependiendo de sus características estas pueden ser: matrices, data frames o tibbles.
- Se puede considerar a los arrays como arreglos multidimensionales de matrices
- Finalmente, las listas son estructuras de datos básicas. No se consideran dimensionales dado que almacena a otras estructuras de datos secuencialmente. Una lista puede albergar vectores, factores, matrices, data frames, tibbles, arrays, incluso otras listas.

Figura 3.3: Estructuras informáticas para almacenar de datos en el lenguaje R.