3.1 Clasificación de variables

Toda variable cuenta con dos atributos: clase y estructura. Para entender cómo se almacenan los datos en R, se necesita conocerlas a detalle.

Analogía del gato en la caja para entender a las variables. Aquí, el gato es el contenido; la caja, la estructura. Esta “variable” podría ser considerada de la clase “contenedora de gatos” y de estructura “cúbica”. De igual manera, en R reconoceremos variables contenedoras de números, de caracteres, de valores lógicos, mismos que podrán estar ordenados en estructuras de una, dos, tres o N dimensiones.

Figura 3.2: Analogía del gato en la caja para entender a las variables. Aquí, el gato es el contenido; la caja, la estructura. Esta “variable” podría ser considerada de la clase “contenedora de gatos” y de estructura “cúbica”. De igual manera, en R reconoceremos variables contenedoras de números, de caracteres, de valores lógicos, mismos que podrán estar ordenados en estructuras de una, dos, tres o N dimensiones.


3.1.1 Clases atómicas

Según su contenido, en R existen seis clases básicas (o atómicas) de variables:

  • Clase lógica: identificado con el nombre logical
  • Clase carácter o texto: identificado con el nombre character
  • Clase número con decimales: conocidos como doubles, identificado con el nombre numeric
  • Clase número entero: identificado con el nombre integer
  • Clase número complejo: identificado con el nombre complex
  • Clase crudo o en bits: identificado con el nombre raw

De estos, los últimos tres no serán utilizando a lo largo de este libro. Quizá surja la pregunta de por qué no usar números enteros. En realidad una variable del tipo numeric ya incluye enteros y con decimales (es decir, todos los números reales). Para efectos de una gran cantidad de funciones estadísticas, en R no es relevante brindarle números enteros como integer, o diferenciarlos de numeric.

3.1.2 Estructuras de datos

Según su estructura, las variables pueden tener una forma de almacenamiento con diferente dimensionalidad.

  • La estructura más básica de R es el vector, con una sola dimensión.
  • El vector se convierte en un factor si es que contiene información categorizada, y sigue teniendo una dimensión.
  • Si vectores se colocan verticalmente, y se apilan lado a lado, se convierten en una estructura de dos dimensiones. Dependiendo de sus características estas pueden ser: matrices, data frames o tibbles.
  • Se puede considerar a los arrays como arreglos multidimensionales de matrices
  • Finalmente, las listas son estructuras de datos básicas. No se consideran dimensionales dado que almacena a otras estructuras de datos secuencialmente. Una lista puede albergar vectores, factores, matrices, data frames, tibbles, arrays, incluso otras listas.
Estructuras informáticas para almacenar de datos en el lenguaje R.

Figura 3.3: Estructuras informáticas para almacenar de datos en el lenguaje R.