2.7 Funciones básica útiles

En gran medida, las primeras etapas del aprendizaje de R involucran entender, siendo prioritario comprender qué dice un código y cómo se interpreta, más allá de escribirlo de memoria. En este sentido, la mayoría de funciones están nombradas de tal manera que indican para qué se pueden usar. Un dominio básico del idioma inglés será de mucha utilidad, principalmente porque casi todas las funciones de R están nombradas en inglés.

Para facilitar esta primera etapa de aprendizaje, aquí se muestra una lista de funciones básica útiles, tanto a nivel de programación como de análisis de datos, que serán clave para iniciar con R.

Los ejemplos de uso de la tabla son aplicables, siempre y cuando se ejecute antes el siguiente código para activar la base de datos iris, y crear los vectores x, y, y letras.

data("iris")
set.seed(123)
x <- rnorm(30,2,1)
y <- rnorm(30,5,3)*x/2
letras <- c("A", "B", "A", "A")
Tabla 2.4: Funciones básicas útiles en R.
Función Descripción Ejmplo.de.uso
|> Operador pipe nativo. x |> round(2)
%>% Operador pipe de tidyverse. x %>% round(2)
mean() Promedio de un conjunto de datos x. mean(x)
median() Mediana de un conjunto de datos x. median(x)
sd() Desviación estándar de un conjunto de datos x. sd(x)
var() Varianza de un conjunto de datos x. var(x)
quantile() Cálculo de cuantiles de un conjunto de datos x. quantile(x)
range() Valor mínimo y máximo de un conjunto de datos x. range(x)
seq_along() Crea una secuencia de números enteros desde 1 hasta el valor de la longitud de elementos del vector. seq_along(x)
sum() Suma de todos los elementos numéricos de un conjunto de datos x. sum(x)
max() Valor máximo de un conjunto de datos x. max(x)
min() Valor mínimo de un conjunto de datos x. min(x)
seq() Calcula una secuencia de números al ofrecerle un inicio, un final y cada cuántos valores. seq(0, 10, 2)
seq() Calcula una secuencia de números al ofrecerle un inicio, un final y cada la cantidad de valores que necesito de dicho rango. seq(0, 10, length=25)
rep() Repite un vector una cantidad de veces definida. rep("Perú", 15)
paste0() Concatena dos elementos de texto sin espacio entre ellos paste0("Séptima","Maravilla")
paste() Concatena dos elementos de texto con espacio entre ellos paste("Séptima","Maravilla")
sort() Reordena un vector de mayor a menor, o alfabéticamente. sort(c("C","Z","A"))
rev() Muestra un vector en orden reverso. rev(c("C","Z","A"))
unique() Muestra los valores únicos de un vector x. unique(letras)
scale() Estandariza (centrado y escalado) un conjunto de datos x. scale(x)
lm() Calcula un modelo lineal, siguiendo una fórmula predefinida. lm(Petal.Length ~ Sepal.Length, data=iris)
glm() Calcula un modelo generalizado lineal, siguiendo una fórmula predefinida. glm(Petal.Length ~ Sepal.Length, data=iris)
aov() Calcula un ANOVA, siguiendo una fórmula predefinida. aov(Petal.Length ~ Species, data=iris)
summary() Ofrece un resumen estadístico de un objeto especial, un vector o una base de datos. summary(x)
chisq.test() Prueba de Chi cuadrado de dos variables. chisq.test(x, y)
t.test() Prueba de T de dos variables. t.test(x, y)
cor.test() Correlación (pearson, kendall, spearman) de dos conjuntos de datos. cor.test(x, y, method="pearson")
plot() Realizá un gráfico de dispersión de puntos entre dos vectores numéricos. plot(x, y)
pairs() Genera un gráfico de enfrentamientos pareados entre todas las columnas de una base de datos. pairs(DF)
hist() Grafica un histograma de frecuencias de un vector x. hist(x)
boxplot() Grafica un gráfico de cajas de un vector x. boxplot(x)
plot(density()) Produce el gráfico de función de densidad de un vector x. plot(density(x))
rnorm() Genera una cantidad de números aleatorios que siguen la distribución Normal, con parámetros definidos. rnorm(100, mean=1, sd=0)
set.seed() Especifíca que secuencia de números aleatorios usar. Permite replicabilidad de un evento aleatorio. set.seed(123)
getwd() Muestra la dirección del directorio de trabajo actual. getwd()
setwd() Define la nueva dirección del directorio de trabajo. setwd("C:/mi carpeta")
str() Muestra la estructura de una base de datos. str(iris)
View() Visualiza una base de datos en una nueva pestaña. View(iris)
names() Reporta los nombres de las columnas de una base de datos. names(iris)
colnames() Reporta los nombres de las columnas de una base de datos. colnames(iris)
rownames() Reporta los nombres de las filas de una base de datos. rownames(iris)
length() Reporta el número de elementos de un vector, o la cantidad de columnas de una base de datos. length(x) o length(iris)
nrow() Reporta la cantidad de filas de una base de datos. nrow(iris)
ncol() Reporta la cantidad de columnas de una base de datos. ncol(iris)
head() Muestra las primeras 6 filas de una data frame (DF) o tibble. head(DF)
tail() Muestra las últimas 6 filas de una data frame (DF) o tibble. tail(DF)
ls() Lista el nombre de todos los objetos en el ambiente. ls()
rm() Elimina una variable del ambiente de RStudio. rm(iris)
rm(ls()) Elimina todas las variables del ambiente de RStudio. rm(ls())
dev.off() Cierra forzadamente la salida gráfica de RStudio. Ejecutar para cuando existe algún error en la generación de un gráfico. Además, permite terminar la exportación de un archivo gráfico. dev.off()
install.packages() Permite instalar una librería en RStudio. install.packages("tidyverse")
library() Permite activar durante la sesión actual una librería previamente instalada. library(tidyverse)
table() Muestra la frecuencia de los elementos únicos de un vector. table(letras)
subset() Devuelve un subgrupo de filas en una base de datos, filtradas si cumplen con una condición lógica. subset(iris, Petal.Length > 6.5)
sample() Devuelve un muestreo aleatorio de tamaño definido de un conjunto de datos x. sample(x, 3)
data() Permite cargar una base de datos de ejemplo preinstalada en RStudio dentro de algún paquete activo. data("iris")
round() Redondea un número a la cantidad de decimales establecida. round(0.00887, 2)
signif() Redondea un número a la cantidad de números significativos establecida. signif(0.00887, 2)
print() Imprime un objeto en la consola. Retorna el valor original.. print(x)
return() Imprime un objeto en la consola. Retorna el valor original.. return(x)
cut() Convierte a factor un vector, dividiéndolo (cortándolo) en la cantidad de grupos definidos. Clásica función para convertir un vector numérico de edades en rangos etarios. cut(1:20, breaks = 3)
cut() Los mismo que cut() pero dándole un nombre nuevo a cada nivel del factor. cut(1:20, breaks = 3) |> factor(labels = c("A","B","C"))
print() Imprime un objeto en la consola. Retorna el valor original.. print(x)
return() Imprime un objeto en la consola. Retorna el valor original.. return(x)