Blgo. Irwing S. Saldaña
Instituto de Ciencias Antonio Brack | masterX
R es un lenguaje de programación.
Permite al usuario crear sus propias rutas analíticas.
Usaremos RStudio como intérprete del lenguaje R.
Diapositivas interactivas con Quarto Markdown y Revealjs en RStudio.
Desarrollo en vivo de modelamiento con lenguaje de programación R.
Quizizz para reforzamiento final
Es la forma de relacionar dos variables numéricas continuas más sencilla que existe.
Asume la fórmula matemática \(y = \beta_0 + \beta_ix_i\)
Por ello, se dice que Y (variable dependiente) se calcula en función de X
X: variable independiente, o explicativa.
Y: variable dependiente, o respuesta.
El método de cálculo tradicional de los parámetros es el OLS (Ordinal Least Squares) Cuadrados mínimos ordinarios, pero puede hacer con otros métodos como ML (Maximum Likelihood) Máxima verosimilitud.
Parámetro \(\beta_0\): o intercepto de la recta en el eje Y
Parámetro \(\beta_i\): o coeficiente (pendiente) de la iésima variable independiente X.
La fórmula matemática incluye un valor desconocido llamado \(\epsilon\):
\[ y = \beta_0 + \beta_ix_i + \epsilon \]
Este representa el error, que no se conoce pero se estima utilizando los residuales de la regresión.
Es la diferencia entre el valor Y de cada punto y su respectiva proyección en la recta de la regresión.
Implica la diferencia entre lo real y lo predicho para la variable dependiente Y.
Mientras más grandes sean los valores, más error hay en la regresión.
\(\beta_0\): equivale al promedio esperado para Y cuando x = 0
\(\beta_1\): equivale al cambio (aumento o disminución) promedio esperado para Y cuando x aumenta en una unidad.
Hwt
y la variable X como Bwt
(Intercept) Bwt
-0.3566624 4.0340627
RSE:error estándar residual (siglas en inglés) es una forma de medir la desviación estándar de los residuos en un modelo de regresión. A menor valor de RSE, mejor el ajuste del modelo.
R-squared: R cuadrado. Es una medida estadística que indica cuánta variabilidad de la variable Y es explicada por la variable X.
Linealidad de la relación entre X e Y.
Homogeneidad de varianza de los residuales (Homocedasticidad).
Normalidad de los residuales.
Ausencia de valores atípicos (outliers).
“Modelos Lineales con R | Blgo. Irwing S. Saldaña”