Resumen Breve
Este video explica la regresión lineal simple, una técnica estadística para predecir una variable cuantitativa (dependiente) en función de otra (independiente). Se ilustran conceptos como variables dependientes e independientes, relación directa e inversa entre variables, y la modelización de una recta para representar la relación entre los datos. Además, se explica cómo encontrar la mejor recta a través del método de mínimos cuadrados y se definen los conceptos de intercepto y pendiente.
- La regresión lineal simple busca modelar la relación entre dos variables cuantitativas mediante una línea recta.
- La variable dependiente (y) es la que se quiere predecir, mientras que la independiente (x) es la que explica la variable dependiente.
- La relación entre las variables puede ser directa (ambas aumentan o disminuyen juntas) o inversa (una aumenta mientras la otra disminuye).
- La "mejor" recta se encuentra minimizando las distancias entre los puntos reales y la recta modelada, utilizando el método de mínimos cuadrados.
- La ecuación de la recta tiene dos componentes clave: el intercepto (donde la recta cruza el eje y) y la pendiente (la inclinación de la recta).
Introducción a la Regresión Lineal Simple
La regresión lineal es una técnica estadística para predecir o estimar una variable cuantitativa basándose en otra variable cuantitativa. La variable que se busca predecir o estimar se llama variable dependiente (y), mientras que la variable que se utiliza para explicar o predecir la variable dependiente se llama variable independiente (x). La variable dependiente "depende" de x, mientras que la variable independiente explica a "y".
Variables Dependientes e Independientes
La variable dependiente (y) es la que se desea predecir o estimar, mientras que la variable independiente (x) es la variable explicativa que ayuda a estimar o predecir "y". Por ejemplo, si se quiere predecir el sueldo de un trabajador en función de su edad, el sueldo sería la variable dependiente (y) y la edad sería la variable independiente (x). Generalmente, a medida que aumenta la edad, aumenta el sueldo debido a la experiencia.
Relación Directa e Inversa entre Variables
Cuando ambas variables (x e y) aumentan o disminuyen juntas, se dice que tienen una relación directa. Por ejemplo, a mayor edad, mayor sueldo. Por otro lado, si una variable aumenta mientras la otra disminuye, se dice que tienen una relación inversa. Por ejemplo, si se quiere predecir el tiempo de construcción de un condominio en función del número de trabajadores, a mayor número de trabajadores, menor tiempo de construcción.
Ejemplo Práctico: Predicción de Notas
Se presenta un ejemplo donde se busca predecir las notas de un alumno en función de las horas de estudio. Se toma una muestra de seis alumnos y se registran sus horas de estudio (x) y sus notas (y). Estos datos se grafican en un diagrama de dispersión, donde se observa una relación directa entre las horas de estudio y las notas: a medida que aumentan las horas de estudio, la nota tiende a aumentar.
Modelado de la Recta de Regresión
La regresión lineal consiste en modelar una línea recta que mejor se ajuste a los puntos del diagrama de dispersión. No siempre existe una recta que pase por todos los puntos, por lo que se busca la "mejor" recta, que es aquella que minimiza las distancias entre los puntos reales y la recta modelada. Esta recta se llama ecuación estimada (ŷ) y se representa como ŷ = b0 + b1*x, donde b0 es el intercepto y b1 es la pendiente.
El Método de Mínimos Cuadrados
La "mejor" recta se encuentra calculando los coeficientes b0 y b1 utilizando el método de mínimos cuadrados. Este método busca minimizar la suma de los cuadrados de las distancias verticales entre los puntos reales y la recta. Existen fórmulas para calcular b0 y b1, y también se pueden utilizar herramientas como SPSS para realizar esta operación.
Intercepto y Pendiente
En la ecuación estimada ŷ = b0 + b1*x, b0 es el intercepto y b1 es la pendiente. El intercepto (b0) es el punto donde la recta cruza el eje y. La pendiente (b1) indica la inclinación de la recta con respecto al eje horizontal. Una pendiente positiva indica que la recta asciende (relación directa), mientras que una pendiente negativa indica que la recta desciende (relación inversa). La pendiente representa el cambio en "y" por cada unidad de cambio en "x".