REGRESIÓN LINEAL SIMPLE | EJERCICIO 1

REGRESIÓN LINEAL SIMPLE | EJERCICIO 1

Resumen Breve

Este video explica cómo utilizar la regresión lineal para realizar pronósticos, ilustrándolo con un ejemplo práctico de una empresa de remodelación en Manhattan. Se detallan los componentes de la ecuación de regresión lineal, cómo calcular la ordenada y la pendiente, y cómo interpretar los resultados para predecir ventas basándose en la nómina del área. Además, se explica cómo calcular el error estándar de la estimación, el coeficiente de correlación y el coeficiente de determinación para evaluar la precisión del modelo.

  • Se explica la ecuación de regresión lineal y sus componentes.
  • Se muestra cómo calcular la ordenada y la pendiente.
  • Se utiliza un ejemplo práctico para pronosticar ventas.
  • Se explica cómo calcular el error estándar de la estimación y los coeficientes de correlación y determinación.

Introducción a la Regresión Lineal

El análisis de regresión lineal es un modelo matemático que describe la relación entre una variable dependiente (la que se quiere pronosticar) y una variable independiente (la que influye en la variable dependiente) mediante una ecuación lineal. La ecuación de la recta es Y = a + bX, donde Y es la variable dependiente, a es la ordenada al origen, b es la pendiente de la recta, y X es la variable independiente. Para calcular los valores de 'a' y 'b', se utilizan ecuaciones que involucran los valores conocidos de las variables, sus promedios y el número de datos.

Ejemplo Práctico: Remodelación de Casas en Manhattan

Una empresa de remodelación en Manhattan ha notado que sus ingresos dependen de la nómina del área. Se proporciona una tabla con datos de los últimos seis años, mostrando las ventas en cientos de miles de dólares y la nómina en cientos de millones de dólares. Se identifica que las ventas son la variable dependiente (Y) y la nómina es la variable independiente (X), ya que las ventas dependen del ingreso monetario en Manhattan.

Diagrama de Dispersión y Relación Lineal

Para determinar si existe una relación lineal entre la nómina y las ventas, se grafican los datos en un diagrama de dispersión. La nómina (X) se representa en el eje de las abscisas y las ventas (Y) en el eje de las ordenadas. Se observa una correlación positiva, ya que cuando la nómina aumenta, las ventas tienden a aumentar también. Sin embargo, los puntos no forman una línea recta perfecta, por lo que se busca la recta que mejor se ajuste a estos puntos utilizando la ecuación de la recta.

Cálculo de la Pendiente y la Ordenada

Para calcular la pendiente (b), se utiliza una ecuación que involucra la sumatoria de X por Y, el número de observaciones (n), y los promedios de X e Y. Se agregan dos columnas a la tabla original: una para X al cuadrado y otra para la multiplicación de X por Y. Se realizan los cálculos necesarios y se sustituyen los valores en la ecuación para obtener la pendiente. Una vez obtenida la pendiente, se calcula la ordenada al origen (a) utilizando la ecuación que involucra el promedio de Y, la pendiente y el promedio de X.

Pronóstico de Ventas

Con los valores de la pendiente y la ordenada, se puede construir la ecuación de la recta y utilizarla para pronosticar las ventas. Por ejemplo, si la cámara de comercio predice que la nómina será de 600 millones de dólares el próximo año, se sustituye este valor en la ecuación para obtener una estimación de las ventas. Se grafica el resultado en el diagrama de dispersión y se traza la línea recta que representa la ecuación de regresión.

Limitaciones del Pronóstico

Se advierte que no se deben realizar pronósticos para periodos muy lejanos con pocos datos, ya que el mercado es inestable y las condiciones pueden cambiar drásticamente. Es recomendable limitar los pronósticos a uno o dos años con datos de seis años.

Error Estándar de la Estimación

Se explica cómo calcular el error estándar de la estimación, que mide la desviación de los valores de la variable dependiente (Y) con respecto a la recta de regresión. Se agrega una columna más a la tabla, la cual será Y al cuadrado. Se utiliza una ecuación que involucra la sumatoria de Y al cuadrado, la ordenada, la sumatoria de Y, la pendiente, la sumatoria de X por Y, y el número de observaciones. El resultado es similar a una desviación estándar, pero con respecto a la recta de regresión en lugar del promedio.

Coeficiente de Correlación

Se explica el coeficiente de correlación (r), que expresa el grado o fuerza de la relación lineal entre las variables. Puede ser cualquier número entre -1 y 1. Una correlación positiva perfecta (r = 1) indica que cuando una variable aumenta, la otra también aumenta en la misma proporción. Una correlación negativa perfecta (r = -1) indica que cuando una variable aumenta, la otra disminuye en la misma proporción. Un valor de r cercano a 0 indica una correlación débil o nula. Se muestra la fórmula para calcular el coeficiente de correlación y se sustituyen los valores obtenidos anteriormente.

Interpretación del Coeficiente de Correlación

Se explica cómo interpretar el valor del coeficiente de correlación. En el ejemplo, el coeficiente de correlación es 0.90, lo que indica una correlación positiva muy fuerte entre las ventas y la nómina. Esto confirma que existe una relación estrecha entre ambas variables.

Coeficiente de Determinación

Se explica el coeficiente de determinación, que es el porcentaje de variación en la variable dependiente (Y) que explica la ecuación de regresión. Se calcula elevando al cuadrado el coeficiente de correlación (r). En el ejemplo, el coeficiente de determinación es 0.81, lo que significa que el 81% de la variación de las ventas se explica por la nómina del área de Manhattan. El 19% restante se debe a otros factores no incluidos en la ecuación.

Share

Summarize Anything ! Download Summ App

Download on the Apple Store
Get it on Google Play
© 2024 Summ