Para entender mejor que es una **regresión lineal** imagina que tienes un grupo de puntos en un gráfico. Estos puntos representan alguna relación entre dos cosas. Por ejemplo, pueden ser las horas que estudias y las notas que obtienes en un examen. La regresión lineal trata de encontrar una línea recta que pase lo más cerca posible de todos esos puntos. Esta línea se llama "línea de regresión". ## ¿Por qué representar la regresión como una línea? Usamos una línea porque es la forma más simple de mostrar una relación entre dos cosas. Si las horas de estudio y las notas están relacionadas, una línea puede darnos una idea general de cómo cambia una cosa cuando cambia la otra. ## Componentes básicos de la regresión lineal 1. **Variables**: - **Variable independiente (X)**: Es lo que tú controlas. En nuestro ejemplo, serían las horas de estudio. - **Variable dependiente (Y)**: Es lo que quieres predecir o explicar. En nuestro ejemplo, sería la nota del examen. 2. **Línea de mejor ajuste**: Esta línea se dibuja de tal manera que la suma de las distancias (verticales) de todos los puntos a la línea sea lo más pequeña posible. ## Ejemplo simple Supongamos que tienes estos datos: - 1 hora de estudio -> 60 puntos en el examen - 2 horas de estudio -> 70 puntos en el examen - 3 horas de estudio -> 80 puntos en el examen - 4 horas de estudio -> 90 puntos en el examen Si los dibujas en un gráfico, los puntos estarían casi en una línea recta. La regresión lineal encontraría esa línea que pasa por estos puntos. ## La fórmula de la línea La línea de regresión se puede describir con una fórmula matemática simple: \[ Y = a + bX \] Donde: - **Y** es la nota que queremos predecir. - **a** es el punto donde la línea cruza el eje Y (cuando X es 0). - **b** es la pendiente de la línea, que nos dice cuánto cambia Y cuando X cambia. ## ¿Para qué sirve? La regresión lineal se usa para predecir valores. Por ejemplo, si quieres saber qué nota podrías sacar si estudias 5 horas, puedes usar la fórmula de la línea. También se usa para entender la relación entre dos variables.
Descubre cómo la regresión lineal, un modelo predictivo esencial, puede ayudarte a entender y predecir variables clave. Aprende sobre sus dos tipos principales: simple y múltiple, y los cinco supuestos críticos que garantizan su precisión. ¡Optimiza tus análisis de datos!
2hrs promedio
Aprende a construir un modelo de regresión lineal desde cero: comprende un nuevo dataset, realiza un análisis exploratorio (EDA), modela los datos y optimiza tu modelo. Descubre cómo el $R^2$ evoluciona al ajustar el hiperparámetro del modelo Lasso hasta un valor de 20.