El uso de la regresión lineal para establecer relaciones empíricas

La regresión lineal es una herramienta potente para calcular la relación entre una variable y un conjunto de otras variables

Erasmus University, the Netherlands

one-pager full article

Discurso de ascensor

La regresión lineal es una herramienta potente para investigar la relación entre múltiples variables relacionando una variable con un conjunto de variables. Puede identificar el efecto de una variable mientras se ajusta para otras diferencias observables. Por ejemplo, puede analizar la relación entre salarios y género tras estudiar las diferencias en características como la educación y la experiencia. Un modelo de regresión lineal se calcula normalmente con mínimos cuadrados ordinarios, lo que reduce las diferencias entre los valores de las muestras observadas y los valores ajustados del modelo. Existen múltiples herramientas para evaluar el modelo.

Hallazgos clave

Pros

La regresión lineal es una herramienta simple y cómoda para establecer una relación empírica entre una variable y un conjunto de otras variables.

La regresión lineal calculada mediante mínimos cuadrados ordinarios es el mejor «predictor lineal explicativo»: en un ejemplo dado, la combinación lineal calculada de regresores ofrece la aproximación más cercana al resultado real.

Los mínimos cuadrados ordinarios funcionan razonablemente bien incluso si el modelo no se ha especificado perfectamente.

La regresión lineal con mínimos cuadrados ordinarios puede ofrecer un valor de referencia rápido para métodos más avanzados.

Contras

Las relaciones causales son más útiles para el asesoramiento e intervenciones sobre políticas, pero interpretar un modelo de regresión lineal como una relación causal es difícil y requiere fuertes hipótesis.

La especificación de un modelo de regresión lineal no es siempre sencilla porque no existe una regla simple y sólida que prescriba cómo elegir una especificación adecuada.

La especificación de un modelo de regresión exige cuidado y pruebas estadísticas, sobre todo si los cálculos de interés se muestran muy sensibles a la especificación utilizada o al conjunto de variables explicativas incluidas.

Mensaje principal de los autores

La regresión lineal puede usarse para establecer de forma empírica la relación entre una variable de interés, por ej., el salario de una persona, y un conjunto de otras variables que pueden estar interrelacionadas, como el género, educación y experiencia. El cálculo de dichas relaciones se hace normalmente con mínimos cuadrados ordinarios, que tratan de hacer que el modelo de regresión encaje en los datos lo mejor posible. La regresión lineal puede predecir la variable resultante en los casos que no se observa; así, los responsables políticos pueden usarla para predecir la variable resultante después de cambiar una o más de las variables explicativas para reflejar una intervención política.

Full citation

Full citation

Data source(s)

Data type(s)

Method(s)

Countries