6.1 Introducción 1

José Benito Hernández C.

Guía de Estadística

Tema 6

Regresión Lineal

6.1 Introducción

En este capítulo estudiaremos las relaciones lineales en los datos de la muestra y utilizaremos

el método de los mínimos cuadrados para estimar los parámetros necesarios. El científico inglés

Sir Francis Galton

(1822-1911), primo de

Charles Darwin

, hizo importantes contribuciones a la

genética y la psicología. Es el inventor de la regresión y un pionero en la aplicación de la estadística

a la biología. Uno de los conjuntos de datos que él consideraba consistía en las alturas de los padres

y de los primeros hijos. Mirando los diagramas de dispersión de estas alturas, Galton vio que la

tendencia era lineal y creciente. Después de ajustar una línea a estos datos (usando las técnicas

descritas en este capítulo), observó que para los padres cuyas alturas eran más altas que el promedio,

la línea de regresión predijo que los padres más altos tendían a tener hijos más bajos y los padres

más bajos tendían a tener hijos más altos. Hay una regresión hacia la media. Así es como el método

de este capítulo recibió su nombre: regresión lineal.

En capítulos anteriores, nos preocupaban principalmente las inferencias sobre los parámetros

de la población. En este capítulo, examinamos la relación entre una o más variables y crearemos

un modelo que puede ser utilizado con fines predictivos. Por ejemplo, consideremos la pregunta

“¿Existe evidencia estadística para concluir que los países con los niveles más altos de colesterol en

sangre tienen la mayor incidencia de enfermedades cardíacas?” Es importante responder a esto si

queremos tomar decisiones médicas y de estilo de vida apropiadas. Estudiaremos la relación entre

las variables mediante el análisis de regresión.

Nuestro objetivo es crear un modelo y estudiar los procedimientos inferenciales cuando están

presentes una variable dependiente y varias variables independientes. Denotamos por

la variable

aleatoria a predecir, también llamada variable dependiente (o variable de respuesta) y por

las variables independientes (o predictoras) utilizadas para modelar (o predecir)

. Por ejemplo,

denotemos por (

x, y

) la altura y el peso de un varón adulto. Nuestro interés puede ser encontrar

la relación entre la altura y el peso de una muestra de

individuos. El proceso de encontrar una

ecuación matemática que mejor se ajuste a los datos ruidosos se conoce como análisis de regresión.

Introducción a la Regresión Lineal Simple: Métodos y Aplicaciones en R, Guías, Proyectos, Investigaciones de Estadística Matemática

Documentos relacionados

Vista previa parcial del texto

¡Descarga Introducción a la Regresión Lineal Simple: Métodos y Aplicaciones en R y más Guías, Proyectos, Investigaciones en PDF de Estadística Matemática solo en Docsity!

José Benito Hernández C.

Guía de Estadística

Tema 6

Regresión Lineal

6.1 Introducción

SSE =

[

] 2

∂SSE

[

] 2 )

∂SSE

[

] 2 )

10 − 15 (0)^2

Creamos los vectores de datos

R^2 =

6.4 Propiedades de los estimadores de mínimos cuadrados: regresión lineal sim-

ple

∑^5

SSE

5 − 2 = 0 ,^367.

T =

RR =

10 = 0 ,^1.

= 0 ,^7 −^0

RR =

(1 − 0)^2

6.7 Ejercicios para la práctica