SlideShare una empresa de Scribd logo
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Métodos Predictivos 
Resumen de Clases 
Por: Oliver Amadeo Vilca Huayta 
ovilca@gmail.com 
Departamento de Ingeniería de Sistemas - UNAP 
Abril del 2011
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
1 ¿Porqué es importante los métodos predictivos? 
Introducción 
2 Regresión Simple 
Regresión Simple 
La linea de mínimos cuadrados que mejor se ajusta 
Estimaciones puntuales de mínimos cuadrados 
Coeficiente de determinación y correlación simple 
Intérvalo de confianza para un valor individual de y 
Prueba F global 
3 Regresión Múltiple 
Introducción 
Enfoque matricial 
Coeficiente de determinación múltiple R2 
Prueba F global 
Prueba T 
4 Regresión Cuadrática 
Introducción 
Ejemplo 
5 Interacción 
Introducción 
Fin
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Capítulo 1: 
INTRODUCCCIÓN A LOS 
MÉTODOS PREDICTIVOS
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Introducción 
¿Porqué es importante los métodos predictivos? 
La finalidad de los modelos predictivos es la obtención de 
pronósticos acerca de la evolución futura de determinadas 
variables. 
Es importante en muchas empresas y entidades ya que las 
predicciones de hechos futuros se pueden incorporar al proceso 
de toma de decisiones. 
La intuición no necesariamente da los mejores resultados. 
Mejora la planeación y competitividad.
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Introducción 
El análisis de regresión es una técnicca estadística para 
investigar y modelar la relación entre variables. 
Son muchas las aplicaciones y las hay en casi cualquier 
campo: ingeniería, ciencias, físicas y químicas, economía, 
administración, biología y en las ciencias sociales, de hecho, 
puede ser que el análisis de regresión sea la técnica estadística 
más usada (Montgomery et al., 2007).
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Introducción 
Pronósticos 
Las predicciones de hechos y condiciones futuros se llaman 
pronósticos. 
Se analiza los datos para poder identificar un patrón que se 
pueda utilizar para describirlo. Luego, este patrón se 
extrapola, o se amplía, hacia el futuro con el objeto de 
preparar un pronóstico. Se apoya en el supuesto de que el 
patrón que se identificó sigue siendo el mismo en el futuro. 
No se puede esperar que una técnica de predicción dé buenas 
predicciones a menos que esta hipótesis sea válida.
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Introducción 
Pronosticos 
La información tranversal consta de valores observados en 
un punto en el tiempo. 
Notas del último examen del semestre. 
Índice de percepciones de corrupción 2010, america latina. 
Número de consultas realizadas a un Sistema Información 
durante el último mes. 
Una serie de tiempo es una sucesión cronológica de 
observaciones de una variable en particular. 
Población de la ciudad de Puno con respecto al tiempo. 
Índice de percepciones de corrupción en Perú, del 2000 al 
2010.
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Introducción 
Partes de una serie de tiempo: 
Tendencia. 
Ciclo. 
Variaciones estacionales. 
Fluctuaciones irregulares.
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Introducción 
Medición de los errores de pronóstico 
et = yt − ˆ yt 
yt valor real de la variable de interés en el periodo de tiempo t. 
ˆ yt el valor predicho. 
et error de pronóstico para un pronóstico particular ˆ yt . 
Con frecuencia un examen de los errores de pronóstico en el 
tiempo indica si la técnica de predicción va de acuerdo o no 
con el patrón. Por ejemplo: si una técnica de predicción 
predice exáctamente la tendencia, la variación estacional o el 
componente cíclico que están presentes en una serie de 
tiempo, los errores de pronóstico reflejarán sólo el componente 
irregular.
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Introducción 
Medición de la magnitud de los errores 
Desviación absoluta: 
et = |yt − ˆ yt | 
Desviación absoluta media DAM: 
Pn 
t=1 |et | 
n 
= 
Pn 
t=1 |yt − ˆ yt | 
n 
Error cuadrático: 
(et )2 = (yt − ˆ yt)2 
Error cudrático medio (ECM): 
Pn 
t=1(et )2 
n 
= 
Pn 
t=1(yt − ˆ yt)2 
n
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Introducción 
Medición de la magnitud de los errores 
Una manera de medir el error de pronóstico que facilita la 
comparación de diferentes series de tiempo con valores de distintas 
magnitudes es dividir las desviaciones absolutas entre el valor real 
yt y luego multiplicarlo por 100. 
Error absoluto de porcentaje EAP: 
|et | 
yt 
(100) = |yt − ˆ yt | 
yt 
(100) 
Error absoluto de porcentaje medio EAPM: 
Pn 
t=1 EAPt 
n 
= 
100 
Pn 
t=1 
|yt−ˆ yt | 
yt 
n
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Regresión Simple
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Regresión Simple 
Regresión Lineal Simple 
Capítulo 2: 
REGRESIÓN LINEAL SIMPLE
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Regresión Simple 
Los modelos de regresión en los que se emplea una variable 
dependiente y una variable independiente se denominan modelos 
de regresión lineal (o de una recta) simple. 
Modelo de regresión lineal simple 
y = uy;x +  =
0 +
1x +  
uy;x es el valor medio de la variable dependiente y cuando el 
valor de la variable independiente es x. Recta de medias.
0 es la ordenada al origen.
0 es el valor medio de y 
cuando x es igual a cero.
1 es la pendiente, es el cambio (incremento o decremento) 
en el valor medio de y asociado con un incremento de una 
unidad de x. 
 es un término de error que describe los efectos sobre y de 
todos los otros factores que no son los valores de la variable 
independiente x.
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Regresión Simple 
y x 
Variable dependiente Variable independiente 
Variable respuesta Variable predictora 
Variable Variable 
Ejm: Consumo de combustible por se-mana 
Ejm: Temperatura promedio por hora 
durante la semana 
Cuadro: Denominaciones de las variables.
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
La linea de mínimos cuadrados que mejor se ajusta 
El método de mínimos cuadrados fue descrito primero por 
Carl Friedrich Gauss alrededor 1794. 
El día de Año Nuevo de 1801, el astrónomo italiano Giuseppe 
Piazzi descubrió el planeta Ceres. Fue capaz de seguir su 
órbita durante 40 días. Durante el curso de ese año, muchos 
científicos intentaron estimar su trayectoria con base en las 
observaciones de Piazzi. La mayoría de evaluaciones fueron 
inútiles; el único cálculo suficientemente preciso, que permitió 
al astrónomo Franz Xaver von Zach, reencontrar a Ceres al 
final del año fue el método Gauss.
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
La linea de mínimos cuadrados que mejor se ajusta 
Escoge
0 y
1 de tal manera P 
que para un conjunto de datos, la 
suma de residuos al cuadrado 
e2 
t sea lo mas pequeño posible. 
X 
e2 
t = 
X 
(yt − ˆ yt )2 = 
X 
(yt −
0 −
1xt )2 
Para que sea lo mímino, se deriva respecto a
0 y
1: 
−2 
X 
(yt −
0 −
1xt )2 = 0 (1) 
−2 
X 
xt (yt −
0 −
1xt )2 = 0 (2) 
Reordenando se obtiene las denominadas ecuaciones normales: 
X 
yt =
0n +
1 
X 
xt (3) 
X 
xtyt =
0 
X 
xt +
1 
X 
x2 
t (4) 
Resolviendo el sistema de ecuaciones para
0 y
1 se tiene:
1 = 
P 
xiyi − 
P 
xi 
P 
yi 
n 
P 
x2 
i − 
P 
( 
xi )2 
n 
y
0 = y −
1x
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Estimaciones puntuales de mínimos cuadrados 
Sea n la cantidad de observaciones, asimismo, y = 
P 
yi 
n y x = 
P 
xi 
n 
La estimación puntual de los mínimos cuadrados de la 
pendiente:
1 = 
P 
(xi − x)(yi − y) P 
(xi − x)2 = 
P 
xiyi − 
P 
xi 
P 
yi 
n 
P 
x2 
i − 
P 
( 
xi )2 
n 
= 
SSxy 
SSxx 
La estimación puntual de los mínimos cuadrados de la 
ordenada al origen
0 es:
0 = y −
1x 
Con objeto de simplificar la notación, con P 
frecuencia se Pomiten los 
límites de la sumatoria. Es decir usamos 
en lugar de 
n 
i=1
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Estimaciones puntuales de mínimos cuadrados 
Suposiciones para el modelo de regresión 
La media de la población de los valores potenciales del 
término de error es igual a cero. 
Suposición de la varianza constante (homoscedasticidad) 
: La varianza de la población de los valores potenciales del 
término de error no depende del valor de x. La varianza 
constante se denota como 2. 
Suposición de normalidad: La población de los valores 
potenciales del término de error tiene una distribución normal. 
Suposición de independencia: Un valor cualquiera del 
término de error  es estadísticamente independiente de 
cualquier otro valor de .
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Coeficiente de determinación y correlación simple 
Variación total: Suma de los errores de predicción al 
cuadrado que se obtiene cuando no empleamos la variable 
predictora x. Mide la cantidad total de variación que muestran 
los valores observados de y. 
PSSyy = 
n 
i=1(yi − y)2 = 
Pn 
i=1 y2 
i − 
Pn 
( 
i=1 
yi)2 
n 
Variación inexplicada: Suma de los errores de predicción al 
cuadrado que se obtiene cuando usamos la variable predictora 
x (otro Pnombre para SSE). 
SSE = 
n 
i=1(yi − ˆyi )2 
VPariación explicada: n 
i=1( ˆ yi − y)2 
Se puede demostrar que: 
Xn 
i=1 
(yi − y)2 = 
Xn 
i=1 
(yi − ˆyi )2 + 
Xn 
i=1 
( ˆ yi − y)2
Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 
Coeficiente de determinación y correlación simple 
Coeficiente de determinación simple r 2 
El coeficiente de determinación simple: Es una medida de 
utilidad del modelo de regresión lineal simple. 
r 2 = 
variacion explicada 
variacion total 
r 2 es la proporción de la variación total en los n valores 
observados de la variable dependiente que explica el modelo 
de regresión lineal simple. 
También se puede calcular utilizando la fórmula: 
r 2 =

Más contenido relacionado

PDF
Preguntas de Regresion Lineal
PDF
Apuntes de Analisis de Regresion Lineal Simple
DOCX
Regresion estadistica
PPTX
Coeficiente de correlacion
PPTX
Analisis de regresion (2)
PDF
notas19deagosto
DOCX
Coeficientes determinacion y correlacion
PDF
Medidas descriptivas2018
Preguntas de Regresion Lineal
Apuntes de Analisis de Regresion Lineal Simple
Regresion estadistica
Coeficiente de correlacion
Analisis de regresion (2)
notas19deagosto
Coeficientes determinacion y correlacion
Medidas descriptivas2018

La actualidad más candente (19)

PPT
Estadistica
PDF
Curso de-econometria-basica
PPT
Regresión lineal y correlación
PPTX
Coeficiente de determinación
PPT
Regresion Y Correlacion
PPTX
Regresion lineal
DOCX
REGRESIÓN LINEAL SIMPLE
PPT
Regresion lineal
PPTX
regresion lineal simple
PPT
Analisis De Regresion Y Correlacion
DOCX
28 ejercicios
PDF
Regresión lineal multiple autores grillet montaño rodríguez
PDF
Analisis de regresion y correlacion lineal
PPT
6 regresion y correlación
PPTX
Regresion lineal
PDF
Estadistica 2020
PPT
Distribucion normal por wallter lopez
PPTX
Regresión lineal,ajuste de curva,tipos de regresión lineal
PPT
Pruebas de Uniformidad
Estadistica
Curso de-econometria-basica
Regresión lineal y correlación
Coeficiente de determinación
Regresion Y Correlacion
Regresion lineal
REGRESIÓN LINEAL SIMPLE
Regresion lineal
regresion lineal simple
Analisis De Regresion Y Correlacion
28 ejercicios
Regresión lineal multiple autores grillet montaño rodríguez
Analisis de regresion y correlacion lineal
6 regresion y correlación
Regresion lineal
Estadistica 2020
Distribucion normal por wallter lopez
Regresión lineal,ajuste de curva,tipos de regresión lineal
Pruebas de Uniformidad
Publicidad

Destacado (8)

PPT
Atenuación exponencial metodo holton
PPT
Análisis de regresión múltiple
PPTX
5. regresión lineal multiple
PPT
Regresion lineal multiple
PDF
Modelos predictivos: datos, métodos, problemas y aplicaciones
PPTX
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
PPT
Ejercicios de análisis de regresión múltiple
PPT
Regresión lineal múltiple
Atenuación exponencial metodo holton
Análisis de regresión múltiple
5. regresión lineal multiple
Regresion lineal multiple
Modelos predictivos: datos, métodos, problemas y aplicaciones
Métodos predictivos y Descriptivos - MINERÍA DE DATOS
Ejercicios de análisis de regresión múltiple
Regresión lineal múltiple
Publicidad

Similar a Metodos Predictivos (20)

PDF
minimos-cuadrados-y-regresion
DOCX
Regresion lineal simple
PPTX
Tema IV Tecnicas de Pronostico Grupo 6.pptx
PPT
1. presentacion-minimos-cuadrados
PDF
REPASO MODELOS ECONOMETRICOS.pdf
PDF
REPASO MODELOS ECONOMETRICOS.pdf
PPTX
proyección minimosvxvdvdsf cuadrados.pptx
DOCX
Tema2. pronosticos de demanda
PDF
Regresión lineal proyeccion de demanda .pdf
PPT
Minimos Cuadrados
PPTX
Pronosticos
PDF
Clase 4 Ajuste de curvas.pdf
PPT
Presentación regreción lineal
PPTX
expocicion regresion.pptx
PPTX
CORRELACIÓN Y REGRESIÓN DIAPOSITIVAS.pptx
PPT
Regresion lineal simple
PPT
Regresion lineal simple
PPTX
Analisis_de_REGRESION_LINEALLLLLLLLL.pptx
PPTX
Regresión Lineal
PDF
Presentación clase 5 regresión múltiple.pdf
minimos-cuadrados-y-regresion
Regresion lineal simple
Tema IV Tecnicas de Pronostico Grupo 6.pptx
1. presentacion-minimos-cuadrados
REPASO MODELOS ECONOMETRICOS.pdf
REPASO MODELOS ECONOMETRICOS.pdf
proyección minimosvxvdvdsf cuadrados.pptx
Tema2. pronosticos de demanda
Regresión lineal proyeccion de demanda .pdf
Minimos Cuadrados
Pronosticos
Clase 4 Ajuste de curvas.pdf
Presentación regreción lineal
expocicion regresion.pptx
CORRELACIÓN Y REGRESIÓN DIAPOSITIVAS.pptx
Regresion lineal simple
Regresion lineal simple
Analisis_de_REGRESION_LINEALLLLLLLLL.pptx
Regresión Lineal
Presentación clase 5 regresión múltiple.pdf

Último (20)

PDF
RM2025 - FUNDAMENTOS TEÓRICOS - PEDIATRÍA.pdf
PDF
Manual del Gobierno Escolar -MINEDUC.pdf
PDF
Jodorowsky, Alejandro - Manual de Psicomagia.pdf
PDF
2.0 Introduccion a processing, y como obtenerlo
PDF
Como usar el Cerebro en las Aulas SG2 NARCEA Ccesa007.pdf
PDF
Esc. Sab. Lección 7. El pan y el agua de vida.pdf
DOCX
PLAN DE CASTELLANO 2021 actualizado a la normativa
PDF
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE_COM.pdf
PDF
Telos 127 Generacion Al fa Beta - fundaciontelefonica
PPTX
Historia-Clinica-de-Emergencia-Obstetrica 1.10.pptx
PDF
Introduccion a la Investigacion Cualitativa FLICK Ccesa007.pdf
PPTX
TEMA 1ORGANIZACIÓN FUNCIONAL DEL CUERPO, MEDIO INTERNO Y HOMEOSTASIS (3) [Aut...
PDF
Los10 Mandamientos de la Actitud Mental Positiva Ccesa007.pdf
PDF
ciencia_tecnologia_sociedad Mitcham Carl. (1994)..pdf
PDF
Introducción a la historia de la filosofía
PPTX
MATEMATICAS GEOMETRICA USO TRANSPORTADOR
PPTX
RESUMENES JULIO - QUIRÓFANO HOSPITAL GENERAL PUYO.pptx
PDF
Mi Primer Millon - Poissant - Godefroy Ccesa007.pdf
PDF
LIBRO 2-SALUD Y AMBIENTE-4TO CEBA avanzado.pdf
PDF
Texto Digital Los Miserables - Victor Hugo Ccesa007.pdf
RM2025 - FUNDAMENTOS TEÓRICOS - PEDIATRÍA.pdf
Manual del Gobierno Escolar -MINEDUC.pdf
Jodorowsky, Alejandro - Manual de Psicomagia.pdf
2.0 Introduccion a processing, y como obtenerlo
Como usar el Cerebro en las Aulas SG2 NARCEA Ccesa007.pdf
Esc. Sab. Lección 7. El pan y el agua de vida.pdf
PLAN DE CASTELLANO 2021 actualizado a la normativa
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE_COM.pdf
Telos 127 Generacion Al fa Beta - fundaciontelefonica
Historia-Clinica-de-Emergencia-Obstetrica 1.10.pptx
Introduccion a la Investigacion Cualitativa FLICK Ccesa007.pdf
TEMA 1ORGANIZACIÓN FUNCIONAL DEL CUERPO, MEDIO INTERNO Y HOMEOSTASIS (3) [Aut...
Los10 Mandamientos de la Actitud Mental Positiva Ccesa007.pdf
ciencia_tecnologia_sociedad Mitcham Carl. (1994)..pdf
Introducción a la historia de la filosofía
MATEMATICAS GEOMETRICA USO TRANSPORTADOR
RESUMENES JULIO - QUIRÓFANO HOSPITAL GENERAL PUYO.pptx
Mi Primer Millon - Poissant - Godefroy Ccesa007.pdf
LIBRO 2-SALUD Y AMBIENTE-4TO CEBA avanzado.pdf
Texto Digital Los Miserables - Victor Hugo Ccesa007.pdf

Metodos Predictivos

  • 1. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Métodos Predictivos Resumen de Clases Por: Oliver Amadeo Vilca Huayta ovilca@gmail.com Departamento de Ingeniería de Sistemas - UNAP Abril del 2011
  • 2. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción 1 ¿Porqué es importante los métodos predictivos? Introducción 2 Regresión Simple Regresión Simple La linea de mínimos cuadrados que mejor se ajusta Estimaciones puntuales de mínimos cuadrados Coeficiente de determinación y correlación simple Intérvalo de confianza para un valor individual de y Prueba F global 3 Regresión Múltiple Introducción Enfoque matricial Coeficiente de determinación múltiple R2 Prueba F global Prueba T 4 Regresión Cuadrática Introducción Ejemplo 5 Interacción Introducción Fin
  • 3. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Capítulo 1: INTRODUCCCIÓN A LOS MÉTODOS PREDICTIVOS
  • 4. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción ¿Porqué es importante los métodos predictivos? La finalidad de los modelos predictivos es la obtención de pronósticos acerca de la evolución futura de determinadas variables. Es importante en muchas empresas y entidades ya que las predicciones de hechos futuros se pueden incorporar al proceso de toma de decisiones. La intuición no necesariamente da los mejores resultados. Mejora la planeación y competitividad.
  • 5. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción El análisis de regresión es una técnicca estadística para investigar y modelar la relación entre variables. Son muchas las aplicaciones y las hay en casi cualquier campo: ingeniería, ciencias, físicas y químicas, economía, administración, biología y en las ciencias sociales, de hecho, puede ser que el análisis de regresión sea la técnica estadística más usada (Montgomery et al., 2007).
  • 6. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción Pronósticos Las predicciones de hechos y condiciones futuros se llaman pronósticos. Se analiza los datos para poder identificar un patrón que se pueda utilizar para describirlo. Luego, este patrón se extrapola, o se amplía, hacia el futuro con el objeto de preparar un pronóstico. Se apoya en el supuesto de que el patrón que se identificó sigue siendo el mismo en el futuro. No se puede esperar que una técnica de predicción dé buenas predicciones a menos que esta hipótesis sea válida.
  • 7. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción Pronosticos La información tranversal consta de valores observados en un punto en el tiempo. Notas del último examen del semestre. Índice de percepciones de corrupción 2010, america latina. Número de consultas realizadas a un Sistema Información durante el último mes. Una serie de tiempo es una sucesión cronológica de observaciones de una variable en particular. Población de la ciudad de Puno con respecto al tiempo. Índice de percepciones de corrupción en Perú, del 2000 al 2010.
  • 8. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción Partes de una serie de tiempo: Tendencia. Ciclo. Variaciones estacionales. Fluctuaciones irregulares.
  • 9. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción Medición de los errores de pronóstico et = yt − ˆ yt yt valor real de la variable de interés en el periodo de tiempo t. ˆ yt el valor predicho. et error de pronóstico para un pronóstico particular ˆ yt . Con frecuencia un examen de los errores de pronóstico en el tiempo indica si la técnica de predicción va de acuerdo o no con el patrón. Por ejemplo: si una técnica de predicción predice exáctamente la tendencia, la variación estacional o el componente cíclico que están presentes en una serie de tiempo, los errores de pronóstico reflejarán sólo el componente irregular.
  • 10. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción Medición de la magnitud de los errores Desviación absoluta: et = |yt − ˆ yt | Desviación absoluta media DAM: Pn t=1 |et | n = Pn t=1 |yt − ˆ yt | n Error cuadrático: (et )2 = (yt − ˆ yt)2 Error cudrático medio (ECM): Pn t=1(et )2 n = Pn t=1(yt − ˆ yt)2 n
  • 11. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción Medición de la magnitud de los errores Una manera de medir el error de pronóstico que facilita la comparación de diferentes series de tiempo con valores de distintas magnitudes es dividir las desviaciones absolutas entre el valor real yt y luego multiplicarlo por 100. Error absoluto de porcentaje EAP: |et | yt (100) = |yt − ˆ yt | yt (100) Error absoluto de porcentaje medio EAPM: Pn t=1 EAPt n = 100 Pn t=1 |yt−ˆ yt | yt n
  • 12. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Regresión Simple
  • 13. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Regresión Simple Regresión Lineal Simple Capítulo 2: REGRESIÓN LINEAL SIMPLE
  • 14. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Regresión Simple Los modelos de regresión en los que se emplea una variable dependiente y una variable independiente se denominan modelos de regresión lineal (o de una recta) simple. Modelo de regresión lineal simple y = uy;x + =
  • 15. 0 +
  • 16. 1x + uy;x es el valor medio de la variable dependiente y cuando el valor de la variable independiente es x. Recta de medias.
  • 17. 0 es la ordenada al origen.
  • 18. 0 es el valor medio de y cuando x es igual a cero.
  • 19. 1 es la pendiente, es el cambio (incremento o decremento) en el valor medio de y asociado con un incremento de una unidad de x. es un término de error que describe los efectos sobre y de todos los otros factores que no son los valores de la variable independiente x.
  • 20. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Regresión Simple y x Variable dependiente Variable independiente Variable respuesta Variable predictora Variable Variable Ejm: Consumo de combustible por se-mana Ejm: Temperatura promedio por hora durante la semana Cuadro: Denominaciones de las variables.
  • 21. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción La linea de mínimos cuadrados que mejor se ajusta El método de mínimos cuadrados fue descrito primero por Carl Friedrich Gauss alrededor 1794. El día de Año Nuevo de 1801, el astrónomo italiano Giuseppe Piazzi descubrió el planeta Ceres. Fue capaz de seguir su órbita durante 40 días. Durante el curso de ese año, muchos científicos intentaron estimar su trayectoria con base en las observaciones de Piazzi. La mayoría de evaluaciones fueron inútiles; el único cálculo suficientemente preciso, que permitió al astrónomo Franz Xaver von Zach, reencontrar a Ceres al final del año fue el método Gauss.
  • 22. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción La linea de mínimos cuadrados que mejor se ajusta Escoge
  • 23. 0 y
  • 24. 1 de tal manera P que para un conjunto de datos, la suma de residuos al cuadrado e2 t sea lo mas pequeño posible. X e2 t = X (yt − ˆ yt )2 = X (yt −
  • 25. 0 −
  • 26. 1xt )2 Para que sea lo mímino, se deriva respecto a
  • 27. 0 y
  • 28. 1: −2 X (yt −
  • 29. 0 −
  • 30. 1xt )2 = 0 (1) −2 X xt (yt −
  • 31. 0 −
  • 32. 1xt )2 = 0 (2) Reordenando se obtiene las denominadas ecuaciones normales: X yt =
  • 33. 0n +
  • 34. 1 X xt (3) X xtyt =
  • 35. 0 X xt +
  • 36. 1 X x2 t (4) Resolviendo el sistema de ecuaciones para
  • 37. 0 y
  • 39. 1 = P xiyi − P xi P yi n P x2 i − P ( xi )2 n y
  • 40. 0 = y
  • 41. 1x
  • 42. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Estimaciones puntuales de mínimos cuadrados Sea n la cantidad de observaciones, asimismo, y = P yi n y x = P xi n La estimación puntual de los mínimos cuadrados de la pendiente:
  • 43. 1 = P (xi − x)(yi − y) P (xi − x)2 = P xiyi − P xi P yi n P x2 i − P ( xi )2 n = SSxy SSxx La estimación puntual de los mínimos cuadrados de la ordenada al origen
  • 44. 0 es:
  • 45. 0 = y
  • 46. 1x Con objeto de simplificar la notación, con P frecuencia se Pomiten los límites de la sumatoria. Es decir usamos en lugar de n i=1
  • 47. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Estimaciones puntuales de mínimos cuadrados Suposiciones para el modelo de regresión La media de la población de los valores potenciales del término de error es igual a cero. Suposición de la varianza constante (homoscedasticidad) : La varianza de la población de los valores potenciales del término de error no depende del valor de x. La varianza constante se denota como 2. Suposición de normalidad: La población de los valores potenciales del término de error tiene una distribución normal. Suposición de independencia: Un valor cualquiera del término de error es estadísticamente independiente de cualquier otro valor de .
  • 48. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Coeficiente de determinación y correlación simple Variación total: Suma de los errores de predicción al cuadrado que se obtiene cuando no empleamos la variable predictora x. Mide la cantidad total de variación que muestran los valores observados de y. PSSyy = n i=1(yi − y)2 = Pn i=1 y2 i − Pn ( i=1 yi)2 n Variación inexplicada: Suma de los errores de predicción al cuadrado que se obtiene cuando usamos la variable predictora x (otro Pnombre para SSE). SSE = n i=1(yi − ˆyi )2 VPariación explicada: n i=1( ˆ yi − y)2 Se puede demostrar que: Xn i=1 (yi − y)2 = Xn i=1 (yi − ˆyi )2 + Xn i=1 ( ˆ yi − y)2
  • 49. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Coeficiente de determinación y correlación simple Coeficiente de determinación simple r 2 El coeficiente de determinación simple: Es una medida de utilidad del modelo de regresión lineal simple. r 2 = variacion explicada variacion total r 2 es la proporción de la variación total en los n valores observados de la variable dependiente que explica el modelo de regresión lineal simple. También se puede calcular utilizando la fórmula: r 2 =
  • 50. 2 1 Pn i=1(xi − x)2 Pn i=1(yi − y)2
  • 51. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Coeficiente de determinación y correlación simple Coeficiente de correlación simple r Coeficiente de correlación simple: Medida de relación entre dos variables y y x, varia entre -1 y 1. Un valor cercano a cero quiere decir que hay una pequeña relación lineal entre y y x. Un valor de r cercano a 1 significa que y y x tienen una fuerte tendencia a desplazarse juntas en una forma lineal con una pendiente positiva (correlación positiva, no significa que exista una relación causa efecto). pr = +r 2 si la pendiente es positiva pr = − r 2 si la pendiente es negativa Coeficiente de correlación simple también se puede calcular usando la fórmula que da automáticamente el signo (+ o -): r = p SSxy SSxxSSyy
  • 52. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Coeficiente de determinación y correlación simple Para efectuar las pruebas de hipótesis cuando se aplica el modelo de regresión lineal, es necesario calcular las estimaciones puntuales 2 y (la varianza constante y la desviación estándar de las diferentes poblaciones de términos de error) Error cuadrático medio y error estándar Una estimación puntual de 2 es el error cuadrático medio: s2 = SSE n − 2 Una estimación puntual de es el error estándar: s = s SSE n − 2
  • 53. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Intérvalo de confianza para un valor individual de y El valor de la distancia para la regresión lineal simple Para un valor particular x0 de x es: Valor de distancia = 1 n + (x0 − x)2 SSxx Intérvalo de confianza para un valor individual de y Si se sustentas las suposiciones de regresión, un intérvalo de predicción [/2] sp1 + valor de distancia] [ˆy ± t(n−2)
  • 54. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Intérvalo de confianza para un valor individual de y 6 7 8 9 10 11 12 13 14 Consumo de combustible por semana Consumo de combustible por semana 25 30 35 40 45 50 55 60 65 Temperatura promedio por hora durante la semana Intérvalo de predicción para un valor individual al 95%
  • 55. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Prueba F global Una prueba F para el modelo de regresión lineal simple Una manera de evaluar la utilidad del modelo de regresión es probar la significancia de la relación de regresión entre y y x. Probamos la hipótesis nula: H0 :
  • 56. 1 = 0 Es decir, que la relación de regresión entre y y x no es significante. Contra: Ha :
  • 57. 16= 0 Lo cual quiere decir que la relación entre y y x es significante. Si se puede rechazar H0 al nivel de significancia , entonces se dice que el modelo de regresión lineal simple es significante en el nivel de significancia .
  • 58. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Prueba F global Una prueba F para el modelo de regresión lineal simple Definamos la estadística F global como F(modelo) = Variacion explicada (Variacion inexplicada)/(n − 2) También definimos el valor p relacionado con F(modelo) como el área bajo la curva de distribución F(con 1 y n − 2 grados de libertad) a la derecha de F(modelo). Se puede aceptar Ha: en el nivel de significancia si se mantiene algunas de las condiciones siguientes: F(modelo) F[] valor p Donde el punto F[] se basa en 1 grados de libertad para el numerador y n − 2 para el denominador.
  • 59. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción Capítulo 3: REGRESIÓN LINEAL MÚLTIPLE
  • 60. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción Los modelos de regresión en los que se emplean más de una variable independiente se denominan modelos de regresión múltiple. Para expresar una variable dependiente en función de cualquier cantidad de variables independientes. Modelo de regresión múltiple y = uy;x1,x2,··· ,xk + =
  • 61. 0 +
  • 62. 1x1 +
  • 63. 2x2 + · · · +
  • 64. k xk + . uy;x1,x2,··· ,xk es el valor medio de la variable dependiente y cuando los valores de la variables independientes son x1, x2, · · · , xk .
  • 65. 0,
  • 66. 1,
  • 67. 2, · · · ,
  • 68. k son parámetros de regresión (desconocidos) que relacionan el valor medio de y con x1, x2, · · · , xk . es un término de error que describe los efectos sobre y de todos los otros factores que no son los valores de las variables independientes x1, x2, · · · , xk .
  • 69. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción Interpretación de los parámetros de regresión: y =
  • 70. 0 +
  • 71. 1x1 +
  • 72. 2x2 + Consumo de combustible = f(temperatura horaria promedio , índice de enfriamiento) Los parámetros relacionan la media de la variable dependiente con las variables independientes en un sentido global.
  • 73. 0: ordenada al origen.
  • 74. 1: cambio en el consumo medio de combustible a la semana que se asocia con el incremento de un grado en la temperatura promedio cuando no cambia el índice de enfriamiento.
  • 75. 2: cambio en el consumo medio de combustible a la semana que se asocia con el incremento de una unidad en el índice de enfriamiento cuando no cambia la temperatura horaria promedio.
  • 76. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción Suposiciones para el modelo de regresión múltiple En cualquier combinación dada de valores de x1, x2, · · · , xk La media de la población de los valores potenciales del término de error es igual a cero. Suposición de la varianza constante: La varianza de la población de los valores potenciales del término de error no depende de la combinación de valores de x1, x2, · · · , xk . La varianza constante se denota como 2. Suposición de normalidad: La población de los valores potenciales del término de error tiene una distribución normal. Suposición de independencia: Un valor cualquiera del término de error es estadísticamente independiente de cualquier otro valor de .
  • 77. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Enfoque matricial Hay k variables regresoras y n observaciones y el modelo que relaciona las variables regresoras con la variable de repuesta es: yi =
  • 78. 0 +
  • 80. 2xi2 + · · · +
  • 81. kxik + i , para i = 1, 2, · · · , n Este es un modelo de n ecuaciones que en notación matricial puede expresarse como: Y = X ˆ
  • 82. + donde: Y = 0 BBBB@ y1 y2 ... yn 1 CCCCAX = 0 BBBB@ 1 x11 x12 . . . x1k 1 x21 x22 . . . x2k 1 ... ... . . . ... 1 xn1 xn2 . . . xnk 1 CCCCA ˆ
  • 84. ˆ0
  • 85. ˆ1
  • 87. ˆk 1 CCCCCCA = 0 BBBB@ 1 2 ... n 1 CCCCA
  • 88. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Enfoque matricial Las estimaciones puntuales de mínimos cuadrados: (X0X)−1X0Y = 0 BBBBBB@ ˆ
  • 89. 0
  • 90. ˆ1
  • 93. Y es el vector columna de los n valores observados de la variable dependiente y1, y2, . . . , yn Y = 0 BBBB@ y1 y2 ... yn 1 CCCCA X = 0 BBBB@ 1 x11 x12 . . . x1k 1 x21 x22 . . . x2k 1 ... ... . . . ... 1 xn1 xn2 . . . xnk 1 CCCCA
  • 94. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Enfoque matricial Variación inexplicada y explicada Variación total: SSyy = Xn i=1 (yi − y)2 = Xn i=1 y2 i − Pn ( i=1 yi )2 n Variación inexplicada: SSE = Xn i=1 (yi − ˆyi )2 = Xn i=1 y2 i − ˆ
  • 96. 0X0Y − Pn ( i=1 yi )2 n
  • 97. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Enfoque matricial Para efectuar las pruebas de hipótesis cuando se aplica el modelo de regresión lineal, es necesario calcular las estimaciones puntuales 2 y (la varianza constante y la desviación estándar de las diferentes poblaciones de términos de error) Error cuadrático medio y error estándar Una estimación puntual de 2 es el error cuadrático medio: s2 = SSE n − (k + 1) Una estimación puntual de es el error estándar: S = s SSE n − (k + 1)
  • 98. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Coeficiente de determinación múltiple R2 Variación total: SSyy = Pn i=1(yi − y)2 = Pn i=1 y2 i − ( Pn i=1 yi)2 n Variación Pinexplicada: SSE = n i=1(yi − ˆyi )2 = Pn i − ˆ
  • 99. 0X0Y i=1 y2 Variación explicada: Pn i=1( ˆ yi − y)2 = ˆ
  • 100. 0X0Y − ( Pn i=1 yi)2 n Coeficiente de determinación múltiple: R2 = variacion explicada variacion total Coeficiente de correlación múltiple: R = pR2 Coeficiente de determinación múltiple ajustado (R2 ajustado): R2 = R2 − k n − 1 n − 1 n − (k + 1)
  • 101. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Prueba F global Una prueba F para el modelo de regresión lineal Una manera de evaluar la utilidad del modelo de regresión es probar la significancia de la relación de regresión entre y y x1, x2, · · · , xk (k+1 parámetros). Probamos la hipótesis nula: H0 :
  • 102. 1 =
  • 103. 2 = · · · =
  • 104. k = 0 La cual establece que ninguna de las variables independientes está relacionado significativamente con y (la relación de regresión no es significante). Ha : por lo menos uno de
  • 105. 1,
  • 106. 2, · · · ,
  • 107. k no es igual a cero. Lo cual quiere decir que por lo menos una de las variables independientes está significativamente relacionado con y.
  • 108. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Prueba F global Una prueba F para el modelo de regresión lineal Definamos la estadística F global como F(modelo) = (Variacion explicada)/k (Variacion inexplicada)/[n − (k + 1)] También definimos el valor p relacionado con F(modelo) como el área bajo la curva de distribución F que tiene k y [n − (k + 1)] grados de libertad a la derecha de F(modelo). Se puede aceptar Ha: en el nivel de significancia si se mantiene algunas de las condiciones siguientes: F(modelo) F[] valor p Donde el punto F[] se basa en k grados de libertad para el numerador y n − (k + 1) para el denominador.
  • 109. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Prueba T Prueba de la significancia de la variable independiente xj ¿Cuáles variables independientes afectan significativamente a y? (individualmente). Para probar la significancia de xj probamos la hipótesis nula contra la hipótesis alternativa: H0 :
  • 110. j = 0 Ha :
  • 111. j6= 0 La estadística de prueba. t = ˆ
  • 112. j Sbj = ˆ
  • 113. j Spcjj Condición del punto de rechazo H0 si |t| t(n−(k+1)) [/2] n − (k + 1) grados de libertad.
  • 114. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción Sección 3.2: Regresión Cuadrática
  • 115. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción Una forma útil del modelo de regresión lineal es la que se denomina modelo de regresión cudrática. Modelo de regresión cuadrática y =
  • 116. 0 +
  • 117. 1x +
  • 118. 2x2 + . Donde
  • 119. 0 +
  • 120. 1x +
  • 121. 2x2 es uy;x es el valor medio de la variable dependiente y cuando es valor de la variable independiente es x.
  • 122. 0,
  • 123. 1,
  • 124. 2 son parámetros de regresión (desconocidos) que relacionan el valor medio de y con x. es un término de error que describe los efectos sobre y de todos los otros factores que no son x y x2.
  • 125. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Ejemplo Ejemplo Una compañia desea mejorar la cantidad de kilómetros recorridos por galón de gasolina en los automóviles que usan su gasolina. Los químicos de la compañía recomiendan un aditivo (Cripton19) se mezcle con la gasolína. Determinar la cantidad de unidades de aditivo que se debe mezclar con la gasolina para maximizar las millas recorridas. A la compañía le gustaría predecir la cantidad máxima de millas recorridas por galón que se puede alcanzar utilizando el aditivo.
  • 126. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Ejemplo X = Número de unidades de aditivo Y = Cantidad de millas recorridas 0 25.8 0 26.1 0 25.4 1 29.6 1 29.2 1 29.8 2 32.0 2 31.4 2 31.7 3 31.7 3 31.5 3 31.2 4 29.4 4 29.0 4 29.5 Cuadro: Millas recorridas según unidades de aditivo.
  • 127. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Ejemplo scatter y x, title(Millas Recorridas según aditivo) subtitle(Petroleos S.A.) caption(Fuente: Elaboración propia) scheme(sj) 24 26 28 30 32 Millas recorridas Millas Recorridas según aditivo Métodos Predictivos 2010 0 1 2 3 4 Aditivo Fuente: Elaboración propia
  • 128. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Ejemplo generate xx = x*x regres y x xx
  • 129. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Ejemplo Cantidad de aditivo que maximiza los kilómetros recorridos Ecuación de predicción de mínimos cuadrados orginarios: y = 25,71524 + 4,976191x − 1,019048x2 Cantidad de unidades de aditivo que maximiza los kilómetros recorridos: Usamos cálculo diferencial: diff(25.71524 + 4.976191*x - 1.019048*x*x , x , 1); 4.976191 - 2.038096*x solve(%,x),float; x = 2.44 unidades de aditivo. La cantidad predicha de kilometros recorridos por galón: ev(25.71524 + 4.976191*x - 1.019048*x*x , x=2.44 ); 31.7901 kilómetros por galón.
  • 130. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Ejemplo 32 GRAFICA DE LA ECUACION DE PREDICCION galon 30 por 28 Kilometros 26 24 22 0 1 2 3 4 5 6 Unidades de aditivo
  • 131. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Introducción Sección 3.3: Interacción
  • 132. Introducción a MP Regresión Simple Regresión Múltiple Regresión Cuadrática Interacción Fin Gracias por su atención.