Sesión 04
Anova y Regresión Lineal Simple
Dr. Jorge Ramírez Medina
Hablemos de transnacionales
Dr. Jorge Ramírez Medina
En lenguaje estadístico
Dr. Jorge Ramírez Medina
Descomposición de la variación
• SSentre. Estimación de la variabilidad entre tratamientos, también se le
denota por SSx, esta es la variación en X relacionada a la variación en las
medias de cada muestra. Se le conoce como SCTR suma de los cuadrados
debido a los tratamientos.
• SSdentro. variación dentro de cada una de las muestras, también denotada
como SSerror, es la variación en X debido a la variación dentro de cada una
de las muestras. Se le conoce como SCE, suma de cuadrados debido al error
• SSy. Es la variación total. Se le conoce como STC, suma de cuadrados del
total
STC = SCTR + SCE
Dr. Jorge Ramírez Medina
Tabla ANOVA
 
2
2
1

ns
Dr. Jorge Ramírez Medina
Ejemplo; Estrés laboral
Sistema A
Sistema B
Sistema C
Dr. Jorge Ramírez Medina
ANOVA dos factores
Ingeniería
Dr. Jorge Ramírez Medina
Ejercicio en clase
Cata de Vinos
Sube en la plataforma el ejercicio
sobre la cata de vinos. Atiende las
instrucciones del profesor para
esta actividad
Dr. Jorge Ramírez Medina
Reflexión
Historia del Dr. Howard
Mozkowitz
Dr. Jorge Ramírez Medina
Modelo de
regresión lineal simple
Dr. Jorge Ramírez Medina
Método de mínimos cuadrados
Dr. Jorge Ramírez Medina
Calculando b0 y b1
Dr. Jorge Ramírez Medina
Suposiciones del modelo
• E(e)=0
• Varianza de e, (que es 2) es la misma para todos los valores de x.
• Los valores de e son independientes.
• e es una variable distribuida normalmente
Dr. Jorge Ramírez Medina
Ejemplo
Dr. Jorge Ramírez Medina
Suma de cuadrados
debido al error
Dr. Jorge Ramírez Medina
Suma total de cuadrados
Dr. Jorge Ramírez Medina
SCE y STC
Dr. Jorge Ramírez Medina
Suma de cuadrados
debido a la regresión
Dr. Jorge Ramírez Medina
¿Qué tan bien se ajustan los datos a
la regresión?
Dr. Jorge Ramírez Medina
¿Cómo comprobamos
el ajuste del modelo?
Dr. Jorge Ramírez Medina
¿Cómo comprobamos
el ajuste del modelo?
• Usando r2
• Usando una prueba de hipótesis
H0: b1= 0
Ha: b1 ≠ 0
Estadístico de prueba
F=CMR/ECM
Regla rechazo
r-value<=a
• Análisis de residuos
Dr. Jorge Ramírez Medina
Usando r2
Dr. Jorge Ramírez Medina
EGADE Business School
𝑟2
=
𝑆𝐶𝑅
𝑆𝐶𝑇
=
𝑆𝑇𝐶 − 𝑆𝐶𝐸
𝑆𝐶𝑇
Dr. Jorge Ramírez Medina
En donde
Coeficiente de correlación
Dr. Jorge Ramírez Medina
Usando la prueba F
Fuente de
variación
Suma de
cuadrados
Grados
de
libertad
Cuadrado Medio F p-value
Regresión SCR 1 CMR=SCR/1 F=CMR/CME tablas
Error SCE n-2 CME=SCE/(n-2)
Total STC n-1
Dr. Jorge Ramírez Medina
En el ejemplo
𝐹 =
𝐶𝑀𝑅
𝐸𝐶𝑀
𝐶𝑀𝑅 =
𝑆𝐶𝑅
𝑁𝑜. 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠
𝑠2 = 𝐸𝐶𝑀 =
𝑆𝐶𝐸
𝑛 − 2
14200
1
15300
10−2
= 191.25
𝐹 = 74.25
p-value
2.54887E-05
Dr. Jorge Ramírez Medina
Análisis de residuos
(𝑦𝑖 − 𝑦 )
Dr. Jorge Ramírez Medina
Análisis de residuos
• Cuando se cumplen las hipótesis estructurales del modelo de
regresión lineal. se observa una nube de puntos en dirección
horizontal y con anchura constante (la media de cada error debería
ser cero y tener todas la misma varianza).
Dr. Jorge Ramírez Medina
Análisis de residuos
Si se viola la linealidad se observará una falta de linealidad también
en los residuos
Dr. Jorge Ramírez Medina
Análisis de residuos
Si se viola la homoscedasticidad, la anchura de la banda no será
constante
Dr. Jorge Ramírez Medina
Análisis de residuos
Una relación lineal entre los residuos y las predicciones puede
indicar que alguna variable no incluida en el modelo puede ser
significativa
Dr. Jorge Ramírez Medina
Ejemplo de RLS
¿Cuál es el país que más contribuye al bienestar de la humanidad?
Dr. Jorge Ramírez Medina
Ejemplo de RLS
Dr. Jorge Ramírez Medina
Ejemplo de RLS
Encuentre la ecuación de regresión entre el Índice de progreso
social – Fundamentos de Bienestar.
Dr. Jorge Ramírez Medina
Conceptos de Estadística
Suerte en su
maestría
Dr. Jorge Ramírez Medina
Fin de sesión

Más contenido relacionado

PPTX
S03 ad4024
PPTX
Sesión 02
PPTX
Sesión 01
PPT
S01 ad4001 ss
PPT
S04 ad4001 ss
PPT
S03 ad4001 v2_ss
PDF
Distribucion Normal
DOCX
Trabajo de prueba de hipótesis
S03 ad4024
Sesión 02
Sesión 01
S01 ad4001 ss
S04 ad4001 ss
S03 ad4001 v2_ss
Distribucion Normal
Trabajo de prueba de hipótesis

La actualidad más candente (20)

PDF
Calculo del tamaño de muestra
DOCX
Universidad Tecnológica de Torreón
PDF
Proyecto estadistica ejercicios UNIDEG
PPT
DOCX
Estimación de la varianza poblacional
PPT
S03 AD4001
PPT
S03 ad4001 slide_share
PPTX
2. ejercicios de prueba de hipótesis
PDF
Estimacion y desviacion
DOCX
Estimacion de la_media_poblacional
DOC
Ejercicios Contraste de Hipótesis resueltos
PPTX
Presentación probabilidad
DOCX
2 estimación
DOCX
Distribucion normal
PPTX
Prueba de hipotesis estadistica aplicada a la ingenieria
PDF
Pdfcoffee.com capitilo 11-prueba-de-hipotesis-de-dos-muestraspdf-5-pdf-free
PDF
Ejercicios prueba de hipótesis
DOCX
Intervalos de confianza (7)
Calculo del tamaño de muestra
Universidad Tecnológica de Torreón
Proyecto estadistica ejercicios UNIDEG
Estimación de la varianza poblacional
S03 AD4001
S03 ad4001 slide_share
2. ejercicios de prueba de hipótesis
Estimacion y desviacion
Estimacion de la_media_poblacional
Ejercicios Contraste de Hipótesis resueltos
Presentación probabilidad
2 estimación
Distribucion normal
Prueba de hipotesis estadistica aplicada a la ingenieria
Pdfcoffee.com capitilo 11-prueba-de-hipotesis-de-dos-muestraspdf-5-pdf-free
Ejercicios prueba de hipótesis
Intervalos de confianza (7)
Publicidad

Similar a S04 (20)

PPTX
S04 ad4024 v2
PPTX
S09 ad4001
PDF
Regresion_lineal_simple.pdf
PPT
AD4001 s10 ss
PPTX
LAB IV. Parte 2
PPTX
Analisis_de_REGRESION_LINEALLLLLLLLL.pptx
PPTX
Econometria Salida Stata
PPT
Regresion_lineal para realizar estudios socioecológicos.ppt
PPT
EI2_MAMN_RLMultiple.ppt
PPT
Unidad5 reglineal
PPTX
La Regresión Lineal Simple en la programcion de laos vlimites variables
PPSX
Estadística aplicada a la educación superior
PDF
RETROALIMENTACIÓN-CORRELACIÓN Y REGRESIÓN.pdf
PPTX
regresiones leniales.pptx
DOCX
Regresion estadistica
PDF
Regresion
PPT
Cap2. modelo regresión multiple-v2-2011
PDF
Estadística y diseños experimentales aplicados a la educación superior
PDF
PPTX
Regresion lineal
S04 ad4024 v2
S09 ad4001
Regresion_lineal_simple.pdf
AD4001 s10 ss
LAB IV. Parte 2
Analisis_de_REGRESION_LINEALLLLLLLLL.pptx
Econometria Salida Stata
Regresion_lineal para realizar estudios socioecológicos.ppt
EI2_MAMN_RLMultiple.ppt
Unidad5 reglineal
La Regresión Lineal Simple en la programcion de laos vlimites variables
Estadística aplicada a la educación superior
RETROALIMENTACIÓN-CORRELACIÓN Y REGRESIÓN.pdf
regresiones leniales.pptx
Regresion estadistica
Regresion
Cap2. modelo regresión multiple-v2-2011
Estadística y diseños experimentales aplicados a la educación superior
Regresion lineal
Publicidad

Más de Jorge Ramírez (20)

PPTX
AD4026 BI Sesión 04
PPTX
Session 03 Business Intelligence
PDF
Business Intelligence S02
PPTX
AD4026 BI Sesión 01
PDF
Sesión 01 FZ4013
PDF
Sesión 01 FZ4013
PPTX
S11 ad5015
PPTX
Sesión 10 AD5015
PPT
Apoyo ejercicio busqueda de-patentes
PPT
Introduccion innovacion 2013-ott-cem
PPTX
Sesión 06
PPTX
Diapositivas de la sesión 04 AD5015
PPTX
sesión 03 AD5015
AD4026 BI Sesión 04
Session 03 Business Intelligence
Business Intelligence S02
AD4026 BI Sesión 01
Sesión 01 FZ4013
Sesión 01 FZ4013
S11 ad5015
Sesión 10 AD5015
Apoyo ejercicio busqueda de-patentes
Introduccion innovacion 2013-ott-cem
Sesión 06
Diapositivas de la sesión 04 AD5015
sesión 03 AD5015

Último (20)

PDF
IPERC...................................
DOCX
Programa_Sintetico_Fase_4.docx 3° Y 4°..
PDF
RM2025 - FUNDAMENTOS TEÓRICOS - PEDIATRÍA.pdf
PDF
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE_COM.pdf
PDF
ACERTIJO EL CONJURO DEL CAZAFANTASMAS MATEMÁTICO. Por JAVIER SOLIS NOYOLA
PDF
Aqui No Hay Reglas Hastings-Meyer Ccesa007.pdf
PPTX
RESUMENES JULIO - QUIRÓFANO HOSPITAL GENERAL PUYO.pptx
DOCX
PLAN DE CASTELLANO 2021 actualizado a la normativa
DOC
4°_GRADO_-_SESIONES_DEL_11_AL_15_DE_AGOSTO.doc
PDF
CURRICULAR DE PRIMARIA santa ursula..pdf
PDF
Como Potenciar las Emociones Positivas y Afrontar las Negativas Ccesa007.pdf
DOCX
PLAN DE AREA DE CIENCIAS SOCIALES TODOS LOS GRUPOS
PPTX
MATEMATICAS GEOMETRICA USO TRANSPORTADOR
PDF
2.0 Introduccion a processing, y como obtenerlo
PDF
ciencia_tecnologia_sociedad Mitcham Carl. (1994)..pdf
PDF
Ernst Cassirer - Antropologia Filosofica.pdf
PDF
Introduccion a la Investigacion Cualitativa FLICK Ccesa007.pdf
PDF
La lluvia sabe por qué: una historia sobre amistad, resiliencia y esperanza e...
PDF
Telos 127 Generacion Al fa Beta - fundaciontelefonica
PDF
La Inteligencia Emocional - Fabian Goleman TE4 Ccesa007.pdf
IPERC...................................
Programa_Sintetico_Fase_4.docx 3° Y 4°..
RM2025 - FUNDAMENTOS TEÓRICOS - PEDIATRÍA.pdf
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE_COM.pdf
ACERTIJO EL CONJURO DEL CAZAFANTASMAS MATEMÁTICO. Por JAVIER SOLIS NOYOLA
Aqui No Hay Reglas Hastings-Meyer Ccesa007.pdf
RESUMENES JULIO - QUIRÓFANO HOSPITAL GENERAL PUYO.pptx
PLAN DE CASTELLANO 2021 actualizado a la normativa
4°_GRADO_-_SESIONES_DEL_11_AL_15_DE_AGOSTO.doc
CURRICULAR DE PRIMARIA santa ursula..pdf
Como Potenciar las Emociones Positivas y Afrontar las Negativas Ccesa007.pdf
PLAN DE AREA DE CIENCIAS SOCIALES TODOS LOS GRUPOS
MATEMATICAS GEOMETRICA USO TRANSPORTADOR
2.0 Introduccion a processing, y como obtenerlo
ciencia_tecnologia_sociedad Mitcham Carl. (1994)..pdf
Ernst Cassirer - Antropologia Filosofica.pdf
Introduccion a la Investigacion Cualitativa FLICK Ccesa007.pdf
La lluvia sabe por qué: una historia sobre amistad, resiliencia y esperanza e...
Telos 127 Generacion Al fa Beta - fundaciontelefonica
La Inteligencia Emocional - Fabian Goleman TE4 Ccesa007.pdf

S04

  • 1. Sesión 04 Anova y Regresión Lineal Simple
  • 2. Dr. Jorge Ramírez Medina Hablemos de transnacionales
  • 3. Dr. Jorge Ramírez Medina En lenguaje estadístico
  • 4. Dr. Jorge Ramírez Medina Descomposición de la variación • SSentre. Estimación de la variabilidad entre tratamientos, también se le denota por SSx, esta es la variación en X relacionada a la variación en las medias de cada muestra. Se le conoce como SCTR suma de los cuadrados debido a los tratamientos. • SSdentro. variación dentro de cada una de las muestras, también denotada como SSerror, es la variación en X debido a la variación dentro de cada una de las muestras. Se le conoce como SCE, suma de cuadrados debido al error • SSy. Es la variación total. Se le conoce como STC, suma de cuadrados del total STC = SCTR + SCE
  • 5. Dr. Jorge Ramírez Medina Tabla ANOVA   2 2 1  ns
  • 6. Dr. Jorge Ramírez Medina Ejemplo; Estrés laboral Sistema A Sistema B Sistema C
  • 7. Dr. Jorge Ramírez Medina ANOVA dos factores Ingeniería
  • 8. Dr. Jorge Ramírez Medina Ejercicio en clase Cata de Vinos Sube en la plataforma el ejercicio sobre la cata de vinos. Atiende las instrucciones del profesor para esta actividad
  • 9. Dr. Jorge Ramírez Medina Reflexión Historia del Dr. Howard Mozkowitz
  • 10. Dr. Jorge Ramírez Medina Modelo de regresión lineal simple
  • 11. Dr. Jorge Ramírez Medina Método de mínimos cuadrados
  • 12. Dr. Jorge Ramírez Medina Calculando b0 y b1
  • 13. Dr. Jorge Ramírez Medina Suposiciones del modelo • E(e)=0 • Varianza de e, (que es 2) es la misma para todos los valores de x. • Los valores de e son independientes. • e es una variable distribuida normalmente
  • 14. Dr. Jorge Ramírez Medina Ejemplo
  • 15. Dr. Jorge Ramírez Medina Suma de cuadrados debido al error
  • 16. Dr. Jorge Ramírez Medina Suma total de cuadrados
  • 17. Dr. Jorge Ramírez Medina SCE y STC
  • 18. Dr. Jorge Ramírez Medina Suma de cuadrados debido a la regresión
  • 19. Dr. Jorge Ramírez Medina ¿Qué tan bien se ajustan los datos a la regresión?
  • 20. Dr. Jorge Ramírez Medina ¿Cómo comprobamos el ajuste del modelo?
  • 21. Dr. Jorge Ramírez Medina ¿Cómo comprobamos el ajuste del modelo? • Usando r2 • Usando una prueba de hipótesis H0: b1= 0 Ha: b1 ≠ 0 Estadístico de prueba F=CMR/ECM Regla rechazo r-value<=a • Análisis de residuos
  • 22. Dr. Jorge Ramírez Medina Usando r2 Dr. Jorge Ramírez Medina EGADE Business School 𝑟2 = 𝑆𝐶𝑅 𝑆𝐶𝑇 = 𝑆𝑇𝐶 − 𝑆𝐶𝐸 𝑆𝐶𝑇
  • 23. Dr. Jorge Ramírez Medina En donde Coeficiente de correlación
  • 24. Dr. Jorge Ramírez Medina Usando la prueba F Fuente de variación Suma de cuadrados Grados de libertad Cuadrado Medio F p-value Regresión SCR 1 CMR=SCR/1 F=CMR/CME tablas Error SCE n-2 CME=SCE/(n-2) Total STC n-1
  • 25. Dr. Jorge Ramírez Medina En el ejemplo 𝐹 = 𝐶𝑀𝑅 𝐸𝐶𝑀 𝐶𝑀𝑅 = 𝑆𝐶𝑅 𝑁𝑜. 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑠2 = 𝐸𝐶𝑀 = 𝑆𝐶𝐸 𝑛 − 2 14200 1 15300 10−2 = 191.25 𝐹 = 74.25 p-value 2.54887E-05
  • 26. Dr. Jorge Ramírez Medina Análisis de residuos (𝑦𝑖 − 𝑦 )
  • 27. Dr. Jorge Ramírez Medina Análisis de residuos • Cuando se cumplen las hipótesis estructurales del modelo de regresión lineal. se observa una nube de puntos en dirección horizontal y con anchura constante (la media de cada error debería ser cero y tener todas la misma varianza).
  • 28. Dr. Jorge Ramírez Medina Análisis de residuos Si se viola la linealidad se observará una falta de linealidad también en los residuos
  • 29. Dr. Jorge Ramírez Medina Análisis de residuos Si se viola la homoscedasticidad, la anchura de la banda no será constante
  • 30. Dr. Jorge Ramírez Medina Análisis de residuos Una relación lineal entre los residuos y las predicciones puede indicar que alguna variable no incluida en el modelo puede ser significativa
  • 31. Dr. Jorge Ramírez Medina Ejemplo de RLS ¿Cuál es el país que más contribuye al bienestar de la humanidad?
  • 32. Dr. Jorge Ramírez Medina Ejemplo de RLS
  • 33. Dr. Jorge Ramírez Medina Ejemplo de RLS Encuentre la ecuación de regresión entre el Índice de progreso social – Fundamentos de Bienestar.
  • 34. Dr. Jorge Ramírez Medina Conceptos de Estadística Suerte en su maestría
  • 35. Dr. Jorge Ramírez Medina Fin de sesión

Notas del editor

  • #3: Hablar de lo mala que es la CocaCola. Satanizar Buscar alumno en contra de Coca y preguntarle su evaluación del 1-10 Después: poner comercial de la Coca Cola Mostrarles el caso Coca Cola Femsa – EGADE Buscar alumno en favor de Coca y preguntarle su evaluación del 1-10
  • #5: En resumen , la racionalidad del análisis de varianza se basa en el cálculo de dos estimaciones independientes de la varianza poblacional s2 común. Una estimación se basa en la variabilidad entre las medias de las muestras mismas(entre las muestras), y la otra en la variabilidad de los datos dentro de cada muestra. Si se comparan ambas, se podrá determinar si las medias de la población son iguales. The total variation in Y, denoted by SSy, can be decomposed into two components: SSy = SSbetween + SSwithin where the subscripts between and within refer to the categories of X. SSbetween is the variation in Y related to the variation in the means of the categories of X. For this reason, SSbetween is also denoted as SSx. SSwithin is the variation in Y related to the variation within each category of X. SSwithin is not accounted for by X. Therefore it is referred to as SSerror.
  • #6: Para presentar de manera adecuada los cálculos anteriores se usa una tabla conocida como ANOVA (presentación depende del paquete estadístico usado) HACER AQUÍ EL EJEMPLO DE LA PLANTA CON ANOVA USANDO EXCEL
  • #7: Tres propuestas para reducir el estrés en el trabajo Pero cada quién lo maneja a su modo CME fuente de variación del grupo depende de las variaciones individuales de los empleados también Quitar estas diferencias con diseño de bloque aleatorizado Ejercicios en clase/Estrés
  • #8: Un experimento factorial es un diseño experimental que permite obtener simultáneamente conclusiones de dos o más facotres. El termino factorial se debe a que incluye todas las posibles combinaciones Estudiantes de tres licenciaturas aplican un examen en donde hay tres apoyos Suponga que se toma una muestra de dos estudiantes para cada una de las combinaciones de tratamientos (dos replicaciones) De cada licenciatura se tomarán seis estudiantes
  • #14: las hipótesis estructurales del modelo de regresión lineal
  • #22: Si se rechaza Ho => b1 es diferente de cero Por lo que aplica y=bo+b1x+e X y Y están relacionadas linealmente
  • #23: ECM= Error cuadrado medio. Estimación de S^2 Porcentaje de la variación en la variable dependiente que es explicada por la variable independiente. En peso-altura. = .58 (peso explicado por la altura) 58% de la variación en peso es explicado por la altura el otro 42% es error.
  • #26: CMR= Cuadrado Medio de la regresión ECM = error cuadrado medio-> error estándar de estimación Error típico = raíz(s^2)
  • #32: Michael Green The good country Index
  • #33: Michael Green The good country Index
  • #35: 1- Qué es estadística? 2- Qué son los datos cuantitativos y cualitativos 3- ¿Cuáles son los modelos estadísticos más simples? 4- ¿Qué es la varianza? 5- ¿Para qué sirve un diagrama de caja? 6- ¿Qué es un estadístico de prueba? 7- ¿Cuál es el objetivo de la estadística inferencial? 8- ¿Cuál es la fórmula de la distribución Poisson? 9- ¿Qué establece el teorema del límite central? 10- ¿Qué es estandarizar? 11- ¿Porqué nunca aceptamos la hipótesis nula? 12- en general una hipótesis prueba el valor de la media de una población y toma tres formas ¿cuáles son? 13- ¿Qué son las pruebas pareadas? 14- ¿cuál es la hipótesis que probamos con ANOVA? 15- ¿Cuál es el modelo de RLS?