Sesión 04
Anova y Regresión Lineal Simple
Dr. Jorge Ramírez Medina
Inferencia de 2 poblaciones
• Caso 1: Sams de Tlanepantla vende menos que Sams
Santa fe. El gerente cree que se puede deber a la
diferencia del tipo de clientes (distinta edad, ingresos, etc.) y
decide investigar la diferencia de las medias de los ingresos
de los clientes de cada tienda.
• Caso 2: El Tec quiere demostrar que un nuevo programa
en el Laboratorio de Mecatrónica ayuda a los estudiantes a
reducir el tiempo requerido de diseño. Para esto se
selecciona a un grupo de estudiantes usa la tecnología actual
y otro que usa el nuevo programa.
Dr. Jorge Ramírez Medina
Inferencia de 2 poblaciones
• Caso 3: Una empresa de investigación de mercados
obtuvo una muestra de personas para evaluar el potencial de
compra de cierto producto, antes y después de que esas
personas vieran un nuevo comercial en televisión sobre el
producto. Las calificaciones de potencial de compra se
basaron en una escala de 0 a 10, en donde los valores
mayores indicaban un mayor potencial de compra. Se quiere
investigar la hipótesis de que el comercial mejorará la media
de la calificación de potencial de compra. .
Dr. Jorge Ramírez Medina
Solución Caso 1
Dr. Jorge Ramírez Medina
Solución Caso 2
Dr. Jorge Ramírez Medina
Solución Caso 3
Dr. Jorge Ramírez Medina
Solución Caso 3
Dr. Jorge Ramírez Medina
Tabla ANOVA
 
2
2
1

ns
Dr. Jorge Ramírez Medina
Ejemplo; Estrés laboral
Sistema A
Sistema B
Sistema C
Dr. Jorge Ramírez Medina
ANOVA dos factores
Ingeniería
Dr. Jorge Ramírez Medina
Ejercicio en clase
Cata de Vinos
Sube en la plataforma el ejercicio
sobre la cata de vinos. Atiende las
instrucciones del profesor para
esta actividad
Dr. Jorge Ramírez Medina
Modelo de
regresión lineal simple
Dr. Jorge Ramírez Medina
Método de mínimos cuadrados
Dr. Jorge Ramírez Medina
Calculando b0 y b1
Dr. Jorge Ramírez Medina
Suposiciones del modelo
• E(e)=0
• Varianza de e, (que es 2) es la misma para todos los valores de x.
• Los valores de e son independientes.
• e es una variable distribuida normalmente
Dr. Jorge Ramírez Medina
Ejemplo
Dr. Jorge Ramírez Medina
Suma de cuadrados
debido al error
Dr. Jorge Ramírez Medina
Suma total de cuadrados
Dr. Jorge Ramírez Medina
SCE y STC
Dr. Jorge Ramírez Medina
Suma de cuadrados
debido a la regresión
Dr. Jorge Ramírez Medina
¿Qué tan bien se ajustan los datos a
la regresión?
Dr. Jorge Ramírez Medina
¿Cómo comprobamos
el ajuste del modelo?
Dr. Jorge Ramírez Medina
¿Cómo comprobamos
el ajuste del modelo?
• Usando r2
• Usando una prueba de hipótesis
H0: b1= 0
Ha: b1 ≠ 0
Estadístico de prueba
F=CMR/ECM
Regla rechazo
r-value<=a
• Análisis de residuos
Dr. Jorge Ramírez Medina
Usando r2
Dr. Jorge Ramírez Medina
EGADE Business School
𝑟2
=
𝑆𝐶𝑅
𝑆𝐶𝑇
=
𝑆𝑇𝐶 − 𝑆𝐶𝐸
𝑆𝐶𝑇
Dr. Jorge Ramírez Medina
En donde
Coeficiente de correlación
Dr. Jorge Ramírez Medina
Usando la prueba F
Fuente de
variación
Suma de
cuadrados
Grados
de
libertad
Cuadrado Medio F p-value
Regresión SCR 1 CMR=SCR/1 F=CMR/CME tablas
Error SCE n-2 CME=SCE/(n-2)
Total STC n-1
Dr. Jorge Ramírez Medina
En el ejemplo
𝐹 =
𝐶𝑀𝑅
𝐸𝐶𝑀
𝐶𝑀𝑅 =
𝑆𝐶𝑅
𝑁𝑜. 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠
𝑠2 = 𝐸𝐶𝑀 =
𝑆𝐶𝐸
𝑛 − 2
14200
1
15300
10−2
= 191.25
𝐹 = 74.25
p-value
2.54887E-05
Dr. Jorge Ramírez Medina
Análisis de residuos
(𝑦𝑖 − 𝑦 )
Dr. Jorge Ramírez Medina
Análisis de residuos
• Cuando se cumplen las hipótesis estructurales del modelo de
regresión lineal. se observa una nube de puntos en dirección
horizontal y con anchura constante (la media de cada error debería
ser cero y tener todas la misma varianza).
Dr. Jorge Ramírez Medina
Análisis de residuos
Si se viola la linealidad se observará una falta de linealidad también
en los residuos
Dr. Jorge Ramírez Medina
Análisis de residuos
Si se viola la homoscedasticidad, la anchura de la banda no será
constante
Dr. Jorge Ramírez Medina
Análisis de residuos
Una relación lineal entre los residuos y las predicciones puede
indicar que alguna variable no incluida en el modelo puede ser
significativa
Dr. Jorge Ramírez Medina
Ejemplo de RLS
Encuentre la ecuación de regresión entre el Índice de progreso
social – Fundamentos de Bienestar.
Dr. Jorge Ramírez Medina
Conceptos de Estadística
Suerte en su
maestría
Dr. Jorge Ramírez Medina
Fin de sesión

Más contenido relacionado

PPT
S06 ad4001 alumnos_ss
DOCX
Unidad 1
DOCX
Ejercicios de ESTADISTICA
PPT
S06 AD4001
PPTX
S09 ad4001
PPTX
S06 ad4001 alumnos
S06 ad4001 alumnos_ss
Unidad 1
Ejercicios de ESTADISTICA
S06 AD4001
S09 ad4001
S06 ad4001 alumnos

Similar a S04 ad4024 v2 (20)

PPTX
S08 ad4001
PPT
S04 ad4001 v3_s_sa
PPTX
S03 ad4024
PDF
Ayudantía de eiq344.diseño completamente al azar.
PPTX
Plantilla 04 1_
PPTX
PPT
S08 ad4001 ss
PDF
PPT
S01 ad4001 ss
PPTX
PREPARACIÓN DE DATA Y SUBSECUENTE ANÁLISIS EN INVESTIGACIÓN DE MERCADOS
PPTX
Trabajo de estadistica 2 prueba de suma de rango.pptx
PPTX
Diario de campo 9
PPTX
Diario de campo 9
DOCX
Fase-5-Diseño Experimental Trabajo UNADEvaluacion-Final-POA.docx
PDF
wuolah-free-P1 PSF.pdf
PPTX
DOCX
Ejercicios de prueba de hipotesis
DOCX
Capitulo 3
PPTX
CRITICIDAD resuelto.pptx sdfbdbfadbcdjbdbcsdbdbvjkdvjvs
S08 ad4001
S04 ad4001 v3_s_sa
S03 ad4024
Ayudantía de eiq344.diseño completamente al azar.
Plantilla 04 1_
S08 ad4001 ss
S01 ad4001 ss
PREPARACIÓN DE DATA Y SUBSECUENTE ANÁLISIS EN INVESTIGACIÓN DE MERCADOS
Trabajo de estadistica 2 prueba de suma de rango.pptx
Diario de campo 9
Diario de campo 9
Fase-5-Diseño Experimental Trabajo UNADEvaluacion-Final-POA.docx
wuolah-free-P1 PSF.pdf
Ejercicios de prueba de hipotesis
Capitulo 3
CRITICIDAD resuelto.pptx sdfbdbfadbcdjbdbcsdbdbvjkdvjvs
Publicidad

Más de Jorge Ramírez (20)

PPTX
AD4026 BI Sesión 04
PPTX
Session 03 Business Intelligence
PDF
Business Intelligence S02
PPTX
AD4026 BI Sesión 01
PDF
Sesión 01 FZ4013
PDF
Sesión 01 FZ4013
PPTX
S11 ad5015
PPTX
Sesión 10 AD5015
PPT
Apoyo ejercicio busqueda de-patentes
PPT
Introduccion innovacion 2013-ott-cem
PPTX
Sesión 06
PPTX
Diapositivas de la sesión 04 AD5015
PPTX
sesión 03 AD5015
PPTX
Sesión 02 AD5010
AD4026 BI Sesión 04
Session 03 Business Intelligence
Business Intelligence S02
AD4026 BI Sesión 01
Sesión 01 FZ4013
Sesión 01 FZ4013
S11 ad5015
Sesión 10 AD5015
Apoyo ejercicio busqueda de-patentes
Introduccion innovacion 2013-ott-cem
Sesión 06
Diapositivas de la sesión 04 AD5015
sesión 03 AD5015
Sesión 02 AD5010
Publicidad

Último (20)

PDF
Telos 127 Generacion Al fa Beta - fundaciontelefonica
PDF
2.0 Introduccion a processing, y como obtenerlo
DOCX
Programa_Sintetico_Fase_4.docx 3° Y 4°..
PDF
Introducción a la historia de la filosofía
PDF
La Inteligencia Emocional - Fabian Goleman TE4 Ccesa007.pdf
DOCX
PLAN DE CASTELLANO 2021 actualizado a la normativa
DOC
4°_GRADO_-_SESIONES_DEL_11_AL_15_DE_AGOSTO.doc
PDF
LIBRO 2-SALUD Y AMBIENTE-4TO CEBA avanzado.pdf
PDF
Manual del Gobierno Escolar -MINEDUC.pdf
PDF
Nadie puede salvarte excepto Tú - Madame Rouge Ccesa007.pdf
PDF
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE_COM.pdf
PDF
E1 Guía_Matemática_5°_grado.pdf paraguay
PPTX
TEMA 1ORGANIZACIÓN FUNCIONAL DEL CUERPO, MEDIO INTERNO Y HOMEOSTASIS (3) [Aut...
PDF
informe tipos de Informatica perfiles profesionales _pdf
PDF
ACERTIJO EL CONJURO DEL CAZAFANTASMAS MATEMÁTICO. Por JAVIER SOLIS NOYOLA
PDF
Modelo Educativo SUB 2023versión final.pdf
PPTX
BIZANCIO. EVOLUCIÓN HISTORICA, RAGOS POLÍTICOS, ECONOMICOS Y SOCIALES
PDF
ciencia_tecnologia_sociedad Mitcham Carl. (1994)..pdf
PDF
Teologia-Sistematica-Por-Lewis-Sperry-Chafer_060044.pdf
DOCX
TEXTO DE TRABAJO DE EDUCACION RELIGIOSA - CUARTO GRADO.docx
Telos 127 Generacion Al fa Beta - fundaciontelefonica
2.0 Introduccion a processing, y como obtenerlo
Programa_Sintetico_Fase_4.docx 3° Y 4°..
Introducción a la historia de la filosofía
La Inteligencia Emocional - Fabian Goleman TE4 Ccesa007.pdf
PLAN DE CASTELLANO 2021 actualizado a la normativa
4°_GRADO_-_SESIONES_DEL_11_AL_15_DE_AGOSTO.doc
LIBRO 2-SALUD Y AMBIENTE-4TO CEBA avanzado.pdf
Manual del Gobierno Escolar -MINEDUC.pdf
Nadie puede salvarte excepto Tú - Madame Rouge Ccesa007.pdf
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE_COM.pdf
E1 Guía_Matemática_5°_grado.pdf paraguay
TEMA 1ORGANIZACIÓN FUNCIONAL DEL CUERPO, MEDIO INTERNO Y HOMEOSTASIS (3) [Aut...
informe tipos de Informatica perfiles profesionales _pdf
ACERTIJO EL CONJURO DEL CAZAFANTASMAS MATEMÁTICO. Por JAVIER SOLIS NOYOLA
Modelo Educativo SUB 2023versión final.pdf
BIZANCIO. EVOLUCIÓN HISTORICA, RAGOS POLÍTICOS, ECONOMICOS Y SOCIALES
ciencia_tecnologia_sociedad Mitcham Carl. (1994)..pdf
Teologia-Sistematica-Por-Lewis-Sperry-Chafer_060044.pdf
TEXTO DE TRABAJO DE EDUCACION RELIGIOSA - CUARTO GRADO.docx

S04 ad4024 v2

  • 1. Sesión 04 Anova y Regresión Lineal Simple
  • 2. Dr. Jorge Ramírez Medina Inferencia de 2 poblaciones • Caso 1: Sams de Tlanepantla vende menos que Sams Santa fe. El gerente cree que se puede deber a la diferencia del tipo de clientes (distinta edad, ingresos, etc.) y decide investigar la diferencia de las medias de los ingresos de los clientes de cada tienda. • Caso 2: El Tec quiere demostrar que un nuevo programa en el Laboratorio de Mecatrónica ayuda a los estudiantes a reducir el tiempo requerido de diseño. Para esto se selecciona a un grupo de estudiantes usa la tecnología actual y otro que usa el nuevo programa.
  • 3. Dr. Jorge Ramírez Medina Inferencia de 2 poblaciones • Caso 3: Una empresa de investigación de mercados obtuvo una muestra de personas para evaluar el potencial de compra de cierto producto, antes y después de que esas personas vieran un nuevo comercial en televisión sobre el producto. Las calificaciones de potencial de compra se basaron en una escala de 0 a 10, en donde los valores mayores indicaban un mayor potencial de compra. Se quiere investigar la hipótesis de que el comercial mejorará la media de la calificación de potencial de compra. .
  • 4. Dr. Jorge Ramírez Medina Solución Caso 1
  • 5. Dr. Jorge Ramírez Medina Solución Caso 2
  • 6. Dr. Jorge Ramírez Medina Solución Caso 3
  • 7. Dr. Jorge Ramírez Medina Solución Caso 3
  • 8. Dr. Jorge Ramírez Medina Tabla ANOVA   2 2 1  ns
  • 9. Dr. Jorge Ramírez Medina Ejemplo; Estrés laboral Sistema A Sistema B Sistema C
  • 10. Dr. Jorge Ramírez Medina ANOVA dos factores Ingeniería
  • 11. Dr. Jorge Ramírez Medina Ejercicio en clase Cata de Vinos Sube en la plataforma el ejercicio sobre la cata de vinos. Atiende las instrucciones del profesor para esta actividad
  • 12. Dr. Jorge Ramírez Medina Modelo de regresión lineal simple
  • 13. Dr. Jorge Ramírez Medina Método de mínimos cuadrados
  • 14. Dr. Jorge Ramírez Medina Calculando b0 y b1
  • 15. Dr. Jorge Ramírez Medina Suposiciones del modelo • E(e)=0 • Varianza de e, (que es 2) es la misma para todos los valores de x. • Los valores de e son independientes. • e es una variable distribuida normalmente
  • 16. Dr. Jorge Ramírez Medina Ejemplo
  • 17. Dr. Jorge Ramírez Medina Suma de cuadrados debido al error
  • 18. Dr. Jorge Ramírez Medina Suma total de cuadrados
  • 19. Dr. Jorge Ramírez Medina SCE y STC
  • 20. Dr. Jorge Ramírez Medina Suma de cuadrados debido a la regresión
  • 21. Dr. Jorge Ramírez Medina ¿Qué tan bien se ajustan los datos a la regresión?
  • 22. Dr. Jorge Ramírez Medina ¿Cómo comprobamos el ajuste del modelo?
  • 23. Dr. Jorge Ramírez Medina ¿Cómo comprobamos el ajuste del modelo? • Usando r2 • Usando una prueba de hipótesis H0: b1= 0 Ha: b1 ≠ 0 Estadístico de prueba F=CMR/ECM Regla rechazo r-value<=a • Análisis de residuos
  • 24. Dr. Jorge Ramírez Medina Usando r2 Dr. Jorge Ramírez Medina EGADE Business School 𝑟2 = 𝑆𝐶𝑅 𝑆𝐶𝑇 = 𝑆𝑇𝐶 − 𝑆𝐶𝐸 𝑆𝐶𝑇
  • 25. Dr. Jorge Ramírez Medina En donde Coeficiente de correlación
  • 26. Dr. Jorge Ramírez Medina Usando la prueba F Fuente de variación Suma de cuadrados Grados de libertad Cuadrado Medio F p-value Regresión SCR 1 CMR=SCR/1 F=CMR/CME tablas Error SCE n-2 CME=SCE/(n-2) Total STC n-1
  • 27. Dr. Jorge Ramírez Medina En el ejemplo 𝐹 = 𝐶𝑀𝑅 𝐸𝐶𝑀 𝐶𝑀𝑅 = 𝑆𝐶𝑅 𝑁𝑜. 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑠2 = 𝐸𝐶𝑀 = 𝑆𝐶𝐸 𝑛 − 2 14200 1 15300 10−2 = 191.25 𝐹 = 74.25 p-value 2.54887E-05
  • 28. Dr. Jorge Ramírez Medina Análisis de residuos (𝑦𝑖 − 𝑦 )
  • 29. Dr. Jorge Ramírez Medina Análisis de residuos • Cuando se cumplen las hipótesis estructurales del modelo de regresión lineal. se observa una nube de puntos en dirección horizontal y con anchura constante (la media de cada error debería ser cero y tener todas la misma varianza).
  • 30. Dr. Jorge Ramírez Medina Análisis de residuos Si se viola la linealidad se observará una falta de linealidad también en los residuos
  • 31. Dr. Jorge Ramírez Medina Análisis de residuos Si se viola la homoscedasticidad, la anchura de la banda no será constante
  • 32. Dr. Jorge Ramírez Medina Análisis de residuos Una relación lineal entre los residuos y las predicciones puede indicar que alguna variable no incluida en el modelo puede ser significativa
  • 33. Dr. Jorge Ramírez Medina Ejemplo de RLS Encuentre la ecuación de regresión entre el Índice de progreso social – Fundamentos de Bienestar.
  • 34. Dr. Jorge Ramírez Medina Conceptos de Estadística Suerte en su maestría
  • 35. Dr. Jorge Ramírez Medina Fin de sesión

Notas del editor

  • #3: Ver datos de los casos en excel
  • #4: Ver datos de los casos en excel
  • #5: Checar caso de varianzas iguales o diferentes
  • #9: Para presentar de manera adecuada los cálculos anteriores se usa una tabla conocida como ANOVA (presentación depende del paquete estadístico usado) HACER AQUÍ EL EJEMPLO DE LA PLANTA CON ANOVA USANDO EXCEL
  • #10: Tres propuestas para reducir el estrés en el trabajo Pero cada quién lo maneja a su modo CME fuente de variación del grupo depende de las variaciones individuales de los empleados también Quitar estas diferencias con diseño de bloque aleatorizado Ejercicios en clase/Estrés
  • #11: Un experimento factorial es un diseño experimental que permite obtener simultáneamente conclusiones de dos o más facotres. El termino factorial se debe a que incluye todas las posibles combinaciones Estudiantes de tres licenciaturas aplican un examen en donde hay tres apoyos Suponga que se toma una muestra de dos estudiantes para cada una de las combinaciones de tratamientos (dos replicaciones) De cada licenciatura se tomarán seis estudiantes
  • #16: las hipótesis estructurales del modelo de regresión lineal
  • #24: Si se rechaza Ho => b1 es diferente de cero Por lo que aplica y=bo+b1x+e X y Y están relacionadas linealmente
  • #25: ECM= Error cuadrado medio. Estimación de S^2 Porcentaje de la variación en la variable dependiente que es explicada por la variable independiente. En peso-altura. = .58 (peso explicado por la altura) 58% de la variación en peso es explicado por la altura el otro 42% es error.
  • #28: CMR= Cuadrado Medio de la regresión ECM = error cuadrado medio-> error estándar de estimación Error típico = raíz(s^2)
  • #35: 1- Qué es estadística? 2- Qué son los datos cuantitativos y cualitativos 3- ¿Cuáles son los modelos estadísticos más simples? 4- ¿Qué es la varianza? 5- ¿Para qué sirve un diagrama de caja? 6- ¿Qué es un estadístico de prueba? 7- ¿Cuál es el objetivo de la estadística inferencial? 8- ¿Cuál es la fórmula de la distribución Poisson? 9- ¿Qué establece el teorema del límite central? 10- ¿Qué es estandarizar? 11- ¿Porqué nunca aceptamos la hipótesis nula? 12- en general una hipótesis prueba el valor de la media de una población y toma tres formas ¿cuáles son? 13- ¿Qué son las pruebas pareadas? 14- ¿cuál es la hipótesis que probamos con ANOVA? 15- ¿Cuál es el modelo de RLS?