SlideShare una empresa de Scribd logo
Escuela Profesional de Ingeniería Industrial
Estadística Industrial
ANOVA
(ANalysis Of VAriance)
Colección de modelos estadísticos que permiten testear hipótesis
sobre igualdad de medias en varios grupos (muestras
independientes o relacionadas)
Jay L. Devore. Probabilidad y Estadística para ingeniería y
ciencias. Análisis de varianza. Cap. 10. pp. 410-440
danielmavila@yahoo.es
2019-1
Variación entre (inter) - grupos y variación dentro (intra) - grupos
Lo que hace el test ANOVA es comparar las dos medidas de variabilidad,
la variación entre-grupos (MS Factor (Mean Square)) y la variación intra-
grupos (MS Error). Si ocurre que el MS Factor es significativamente
mayor que el MS Error, entonces el test concluirá que las medias de los
distintos grupos no son iguales en todos los casos (lo que implica que no
todos los datos pertenecen a un mismo grupo o, lo que es lo mismo, que
el valor de las observaciones sí depende del factor considerado). Si, por
el contrario, el MS Factor no es significativamente mayor que el MS
Error, entonces el test concluirá que no se aprecian diferencias
significativas entre las medias de los distintos grupos (en otras palabras,
que las observaciones parecen proceder todas de un único grupo o, lo
que es lo mismo, que las observaciones no parecen depender del factor
considerado).
En la siguiente tabla se muestran los resultados maestrales de las ventas por mes de la empresa
You TOO:
Ventas mensuales (US$ 000)
Quiroz Huaroto Martínez
15 15 19
10 10 12
9 12 16
5 11 16
16 12 17
Media muestral: 11 12 16
En este problema los vendedores son los “tratamientos”.
Ejemplo
3210 :  H La hipótesis nula expresa que no hay
diferencia significativa entre las ventas medias de los tres
vendedores.
:1H Plantea que al menos una media es diferente.
Se seleccionó un nivel de significancia  = 0,05.
El estadístico de prueba adecuado es la distribución F. Este
procedimiento se basa en varias consideraciones: 1) Los
datos deben estar al menos en escala de intervalo; 2) La
selección real de las ventas debe hacerse utilizando un
procedimiento de tipo probabilístico; 3) La distribución de
las venta mensuales para cada una de las poblaciones es
normal y 4) Las varianzas de las tres poblaciones son
iguales, es decir, 2
3
2
2
2
1   .
Ejemplo You Too…
F es la razón de dos varianzas:
muestraslaseniaciónlasegúnestimadalpoblacionaVarianza
muestralesmediasentreiaciónsegúnestimadalpoblacionaVarianza
F
var
var

La terminología común para el numerador es
“varianza entre muestras”. Para el denominador
es “varianza en las muestras”. El numerador
tiene 1k grados de libertad. El denominador tiene
kN  grados de libertad; donde k es el número de
tratamientos y N es el número de observaciones.
Ejemplo You Too…
Para este problema, hay tres tratamientos (vendedores),
por lo que se tiene k – 1 = 2 gl en el numerador. Hay 15
observaciones (tres muestras de cinco cada una), por
tanto, hay N – k = 12 gl en el denominador.
El valor crítico (valor teórico), esto es, el punto divisorio
entre la región de aceptación y la de rechazo, se obtiene
consultando la tabla correspondiente. Ese número es 3,89,
y es el valor crítico de Fc para el nivel 5%.
Ejemplo You Too…
Al utilizar el nivel predeterminado de 0,05 la regla de
decisión es no rechazar la hipótesis nula si el valor
calculado (valor empírico) de Fp es menor o igual a 3,89; se
rechaza la hipótesis nula y se acepta la alternativa, si el
valor calculado de Fp es mayor que 3,89.
Para calcular Fp y tomar una decisión, el primer paso es
organizar una tabla ANOVA. Esta es sólo una forma
conveniente de registrar la suma de cuadrados y otros
cálculos. El formato general para un problema de análisis
de varianza en un sentido (un factor) se muestra en la
siguiente tabla:
Ejemplo You Too…
Fuente de Suma de
Grados
de Cuadrados
variación cuadrados libertad medios
Entre
tratamientos SST k - 1
SST/(k-1) =
MSTR
Error (en los
tratamientos) SSE N - k
SSE/(N-k) =
MSE
Total Total SS
MSE
MSTR
kN
SSE
k
SST
F 

 1p
en donde:
MSTR: cuadrado medio entre tratamientos.
MSE : cuadrado medio debido al error. También se denomina cuadrado
medio dentro de tratamiento.
SST : suma de cuadrados de tratamiento.
Tabla de Anova de un solo factor
Se obtiene mediante la siguiente fórmula:








N
X
n
T
SST
c
c
22
)(
donde:
2
cT : indica elevar al cuadrado el total de cada columna (el
subíndice c se refiere a la columna)
cn : es el número de observaciones para cada tratamiento
respectivo (columna). Hay cinco valores de ventas para
Quiroz, cinco para Huaroto y cinco para Martínez.
X : es la suma de todas las observaciones (ventas). Es US$
195.
k: es el número de tratamientos (vendedores). Hay tres.
N : es el número total de observaciones. Hay 15.
Cálculo de la Suma Total de Cuadrados (SST, por sus siglas en inglés)
Sr. Quiroz Sr. Huaroto Sr. Martínez
1X 2
1X 2X 2
2X 3X 2
3X
15 225 15 225 19 361
10 100 10 100 12 144
9 81 12 144 16 256
5 25 11 121 16 256
16 256 12 144 17 289 Total
Totales de columna: 55 60 80 195
Tamaño de muestra 5 5 5 15
Suma de cuadrados 687 734 1306 2727
Cálculo de SST
70535,2605,2
15
)195(
5
)80(
5
)60(
5
)55()( 222222












  
N
X
n
T
SST
c
c
Cálculo de SSE
122605,2727,2
2
2






  
c
c
n
T
XSSE
La variación total (Total SS) es la suma de la variación entre columnas y
entre renglones; es decir, Total SS = SST + SSE = 70 + 122 = 192.
Ejemplo You Too…
Ventas de vendedores de You Too – Periodo 1-5
Verificación
192535,2727,2
15
)195(
727,2
)( 22
2
 

N
X
XSSTotal
Las tres sumas de cuadrados y los cálculos necesarios para determinar F, se presentan en el siguiente
cuadro:
Fuente de Suma de Grados de Cuadrados
variación cuadrados libertad medios
Entre tratamientos SST= 70 k – 1=3-1=2 70/2=35 = MSTR
Error (en los tratamientos) SSE=122 N – k=15-3=12 122/12 =10.17= MSE
Total SS Total SS=192
Cálculo de Fp
44,3
17.10
351p 


MSE
MSTR
kN
SSE
k
SST
F
Ejemplo You Too…
La regla de decisión indica que si el valor calculado de Fp es
menor que o igual al valor crítico de 3,89, la hipótesis nula
se acepta. Si el valor de Fp es mayor que 3,89, la hipótesis
nula se rechaza y la hipótesis alternativa se acepta. Puesto
que 3,44 < 3,89, la hipótesis nula no se rechaza al nivel 5%.
En otras palabras, las diferencias en las ventas medias
mensuales (US$11 000; US$12 000 y US$16 000) se
atribuyen al azar (muestreo). Desde el punto de vista
práctico, los niveles de ventas de los tres vendedores que se
consideran para el puesto de CEO son iguales. No puede
tomarse una decisión respecto al puesto, con base en las
Ejemplo You Too…
Hipótesis básicas de los modelos
En el estudio de un modelo de Diseño de Experimentos,
al igual que en el estudio de cualquier modelo
estadístico, se debe contrastar que se verifican las
hipótesis básicas o estructurales del modelo, como por
ejemplo:
a) Bondad del ajuste del modelo estadístico propuesto.
b) La normalidad.
c) La homocedasticidad del error.
d) La homogeneidad de la muestra.
e) La independencia de las observaciones.
http://dm.udc.es/asignaturas/estadistica2/sec4_1.html
Ejemplo 2
Se evaluará el desempeño del docente del curso Estadística Industrial,
siendo las alternativas de respuestas las siguientes: 1 (excelente), 2
(bueno), 3 (aceptable) o 4 (necesita capacitación). El delegado recolectó
las evaluaciones y aseguró a los estudiantes que el profesor no las
recibiría hasta después que las calificaciones del curso se hubieran
ingresado al SUM. La evaluación (el tratamiento) que un estudiante
asignó al profesor se comparó con su calificación final del curso.
Lógicamente, se esperaría que en general, el grupo de estudiantes que
pensó que el profesor era excelente tuvieran una calificación promedio
final del curso significativamente más alta que los alumnos que lo
evaluaron como bueno, aceptable o regular, o deficiente. También se
esperaría que los alumnos que lo evaluaron como deficiente tuvieran las
calificaciones promedio más bajas.
Se seleccionaron muestras de cada grupo de evaluación. Los resultados son:
Excelente Bueno Regular Deficiente
94 75 70 68
90 68 73 70
85 77 76 72
80 83 78 65
88 80 74
68 65
65
La pregunta es si existe o no una diferencia estadística entre la puntuación media de los cuatro
grupos.
Evaluación docente…
Se seleccionó el nivel de significación 0,01.
La regla de decisión es que la hipótesis nula, que plantea que no
hay diferencia entre las medias, no se rechazará si el valor
calculado de Fp es menor que el valor crítico. De otra manera, la
hipótesis nula se rechazará y se aceptará la hipótesis alternativa.
Recuerda que los grados de libertad en el numerador de la razón
F se obtienen por k – 1, donde k es el número de tratamientos
(grupos de evaluación del profesor). Hay cuatro tratamientos, de
manera que son 3 gl. Los grados de libertad en el denominador
son en total 18, que se obtienen mediante N – k, en donde N es
el número total de estudiantes en la muestra. Hay 22 estudiantes,
por lo que son 18 gl.
Observa que el valor crítico Fc es 5,09 de acuerdo al valor en la
tabla correspondiente. La regla de decisión será: acepte la
hipótesis nula al nivel 0,01 si el valor calculado de Fp es menor o
igual a 5,09; y rechace la hipótesis nula si el valor calculado es
mayor que 5,09.
Evaluación docente…
Los cálculos necesarios para determinar la razón F se muestran en la siguiente tabla:
Excelente Bueno Aceptable Deficiente
1X 2
1X 2X 2
2X 3X 2
3X 4X 2
4X
94 8836 75 5625 70 4900 68 4624
90 8100 68 4624 73 5329 70 4900
85 7225 77 5929 76 5776 72 5184
80 6400 83 6889 78 6084 65 4225
88 7744 80 6400 74 5476
68 4624 65 4225
65 4225
cT 349 391 510 414
cn 4 5 7 6
 2
X 30561 30811 37338 28634
Nata que la suma de los totales por columna  )( ix es 1664; el total de los tamaños de muestras (N)
es 22; y la suma de los cuadrados 127 344.
Calculando SST, SSE y total SS, se obtiene:
68.890
22
)1664(
6
)414(
7
)510(
5
)391(
4
)349()( 2222222












 

N
X
n
T
SST
c
c
41.59459.126749127344
2
2






  
c
c
n
T
XSSE
Total SS = SST + SSE = 890.68 + 594.41 = 1485.09
Como verificación:
09.14859.125858127344
22
)1664(
127344
)( 22
2
 

N
X
XSSTotal
Evaluación docente…
Estos valores se colocan en la tabla ANOVA:
Fuente de Suma de Grados de Cuadrados
variación cuadrados libertad medios
Tratamiento (entre columnas) SST= 890.68 k – 1=4-1=3 890.68/3=296.89 MSTR
Error (entre renglones) SSE=594.41 N – k=22-4=18 594.41/18 =33.02= MSE
Total SS Total SS=1485.09
Introduciendo los cuadrados medios en la fórmula de Fp, se obtiene:
99,8
02.33
89.296
p 
MSE
MSTR
F
Evaluación docente…
Decisión: como el valor calculado de Fp es 8,99 es mayor que el valor
crítico 5,09; la hipótesis nula de que no existe diferencia entre las
medias se rechaza al nivel 0,01. Básicamente esto indica que es muy
probable que las diferencias observadas entre las medias no se
deban al azar. Desde el punto de vista práctico, se sugiere que las
calificaciones que obtuvieron los estudiantes en el curso están
relacionadas con las opiniones que tienen de la capacidad general y
la forma como se conduce en clase el profesor.
Ejercicio
Tres tipos distintos de motores de gasolina fueron probados para determinar
cuánto tiempo son útiles antes de necesitar una reparación; si los tiempos de
vida de los motores de cada tipo se distribuyen normalmente y tienen la misma
varianza, haz una prueba para determinar si difieren las medias de vida útil antes
de requerir una reparación. En la tabla siguiente aparecen los tiempos de vida
útil, en decenas de miles de km para cada tipo de motor.
Tiempos
A B C
6 8 3
2 7 2
4 7 5
1 2 4
7 6 1
R. SST = 23,33; SSE = 58; Fp = 2,4138; Fc = 3,885
Inferencia acerca de las medias de un tratamiento
Supón que al aplicar el procedimiento ANOVA, se decide
rechazar la hipótesis nula. Esto permite concluir que todas
las medias de tratamiento no son iguales. Algunas veces
esta conclusión puede considerarse satisfactoria, pero en
otros casos se desea saber cuáles medias de tratamiento
son diferentes.
En el ejemplo de la evaluación al docente, la hipótesis nula
se rechazó y la alternativa se aceptó. Si las opiniones de los
estudiantes son en realidad diferentes, la pregunta es
¿Entre qué grupos difieren las medias del tratamiento?
Existen varios procedimientos para responder esta pregunta.
El más sencillo es mediante el uso de niveles de confianza.
Intervalo de confianza para la diferencia entre dos medias poblacionales
Donde:
1x : es la media del primer tratamiento.
2x : es la media del segundo tratamiento
t : se obtiene a partir de la tabla t. Los grados de libertad son N – k.
MSE: es el error cuadrado medio que se obtiene a partir de la tabla
ANOVA.
1n : es el número de observaciones en el primer tratamiento.
2n : es el número de observaciones en el segundo tratamiento.







21
21
11
)(
nn
MSEtxx
Si el intervalo de confianza incluye al cero, se concluye que no hay
diferencia en el par de medias de tratamiento. Sin embargo, si ambos
extremos del intervalo de confianza tienen el mismo signo, esto indica
que las medias de tratamiento son diferentes.
 04,2646,10
79.725.18
6
1
4
1
0.33101.2)00.6925.87(
11
)(
21
21
y
nn
MSEtxx















Se conoce que el intervalo de confianza de 95% varía de 10,46 hasta 26,04. Ambos extremos son
positivos; en consecuencia, podemos concluir que estas medias de tratamiento difieren
significativamente. Es decir, los estudiantes que evaluaron al profesor como Excelente tienen
calificaciones más altas que los que lo evaluaron como Deficiente.
Intervalo de confianza…
Utilizando el ejemplo anterior acerca de las opiniones de estudiantes (Excelente y
Deficiente) y el nivel de confianza de 0,95; los extremos del intervalo de confianza
son 10,46 y 26,04 que se obtienen por:
Precaución
La investigación de diferencias de medias
de tratamiento es un proceso secuencial. El
paso inicial es realizar la prueba ANOVA.
Solo si se rechaza, la hipótesis nula de que
la medias de tratamiento son iguales, debe
intentarse llevar a cabo cualquier análisis
de las medias de tratamiento
Ejercicio.
En un experimento se compararon tres métodos de enseñar el idioma ruso
(русский язык); para evaluar la instrucción, se administró una prueba de
vocabulario de 50 preguntas a los 24 estudiantes del experimento repartidos
de a ocho por grupo.
a) ¿Cuál es la variable respuesta y la explicativa en este estudio?
R. La variable respuesta es el puntaje en la prueba de vocabulario y la
variable explicativa son los métodos de enseñanza (auditivo, traducción y
combinado). Es un factor con 3 niveles.
b) Completa la siguiente tabla de ANOVA:
R
R. Pasos para completar la tabla:
1) Grados de libertad, en Total son n - 1 y n = 24, por lo tanto son 23. Los grupos a
comparar son 3 por lo tanto los gl Inter-grupos son 2.
2) La suma de cuadrados Inter-grupos se obtiene multiplicando la media cuadrática
por los gl, 323.792*2 = 647.584
3) Teniendo la SC Inter-grupos, la SC Intra-grupo es 1460.958 - 647.584 = 813.374
4) Con la SC Intra y los gl, la media cuadrática Intra-g = 813.374/21 = 38.732
5) Con las dos MC el test F = 323.792/38.732 = 8.360
c) ¿Qué supuestos debería verificar el investigador?, escribe las hipótesis
asociadas a ellos.
Ejercicio Idioma ruso…
Antes de comparar las medias, debe verificar los supuestos de Normalidad y de
Homogeneidad de las varianzas (el supuesto de Independencia se comprueba
en el diseño, se dividió a 8 estudiantes por cada método).
Hipótesis
1) Normalidad: Necesita realizar 3 pruebas de hipótesis, una para cada
grupo del tipo:
donde i representará cada método de enseñanza: auditivo, traducción y
combinado.
2) Homocedasticidad: la hipótesis es:
Donde 1 = método auditivo, 2 = método traducción, 3 = método combinado
d) Asume que se cumplen los supuestos, realiza la prueba (en el acápite b) figura
la tabla Anova) de interés para el investigador. Indica la conclusión.
Si se cumplen los supuestos, entonces podemos comparar las medias de los
métodos de enseñanza usando el test F de la ANOVA:
Hipótesis:
De la tabla de ANOVA el test F = 8,36 al que corresponde un valor-p de 0,002,
este valor-p es menor que el nivel de significación de 0,05, por lo tanto se
rechaza la hipótesis nula, conclusión: existen diferencias significativas entre las
medias de los métodos de enseñanza al 5%.
R
R
Ejercicio Idioma ruso…
Los ejemplos desarrollados antes de la presente diapositivas se
caracterizan porque la pertenencia a una población o a otra
depende de un único factor (tipo de delito, franja de edad, país,
editorial, modelo de automóvil, motor de búsqueda, etcétera).
En estos casos, se usa ANOVA de un único factor (en inglés one-
way ANOVA o single-factor ANOVA).
Existen técnicas ANOVA para el caso en que los grupos vengan
determinados por dos factores (Tipo de delito y solvencia
económica del acusado, franja de edad y clase social, etc.).
Los tratamientos se asignan a las columnas y los bloques a los
renglones. Un bloque indica condiciones similares de los sujetos al
experimentar con diferentes tratamientos.
Cuando el factor A consta de I niveles y el factor B de J niveles,
existen IJ combinaciones diferentes (pares) de niveles de los dos
factores, cada uno llamado tratamiento. Con Kij el número de
observaciones en el tratamiento compuesto del factor A al nivel i y
del factor B al nivel j.
ANOVA DE DOS VÍAS, DIRECCIONES O FACTORES, Two-way ANOVA
ANOVA (Bifactorial) en dos sentidos (Una muestra por grupo, Ki,j = 1)
La compañía de autobuses Mortal Kombat Chosicano, está ampliando el
servicio desde el centro de Lima al Aeropuerto por cuatro rutas
diferentes. La Empresa realizó recorridos de prueba en una semana
determinada, para determinar si hay diferencia significativa en los
tiempos medios del trayecto en las cuatro rutas. Los tiempos del trayecto
en minutos en cada una de las cuatro rutas y de acuerdo al día de la
semana se muestran a continuación:
Tiempo del recorrido del Centro al Aeropuerto
Día Ruta 1 Ruta 2 Ruta 3 Ruta 4
Lunes 18 20 20 22
Martes 21 22 24 24
Miércoles 20 23 25 23
Jueves 25 21 28 25
Viernes 26 24 28 25
Al nivel de significancia 5% ¿puede concluirse que hay diferencia en las
cuatro rutas? ¿Existe una diferencia dependiendo de qué día de la
semana se trata?
En este caso, el día de la semana se denomina variable de
bloque. En consecuencia, se tiene variación debida al
tratamiento y debida a los bloques. La suma de cuadrados
debida a los bloques (SSB) se calcula como sigue:
N
x
k
B
SSB r
22
)(
 






Donde:
Br :se refiere al total del bloque, es decir, al total de cada
renglón, y
k :es el número de elementos en cada bloque.
El mismo formato que sirve para el caso de ANOVA en
un sentido se utiliza para la tabla ANOVA en dos
sentidos. Los totales de SST y SS se calculan igual que
antes. SSE se obtiene por sustracción (SSE = Total SS –
SST – SSB). En la siguiente tabla se muestran los
cálculos necesarios:
Caso Mortal Kombat…
Tiempo de viaje, por ruta (minutos)
Día Ruta 1 Ruta 2 Ruta 3 Ruta 4
Suma de
renglones Br
Lunes 18 20 20 22 80
Martes 21 22 24 24 91
Miércoles 20 23 25 23 91
Jueves 25 21 28 25 99
Viernes 26 24 28 25 103 Totales
Totales por
columna, Tc 110 110 125 119 464
Suma de
cuadrados 2446 2430 3169 2839 10904
Tamaño de la
muestra nc 5 5 5 5 20
Análogo a la tabla ANOVA para un análisis en un sentido, el formato general en dos sentidos es:
Fuente de variación Suma de cuadrados Grados libertad Cuadrado medio
Tratamientos SST k - 1
MSTR
k
SST

1
Bloque SSB n -1
MSB
n
SSB

1
Error SSE (k-1)(n-1)
MSE
nk
SSE

 )1)(1(
Total Total SS
Caso Mortal Kombat…
Como antes, para calcular SST:
4,32
20
)464(
5
)119(
5
)125(
5
)110(
5
)110()( 2222222












 

N
X
n
T
SST
c
c
SSB se obtiene mediante:
2,78
20
)464(
4
)103(
4
)99(
4
)91(
4
)91(
4
)80()( 22222222








 N
x
k
B
SSB r
Los demás términos de suma de cuadrados son:
2,139
20
)464(
10904
)( 22
2
 

N
X
XSSTotal
SSE = Total SS – SST – SSB=139.2 – 32.4 – 78.2 = 28,6
Caso Mortal Kombat…
Los valores para los diferentes compone
ANOVA se calculan de la siguiente mane
Fuente de
variación
Suma de
cuadrados
Grados
libertad
Tratamientos
32.4
3
Bloque 4
Caso Mortal Kombat…
1.- 43210 :  H . Las medias de tratamiento son iguales.
:1H Las medias de tratamiento no son iguales.
2.- 543210 :  H . Las medias de bloques son iguales.
1H : Las medias de bloques no son iguales.
Caso Mortal Kombat…
Primero se demostrará la hipótesis sobre las medias de tratamiento. Hay k – 1 = 3 grados de libertad
en el numerador y (k – 1) (n – 1) = 12 grados de libertad en el denominador. Al nivel de
significancia 0,05, el valor crítico de F es 3,49. La hipótesis nula de que los tiempos medios para las
cuatro rutas son iguales se rechaza si la razón F es mayor que 3,49.
54,4
38,2
8,10

MSE
MSTR
F
La hipótesis nula se rechaza y se acepta la hipótesis alternativa. Se concluye que el tiempo promedio
de trayecto no es igual para todas las rutas. La empresa desea efectuar algunas pruebas para
determinar qué medias de tratamiento difieren.
A continuación, se hace una prueba para determinar si el tiempo del trayecto es igual para diferentes
días de la semana. Los grados de libertad en el numerador para bloques es n – 1 = 4. Los grados de
libertad en el denominador son igual que antes, es decir, 12. La hipótesis nula de que las medias de
bloques son iguales se rechaza si la razón F es mayor que 3.26.
21.8
38.2
55.19

MSE
MSB
F
La hipótesis nula se rechaza, y la hipótesis alternativa se acepta. El tiempo promedio del trayecto no
es igual para los diferentes días de la semana.
Caso Mortal Kombat…
Ejercicio 1.
Pánfila, ingeniera industrial, quiere probar el efecto de cuatro agentes químicos
sobre la resistencia de un tipo particular de tela. Debido a que podría haber
variabilidad de un rollo de tela a otro, la ingeniera decide usar un diseño de
bloques aleatorizados, con los rollos de tela considerados como bloques.
Selecciona cinco rollos y aplica los cuatro agentes químicos de manera aleatoria a
cada rollo. A continuación se presentan las resistencias a la tensión resultantes.
Analiza los datos de este experimento (utiliza α = 5%) y obtén las conclusiones
apropiadas.
Rollo
Agente
Químico 1 2 3 4 5
1 73 68 74 71 67
2 73 67 75 72 70
3 75 68 78 73 68
4 73 71 75 75 69
R. SST = 12,95; SSB = 157; SSE = 21,8; MSTR = 4,317; MSB = 39,25; MSE
= 1,817; FpT = 2,3761; FpB = 21,6; FcTR = 3,49; FcB = 3,26
Ejercicio 2.
El ingeniero Alfredo Mastrókalo está interesado en estudiar el efecto sobre la
conductividad de una válvula electrónica que tienen tres tipos diferentes de
recubrimiento para los tubos de rayos catódicos utilizados en un dispositivo de
visualización de un sistema de telecomunicaciones. Se obtienen los siguientes
datos:
Contrasta con un nivel de significación del 5 % si el tipo de recubrimiento tiene
algún efecto sobre la conductividad.
Tip. Se supone que las muestras proceden de poblaciones normales e
independientes con la misma varianza.
Conclusión: como F = 10,725 es mayor que F0,95;2;9 = 4,26, rechazamos H0.
Existen por tanto diferencias significativas entre los tres tipos de recubrimiento, es
decir, el tipo de recubrimiento influye en la conductividad. de la válvula.
Tipo de
recubrimiento
Conductividad
1 143 141 150 146
2 152 149 137 143
3 134 133 132 127
Agua Fría Agua Tibia Agua Caliente
Poco Azúcar 75 87 60
Azúcar Normal 74 82 55
Mucho Azúcar 70 79 53
Levadura: Tamaño de los panes dulces
Ejercicio 3.
R. El resultado indica el valor de F por las filas (cantidad de azúcar) es 23,15.
Para saber si estos resultados son significativos (o sea, si la probabilidad P tiene
un valor menor a 0,05), el valor de la F observado necesita ser al menos 6,94 (o
sea, el valor crítico de F). Como el valor de F observado es de 23,15 es mucho
mayor que el valor crítico de F (6,94), estamos seguros que los resultados de
nuestras pruebas son significativas. El valor de F para las columnas
(temperatura del agua) es igual a 378,53. Esto es también significativo, porque el
valor de F crítico es solamente 6,94. En otras palabras, existe una relación
significativa en la cantidad de azúcar, la temperatura del agua y el tamaño de los
panes dulces. La probabilidad muestra a qué nivel los resultados son estadí-
sticamente significativos.
Supón que has experimentado con levadura para una receta de panes
dulces. Parece ser que la cantidad de azúcar y la temperatura del agua afectan el
tamaño de los panes. Basándote en los siguientes datos, realiza un análisis de
varianza para averiguar lo que es significativo de estas recetas.

Más contenido relacionado

PDF
Distribución beta
PPTX
Gamma presentacion
PDF
Pruebas de Bondad de Ajuste. Independencia y Homogenidad. Est ind clase10
DOCX
Tipo de distribuciones
PPTX
Distribucion de Chi Cuadrado
PPTX
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
PPTX
Distribución T de Student
PPT
Regresion lineal multiple
Distribución beta
Gamma presentacion
Pruebas de Bondad de Ajuste. Independencia y Homogenidad. Est ind clase10
Tipo de distribuciones
Distribucion de Chi Cuadrado
Prueba de hipótesis para distribuciones normal, y t student. Presentación dis...
Distribución T de Student
Regresion lineal multiple

La actualidad más candente (20)

PPT
Chi cuadrado
PDF
T de student
PDF
Pruebas de bondad de ajuste
PPT
11 Transformada De Laplace
PDF
Distribucion exponencial
DOC
Tabla distribución t 2 colas
PPT
Capitulo 3 experimentos_con_un_solo_factor
PPTX
Diapositivas matlab
PPTX
T de student para dos muestras independientes
DOCX
Tarea 12 de probabilidad y estadística con respuestas
 
PDF
Distribuciones muestrales
PDF
Tamaño Optimo de la muestra
DOC
Tabla distribución normal 2 colas exclusión
PDF
Tabla Chi cuadrado PSPP
PDF
DOCX
Tarea 17 de probabilidad y estadistica con respuestas
 
DOCX
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
 
PDF
Analisis de la varianza Est ind clase04
Chi cuadrado
T de student
Pruebas de bondad de ajuste
11 Transformada De Laplace
Distribucion exponencial
Tabla distribución t 2 colas
Capitulo 3 experimentos_con_un_solo_factor
Diapositivas matlab
T de student para dos muestras independientes
Tarea 12 de probabilidad y estadística con respuestas
 
Distribuciones muestrales
Tamaño Optimo de la muestra
Tabla distribución normal 2 colas exclusión
Tabla Chi cuadrado PSPP
Tarea 17 de probabilidad y estadistica con respuestas
 
Tarea 7 de probabilidad y estadistica con respuesta (esperanza matemática o v...
 
Analisis de la varianza Est ind clase04
Publicidad

Similar a Anova (20)

PPTX
ANOVA DE UNO Y DOS FACTORES.pptx
PPTX
Analisis de varianza
PPT
PPT
Analisis de varianzaunsolofactor
PPT
Anova 3
PDF
Análisis de Varianza (ANOVA) de una Vía
PDF
(4) comparación entre varios tratamientos (1).pdf
PPT
Clase anova
PPT
Analisis varianza u36
PDF
S09_S1 ANOVA. Clase para entender mejor anova.pdf
PPT
Laminas series bidimensionales y cronologicas
PPT
Laminas series bidimensionales y cronologicas
PPT
Laminas series bidimensionales y cronologicas
DOCX
Planteamiento de hipotesis -f fisher
DOCX
Planteamiento de hipotesis -f fisher
DOCX
Planteamiento de hipotesis -f fisher
PPTX
2. Diseño un solo factor para probabilidad y Estadística.pptx
PDF
notas19deagosto
PPTX
cap 8 métodos: diseño por bloques completos y aleatorizados.pptx
ANOVA DE UNO Y DOS FACTORES.pptx
Analisis de varianza
Analisis de varianzaunsolofactor
Anova 3
Análisis de Varianza (ANOVA) de una Vía
(4) comparación entre varios tratamientos (1).pdf
Clase anova
Analisis varianza u36
S09_S1 ANOVA. Clase para entender mejor anova.pdf
Laminas series bidimensionales y cronologicas
Laminas series bidimensionales y cronologicas
Laminas series bidimensionales y cronologicas
Planteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisher
Planteamiento de hipotesis -f fisher
2. Diseño un solo factor para probabilidad y Estadística.pptx
notas19deagosto
cap 8 métodos: diseño por bloques completos y aleatorizados.pptx
Publicidad

Último (20)

PPTX
Intoxicación por artrópodos picadores y pulgas
PDF
_APENDICITIS - CIRUGIA TUTO.pdf cirugía 1
PDF
Presentación Propuesta de Proyecto Portfolio Scrapbook Marrón y Negro.pdf
PDF
Tejido Nervioso histología y todas las generalidades
PDF
Química BIO.univ, san agustin de arequipa
PPTX
PLATON.pptx(presentación acerca de los hechos y legados de la vida de Platón)
PPTX
Sesión 2 Vigilancia Epidemiológica.pptxt
PPTX
Caracteristicas fisicoquimicas del Agua.pptx
PPTX
HEMORRAGIA DIGESTIVA ALTA edit.pptx (1).pptx
PDF
BIODIVERSIDAD y tipos de especies de plantas y animales.pdf
PPTX
Revision anatomica del sistema nervioso central
PDF
ATLAS DEL SITEMA NERVIOSO para el cu.pdf
PDF
ENLACE QUÍMICO.pdf Enlaces iónicos, metálicos, covalentes. Uniones intermolec...
PPTX
EMBRIOLOGÍA, CICLO CELULAR, CONCEPTOS BASICOS
PPTX
EXAMEN FISICO DEL RN sem 11 - copia-1.pptx
PPTX
CUIDADO DE ENFERMERÍA EN EL PUERPERIO sem 09 - copia.pptx
PPTX
Enfermedad Pulmonar Obstructiva Y ASMA.pptx
PPTX
HEMO 2DA MITAD EMBARAZO ...............................
PPTX
Clase de Educación sobre Salud Sexual.pptx
PPTX
Anatomia-Fisiologia-y-Patologia-de-los-OFA-material-de-apoyo-parte-3.pptx
Intoxicación por artrópodos picadores y pulgas
_APENDICITIS - CIRUGIA TUTO.pdf cirugía 1
Presentación Propuesta de Proyecto Portfolio Scrapbook Marrón y Negro.pdf
Tejido Nervioso histología y todas las generalidades
Química BIO.univ, san agustin de arequipa
PLATON.pptx(presentación acerca de los hechos y legados de la vida de Platón)
Sesión 2 Vigilancia Epidemiológica.pptxt
Caracteristicas fisicoquimicas del Agua.pptx
HEMORRAGIA DIGESTIVA ALTA edit.pptx (1).pptx
BIODIVERSIDAD y tipos de especies de plantas y animales.pdf
Revision anatomica del sistema nervioso central
ATLAS DEL SITEMA NERVIOSO para el cu.pdf
ENLACE QUÍMICO.pdf Enlaces iónicos, metálicos, covalentes. Uniones intermolec...
EMBRIOLOGÍA, CICLO CELULAR, CONCEPTOS BASICOS
EXAMEN FISICO DEL RN sem 11 - copia-1.pptx
CUIDADO DE ENFERMERÍA EN EL PUERPERIO sem 09 - copia.pptx
Enfermedad Pulmonar Obstructiva Y ASMA.pptx
HEMO 2DA MITAD EMBARAZO ...............................
Clase de Educación sobre Salud Sexual.pptx
Anatomia-Fisiologia-y-Patologia-de-los-OFA-material-de-apoyo-parte-3.pptx

Anova

  • 1. Escuela Profesional de Ingeniería Industrial Estadística Industrial ANOVA (ANalysis Of VAriance) Colección de modelos estadísticos que permiten testear hipótesis sobre igualdad de medias en varios grupos (muestras independientes o relacionadas) Jay L. Devore. Probabilidad y Estadística para ingeniería y ciencias. Análisis de varianza. Cap. 10. pp. 410-440 danielmavila@yahoo.es 2019-1
  • 2. Variación entre (inter) - grupos y variación dentro (intra) - grupos Lo que hace el test ANOVA es comparar las dos medidas de variabilidad, la variación entre-grupos (MS Factor (Mean Square)) y la variación intra- grupos (MS Error). Si ocurre que el MS Factor es significativamente mayor que el MS Error, entonces el test concluirá que las medias de los distintos grupos no son iguales en todos los casos (lo que implica que no todos los datos pertenecen a un mismo grupo o, lo que es lo mismo, que el valor de las observaciones sí depende del factor considerado). Si, por el contrario, el MS Factor no es significativamente mayor que el MS Error, entonces el test concluirá que no se aprecian diferencias significativas entre las medias de los distintos grupos (en otras palabras, que las observaciones parecen proceder todas de un único grupo o, lo que es lo mismo, que las observaciones no parecen depender del factor considerado).
  • 3. En la siguiente tabla se muestran los resultados maestrales de las ventas por mes de la empresa You TOO: Ventas mensuales (US$ 000) Quiroz Huaroto Martínez 15 15 19 10 10 12 9 12 16 5 11 16 16 12 17 Media muestral: 11 12 16 En este problema los vendedores son los “tratamientos”. Ejemplo
  • 4. 3210 :  H La hipótesis nula expresa que no hay diferencia significativa entre las ventas medias de los tres vendedores. :1H Plantea que al menos una media es diferente. Se seleccionó un nivel de significancia  = 0,05. El estadístico de prueba adecuado es la distribución F. Este procedimiento se basa en varias consideraciones: 1) Los datos deben estar al menos en escala de intervalo; 2) La selección real de las ventas debe hacerse utilizando un procedimiento de tipo probabilístico; 3) La distribución de las venta mensuales para cada una de las poblaciones es normal y 4) Las varianzas de las tres poblaciones son iguales, es decir, 2 3 2 2 2 1   . Ejemplo You Too…
  • 5. F es la razón de dos varianzas: muestraslaseniaciónlasegúnestimadalpoblacionaVarianza muestralesmediasentreiaciónsegúnestimadalpoblacionaVarianza F var var  La terminología común para el numerador es “varianza entre muestras”. Para el denominador es “varianza en las muestras”. El numerador tiene 1k grados de libertad. El denominador tiene kN  grados de libertad; donde k es el número de tratamientos y N es el número de observaciones. Ejemplo You Too…
  • 6. Para este problema, hay tres tratamientos (vendedores), por lo que se tiene k – 1 = 2 gl en el numerador. Hay 15 observaciones (tres muestras de cinco cada una), por tanto, hay N – k = 12 gl en el denominador. El valor crítico (valor teórico), esto es, el punto divisorio entre la región de aceptación y la de rechazo, se obtiene consultando la tabla correspondiente. Ese número es 3,89, y es el valor crítico de Fc para el nivel 5%. Ejemplo You Too…
  • 7. Al utilizar el nivel predeterminado de 0,05 la regla de decisión es no rechazar la hipótesis nula si el valor calculado (valor empírico) de Fp es menor o igual a 3,89; se rechaza la hipótesis nula y se acepta la alternativa, si el valor calculado de Fp es mayor que 3,89. Para calcular Fp y tomar una decisión, el primer paso es organizar una tabla ANOVA. Esta es sólo una forma conveniente de registrar la suma de cuadrados y otros cálculos. El formato general para un problema de análisis de varianza en un sentido (un factor) se muestra en la siguiente tabla: Ejemplo You Too…
  • 8. Fuente de Suma de Grados de Cuadrados variación cuadrados libertad medios Entre tratamientos SST k - 1 SST/(k-1) = MSTR Error (en los tratamientos) SSE N - k SSE/(N-k) = MSE Total Total SS MSE MSTR kN SSE k SST F    1p en donde: MSTR: cuadrado medio entre tratamientos. MSE : cuadrado medio debido al error. También se denomina cuadrado medio dentro de tratamiento. SST : suma de cuadrados de tratamiento. Tabla de Anova de un solo factor
  • 9. Se obtiene mediante la siguiente fórmula:         N X n T SST c c 22 )( donde: 2 cT : indica elevar al cuadrado el total de cada columna (el subíndice c se refiere a la columna) cn : es el número de observaciones para cada tratamiento respectivo (columna). Hay cinco valores de ventas para Quiroz, cinco para Huaroto y cinco para Martínez. X : es la suma de todas las observaciones (ventas). Es US$ 195. k: es el número de tratamientos (vendedores). Hay tres. N : es el número total de observaciones. Hay 15. Cálculo de la Suma Total de Cuadrados (SST, por sus siglas en inglés)
  • 10. Sr. Quiroz Sr. Huaroto Sr. Martínez 1X 2 1X 2X 2 2X 3X 2 3X 15 225 15 225 19 361 10 100 10 100 12 144 9 81 12 144 16 256 5 25 11 121 16 256 16 256 12 144 17 289 Total Totales de columna: 55 60 80 195 Tamaño de muestra 5 5 5 15 Suma de cuadrados 687 734 1306 2727 Cálculo de SST 70535,2605,2 15 )195( 5 )80( 5 )60( 5 )55()( 222222                N X n T SST c c Cálculo de SSE 122605,2727,2 2 2          c c n T XSSE La variación total (Total SS) es la suma de la variación entre columnas y entre renglones; es decir, Total SS = SST + SSE = 70 + 122 = 192. Ejemplo You Too… Ventas de vendedores de You Too – Periodo 1-5
  • 11. Verificación 192535,2727,2 15 )195( 727,2 )( 22 2    N X XSSTotal Las tres sumas de cuadrados y los cálculos necesarios para determinar F, se presentan en el siguiente cuadro: Fuente de Suma de Grados de Cuadrados variación cuadrados libertad medios Entre tratamientos SST= 70 k – 1=3-1=2 70/2=35 = MSTR Error (en los tratamientos) SSE=122 N – k=15-3=12 122/12 =10.17= MSE Total SS Total SS=192 Cálculo de Fp 44,3 17.10 351p    MSE MSTR kN SSE k SST F Ejemplo You Too…
  • 12. La regla de decisión indica que si el valor calculado de Fp es menor que o igual al valor crítico de 3,89, la hipótesis nula se acepta. Si el valor de Fp es mayor que 3,89, la hipótesis nula se rechaza y la hipótesis alternativa se acepta. Puesto que 3,44 < 3,89, la hipótesis nula no se rechaza al nivel 5%. En otras palabras, las diferencias en las ventas medias mensuales (US$11 000; US$12 000 y US$16 000) se atribuyen al azar (muestreo). Desde el punto de vista práctico, los niveles de ventas de los tres vendedores que se consideran para el puesto de CEO son iguales. No puede tomarse una decisión respecto al puesto, con base en las Ejemplo You Too…
  • 13. Hipótesis básicas de los modelos En el estudio de un modelo de Diseño de Experimentos, al igual que en el estudio de cualquier modelo estadístico, se debe contrastar que se verifican las hipótesis básicas o estructurales del modelo, como por ejemplo: a) Bondad del ajuste del modelo estadístico propuesto. b) La normalidad. c) La homocedasticidad del error. d) La homogeneidad de la muestra. e) La independencia de las observaciones. http://dm.udc.es/asignaturas/estadistica2/sec4_1.html
  • 14. Ejemplo 2 Se evaluará el desempeño del docente del curso Estadística Industrial, siendo las alternativas de respuestas las siguientes: 1 (excelente), 2 (bueno), 3 (aceptable) o 4 (necesita capacitación). El delegado recolectó las evaluaciones y aseguró a los estudiantes que el profesor no las recibiría hasta después que las calificaciones del curso se hubieran ingresado al SUM. La evaluación (el tratamiento) que un estudiante asignó al profesor se comparó con su calificación final del curso. Lógicamente, se esperaría que en general, el grupo de estudiantes que pensó que el profesor era excelente tuvieran una calificación promedio final del curso significativamente más alta que los alumnos que lo evaluaron como bueno, aceptable o regular, o deficiente. También se esperaría que los alumnos que lo evaluaron como deficiente tuvieran las calificaciones promedio más bajas.
  • 15. Se seleccionaron muestras de cada grupo de evaluación. Los resultados son: Excelente Bueno Regular Deficiente 94 75 70 68 90 68 73 70 85 77 76 72 80 83 78 65 88 80 74 68 65 65 La pregunta es si existe o no una diferencia estadística entre la puntuación media de los cuatro grupos. Evaluación docente… Se seleccionó el nivel de significación 0,01. La regla de decisión es que la hipótesis nula, que plantea que no hay diferencia entre las medias, no se rechazará si el valor calculado de Fp es menor que el valor crítico. De otra manera, la hipótesis nula se rechazará y se aceptará la hipótesis alternativa.
  • 16. Recuerda que los grados de libertad en el numerador de la razón F se obtienen por k – 1, donde k es el número de tratamientos (grupos de evaluación del profesor). Hay cuatro tratamientos, de manera que son 3 gl. Los grados de libertad en el denominador son en total 18, que se obtienen mediante N – k, en donde N es el número total de estudiantes en la muestra. Hay 22 estudiantes, por lo que son 18 gl. Observa que el valor crítico Fc es 5,09 de acuerdo al valor en la tabla correspondiente. La regla de decisión será: acepte la hipótesis nula al nivel 0,01 si el valor calculado de Fp es menor o igual a 5,09; y rechace la hipótesis nula si el valor calculado es mayor que 5,09. Evaluación docente…
  • 17. Los cálculos necesarios para determinar la razón F se muestran en la siguiente tabla: Excelente Bueno Aceptable Deficiente 1X 2 1X 2X 2 2X 3X 2 3X 4X 2 4X 94 8836 75 5625 70 4900 68 4624 90 8100 68 4624 73 5329 70 4900 85 7225 77 5929 76 5776 72 5184 80 6400 83 6889 78 6084 65 4225 88 7744 80 6400 74 5476 68 4624 65 4225 65 4225 cT 349 391 510 414 cn 4 5 7 6  2 X 30561 30811 37338 28634 Nata que la suma de los totales por columna  )( ix es 1664; el total de los tamaños de muestras (N) es 22; y la suma de los cuadrados 127 344. Calculando SST, SSE y total SS, se obtiene: 68.890 22 )1664( 6 )414( 7 )510( 5 )391( 4 )349()( 2222222                N X n T SST c c 41.59459.126749127344 2 2          c c n T XSSE Total SS = SST + SSE = 890.68 + 594.41 = 1485.09 Como verificación: 09.14859.125858127344 22 )1664( 127344 )( 22 2    N X XSSTotal Evaluación docente…
  • 18. Estos valores se colocan en la tabla ANOVA: Fuente de Suma de Grados de Cuadrados variación cuadrados libertad medios Tratamiento (entre columnas) SST= 890.68 k – 1=4-1=3 890.68/3=296.89 MSTR Error (entre renglones) SSE=594.41 N – k=22-4=18 594.41/18 =33.02= MSE Total SS Total SS=1485.09 Introduciendo los cuadrados medios en la fórmula de Fp, se obtiene: 99,8 02.33 89.296 p  MSE MSTR F Evaluación docente… Decisión: como el valor calculado de Fp es 8,99 es mayor que el valor crítico 5,09; la hipótesis nula de que no existe diferencia entre las medias se rechaza al nivel 0,01. Básicamente esto indica que es muy probable que las diferencias observadas entre las medias no se deban al azar. Desde el punto de vista práctico, se sugiere que las calificaciones que obtuvieron los estudiantes en el curso están relacionadas con las opiniones que tienen de la capacidad general y la forma como se conduce en clase el profesor.
  • 19. Ejercicio Tres tipos distintos de motores de gasolina fueron probados para determinar cuánto tiempo son útiles antes de necesitar una reparación; si los tiempos de vida de los motores de cada tipo se distribuyen normalmente y tienen la misma varianza, haz una prueba para determinar si difieren las medias de vida útil antes de requerir una reparación. En la tabla siguiente aparecen los tiempos de vida útil, en decenas de miles de km para cada tipo de motor. Tiempos A B C 6 8 3 2 7 2 4 7 5 1 2 4 7 6 1 R. SST = 23,33; SSE = 58; Fp = 2,4138; Fc = 3,885
  • 20. Inferencia acerca de las medias de un tratamiento Supón que al aplicar el procedimiento ANOVA, se decide rechazar la hipótesis nula. Esto permite concluir que todas las medias de tratamiento no son iguales. Algunas veces esta conclusión puede considerarse satisfactoria, pero en otros casos se desea saber cuáles medias de tratamiento son diferentes. En el ejemplo de la evaluación al docente, la hipótesis nula se rechazó y la alternativa se aceptó. Si las opiniones de los estudiantes son en realidad diferentes, la pregunta es ¿Entre qué grupos difieren las medias del tratamiento? Existen varios procedimientos para responder esta pregunta. El más sencillo es mediante el uso de niveles de confianza.
  • 21. Intervalo de confianza para la diferencia entre dos medias poblacionales Donde: 1x : es la media del primer tratamiento. 2x : es la media del segundo tratamiento t : se obtiene a partir de la tabla t. Los grados de libertad son N – k. MSE: es el error cuadrado medio que se obtiene a partir de la tabla ANOVA. 1n : es el número de observaciones en el primer tratamiento. 2n : es el número de observaciones en el segundo tratamiento.        21 21 11 )( nn MSEtxx Si el intervalo de confianza incluye al cero, se concluye que no hay diferencia en el par de medias de tratamiento. Sin embargo, si ambos extremos del intervalo de confianza tienen el mismo signo, esto indica que las medias de tratamiento son diferentes.
  • 22.  04,2646,10 79.725.18 6 1 4 1 0.33101.2)00.6925.87( 11 )( 21 21 y nn MSEtxx                Se conoce que el intervalo de confianza de 95% varía de 10,46 hasta 26,04. Ambos extremos son positivos; en consecuencia, podemos concluir que estas medias de tratamiento difieren significativamente. Es decir, los estudiantes que evaluaron al profesor como Excelente tienen calificaciones más altas que los que lo evaluaron como Deficiente. Intervalo de confianza… Utilizando el ejemplo anterior acerca de las opiniones de estudiantes (Excelente y Deficiente) y el nivel de confianza de 0,95; los extremos del intervalo de confianza son 10,46 y 26,04 que se obtienen por:
  • 23. Precaución La investigación de diferencias de medias de tratamiento es un proceso secuencial. El paso inicial es realizar la prueba ANOVA. Solo si se rechaza, la hipótesis nula de que la medias de tratamiento son iguales, debe intentarse llevar a cabo cualquier análisis de las medias de tratamiento
  • 24. Ejercicio. En un experimento se compararon tres métodos de enseñar el idioma ruso (русский язык); para evaluar la instrucción, se administró una prueba de vocabulario de 50 preguntas a los 24 estudiantes del experimento repartidos de a ocho por grupo. a) ¿Cuál es la variable respuesta y la explicativa en este estudio? R. La variable respuesta es el puntaje en la prueba de vocabulario y la variable explicativa son los métodos de enseñanza (auditivo, traducción y combinado). Es un factor con 3 niveles. b) Completa la siguiente tabla de ANOVA:
  • 25. R R. Pasos para completar la tabla: 1) Grados de libertad, en Total son n - 1 y n = 24, por lo tanto son 23. Los grupos a comparar son 3 por lo tanto los gl Inter-grupos son 2. 2) La suma de cuadrados Inter-grupos se obtiene multiplicando la media cuadrática por los gl, 323.792*2 = 647.584 3) Teniendo la SC Inter-grupos, la SC Intra-grupo es 1460.958 - 647.584 = 813.374 4) Con la SC Intra y los gl, la media cuadrática Intra-g = 813.374/21 = 38.732 5) Con las dos MC el test F = 323.792/38.732 = 8.360 c) ¿Qué supuestos debería verificar el investigador?, escribe las hipótesis asociadas a ellos. Ejercicio Idioma ruso…
  • 26. Antes de comparar las medias, debe verificar los supuestos de Normalidad y de Homogeneidad de las varianzas (el supuesto de Independencia se comprueba en el diseño, se dividió a 8 estudiantes por cada método). Hipótesis 1) Normalidad: Necesita realizar 3 pruebas de hipótesis, una para cada grupo del tipo: donde i representará cada método de enseñanza: auditivo, traducción y combinado. 2) Homocedasticidad: la hipótesis es: Donde 1 = método auditivo, 2 = método traducción, 3 = método combinado d) Asume que se cumplen los supuestos, realiza la prueba (en el acápite b) figura la tabla Anova) de interés para el investigador. Indica la conclusión. Si se cumplen los supuestos, entonces podemos comparar las medias de los métodos de enseñanza usando el test F de la ANOVA: Hipótesis: De la tabla de ANOVA el test F = 8,36 al que corresponde un valor-p de 0,002, este valor-p es menor que el nivel de significación de 0,05, por lo tanto se rechaza la hipótesis nula, conclusión: existen diferencias significativas entre las medias de los métodos de enseñanza al 5%. R R Ejercicio Idioma ruso…
  • 27. Los ejemplos desarrollados antes de la presente diapositivas se caracterizan porque la pertenencia a una población o a otra depende de un único factor (tipo de delito, franja de edad, país, editorial, modelo de automóvil, motor de búsqueda, etcétera). En estos casos, se usa ANOVA de un único factor (en inglés one- way ANOVA o single-factor ANOVA). Existen técnicas ANOVA para el caso en que los grupos vengan determinados por dos factores (Tipo de delito y solvencia económica del acusado, franja de edad y clase social, etc.). Los tratamientos se asignan a las columnas y los bloques a los renglones. Un bloque indica condiciones similares de los sujetos al experimentar con diferentes tratamientos. Cuando el factor A consta de I niveles y el factor B de J niveles, existen IJ combinaciones diferentes (pares) de niveles de los dos factores, cada uno llamado tratamiento. Con Kij el número de observaciones en el tratamiento compuesto del factor A al nivel i y del factor B al nivel j. ANOVA DE DOS VÍAS, DIRECCIONES O FACTORES, Two-way ANOVA
  • 28. ANOVA (Bifactorial) en dos sentidos (Una muestra por grupo, Ki,j = 1) La compañía de autobuses Mortal Kombat Chosicano, está ampliando el servicio desde el centro de Lima al Aeropuerto por cuatro rutas diferentes. La Empresa realizó recorridos de prueba en una semana determinada, para determinar si hay diferencia significativa en los tiempos medios del trayecto en las cuatro rutas. Los tiempos del trayecto en minutos en cada una de las cuatro rutas y de acuerdo al día de la semana se muestran a continuación: Tiempo del recorrido del Centro al Aeropuerto Día Ruta 1 Ruta 2 Ruta 3 Ruta 4 Lunes 18 20 20 22 Martes 21 22 24 24 Miércoles 20 23 25 23 Jueves 25 21 28 25 Viernes 26 24 28 25 Al nivel de significancia 5% ¿puede concluirse que hay diferencia en las cuatro rutas? ¿Existe una diferencia dependiendo de qué día de la semana se trata?
  • 29. En este caso, el día de la semana se denomina variable de bloque. En consecuencia, se tiene variación debida al tratamiento y debida a los bloques. La suma de cuadrados debida a los bloques (SSB) se calcula como sigue: N x k B SSB r 22 )(         Donde: Br :se refiere al total del bloque, es decir, al total de cada renglón, y k :es el número de elementos en cada bloque. El mismo formato que sirve para el caso de ANOVA en un sentido se utiliza para la tabla ANOVA en dos sentidos. Los totales de SST y SS se calculan igual que antes. SSE se obtiene por sustracción (SSE = Total SS – SST – SSB). En la siguiente tabla se muestran los cálculos necesarios: Caso Mortal Kombat…
  • 30. Tiempo de viaje, por ruta (minutos) Día Ruta 1 Ruta 2 Ruta 3 Ruta 4 Suma de renglones Br Lunes 18 20 20 22 80 Martes 21 22 24 24 91 Miércoles 20 23 25 23 91 Jueves 25 21 28 25 99 Viernes 26 24 28 25 103 Totales Totales por columna, Tc 110 110 125 119 464 Suma de cuadrados 2446 2430 3169 2839 10904 Tamaño de la muestra nc 5 5 5 5 20 Análogo a la tabla ANOVA para un análisis en un sentido, el formato general en dos sentidos es: Fuente de variación Suma de cuadrados Grados libertad Cuadrado medio Tratamientos SST k - 1 MSTR k SST  1 Bloque SSB n -1 MSB n SSB  1 Error SSE (k-1)(n-1) MSE nk SSE   )1)(1( Total Total SS Caso Mortal Kombat…
  • 31. Como antes, para calcular SST: 4,32 20 )464( 5 )119( 5 )125( 5 )110( 5 )110()( 2222222                N X n T SST c c SSB se obtiene mediante: 2,78 20 )464( 4 )103( 4 )99( 4 )91( 4 )91( 4 )80()( 22222222          N x k B SSB r Los demás términos de suma de cuadrados son: 2,139 20 )464( 10904 )( 22 2    N X XSSTotal SSE = Total SS – SST – SSB=139.2 – 32.4 – 78.2 = 28,6 Caso Mortal Kombat…
  • 32. Los valores para los diferentes compone ANOVA se calculan de la siguiente mane Fuente de variación Suma de cuadrados Grados libertad Tratamientos 32.4 3 Bloque 4 Caso Mortal Kombat…
  • 33. 1.- 43210 :  H . Las medias de tratamiento son iguales. :1H Las medias de tratamiento no son iguales. 2.- 543210 :  H . Las medias de bloques son iguales. 1H : Las medias de bloques no son iguales. Caso Mortal Kombat… Primero se demostrará la hipótesis sobre las medias de tratamiento. Hay k – 1 = 3 grados de libertad en el numerador y (k – 1) (n – 1) = 12 grados de libertad en el denominador. Al nivel de significancia 0,05, el valor crítico de F es 3,49. La hipótesis nula de que los tiempos medios para las cuatro rutas son iguales se rechaza si la razón F es mayor que 3,49. 54,4 38,2 8,10  MSE MSTR F La hipótesis nula se rechaza y se acepta la hipótesis alternativa. Se concluye que el tiempo promedio de trayecto no es igual para todas las rutas. La empresa desea efectuar algunas pruebas para determinar qué medias de tratamiento difieren.
  • 34. A continuación, se hace una prueba para determinar si el tiempo del trayecto es igual para diferentes días de la semana. Los grados de libertad en el numerador para bloques es n – 1 = 4. Los grados de libertad en el denominador son igual que antes, es decir, 12. La hipótesis nula de que las medias de bloques son iguales se rechaza si la razón F es mayor que 3.26. 21.8 38.2 55.19  MSE MSB F La hipótesis nula se rechaza, y la hipótesis alternativa se acepta. El tiempo promedio del trayecto no es igual para los diferentes días de la semana. Caso Mortal Kombat…
  • 35. Ejercicio 1. Pánfila, ingeniera industrial, quiere probar el efecto de cuatro agentes químicos sobre la resistencia de un tipo particular de tela. Debido a que podría haber variabilidad de un rollo de tela a otro, la ingeniera decide usar un diseño de bloques aleatorizados, con los rollos de tela considerados como bloques. Selecciona cinco rollos y aplica los cuatro agentes químicos de manera aleatoria a cada rollo. A continuación se presentan las resistencias a la tensión resultantes. Analiza los datos de este experimento (utiliza α = 5%) y obtén las conclusiones apropiadas. Rollo Agente Químico 1 2 3 4 5 1 73 68 74 71 67 2 73 67 75 72 70 3 75 68 78 73 68 4 73 71 75 75 69 R. SST = 12,95; SSB = 157; SSE = 21,8; MSTR = 4,317; MSB = 39,25; MSE = 1,817; FpT = 2,3761; FpB = 21,6; FcTR = 3,49; FcB = 3,26
  • 36. Ejercicio 2. El ingeniero Alfredo Mastrókalo está interesado en estudiar el efecto sobre la conductividad de una válvula electrónica que tienen tres tipos diferentes de recubrimiento para los tubos de rayos catódicos utilizados en un dispositivo de visualización de un sistema de telecomunicaciones. Se obtienen los siguientes datos: Contrasta con un nivel de significación del 5 % si el tipo de recubrimiento tiene algún efecto sobre la conductividad. Tip. Se supone que las muestras proceden de poblaciones normales e independientes con la misma varianza. Conclusión: como F = 10,725 es mayor que F0,95;2;9 = 4,26, rechazamos H0. Existen por tanto diferencias significativas entre los tres tipos de recubrimiento, es decir, el tipo de recubrimiento influye en la conductividad. de la válvula. Tipo de recubrimiento Conductividad 1 143 141 150 146 2 152 149 137 143 3 134 133 132 127
  • 37. Agua Fría Agua Tibia Agua Caliente Poco Azúcar 75 87 60 Azúcar Normal 74 82 55 Mucho Azúcar 70 79 53 Levadura: Tamaño de los panes dulces Ejercicio 3. R. El resultado indica el valor de F por las filas (cantidad de azúcar) es 23,15. Para saber si estos resultados son significativos (o sea, si la probabilidad P tiene un valor menor a 0,05), el valor de la F observado necesita ser al menos 6,94 (o sea, el valor crítico de F). Como el valor de F observado es de 23,15 es mucho mayor que el valor crítico de F (6,94), estamos seguros que los resultados de nuestras pruebas son significativas. El valor de F para las columnas (temperatura del agua) es igual a 378,53. Esto es también significativo, porque el valor de F crítico es solamente 6,94. En otras palabras, existe una relación significativa en la cantidad de azúcar, la temperatura del agua y el tamaño de los panes dulces. La probabilidad muestra a qué nivel los resultados son estadí- sticamente significativos. Supón que has experimentado con levadura para una receta de panes dulces. Parece ser que la cantidad de azúcar y la temperatura del agua afectan el tamaño de los panes. Basándote en los siguientes datos, realiza un análisis de varianza para averiguar lo que es significativo de estas recetas.