SlideShare una empresa de Scribd logo
UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA
DEPARTAMENTO DE CIENCIA Y TECNOLOGÍA
AREA: MATEMÁTICA
ASIGNATURA: ESTADÍSTICA II
GUÍA DE ESTUDIO Nº 4
ANÁLISIS DE VARIANZA
1. Introducción al tema
El análisis de la varianza (ANOVA) permite contrastar la hipótesis nula de que las medias
(μ) de más de dos poblaciones (K >2) son iguales, frente a la hipótesis alternativa de que
por lo menos una de las poblaciones difiere de las demás en cuanto a su valor esperado.
Esta comprobación la realiza partiendo del análisis de la varianza o dispersión encontra-
da.
Este contraste es fundamental en ingeniería para el análisis de resultados experimentales,
en los que interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto a
la variable dependiente o de interés.
Las hipótesis siempre son planteadas de la siguiente manera:
H0: μ1= μ2 = μ3=...μK
H1: Al menos dos de las μ son ≠
Los modelos de ANOVA (Analysis of Variance) son técnicas de Análisis Multivariante de
dependencia, que se utilizan para analizar datos procedentes de diseños con una o más
variables independientes cualitativas medidas en escalas nominales u ordinales (tipo de
material, habilidad del programador, tipo de software o hardware); y una variable depen-
diente cuantitativa medida con una escala de intervalo o de razón (tiempo, resistencia,
rapidez, entre otras).
En este contexto, las variables independientes se suelen denominar factores (y sus dife-
rentes estados posibles o valores son niveles o tratamientos) y la variable dependiente se
conoce como variable de respuesta o variable de estudio (tiempo, resistencia, rapidez,
entre otras).
Los modelos ANOVA permiten, básicamente, comparar los valores medios que toma la
variable dependiente en K poblaciones en las que los niveles de factores son distintos,
con la finalidad de determinar si existen diferencias significativas según dichos niveles o
si, por el contrario, la respuesta en cada población es independiente de los niveles de fac-
tores.
Se trata, por tanto, de un contraste paramétrico que extiende al caso de K poblaciones
el contraste de la igualdad de medias entre dos poblaciones independientes. El Anova
requiere el cumplimiento de los siguientes supuestos:
 Las muestras o grupos analizados deben seguir una distribución Normal. Las pobla-
ciones (distribuciones de probabilidad de la variable dependiente correspondiente a
cada factor) son normales.
 Las K muestras sobre las que se aplican los tratamientos son independientes. Los in-
dividuos estudiados han de ser independientes unos de otros.
 Las muestras o grupos objeto de estudio deben haberse obtenido de forma aleatoria.
 Las poblaciones tienen todas igual varianza (homoscedasticidad).
2. Aplicación del ANOVA en ingeniería
El Análisis de Varianza es un extensión paramétrica de la Prueba de Hipótesis para la
comparación de dos poblaciones, ya que permite comparar K poblaciones en un solo mo-
delo. Para explicar mejor la utilidad en la aplicación del ANOVA en la ingeniería, se plan-
tean 3 ejemplos:
Ejemplo 1. La rapidez de desplazamiento en la pantalla es una consideración importante
en el desarrollo de tarjetas gráficas a color. Se emprende un estudio para comparar el
tiempo, en seg, necesarios para desplazarse una pantalla en documentos de Microsoft
Word con 5 tarjetas gráficas a color distintas en monitores de 24 pulg. La prueba empren-
dida es la de rendimiento Hydra Quick Draw. Se obtienen los datos siguientes:
A B C D E
30.5 48.3 79.2 51.6 79.0
32.4 42.1 84.7 59.4 85.3
27.2 43.5 85.0 57.3 86.2
26.3 40.6 88.2 59.0 82.0
25.1 38.6 76.3 58.7 87.2
38.2 32.1 83.1 68.1 81.7
30.6 41.6 92.6 64.8 93.5
33.7 38.8 88.5 55.5 89.1
Para este estudio o experimento, el objetivo es comprobar si el tiempo promedio (en seg),
necesario para desplazarse una pantalla en documentos de Microsoft Word se ve afecta-
do por el tipo de tarjeta gráfica a color. En donde:
 Variable del estudio (variable dependiente): Rapidez o tiempo (seg) (siempre es cuan-
titativa).
 Tamaño de la muestra: 40 tiempos.
 Unidad Experimental: Monitor de 24 pulg.
 Factor o Tratamiento (variable independiente): Tipo de Tarjeta Gráfica a Color (es cua-
litativa).
 Nivel del Factor: (5) tipos de tarjetas gráficas a color.
Para este caso se estaría comprobando la hipótesis.
Hipótesis 1. La rapidez promedio (seg) de desplazamiento en la pantalla en documentos
de Microsoft Word es igual idependientemente del tipo de tarjeta gráfica a color que se
utilice.
H0: μTarjeta 1= μTarjeta 2 = μTarjeta 3 = μTarjeta 4 = μTarjeta 5
H1: Al menos dos de las μ son ≠
Ejemplo 2. Un Ingeniero sospecha que el acabado superficial de ciertas piezas de metal
está influenciado por el tipo de pintura utilizada y el tiempo de secado. El ingeniero selec-
ciona tres tiempos de secado (20 – 25 y 30 minutos) y emplea dos tipos de pintura. Se
prueban tres piezas con cada combinación de tipo de pintura y tiempos de secado. Los
datos son los siguientes:
PINTURA TIEMPOS DE SECADO (MIN)
20 25 30
1 74 73 78
2 92 98 66
Para este estudio o experimento, el objetivo es comprobar si el tipo de pintura y el tiempo
de secado influye significativamente en el acabado de la pieza de metal medido en %,
entendiendo que a mayor porcentaje, mejor es el acabado. En donde:
 Variable del estudio (variable dependiente): Acabado de la pieza de metal (%) (siem-
pre es cuantitativa).
 Tamaño de la muestra: 6 piezas de metal.
 Unidad Experimental: Piezas de metal.
 Factor o Tratamiento (variables independientes): Tipo de pintura y tiempo de secado
(son cualitativas).
 Nivel del Factor: (2)tipos de pintura - (3) tiempos de secado
Para este caso se estarían comprobando dos hipótesis.
Hipótesis 1. El porcentaje de acabado promedio de las piezas es igual, independiente-
mente del tipo de pintura que se utilice.
H0: μPintura 1= μPintura 2
H1: Al menos dos de las μ son ≠
Hipótesis 2. El porcentaje de acabado promedio de las piezas es igual, independiente-
mente del tiempo de secado que se emplee.
H0: μ20min= μ25min = μ30min
H1: Al menos dos de las μ son ≠
Ejemplo 3. Se realiza un experimento para investigar la diferencia entre los tiempos me-
dios para ensamblar cuatro dispositivos electrónicos distintos, T1, T2, T3 y T4. Hay dos
fuentes de variación no deseada que afectan la respuesta: la variación entre las personas
y el efecto de la fatiga si una persona ensambla una serie de dispositivos durante cierto
tiempo. Por consiguiente 4 ensambladores, fueron seleccionados y cada uno ensambla
los 4 dispositivos T1, T2, T3 y T4, de acuerdo al siguiente diseño en cuadrado latino.
POSICIÓN EN LA SE-
CUENCIA DE ENSAM-
BLAJE
ENSAMBLADORES TOTAL
1 T3 44 T1 41 T2 30 T4 40 155
2 T2 41 T3 42 T4 49 T1 49 181
3 T1 59 T4 41 T3 59 T2 34 193
4 T4 58 T2 37 T1 53 T3 59 207
TOTAL 202 161 191 182 736
En donde:
 Variable del estudio (variable dependiente): Tiempo medio para ensamblar dispositivos
electrónicos (minutos) (siempre es cuantitativa).
 Tamaño de la muestra: 16 ensamblajes o procesos de ensamblajes del dispositvo
electrónico.
 Unidad Experimental: Dispositivo electrónico.
 Factor o Tratamiento (variables independientes): Diferentes dispositivos electrónicos -
Diferentes habilidades de los trabajadores - Diferentes posición en la secuencia (son
cualitativas).
 Nivel del Factor: (4) Dispositivos electrónicos - (4)Ensambladores - (4) posiciones en la
secuencia de ensamblaje.
Hipótesis 1. ¿Proporcionan los datos suficiente evidencia que indique que hay diferencia
entre los tiempos medios de ensamblaje correspondiente a los dispositivos?
H0: μT1= μT2 =μT3= μT4
H1: Al menos dos de las μ son ≠
Hipótesis 2. ¿Proporcionan los datos suficiente evidencia que indique que hay diferencia
entre los tiempos medios de ensamblaje correspondiente a las personas?
H0: μEnsam.1= μEnsam.2 =μEnsam.3 = μEnsam.4
H1: Al menos dos de las μ son ≠
Hipótesis3. ¿Proporcionan los datos suficiente evidencia que indique que hay diferencia
entre los tiempos medios de ensamblaje correspondiente a las posiciones en la secuen-
cia de ensamblaje?
H0: μP1= μP2 =μP3= μP4
H1: Al menos dos de las μ son ≠
Ahora bien, para la comprobación de estas hipótesis el ANOVA o Análisis de Varianza,
como su nombre lo indica, requiere del análisis de las fuentes de variación que existen.
Se analiza la relación entre las llamadas medias cuadráticas inter-grupos (entre grupos) y
medias cuadráticas intra-grupos (dentro de los grupos) , que deben ser iguales si las me-
dias de las poblaciones lo son, por lo que requiere la aplicación de la Distribución Muestral
F. A continuación su descripción.
3. Distribución F
Usada en teoría de probabilidad y estadística, la distribución F es una distribución de pro-
babilidad continua. También se la conoce como distribución F de Snedecor (por George
Snedecor) o como distribución F de Fisher-Snedecor.
La aplicación de la Distribución F se encuentra en la comparación de varianzas mues-
trales y en problemas que implican dos o más muestras. El estadístico F se define como
la razón de dos variables aleatorias chi cuadradas independientes, dividida cada una en-
tre su número de grados de libertad. Sus características son:
 La variable aleatoria F es no negativa, ya que ambos términos de la razón F están ele-
vados al cuadrado.
 La distribución tiene un sesgo hacia la derecha. Dominio de x es de 0 a infinito.
 La forma de cada distribución de muestreo teórico F depende del número de grados
de libertad que estén asociados a ella. Tanto el numerador como el denominador tie-
nen grados de libertad relacionados.
 La función de distribución Fisher está directamente relacionada con la función Chi-
cuadrado, en tanto que F es producto de un cociente entre dos valores correspondien-
tes a esta distribución.
Uso de la Tabla F
Se obtiene el valor F en ubicando primero la Tabla correspondiente al nivel de significacn-
cia establecido (Ej. α=0,01 o α=0,05). Posteriormente se ubica los grados de libertad del
numerador en la parte superior de la tabla (ϑ1 = K-1) y los grados de libertad del denomi-
nador en la columna lateral de la tabla (ϑ2 = n -K).
Utilizando la Tabla 1 (Anexo A) de un nivel de significación de 0,05 y para (ϑ1 = 2) y
(ϑ2 = 10), el valor de F es 4.1028
4. Modelos ANOVA
Aunque existen muchos modelos de ANOVA, puede obtenerse una clasificación bastante
simple de los mismos atendiendo a tres criterios: el número de factores, el tipo de mues-
treo efectuado sobre los niveles de los factores y el tipo de aleatorización utilizada para
seleccionar las muestras representativas de cada población y agrupar las unidades expe-
rimentales en los distintos grupos que se desea comparar.
 Según el número de factores, se llama ANOVA de un factor al modelo en el que existe
una única variable independiente; en cambio, si el modelo consta de más de un factor
se le denomina modelo factorial o se habla de Análisis de Varianza Factorial.
 En cuanto al muestreo de niveles, se refiere a la forma de establecer los niveles de
cada factor. Esto depende, normalmente, de los intereses del investigador. Si se fijan
únicamente aquellos niveles del factor que realmente interesa estudiar, se está ante
un modelo de ANOVA de efectos fijos (también llamado modelo I), mientras que si los
niveles se seleccionan aleatoriamente de entre todos los posibles, se trata de un mo-
delo ANOVA de efectos aleatorios (o modelo II).
 Las distinciones basadas en el tipo de aleatorización son equivalentes a las que se
establecen al hablar de muestras independientes y muestras relacionadas. Como en
todo experimento estadístico en el que no resulta posible trabajar con la población en
su totalidad, se deben elegir muestras aleatorias y asignarse también aleatoriamente
sus elementos a los diferentes niveles o tratamientos, para asegurar que no se come-
tan errores sistemáticos. Si las unidades experimentales reaccionan o responden a los
tratamientos de la misma manera, se dice que son homogéneas. Por el contrario si
responden de diferente manera a los tratamientos debido a sus diferencias intrínsecas,
se dirán heterogéneas.
 Por otra parte, el tamaño de las muestras puede ser o no el mismo. Un diseño es equi-
librado o balanceado si todas las muestras tienen el mismo tamaño y no equilibrado o
no balanceado en caso contrario.
El ANOVA se basa en la descomposición de la variación total de los datos con respecto a
la media global (SST), que bajo el supuesto de que H0 es cierta es una estimación obteni-
da a partir de toda la información muestral, en dos partes:
 Variación dentro de las muestras (SSTR) o Intra-grupos, cuantifica la dispersión (va-
rianza) de los valores de cada muestra con respecto a sus correspondientes medias.
 Variación entre muestras (SSE) o Inter-grupos, cuantifica la dispersión de las medias
de las muestras con respecto a la media global.
Procedimiento de ANOVA
Como el ANOVA es una prueba de hipótesis de igualdad de más de dos medias poblacio-
nales, emplea el mismo procedimiento visto en el tema anterior:
1. Establecer las hipótesis nula y alternativa. Siempre la H0 se plantea en función de la
igualdad de medias y H1 en función de diferencia de por lo menos dos medias.
H0: μ1= μ2 =μ3...= μk
H1: Al menos dos de las μ son ≠
2. Ubicar el valor tabulado del estadístico de prueba, que en este caso es Distribución F
(valor de F en tabla) para un nivel de confianza (α =0,05) y los grados de libertad del
numerador (ϑ1 = k-1) y los grados de libertad del denominador (ϑ2 = n-k). En donde k
es el número de tratamientos o renglón (r) y n es el número total de muestras o datos.
Fα, ϑ1, ϑ2
3. Establecer el área crítica o región de rechazo. Si Fcalc> Ftab se rechaza la hipótesis
nula.
4. Calcular el Estadístico de Prueba (Fcalc).
Fcalc= MSTR/MSSE
5. Analizar en función del Rechazo o Aceptación de la H0.
Modelo Completamente Aleatorizado
Este modelo es el más sencillo del diseño de experimentos, en el cual la variable respues-
ta (variable de estudio o dependiente) puede depender de la influencia de un único fac-
tor (variable independiente), de forma que el resto de las causas de variación se englo-
ban en el error experimental.
Se supone que el experimento ha sido aleatorizado por completo, es decir, todas las uni-
dades experimentales han sido asignadas al azar a los tratamientos.
Ejercicio 1. Las siguientes cifras representan los errores cometidos en 5 semanas suce-
sivas por cuatro técnicos que trabajan en un laboratorio químico:
TÉCNICO I 13 16 12 14 15
TÉCNICO II 14 16 11 19 15
TÉCNICO III 13 18 16 14 18
TÉCNICO IV 18 10 14 15 12
Demuestre en el nivel de significancia de 0.05, si las diferencias entre las 4 medias de la
muestra pueden atribuirse al azar.
Solución
 Variable del estudio (variable dependiente): N° de errores cometidos.
 Tamaño de la muestra: 20 semanas.
 Unidad Experimental: Técnicos.
 Factor o Tratamiento (variable independiente): Habilidad de losTécnicos (es cualitati-
va).
 Nivel del Factor: (4) Técnicos.
1.- H0: μTécnico 1= μTécnico 2 = μTécnico 3 = μTécnico 4
H1: Al menos dos de las μ son ≠
2.- α = 0,05. Con ϑ1 = k-1 = 4-1 = 3 y ϑ2 = n-k = 20-4 = 16.
Por Tabla F0,05, 3,16 = 3.2389
3.- Región crítica Fcalc > 3.2389
4.- Calcular F (Completar el Cuadro 1 siguiendo las fórmulas)
Fuente de va-
riación
Grados de
libertad
Suma de
Cuadrados
Cuadrados Medios
Estadístico de
prueba (F)
Intermuestral
(Tratamiento)
r-1 SSTR MSTR=SSTR/(r-1)
F=MSTR/MSE
Intramuestral
(Error)
n-r SSE MSE=SSE/(n-r)
Total n-1 SST
 
 

2
x
x
n
SSTR i
i ;  
 

2
x
x
SST ij ; SSTR
SST
SSE 

donde:
ni : número de muestras por tratamiento
r: número de tratamientos (k)
X : media del tratamiento i
X : media total o medias de las medias
X 1 13 16 12 14 15 5 14
     
/
X 3 13 18 16 14 18 5 15 8
     
/ ,
X 4 18 10 14 15 12 5 13 8
     
/ ,
X = 14+15+15,8+13,8 / 4 =14,65
 
 

2
x
x
n
SSTR i
i
SSTR = 5 [ (14-14,65)2
+ (15-14,65)2
+ (15,8-14,65)2
+ (13,8-14,65)2
]
SSTR= 12,95
 
 

2
x
x
SST ij
SST = (13-14,65)2
+ (16-14,65)2
+ (12-14,65)2
+ (14-14,65)2
+ (15-14,65)2
+ (14-14,65)2
+ (16-
14,65)2
+ (11-14,65)2
+ (19-14,65)2
+ (15-14,65)2
+ (13-14,65)2
+ (18-14,65)2
+ (16-14,65)2
+ (14-
14,65)2
+ (18-14,65)2
+(18-14,65)2
+ (10-14,65)2
+ (14-14,65)2
+ (15-14,65)2
+ (12-14,65)2
=
SST= 114,5
SSE = SST - SSTR
SSE= 114,5 - 12,95
SSE= 101,55
MSTR = SSTR/r-1 = 12,95/3 = 9,32
MSE = SSE/n-r = 101,55/16 = 6,35
FCalc = 9,32/6,35
FCalc = 0,68
FCalc < Ftab → 0,68< 3.2389 → Se acepta la H0
5.- Se acepta la H0 que establece que los errores promedios de los técnicos es igual in-
dependientemente de la habilidad del técnico. Esto a un nivel de significancia de 0,05.
Modelo de Bloque Aleatorizado
Es un Plan para reunir datos en el que cada uno de los K tratamientos se miden una vez
en cada uno de los b bloques. El orden de los tratamientos dentro de los bloques es alea-
torio.
Ejercicio 2. La resistencia del concreto utilizado en la construcción comercial tiende a
variar de un lote a otro. En consecuencia, se “curan” pequeños cilindros de prueba de
concreto muestreados de cada lote, durante periodos aproximados hasta de 28 días en
ambientes de temperatura y humedad controladas, antes de determinar la resistencia. Así
el concreto se “compra y vende con base en resistencia de cilindros de prueba” (Método
estándar de prueba ASTM C31 para fabricar y curar especímenes de prueba de concreto
en el campo). Los datos siguientes se obtuvieron en un experimento efectuado para com-
parar tres métodos distintos de curado respecto a la resistencia a la compresión, en Mpa.
Analice estos datos a un nivel de significancia de 0.01.
LOTE MÉTODO A MÉTODO B MÉTODO C
X Lotes
1 30.7 33.7 30.5 31,63
2 29.1 30.6 32.6 30,77
3 30.0 32.2 30.5 30,9
4 31.9 34.6 33.5 33,33
5 30.5 33.0 32.4 31,97
6 26.9 29.3 27.8 28
7 28.2 28.4 30.7 29,1
8 32.4 32.4 33.6 32.8
9 26.6 29.5 29.2 28,43
10 28.6 29.4 33.2 30,4
X Métodos 29,49 31,31 31,4 30,73
X = 30,73
Solución
 Variable del estudio (variable dependiente): Resistencia del concreto.
 Tamaño de la muestra: 30 muestras.
 Unidad Experimental: Cilindros de Prueba.
 Factor o Tratamiento (variables independientes): Lotes - Métodos (son cualitativas).
 Nivel del Factor: (10) Lotes - (3) Métodos.
1. H0: μlote1= μlote 2 = μlote 3 = μlote 4 =μlote 5= μlote 6 = μlote 7 = μlote 8 = μlote 9= μlote 10
H1: H1: Al menos dos de las μ son ≠
H0: μmétodo1= μmétodo 2 = μmétodo 3
H1: H1: Al menos dos de las μ son ≠
2.- α = 0,05.
Para Lotes (filas r)
ϑ1 = r-1 = 10-1 = 9
ϑ2 = (r-1) (c-1) = (10-1)(3-1) = (9)(2)= 18.
Por Tabla F0,05, 9,18 = 2.4563
Para Métodos (columnas c)
ϑ1 = c-1 = 3-1 = 2
ϑ2 = (r-1) (c-1) = (10-1)(3-1) = (9)(2)= 18.
Por Tabla F0,05, 2,18 = 3.5546
3.- Región crítica para Lotes
Fcalc lotes > 2.4563
Región crítica para Métodos
Fcalc métodos > 3.5546
4.- Calcular F (Completar el Cuadro 2 siguiendo las fórmulas)
Fuente de va-
riación
g. l.
Suma de
Cuadrados
Cuadrados Medios
Estadístico de
prueba (F)
Intermuestral
(Tratamiento)
r-1 SSTR MSTR=SSTR/(r-1)
F1=MSTR/MSE
F2=MSBL/MSE
Intermuestral
(Bloque)
c-1 SSBL MSBL=SSBL/(c-1)
Intramuestral
(Error)
(r-1)(c-1) SSE MSE=SSE/(r-1)(c-1)
Total c.r-1 SCT
 
 

2
x
x
c
SSTR i
j ;  
 

2
x
x
r
SSBL j
i ;  
 

2
x
x
SST ij
SSE
SSBL
SSTR
SST 

 SSBL
SSTR
SST
SSE 


donde:
ni : número de muestras por tratamiento
r: número de tratamientos (lotes)
c: número de bloques (métodos)
Xi : media del tratamiento i
X j : media del bloque j
X : media total o medias de las medias
X : 30,73
 
 

2
x
x
c
SSTR i
j
SSTR = 3[(31,63-30,73)2
+(30,77-30,73)2
+(30,9-30,73)2
+(33,33-30,73)2
+(31,97 -30,73)2
+(28 -
30,73)2
+(29,1-30,73)2
+(32,8-30,73)2
+ (28,43 -30,73)2
+(30,4-30,73)2
]
SSTR= 86,80
 
 

2
x
x
r
SSBL j
i
SSBL = 10 [ (29,49 - 30,73)2
+(31,31 - 30,73)2
+(31,4 - 30,73)2
] =
SSBL = 23,23
 
 

2
x
x
SST ij
SST = (30,7- 30,73)2
+ (33,7- 30,73)2
+(30,5- 30,73)2
+(29,1- 30,73)2
+(30,6- 30,73)2
+(32,6-
30,73)2
+(30,0- 30,73)2
+(32,2- 30,73)2
+(30,5- 30,73)2
+(31,9- 30,73)2
+(34,6- 30,73)2
+(33,5-
30,73)2
+... +(33,2- 30,73)2
SST= 134,07
SSE = SST - SSTR- SSBL
SSE= 134,07 - 86,80- 23,23
SSE= 24,04
MSTR = SSTR/r-1 = 86,80/9 = 9,64
MSBL = SSBL/c-1 = 23,23/2 = 11,61
MSE = SSE/(r-1)(c-1) = 24,04/18 = 1,33
Lotes
Fcalc lotes = MSTR / MSE
Fcalc lotes = 9,64 / 1,33
FCalc lotes = 7,25
Fcalc lotes > Ftab → 7,25 > 2.4563→ Se Rechaza la H0
Métodos
Fcalc métodos = MSBL / MSE
Fcalc métodos = 11,61/ 1,33
FCalc métodos = 8,72
Fcalc métodos > Ftab → 8,72 > 3.5546 → Se Rechaza la H0
5.- Análisis para lotes:
Se Rechaza la H0 que establece que la resistencia promedio del concreto es igual inde-
pendientemente del tipo de lote. Por lo tanto, las diferencias en los lotes influyen significa-
tivamente en la resistencia promedio del concreto. Esto a un nivel de significancia de 0,05.
Análisis para métodos:
Se Rechaza la H0 que establece que la resistencia promedio del concreto es igual inde-
pendientemente del tipo de método que se utilice. Por lo tanto, las diferencias en los mé-
todos influyen significativamente en la resistencia promedio del concreto. Esto a un nivel
de significancia de 0,05.
Modelo Cuadrado Latino
El diseño cuadro latino se usa cuando se tienen tres factores a evaluar en una misma uni-
dad experimental. Se llama cuadro latino porque los factores deben tener el mismo núme-
ro de niveles o matriz cuadrada (4*4 o 5*5) y porque se usan letras latinas para denominar
los tratamientos (A, B, C...).
Ejercicio 3. Se quiere estudiar el efecto de 5 diferentes catalizadores (A, B, C, D y E) so-
bre el tiempo de reacción de un proceso químico. Cada lote de material sólo permite 5
corridas y cada corrida requiere aproximadamente 1,5 horas, por lo que sólo se pueden
realizar 5 corridas diarias. El experimentador decide correr los experimentos con un dise-
ño en cuadrado latino, para controlar activamente a los lotes y días. Los datos obtenidos
son:
LOTE DÍA
1 2 3 4 5
1 A/8 B/7 D/1 C/7 E/3
2 C/11 E/2 A/7 D/3 B/8
3 B/4 A/9 C/10 E/1 D/5
4 D/6 C/8 E/6 B/6 A/10
5 E/4 D/2 B/3 A/8 C/8
Solución
 Variable del estudio (variable dependiente): Tiempo de reacción de un proceso quími-
co (hr).
 Tamaño de la muestra: 25 muestras.
 Unidad Experimental: Catalizadores.
 Factor o Tratamiento (variables independientes): Catalizadores - Lotes - Días (son
cualitativas).
 Nivel del Factor: (5) catalizadores - (5) lotes - (5) días.
1. H0: μcatalizador 1= μcatalizador 2 = μcatalizador 3 = μcatalizador 4 =μcatalizador 5
H1: Al menos dos de las μ son ≠
H0: μlote 1= μlote 2 = μlote 3 = μlote 4 =μlote 5
H1: Al menos dos de las μ son ≠
H0: μdía 1= μdía 2 = μdía 3 = μdía 4 =μdía 5
H1: Al menos dos de las μ son ≠
2.- α = 0,05.
Para catalizadores (A,B,C,D yE), lotes (filas r) y días (columnas c) el valor tabulado
es el mismo dado que es una matriz cuadrada.
ϑ1 = r-1 = 5-1 = 4
ϑ2 = (r-1) (r-2) = (5-1)(5-2) = (4)(3)= 12.
Por Tabla F0,05, 9,18 = 3.2592
3.- Región crítica para Catalizadores
Fcalc catalizadores > 3.2592
Región crítica para Lotes
Fcalc lotes > 3.2592
Región crítica para Días
Fcalc días > 3.2592
4.- Calcular F (Completar el Cuadro 2 siguiendo las fórmulas)
Fuente de va-
riación
g. l.
Suma de
Cuadrados
Cuadrados Medios
Estadístico de
prueba (F)
Intermuestral
(Tratamiento)
r-1 SSTR MSTR=SSTR/(r-1)
F1=MSTR/MSE
F2=MSBL/MSE
F3=MSCL/MSE
Intermuestral
(Fila)
r-1 SSBL MSFL=SFBL/(r-1)
Intermuestral
(Columna)
r-1 SSCL MSCL=SSCL/(r-1)
Intramuestral
(Error)
(r-1)(r-2) SSE MSE=SSE/(r-1)(r-2)
Total SST
 
 

 2
2
_
_
)
/
1
( C
os
tratamient
de
Suma
r
SSTR , donde 

 ij
x
r
C )
/
1
(
 
 

 2
2
_
_
)
/
1
( C
filas
de
Suma
r
SSBL ;  
 

 2
2
_
_
)
/
1
( C
columnas
de
Suma
r
SSCL ;
 
 2
2
C
x
SST ij ;
SSCL
SSBL
SSTR
SST
SSE 



Suma de Cuadrados del Tratamiento (catalizadores)
 


 2
2
_
_
)
/
1
( C
o s
t r
d e
S u
r
S S
Suma de Cuadrados de filas (lotes)
 



 2
2
_
_
)
/
1
( C
f i
d e
S u
r
S S B
Suma de Cuadrados de columnas (días)
Suma de Cuadrados Total


 2
2
C
x
S S T
i j
Suma de Cuadrados del Error
SST= SSTR+SSBL+SSCL+SSE
SSE= SST- SSTR-SSBL-SSCL
SSE= 206,64-141,44-15,44-12,24
SSE=37,52
Cuadrados Medios
Valores Calculados de F
5.- Análisis
FCalc catalizador = 11,31
Fcalc catalizador > Ftab → 11,31 > 3.2592→ Se Rechaza la H0
Se Rechaza la H0 que establece que el tiempo promedio de reacción de un proceso
químico es igual independientemente del tipo de catalizador que se utilice. Por lo tanto,
las diferencias en los catalizadores influyen significativamente en el tiempo promedio de
reacción de un proceso químico. Esto a un nivel de significancia de 0,05.
FCalc lotes = 1,23
Fcalc lotes < Ftab → 1,23 < 3.2592→ Se Acepta la H0
Se Acepta la H0 que establece que el tiempo promedio de reacción de un proceso
químico es igual independientemente del lote que se utilice. Por lo tanto, las diferencias
en los lotes no influyen significativamente en el tiempo promedio de reacción de un pro-
ceso químico. Esto a un nivel de significancia de 0,05.
FCalc días = 0,98
Fcalc días < Ftab → 0,98 < 3.2592→ Se Acepta la H0
Se Acepta la H0 que establece que el tiempo promedio de reacción de un proceso
químico es igual independientemente del día. Por lo tanto, las diferencias en los días no
influyen significativamente en el tiempo promedio de reacción de un proceso químico. Es-
to a un nivel de significancia de 0,05.

Más contenido relacionado

PPTX
Análisis conformacional
DOC
Experimento De Clement Y Desormes
PDF
Ejercicios cuadrados greco latinos ejercicio 3
PPTX
Graficos de control
PDF
Análisis de la variación de la viscosidad cinematica de un aceite vegetal en ...
PPTX
Metodos iterativos
PPTX
Otras cartas de control
PPTX
Proc sep iii destilacion instantánea
Análisis conformacional
Experimento De Clement Y Desormes
Ejercicios cuadrados greco latinos ejercicio 3
Graficos de control
Análisis de la variación de la viscosidad cinematica de un aceite vegetal en ...
Metodos iterativos
Otras cartas de control
Proc sep iii destilacion instantánea

La actualidad más candente (20)

PPTX
Cálculo de espesor óptimo
DOCX
La lixiviación
DOC
Ejercicios de transferencia de calor
DOCX
205938300 problemas-de-diseno-de-reactores
PPTX
Clase 8 y 9 cap 10
PPTX
Ejercicio 2 solemne pms
PPT
Termodinamica
PDF
Operaciones unitarias.
PDF
Investigacion de torres de enfriamiento
PPTX
13 Diseño Robusto (Taguchi)
PPTX
Ejercicio maquinas hidraulicas
PDF
Herramientas de analisis de los procesos tecnológicos. balance de materia
DOCX
Coeficiente De Joule Y Thomson
PPTX
Termoquímica
DOCX
Método del Punto de Pliegue
PDF
Transferencia de-masa-art
PDF
Termodinamica tecnica problemas - garcía
PPT
Conducción unidimensional en estado estable
PPTX
Ingenierìa econòmica , orìgen , caracterìticas e importancia.
Cálculo de espesor óptimo
La lixiviación
Ejercicios de transferencia de calor
205938300 problemas-de-diseno-de-reactores
Clase 8 y 9 cap 10
Ejercicio 2 solemne pms
Termodinamica
Operaciones unitarias.
Investigacion de torres de enfriamiento
13 Diseño Robusto (Taguchi)
Ejercicio maquinas hidraulicas
Herramientas de analisis de los procesos tecnológicos. balance de materia
Coeficiente De Joule Y Thomson
Termoquímica
Método del Punto de Pliegue
Transferencia de-masa-art
Termodinamica tecnica problemas - garcía
Conducción unidimensional en estado estable
Ingenierìa econòmica , orìgen , caracterìticas e importancia.
Publicidad

Similar a Guía de estudio ANOVA (20)

PPT
Teoria Analisis de Varianza.ppt.........
DOCX
Investigacion hipotesis (ji) rest 1
DOCX
Investigacion hipotesis (ji) rest 1
PPT
Web
PDF
Estadistica 2
PPTX
Serie bidiomensionales y cronologica
PPTX
Serie bidimensionales y cronologica
PDF
PDF
Ayudantía de eiq344.diseño completamente al azar.
PPTX
Mic sesión 8b
DOCX
Distribuciones de probabilidad
DOCX
Planteamiento de Hipótesis para dos poblaciones (WORD)
PPTX
Experimentacion factorial
PPTX
PDF
Chi cuadrado
DOCX
DOCX
Taller en clase diseño de experimentos
PPT
Laminas series bidimensionales y cronologicas
PPT
Laminas series bidimensionales y cronologicas
Teoria Analisis de Varianza.ppt.........
Investigacion hipotesis (ji) rest 1
Investigacion hipotesis (ji) rest 1
Web
Estadistica 2
Serie bidiomensionales y cronologica
Serie bidimensionales y cronologica
Ayudantía de eiq344.diseño completamente al azar.
Mic sesión 8b
Distribuciones de probabilidad
Planteamiento de Hipótesis para dos poblaciones (WORD)
Experimentacion factorial
Chi cuadrado
Taller en clase diseño de experimentos
Laminas series bidimensionales y cronologicas
Laminas series bidimensionales y cronologicas
Publicidad

Más de Liliana Salomon (8)

PDF
Prueba de Hipótesis
PDF
Tema 4 tamaño muestral
PDF
Tema 3. Estimación Paramétrica
PDF
Guía de estudio distribuciones muestrales 1
PDF
Diseños muestrales
PDF
Aplicación Estadística Inferencial
PDF
Guía de estudio. Distribuciones muestrales
PDF
Tema 2. aplicación estadística inferencial (1)
Prueba de Hipótesis
Tema 4 tamaño muestral
Tema 3. Estimación Paramétrica
Guía de estudio distribuciones muestrales 1
Diseños muestrales
Aplicación Estadística Inferencial
Guía de estudio. Distribuciones muestrales
Tema 2. aplicación estadística inferencial (1)

Último (20)

PDF
FUNCION CUADRATICA FUNCIONES RAIZ CUADRADA
PDF
LIBRO UNIVERSITARIO SISTEMAS PRODUCTIVOS BN.pdf
PDF
Sugerencias Didacticas 2023_Diseño de Estructuras Metalicas_digital.pdf
PPTX
clase MICROCONTROLADORES ago-dic 2019.pptx
PPTX
1 CONTAMINACION AMBIENTAL EN EL PLANETA.pptx
PPTX
Logging While Drilling Ingenieria Petrolera.pptx
PPTX
Riesgo eléctrico 5 REGLAS DE ORO PARA TRABAJOS CON TENSION
PPTX
leyes de los gases Ideales. combustible refinación
PPTX
Presentacion ppt rx en soldadura tp 231 vladimir Osuna 7114958 20241.pptx
PPTX
PRESENTACION DIAPOSITIVA PARA UN PROYECTO .pptx
PDF
ntc5951 Metodo de ensayo para determinar las propiedades de tension en plasti...
PDF
LIBRO UNIVERSITARIO INTELIGENCIA ALGORITMICA BN.pdf
DOCX
Cumplimiento normativo y realidad laboral
PDF
SESION 10 SEGURIDAD EN TRABAJOS CON ELECTRICIDAD.pdf
PPTX
LEVANTAMIENTOS TOPOGRAFICOS - DIAPOSITIVAS
PPTX
TECNOLOGIA EN CONSTRUCCION PUBLICO Y PRIVADA
PPTX
CNE-Tx-ZyD_Comite_2020-12-02-Consolidado-Version-Final.pptx
PPTX
MANEJO DE QUIMICOS Y SGA GRUPO Mnsr Aleman.pptx
PDF
silabos de colegio privado para clases tema2
PDF
Curso Introductorio de Cristales Liquidos
FUNCION CUADRATICA FUNCIONES RAIZ CUADRADA
LIBRO UNIVERSITARIO SISTEMAS PRODUCTIVOS BN.pdf
Sugerencias Didacticas 2023_Diseño de Estructuras Metalicas_digital.pdf
clase MICROCONTROLADORES ago-dic 2019.pptx
1 CONTAMINACION AMBIENTAL EN EL PLANETA.pptx
Logging While Drilling Ingenieria Petrolera.pptx
Riesgo eléctrico 5 REGLAS DE ORO PARA TRABAJOS CON TENSION
leyes de los gases Ideales. combustible refinación
Presentacion ppt rx en soldadura tp 231 vladimir Osuna 7114958 20241.pptx
PRESENTACION DIAPOSITIVA PARA UN PROYECTO .pptx
ntc5951 Metodo de ensayo para determinar las propiedades de tension en plasti...
LIBRO UNIVERSITARIO INTELIGENCIA ALGORITMICA BN.pdf
Cumplimiento normativo y realidad laboral
SESION 10 SEGURIDAD EN TRABAJOS CON ELECTRICIDAD.pdf
LEVANTAMIENTOS TOPOGRAFICOS - DIAPOSITIVAS
TECNOLOGIA EN CONSTRUCCION PUBLICO Y PRIVADA
CNE-Tx-ZyD_Comite_2020-12-02-Consolidado-Version-Final.pptx
MANEJO DE QUIMICOS Y SGA GRUPO Mnsr Aleman.pptx
silabos de colegio privado para clases tema2
Curso Introductorio de Cristales Liquidos

Guía de estudio ANOVA

  • 1. UNIVERSIDAD NACIONAL EXPERIMENTAL DE GUAYANA DEPARTAMENTO DE CIENCIA Y TECNOLOGÍA AREA: MATEMÁTICA ASIGNATURA: ESTADÍSTICA II GUÍA DE ESTUDIO Nº 4 ANÁLISIS DE VARIANZA 1. Introducción al tema El análisis de la varianza (ANOVA) permite contrastar la hipótesis nula de que las medias (μ) de más de dos poblaciones (K >2) son iguales, frente a la hipótesis alternativa de que por lo menos una de las poblaciones difiere de las demás en cuanto a su valor esperado. Esta comprobación la realiza partiendo del análisis de la varianza o dispersión encontra- da. Este contraste es fundamental en ingeniería para el análisis de resultados experimentales, en los que interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto a la variable dependiente o de interés. Las hipótesis siempre son planteadas de la siguiente manera: H0: μ1= μ2 = μ3=...μK H1: Al menos dos de las μ son ≠ Los modelos de ANOVA (Analysis of Variance) son técnicas de Análisis Multivariante de dependencia, que se utilizan para analizar datos procedentes de diseños con una o más variables independientes cualitativas medidas en escalas nominales u ordinales (tipo de material, habilidad del programador, tipo de software o hardware); y una variable depen- diente cuantitativa medida con una escala de intervalo o de razón (tiempo, resistencia, rapidez, entre otras). En este contexto, las variables independientes se suelen denominar factores (y sus dife- rentes estados posibles o valores son niveles o tratamientos) y la variable dependiente se conoce como variable de respuesta o variable de estudio (tiempo, resistencia, rapidez, entre otras).
  • 2. Los modelos ANOVA permiten, básicamente, comparar los valores medios que toma la variable dependiente en K poblaciones en las que los niveles de factores son distintos, con la finalidad de determinar si existen diferencias significativas según dichos niveles o si, por el contrario, la respuesta en cada población es independiente de los niveles de fac- tores. Se trata, por tanto, de un contraste paramétrico que extiende al caso de K poblaciones el contraste de la igualdad de medias entre dos poblaciones independientes. El Anova requiere el cumplimiento de los siguientes supuestos:  Las muestras o grupos analizados deben seguir una distribución Normal. Las pobla- ciones (distribuciones de probabilidad de la variable dependiente correspondiente a cada factor) son normales.  Las K muestras sobre las que se aplican los tratamientos son independientes. Los in- dividuos estudiados han de ser independientes unos de otros.  Las muestras o grupos objeto de estudio deben haberse obtenido de forma aleatoria.  Las poblaciones tienen todas igual varianza (homoscedasticidad). 2. Aplicación del ANOVA en ingeniería El Análisis de Varianza es un extensión paramétrica de la Prueba de Hipótesis para la comparación de dos poblaciones, ya que permite comparar K poblaciones en un solo mo- delo. Para explicar mejor la utilidad en la aplicación del ANOVA en la ingeniería, se plan- tean 3 ejemplos: Ejemplo 1. La rapidez de desplazamiento en la pantalla es una consideración importante en el desarrollo de tarjetas gráficas a color. Se emprende un estudio para comparar el tiempo, en seg, necesarios para desplazarse una pantalla en documentos de Microsoft Word con 5 tarjetas gráficas a color distintas en monitores de 24 pulg. La prueba empren- dida es la de rendimiento Hydra Quick Draw. Se obtienen los datos siguientes: A B C D E 30.5 48.3 79.2 51.6 79.0 32.4 42.1 84.7 59.4 85.3 27.2 43.5 85.0 57.3 86.2 26.3 40.6 88.2 59.0 82.0 25.1 38.6 76.3 58.7 87.2 38.2 32.1 83.1 68.1 81.7 30.6 41.6 92.6 64.8 93.5 33.7 38.8 88.5 55.5 89.1
  • 3. Para este estudio o experimento, el objetivo es comprobar si el tiempo promedio (en seg), necesario para desplazarse una pantalla en documentos de Microsoft Word se ve afecta- do por el tipo de tarjeta gráfica a color. En donde:  Variable del estudio (variable dependiente): Rapidez o tiempo (seg) (siempre es cuan- titativa).  Tamaño de la muestra: 40 tiempos.  Unidad Experimental: Monitor de 24 pulg.  Factor o Tratamiento (variable independiente): Tipo de Tarjeta Gráfica a Color (es cua- litativa).  Nivel del Factor: (5) tipos de tarjetas gráficas a color. Para este caso se estaría comprobando la hipótesis. Hipótesis 1. La rapidez promedio (seg) de desplazamiento en la pantalla en documentos de Microsoft Word es igual idependientemente del tipo de tarjeta gráfica a color que se utilice. H0: μTarjeta 1= μTarjeta 2 = μTarjeta 3 = μTarjeta 4 = μTarjeta 5 H1: Al menos dos de las μ son ≠ Ejemplo 2. Un Ingeniero sospecha que el acabado superficial de ciertas piezas de metal está influenciado por el tipo de pintura utilizada y el tiempo de secado. El ingeniero selec- ciona tres tiempos de secado (20 – 25 y 30 minutos) y emplea dos tipos de pintura. Se prueban tres piezas con cada combinación de tipo de pintura y tiempos de secado. Los datos son los siguientes: PINTURA TIEMPOS DE SECADO (MIN) 20 25 30 1 74 73 78 2 92 98 66 Para este estudio o experimento, el objetivo es comprobar si el tipo de pintura y el tiempo de secado influye significativamente en el acabado de la pieza de metal medido en %, entendiendo que a mayor porcentaje, mejor es el acabado. En donde:  Variable del estudio (variable dependiente): Acabado de la pieza de metal (%) (siem- pre es cuantitativa).  Tamaño de la muestra: 6 piezas de metal.  Unidad Experimental: Piezas de metal.
  • 4.  Factor o Tratamiento (variables independientes): Tipo de pintura y tiempo de secado (son cualitativas).  Nivel del Factor: (2)tipos de pintura - (3) tiempos de secado Para este caso se estarían comprobando dos hipótesis. Hipótesis 1. El porcentaje de acabado promedio de las piezas es igual, independiente- mente del tipo de pintura que se utilice. H0: μPintura 1= μPintura 2 H1: Al menos dos de las μ son ≠ Hipótesis 2. El porcentaje de acabado promedio de las piezas es igual, independiente- mente del tiempo de secado que se emplee. H0: μ20min= μ25min = μ30min H1: Al menos dos de las μ son ≠ Ejemplo 3. Se realiza un experimento para investigar la diferencia entre los tiempos me- dios para ensamblar cuatro dispositivos electrónicos distintos, T1, T2, T3 y T4. Hay dos fuentes de variación no deseada que afectan la respuesta: la variación entre las personas y el efecto de la fatiga si una persona ensambla una serie de dispositivos durante cierto tiempo. Por consiguiente 4 ensambladores, fueron seleccionados y cada uno ensambla los 4 dispositivos T1, T2, T3 y T4, de acuerdo al siguiente diseño en cuadrado latino. POSICIÓN EN LA SE- CUENCIA DE ENSAM- BLAJE ENSAMBLADORES TOTAL 1 T3 44 T1 41 T2 30 T4 40 155 2 T2 41 T3 42 T4 49 T1 49 181 3 T1 59 T4 41 T3 59 T2 34 193 4 T4 58 T2 37 T1 53 T3 59 207 TOTAL 202 161 191 182 736 En donde:  Variable del estudio (variable dependiente): Tiempo medio para ensamblar dispositivos electrónicos (minutos) (siempre es cuantitativa).  Tamaño de la muestra: 16 ensamblajes o procesos de ensamblajes del dispositvo electrónico.  Unidad Experimental: Dispositivo electrónico.
  • 5.  Factor o Tratamiento (variables independientes): Diferentes dispositivos electrónicos - Diferentes habilidades de los trabajadores - Diferentes posición en la secuencia (son cualitativas).  Nivel del Factor: (4) Dispositivos electrónicos - (4)Ensambladores - (4) posiciones en la secuencia de ensamblaje. Hipótesis 1. ¿Proporcionan los datos suficiente evidencia que indique que hay diferencia entre los tiempos medios de ensamblaje correspondiente a los dispositivos? H0: μT1= μT2 =μT3= μT4 H1: Al menos dos de las μ son ≠ Hipótesis 2. ¿Proporcionan los datos suficiente evidencia que indique que hay diferencia entre los tiempos medios de ensamblaje correspondiente a las personas? H0: μEnsam.1= μEnsam.2 =μEnsam.3 = μEnsam.4 H1: Al menos dos de las μ son ≠ Hipótesis3. ¿Proporcionan los datos suficiente evidencia que indique que hay diferencia entre los tiempos medios de ensamblaje correspondiente a las posiciones en la secuen- cia de ensamblaje? H0: μP1= μP2 =μP3= μP4 H1: Al menos dos de las μ son ≠ Ahora bien, para la comprobación de estas hipótesis el ANOVA o Análisis de Varianza, como su nombre lo indica, requiere del análisis de las fuentes de variación que existen. Se analiza la relación entre las llamadas medias cuadráticas inter-grupos (entre grupos) y medias cuadráticas intra-grupos (dentro de los grupos) , que deben ser iguales si las me- dias de las poblaciones lo son, por lo que requiere la aplicación de la Distribución Muestral F. A continuación su descripción. 3. Distribución F Usada en teoría de probabilidad y estadística, la distribución F es una distribución de pro- babilidad continua. También se la conoce como distribución F de Snedecor (por George Snedecor) o como distribución F de Fisher-Snedecor. La aplicación de la Distribución F se encuentra en la comparación de varianzas mues- trales y en problemas que implican dos o más muestras. El estadístico F se define como
  • 6. la razón de dos variables aleatorias chi cuadradas independientes, dividida cada una en- tre su número de grados de libertad. Sus características son:  La variable aleatoria F es no negativa, ya que ambos términos de la razón F están ele- vados al cuadrado.  La distribución tiene un sesgo hacia la derecha. Dominio de x es de 0 a infinito.  La forma de cada distribución de muestreo teórico F depende del número de grados de libertad que estén asociados a ella. Tanto el numerador como el denominador tie- nen grados de libertad relacionados.  La función de distribución Fisher está directamente relacionada con la función Chi- cuadrado, en tanto que F es producto de un cociente entre dos valores correspondien- tes a esta distribución. Uso de la Tabla F Se obtiene el valor F en ubicando primero la Tabla correspondiente al nivel de significacn- cia establecido (Ej. α=0,01 o α=0,05). Posteriormente se ubica los grados de libertad del numerador en la parte superior de la tabla (ϑ1 = K-1) y los grados de libertad del denomi- nador en la columna lateral de la tabla (ϑ2 = n -K). Utilizando la Tabla 1 (Anexo A) de un nivel de significación de 0,05 y para (ϑ1 = 2) y (ϑ2 = 10), el valor de F es 4.1028 4. Modelos ANOVA Aunque existen muchos modelos de ANOVA, puede obtenerse una clasificación bastante simple de los mismos atendiendo a tres criterios: el número de factores, el tipo de mues- treo efectuado sobre los niveles de los factores y el tipo de aleatorización utilizada para seleccionar las muestras representativas de cada población y agrupar las unidades expe- rimentales en los distintos grupos que se desea comparar.  Según el número de factores, se llama ANOVA de un factor al modelo en el que existe una única variable independiente; en cambio, si el modelo consta de más de un factor se le denomina modelo factorial o se habla de Análisis de Varianza Factorial.  En cuanto al muestreo de niveles, se refiere a la forma de establecer los niveles de cada factor. Esto depende, normalmente, de los intereses del investigador. Si se fijan únicamente aquellos niveles del factor que realmente interesa estudiar, se está ante
  • 7. un modelo de ANOVA de efectos fijos (también llamado modelo I), mientras que si los niveles se seleccionan aleatoriamente de entre todos los posibles, se trata de un mo- delo ANOVA de efectos aleatorios (o modelo II).  Las distinciones basadas en el tipo de aleatorización son equivalentes a las que se establecen al hablar de muestras independientes y muestras relacionadas. Como en todo experimento estadístico en el que no resulta posible trabajar con la población en su totalidad, se deben elegir muestras aleatorias y asignarse también aleatoriamente sus elementos a los diferentes niveles o tratamientos, para asegurar que no se come- tan errores sistemáticos. Si las unidades experimentales reaccionan o responden a los tratamientos de la misma manera, se dice que son homogéneas. Por el contrario si responden de diferente manera a los tratamientos debido a sus diferencias intrínsecas, se dirán heterogéneas.  Por otra parte, el tamaño de las muestras puede ser o no el mismo. Un diseño es equi- librado o balanceado si todas las muestras tienen el mismo tamaño y no equilibrado o no balanceado en caso contrario. El ANOVA se basa en la descomposición de la variación total de los datos con respecto a la media global (SST), que bajo el supuesto de que H0 es cierta es una estimación obteni- da a partir de toda la información muestral, en dos partes:  Variación dentro de las muestras (SSTR) o Intra-grupos, cuantifica la dispersión (va- rianza) de los valores de cada muestra con respecto a sus correspondientes medias.  Variación entre muestras (SSE) o Inter-grupos, cuantifica la dispersión de las medias de las muestras con respecto a la media global. Procedimiento de ANOVA Como el ANOVA es una prueba de hipótesis de igualdad de más de dos medias poblacio- nales, emplea el mismo procedimiento visto en el tema anterior: 1. Establecer las hipótesis nula y alternativa. Siempre la H0 se plantea en función de la igualdad de medias y H1 en función de diferencia de por lo menos dos medias. H0: μ1= μ2 =μ3...= μk H1: Al menos dos de las μ son ≠
  • 8. 2. Ubicar el valor tabulado del estadístico de prueba, que en este caso es Distribución F (valor de F en tabla) para un nivel de confianza (α =0,05) y los grados de libertad del numerador (ϑ1 = k-1) y los grados de libertad del denominador (ϑ2 = n-k). En donde k es el número de tratamientos o renglón (r) y n es el número total de muestras o datos. Fα, ϑ1, ϑ2 3. Establecer el área crítica o región de rechazo. Si Fcalc> Ftab se rechaza la hipótesis nula. 4. Calcular el Estadístico de Prueba (Fcalc). Fcalc= MSTR/MSSE 5. Analizar en función del Rechazo o Aceptación de la H0. Modelo Completamente Aleatorizado Este modelo es el más sencillo del diseño de experimentos, en el cual la variable respues- ta (variable de estudio o dependiente) puede depender de la influencia de un único fac- tor (variable independiente), de forma que el resto de las causas de variación se englo- ban en el error experimental. Se supone que el experimento ha sido aleatorizado por completo, es decir, todas las uni- dades experimentales han sido asignadas al azar a los tratamientos. Ejercicio 1. Las siguientes cifras representan los errores cometidos en 5 semanas suce- sivas por cuatro técnicos que trabajan en un laboratorio químico: TÉCNICO I 13 16 12 14 15 TÉCNICO II 14 16 11 19 15 TÉCNICO III 13 18 16 14 18 TÉCNICO IV 18 10 14 15 12 Demuestre en el nivel de significancia de 0.05, si las diferencias entre las 4 medias de la muestra pueden atribuirse al azar. Solución  Variable del estudio (variable dependiente): N° de errores cometidos.  Tamaño de la muestra: 20 semanas.  Unidad Experimental: Técnicos.  Factor o Tratamiento (variable independiente): Habilidad de losTécnicos (es cualitati- va).
  • 9.  Nivel del Factor: (4) Técnicos. 1.- H0: μTécnico 1= μTécnico 2 = μTécnico 3 = μTécnico 4 H1: Al menos dos de las μ son ≠ 2.- α = 0,05. Con ϑ1 = k-1 = 4-1 = 3 y ϑ2 = n-k = 20-4 = 16. Por Tabla F0,05, 3,16 = 3.2389 3.- Región crítica Fcalc > 3.2389 4.- Calcular F (Completar el Cuadro 1 siguiendo las fórmulas) Fuente de va- riación Grados de libertad Suma de Cuadrados Cuadrados Medios Estadístico de prueba (F) Intermuestral (Tratamiento) r-1 SSTR MSTR=SSTR/(r-1) F=MSTR/MSE Intramuestral (Error) n-r SSE MSE=SSE/(n-r) Total n-1 SST      2 x x n SSTR i i ;      2 x x SST ij ; SSTR SST SSE   donde: ni : número de muestras por tratamiento r: número de tratamientos (k) X : media del tratamiento i X : media total o medias de las medias X 1 13 16 12 14 15 5 14       / X 3 13 18 16 14 18 5 15 8       / , X 4 18 10 14 15 12 5 13 8       / , X = 14+15+15,8+13,8 / 4 =14,65      2 x x n SSTR i i SSTR = 5 [ (14-14,65)2 + (15-14,65)2 + (15,8-14,65)2 + (13,8-14,65)2 ]
  • 10. SSTR= 12,95      2 x x SST ij SST = (13-14,65)2 + (16-14,65)2 + (12-14,65)2 + (14-14,65)2 + (15-14,65)2 + (14-14,65)2 + (16- 14,65)2 + (11-14,65)2 + (19-14,65)2 + (15-14,65)2 + (13-14,65)2 + (18-14,65)2 + (16-14,65)2 + (14- 14,65)2 + (18-14,65)2 +(18-14,65)2 + (10-14,65)2 + (14-14,65)2 + (15-14,65)2 + (12-14,65)2 = SST= 114,5 SSE = SST - SSTR SSE= 114,5 - 12,95 SSE= 101,55 MSTR = SSTR/r-1 = 12,95/3 = 9,32 MSE = SSE/n-r = 101,55/16 = 6,35 FCalc = 9,32/6,35 FCalc = 0,68 FCalc < Ftab → 0,68< 3.2389 → Se acepta la H0 5.- Se acepta la H0 que establece que los errores promedios de los técnicos es igual in- dependientemente de la habilidad del técnico. Esto a un nivel de significancia de 0,05. Modelo de Bloque Aleatorizado Es un Plan para reunir datos en el que cada uno de los K tratamientos se miden una vez en cada uno de los b bloques. El orden de los tratamientos dentro de los bloques es alea- torio. Ejercicio 2. La resistencia del concreto utilizado en la construcción comercial tiende a variar de un lote a otro. En consecuencia, se “curan” pequeños cilindros de prueba de concreto muestreados de cada lote, durante periodos aproximados hasta de 28 días en ambientes de temperatura y humedad controladas, antes de determinar la resistencia. Así el concreto se “compra y vende con base en resistencia de cilindros de prueba” (Método estándar de prueba ASTM C31 para fabricar y curar especímenes de prueba de concreto en el campo). Los datos siguientes se obtuvieron en un experimento efectuado para com- parar tres métodos distintos de curado respecto a la resistencia a la compresión, en Mpa. Analice estos datos a un nivel de significancia de 0.01.
  • 11. LOTE MÉTODO A MÉTODO B MÉTODO C X Lotes 1 30.7 33.7 30.5 31,63 2 29.1 30.6 32.6 30,77 3 30.0 32.2 30.5 30,9 4 31.9 34.6 33.5 33,33 5 30.5 33.0 32.4 31,97 6 26.9 29.3 27.8 28 7 28.2 28.4 30.7 29,1 8 32.4 32.4 33.6 32.8 9 26.6 29.5 29.2 28,43 10 28.6 29.4 33.2 30,4 X Métodos 29,49 31,31 31,4 30,73 X = 30,73 Solución  Variable del estudio (variable dependiente): Resistencia del concreto.  Tamaño de la muestra: 30 muestras.  Unidad Experimental: Cilindros de Prueba.  Factor o Tratamiento (variables independientes): Lotes - Métodos (son cualitativas).  Nivel del Factor: (10) Lotes - (3) Métodos. 1. H0: μlote1= μlote 2 = μlote 3 = μlote 4 =μlote 5= μlote 6 = μlote 7 = μlote 8 = μlote 9= μlote 10 H1: H1: Al menos dos de las μ son ≠ H0: μmétodo1= μmétodo 2 = μmétodo 3 H1: H1: Al menos dos de las μ son ≠ 2.- α = 0,05. Para Lotes (filas r) ϑ1 = r-1 = 10-1 = 9 ϑ2 = (r-1) (c-1) = (10-1)(3-1) = (9)(2)= 18. Por Tabla F0,05, 9,18 = 2.4563 Para Métodos (columnas c) ϑ1 = c-1 = 3-1 = 2 ϑ2 = (r-1) (c-1) = (10-1)(3-1) = (9)(2)= 18. Por Tabla F0,05, 2,18 = 3.5546 3.- Región crítica para Lotes
  • 12. Fcalc lotes > 2.4563 Región crítica para Métodos Fcalc métodos > 3.5546 4.- Calcular F (Completar el Cuadro 2 siguiendo las fórmulas) Fuente de va- riación g. l. Suma de Cuadrados Cuadrados Medios Estadístico de prueba (F) Intermuestral (Tratamiento) r-1 SSTR MSTR=SSTR/(r-1) F1=MSTR/MSE F2=MSBL/MSE Intermuestral (Bloque) c-1 SSBL MSBL=SSBL/(c-1) Intramuestral (Error) (r-1)(c-1) SSE MSE=SSE/(r-1)(c-1) Total c.r-1 SCT      2 x x c SSTR i j ;      2 x x r SSBL j i ;      2 x x SST ij SSE SSBL SSTR SST    SSBL SSTR SST SSE    donde: ni : número de muestras por tratamiento r: número de tratamientos (lotes) c: número de bloques (métodos) Xi : media del tratamiento i X j : media del bloque j X : media total o medias de las medias X : 30,73      2 x x c SSTR i j SSTR = 3[(31,63-30,73)2 +(30,77-30,73)2 +(30,9-30,73)2 +(33,33-30,73)2 +(31,97 -30,73)2 +(28 - 30,73)2 +(29,1-30,73)2 +(32,8-30,73)2 + (28,43 -30,73)2 +(30,4-30,73)2 ] SSTR= 86,80      2 x x r SSBL j i SSBL = 10 [ (29,49 - 30,73)2 +(31,31 - 30,73)2 +(31,4 - 30,73)2 ] = SSBL = 23,23      2 x x SST ij
  • 13. SST = (30,7- 30,73)2 + (33,7- 30,73)2 +(30,5- 30,73)2 +(29,1- 30,73)2 +(30,6- 30,73)2 +(32,6- 30,73)2 +(30,0- 30,73)2 +(32,2- 30,73)2 +(30,5- 30,73)2 +(31,9- 30,73)2 +(34,6- 30,73)2 +(33,5- 30,73)2 +... +(33,2- 30,73)2 SST= 134,07 SSE = SST - SSTR- SSBL SSE= 134,07 - 86,80- 23,23 SSE= 24,04 MSTR = SSTR/r-1 = 86,80/9 = 9,64 MSBL = SSBL/c-1 = 23,23/2 = 11,61 MSE = SSE/(r-1)(c-1) = 24,04/18 = 1,33 Lotes Fcalc lotes = MSTR / MSE Fcalc lotes = 9,64 / 1,33 FCalc lotes = 7,25 Fcalc lotes > Ftab → 7,25 > 2.4563→ Se Rechaza la H0 Métodos Fcalc métodos = MSBL / MSE Fcalc métodos = 11,61/ 1,33 FCalc métodos = 8,72 Fcalc métodos > Ftab → 8,72 > 3.5546 → Se Rechaza la H0 5.- Análisis para lotes: Se Rechaza la H0 que establece que la resistencia promedio del concreto es igual inde- pendientemente del tipo de lote. Por lo tanto, las diferencias en los lotes influyen significa- tivamente en la resistencia promedio del concreto. Esto a un nivel de significancia de 0,05. Análisis para métodos: Se Rechaza la H0 que establece que la resistencia promedio del concreto es igual inde- pendientemente del tipo de método que se utilice. Por lo tanto, las diferencias en los mé- todos influyen significativamente en la resistencia promedio del concreto. Esto a un nivel de significancia de 0,05. Modelo Cuadrado Latino
  • 14. El diseño cuadro latino se usa cuando se tienen tres factores a evaluar en una misma uni- dad experimental. Se llama cuadro latino porque los factores deben tener el mismo núme- ro de niveles o matriz cuadrada (4*4 o 5*5) y porque se usan letras latinas para denominar los tratamientos (A, B, C...). Ejercicio 3. Se quiere estudiar el efecto de 5 diferentes catalizadores (A, B, C, D y E) so- bre el tiempo de reacción de un proceso químico. Cada lote de material sólo permite 5 corridas y cada corrida requiere aproximadamente 1,5 horas, por lo que sólo se pueden realizar 5 corridas diarias. El experimentador decide correr los experimentos con un dise- ño en cuadrado latino, para controlar activamente a los lotes y días. Los datos obtenidos son: LOTE DÍA 1 2 3 4 5 1 A/8 B/7 D/1 C/7 E/3 2 C/11 E/2 A/7 D/3 B/8 3 B/4 A/9 C/10 E/1 D/5 4 D/6 C/8 E/6 B/6 A/10 5 E/4 D/2 B/3 A/8 C/8 Solución  Variable del estudio (variable dependiente): Tiempo de reacción de un proceso quími- co (hr).  Tamaño de la muestra: 25 muestras.  Unidad Experimental: Catalizadores.  Factor o Tratamiento (variables independientes): Catalizadores - Lotes - Días (son cualitativas).  Nivel del Factor: (5) catalizadores - (5) lotes - (5) días. 1. H0: μcatalizador 1= μcatalizador 2 = μcatalizador 3 = μcatalizador 4 =μcatalizador 5 H1: Al menos dos de las μ son ≠ H0: μlote 1= μlote 2 = μlote 3 = μlote 4 =μlote 5 H1: Al menos dos de las μ son ≠ H0: μdía 1= μdía 2 = μdía 3 = μdía 4 =μdía 5 H1: Al menos dos de las μ son ≠
  • 15. 2.- α = 0,05. Para catalizadores (A,B,C,D yE), lotes (filas r) y días (columnas c) el valor tabulado es el mismo dado que es una matriz cuadrada. ϑ1 = r-1 = 5-1 = 4 ϑ2 = (r-1) (r-2) = (5-1)(5-2) = (4)(3)= 12. Por Tabla F0,05, 9,18 = 3.2592 3.- Región crítica para Catalizadores Fcalc catalizadores > 3.2592 Región crítica para Lotes Fcalc lotes > 3.2592 Región crítica para Días Fcalc días > 3.2592 4.- Calcular F (Completar el Cuadro 2 siguiendo las fórmulas) Fuente de va- riación g. l. Suma de Cuadrados Cuadrados Medios Estadístico de prueba (F) Intermuestral (Tratamiento) r-1 SSTR MSTR=SSTR/(r-1) F1=MSTR/MSE F2=MSBL/MSE F3=MSCL/MSE Intermuestral (Fila) r-1 SSBL MSFL=SFBL/(r-1) Intermuestral (Columna) r-1 SSCL MSCL=SSCL/(r-1) Intramuestral (Error) (r-1)(r-2) SSE MSE=SSE/(r-1)(r-2) Total SST       2 2 _ _ ) / 1 ( C os tratamient de Suma r SSTR , donde    ij x r C ) / 1 (       2 2 _ _ ) / 1 ( C filas de Suma r SSBL ;       2 2 _ _ ) / 1 ( C columnas de Suma r SSCL ;    2 2 C x SST ij ; SSCL SSBL SSTR SST SSE     Suma de Cuadrados del Tratamiento (catalizadores)
  • 16.      2 2 _ _ ) / 1 ( C o s t r d e S u r S S Suma de Cuadrados de filas (lotes)       2 2 _ _ ) / 1 ( C f i d e S u r S S B Suma de Cuadrados de columnas (días) Suma de Cuadrados Total    2 2 C x S S T i j
  • 17. Suma de Cuadrados del Error SST= SSTR+SSBL+SSCL+SSE SSE= SST- SSTR-SSBL-SSCL SSE= 206,64-141,44-15,44-12,24 SSE=37,52 Cuadrados Medios Valores Calculados de F 5.- Análisis FCalc catalizador = 11,31 Fcalc catalizador > Ftab → 11,31 > 3.2592→ Se Rechaza la H0 Se Rechaza la H0 que establece que el tiempo promedio de reacción de un proceso químico es igual independientemente del tipo de catalizador que se utilice. Por lo tanto, las diferencias en los catalizadores influyen significativamente en el tiempo promedio de reacción de un proceso químico. Esto a un nivel de significancia de 0,05.
  • 18. FCalc lotes = 1,23 Fcalc lotes < Ftab → 1,23 < 3.2592→ Se Acepta la H0 Se Acepta la H0 que establece que el tiempo promedio de reacción de un proceso químico es igual independientemente del lote que se utilice. Por lo tanto, las diferencias en los lotes no influyen significativamente en el tiempo promedio de reacción de un pro- ceso químico. Esto a un nivel de significancia de 0,05. FCalc días = 0,98 Fcalc días < Ftab → 0,98 < 3.2592→ Se Acepta la H0 Se Acepta la H0 que establece que el tiempo promedio de reacción de un proceso químico es igual independientemente del día. Por lo tanto, las diferencias en los días no influyen significativamente en el tiempo promedio de reacción de un proceso químico. Es- to a un nivel de significancia de 0,05.