SlideShare una empresa de Scribd logo
Preparado Por:

    David Gonzales, Ph. D.

Cynthia Rodríguez, MS. Student

     Ángela Anaya, ME.
SECCIONES




1. Principios Básicos, Definiciones y Experimentos de un solo Factor Aleatorio…………..1

2. Bloque Completamente Aleatorio y Cuadrado Latino…………………………………..35

3. Diseño Factorial………………………………………………………………………….52

4. Regresión Lineal…………………………………………………………………………60

5. Diseño Factorial 2k……………………………………………………………………….73

6. Diseño Factorial 2k con Bloques…………………………………………………………88

7. Experimentos Fraccionarios 2k…………………………………………………………110

8. Experimentos Gauge R & R……………………………………………………………144

9. Experimentos Anidados y Anidados Factoriales……………………………………….161

10. Experimentos de Parcelas o Cuadrantes Partidas………………………………………175

11. Metodología de Respuesta……………………………………………………………...189
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                      aleatorio.


   1. Principios Básicos

Para iniciar en el curso de Diseño de experimentos, es necesario tener algunos conceptos
claros en la parte de probabilidad y estadística. A continuación se presentan los conceptos
más relevantes.



                                   Estadísticas
                                       Pueden ser




 Descriptivas:    donde     se                       Inferenciales:      donde    se
 describe el comportamiento de                       modelan patrones a partir de
 unos      datos     mediante                        unos      datos,       haciendo
 estimados y algunos métodos                         inferencias a partir de métodos
 gráficos.                                           como pruebas de hipótesis.


Parámetros: describen la población de elementos. Son tomados como la verdad. Como
ejemplo se puede mencionar la media poblacional o µ . Un censo poblacional es un
ejemplo donde se toma la población completa y a partir de ella se sacan parámetros que la
describan.


Estimados: describen una muestra tomada de la población de elementos. Generalmente
se trabaja con muestras de elementos de una población en cuestión. Las muestras se
describen entonces por los estimados; para el caso de la media poblacional µ , su

estimado es la media muestral X . Los estimados se clasifican en medidas de tendencia
central y medidas de dispersión:




                                                                                           1
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                          aleatorio.

  Medidas de tendencia central:


                                            ~
   Prom edio ( X )                M ediana (X )                    M oda



Tie ne un inconve niente y es     Dato central cua ndo la          D ato que ocurre con m ayor
qu e pued e ser influenciado      m uestra e sta organizada de     fre cuencia
po r datos extremos.              m ane ra a scendente



  Medidas de dispersión:


   Varianza (σ )   2
                                  D esviación ( σ )                Rango (R i)
                                   estándar

M edida     de  ruido . Cuan      Usada pa ra ver la disp ersión   D iferencia       entre       la
distintas       son         las   de los datos a su m edia         ob servac ión     má xim a     y
ob servac iones, prome dia la                                      m inim a d e la muestra
distancia       de       cada
ob servac ión de la mue stra a
su prome dio.




  En diseño de experimentos se hacen análisis y se toman decisiones basándose en las
  hipótesis planteadas. A continuación se explican algunos conceptos concernientes a las
  pruebas de hipótesis.


  Valor P (P value)


  Se define como el nivel mínimo de significancia al cual la hipótesis nula Ho sería
  rechazada. En el análisis de varianza con que se analiza el experimento, se tienen en
  cuenta el valor P y el valor de la distribución F. Las tomas de decisión se dan de acuerdo
  a:


  Si       P < α Se rechaza Ho
  Si       P > α No se rechaza Ho
                                                                                                      2
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                       aleatorio.

Si     Fcalculada > Fcritica Se rechaza Ho
Si     Fcalculada < Fcritica No se rechaza Ho


Para ilustrar una toma de decisión, se tiene la siguiente figura:




                                             Valor P




                                                                    Valor α




                                                                               + ∞
                              F calculada          F crítica


La figura muestra que la hipótesis nula Ho no puede ser rechazada debido a que la F
calculada es menor a la F crítica y de igual manera el valor P es menor al nivel de
significancia alfa. El valor P se puede interpretar como la posibilidad de que la hipótesis
nula no sea rechazada; magnitudes altas del mismo se asocian con no poder rechazar la
hipótesis nula. La distribución F presume que las variables analizadas tienen un
comportamiento Gausiano o normal. La misma se calcula como el promedio de
cuadrados de los tratamientos, entre el promedio de cuadrados del error (el promedio de
cuadrados usa la suma de cuadrados entre los grados de libertad).


Los programas estadísticos como Minitab, dan los valores para P y F en el resumen
mostrado al realizar un análisis de varianza. El investigador usualmente toma la decisión
basado en el valor P por comodidad, esto porque él mismo decide el nivel de



                                                                                         3
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                         aleatorio.

significancia de la prueba y no entra en la necesidad de buscar un valor de F crítico en
tablas.


Pruebas de hipótesis estadísticas


Las hipótesis estadísticas son supuestos hechos por el investigador acerca de cierto
parámetro como la media o la desviación estándar, de una o más poblaciones de interés.
La estructura de las pruebas de hipótesis está dada por la formulación de dos términos:


 Ho:   µ = µo Hipótesis nula que establece el valor exacto del parámetro que se desea probar


 H1: µ ≠ µo Hipótesis alterna que establece la posibilidad de que el valor del parámetro se encuentre entre una
            serie de valores distintos al establecido en Ho. (formulación dada para hipótesis alterna de dos colas)

       µ < µo
                  Formulación para hipótesis alternas de una cola

       µ > µo


No rechazar la hipótesis nula implica que la muestra analizada no ofrece suficiente
evidencia para decir que la misma no pueda ser cierta. Sin embargo, si ésta es rechazada,
la prueba entonces ofrece suficiente evidencia para decir que la misma no es cierta.
Cuando se rechaza Ho, se da paso a la aceptación de H1.


Para realizar una prueba de hipótesis se debe tener en cuenta los siguientes pasos:


    1. Establecer Ho (ej: que no exista diferencia entre las medias de los niveles de un
          factor o variable de entrada)
    2. Establecer H1 (ej: que exista diferencia entre las medias de los niveles de un factor
          o variable de entrada)
    3. Establecer α que es el valor que marca el límite entre aceptación y rechazo.
    4. Seleccionar el estadístico de prueba (ej: la media, es decir, la función de la
          muestra aleatoria que se utiliza para tomar una decisión)

                                                                                                                  4
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                      aleatorio.

   5. Establecer la región critica
   6. Calcular el valor de la estadística de prueba para la muestra analizada
   7. Comparar la estadística de prueba con la región crítica y tomar una decisión en
       cuanto a si se rechaza o no Ho.


Cuando se realizan pruebas de hipótesis se puede caer en dos tipos de errores:


   •   Error tipo I: Rechazar Ho cuando no debió ser rechazada. Para este error se define
       la probabilidad α , siendo ésta, la probabilidad de rechazar algo dado que estaba
       bueno o de rechazar dado que debí aceptar. Este error se considera como el error
       del productor porque se rechaza algo del lote de producción que debió ser
       aceptado. α es seleccionado por el investigador.


   •   Error tipo II: No rechazar Ho cuando debió ser rechazada. Para este error se
       define la probabilidad β , siendo ésta, la probabilidad de aceptar algo dado que
       debió ser rechazado. Así este error se considera como el riesgo del consumidor,
       ya que al cometerse, el productor acepta algo que debió ser rechazado y lo lanza a
       la venta estando defectuoso. β solo se controla a través del tamaño de muestra. Si
       el investigador disminuye α entonces β aumenta porque están inversamente
       relacionados pero la suma de α + β ≠ 1.


                                   Ho es cierto          Ho es falso
              No rechazo Ho        Decisión correcta     Error tipo II
              Rechazo Ho           Error tipo I          Decisión correcta


Adicional a lo anterior, es importante definir el potencial de la prueba (1- β ), siendo este
la probabilidad de rechazar Ho cuando debió rechazarse. Experimentalmente con el fin de
aumentar el potencial de la prueba en experimentos corridos de manera completa, se hace
una prueba de poder para determinar el número de replicas que se deben correr para
obtener un poder aceptable (este fluye entre 0.7 y 1 aproximadamente. Cuando el poder

                                                                                           5
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                       aleatorio.

es menor a este, se corre un riesgo mayor de aceptar Ho cuando debió rechazarse y por
ende un fallo en la respuesta del experimento).


Ejemplo 1


El tiempo promedio que tardan los estudiantes en registrarse para las clases de otoño en una
universidad ha sido de 50 minutos con una desviación estándar de 10 minutos. Se está probando
un nuevo método de registro con computadoras modernas. Si se toma una muestra aleatoria de 12
estudiantes que tuvieron un tiempo de registro promedio de 42 minutos con una desviación
estándar de 11.9 minutos quienes se registraron con el nuevo método de registro. Pruebe la
hipótesis de que la media poblacional es ahora menor a 50 minutos usando un nivel de
significancia de 0.05 y de 0.01. Asuma que los datos de tiempo se distribuyen normalmente.


Solución


En este caso en particular se tiene la desviación estándar muestral conocida, de manera que se
trabaja entonces con la estadística t.


La hipótesis del investigador H1 es que la media del tiempo que tardan los estudiantes en
registrarse sea menor a la anterior que era 50 minutos así:


H 0 : µ = 50 min
H1 : µ < 50 min


Como no se conoce la desviación poblacional para el nuevo método entonces se debe usar la
estadística t ya que los datos que se tienen son de una muestra proveniente de una población
mayor:


                                         X −µ   42 − 50
                                  t=          =          = −2.33
                                         S / n 11.9 / 12


Para la toma de decisión se tiene en cuenta que:


                                                                                             6
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                       aleatorio.



                                       Si tcalculada < tcritica se rechaza Ho
                      Si tcalculada > tcritica no hay suficiente evidencia para rechazar Ho




Se procede entonces a buscar los valores de t crítica en la tabla, se debe tener en cuenta que la
tabla pide el valor correspondiente al nivel de significancia y el valor correspondiente a los
grados de libertad:


Con un alfa de 0.05 y 11 grados de libertad T = -1.796
Con un alfa de 0.01 y 11 grados de libertad T = -2.718


A un nivel de significancia del 0.05 se rechaza H0 porque t calculada es menor a t critica, pero a
un nivel de significancia de 0.01 no hay suficiente evidencia para rechazar H0 porque t calculada
es mayor a t critica. Esto indica que hay gran probabilidad de que la media poblacional sea menor
que 50 pero no es mucha la diferencia y quizá no es suficiente garantía para soportar el costo que
requiere la compra del nuevo método de registro.


Procedimiento con Minitab:


    1. En el menú de stat en basic statistics se hace click sobre la opción 1 sample t:




                                                                                                7
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                  aleatorio.

2. Se despliega una ventana donde se ingresan los datos para la media muestral, la
   desviación estándar muestral y el tamaño de muestra, ya que en este caso no se tienen los
   datos sino un resumen de ellos:




3. El problema pide que se pruebe que la media del nuevo procedimiento sea menor a la
   media del procedimiento anterior, es decir, se hace una prueba de hipótesis de una cola.
   Para esto se hace click sobre el botón options donde se despliega una ventana que permite
   poner el nivel de confianza que en este caso es de 95 ya que el nivel de significancia
   inicial a probar es α = 5%. En la casilla de alternative se despliegan las opciones y se
   escoge la opción less than para que se pruebe que la media sea menor a 50.




                                                                                          8
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                       aleatorio.




    4. Al hacer ok se obtienen los siguientes resultados:


                One-Sample T

                Test of mu = 50 vs < 50


                                                          95%
                                                        Upper
                 N      Mean      StDev    SE Mean      Bound         T       P
                12   42.0000    11.9000     3.4352    48.1693     -2.33   0.020




El resultado despliega un valor de t de -2.33 igual al obtenido con los cálculos manuales. En este
caso con un nivel de significancia de 0.05 se obtiene un valor p de 0.02, siendo este menor a 0.05
de manera que se rechaza la hipótesis nula y entonces el tiempo promedio que tardan los
estudiantes en registrarse con el procedimiento nuevo es menor al que se tomaban con el
procedimiento anterior.


Para el caso del nivel de significancia de 0.01 se hace el mismo procedimiento anteriormente
descrito pero cambiando el nivel de confianza a 99.0%.


Ejemplo 2


La especificación para el grueso de una tableta es de 0.03 mm. Se sabe que el grosor de las
tabletas sigue una distribución normal con σ = 0.001 . Se toma una muestra aleatoria de 32
tabletas del proceso y se les mide el grosor. El ingeniero del proceso desea saber si es correcto
decir que el promedio de las tabletas en el lote es de 0.03 mm.




                                                                                                9
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                       aleatorio.

A continuación se muestra una tabla con los datos de los grosores para un lote de 32 tabletas:


                                    Grosor                  Grosor
                    Observacion     (mm)        Observacion (mm)
                              1          0.031           17     0.0283
                              2         0.0285           18     0.0291
                              3          0.029           19     0.0287
                              4         0.0279           20     0.0291
                              5         0.0286           21     0.0309
                              6          0.028           22     0.0298
                              7         0.0305           23     0.0313
                              8         0.0279           24        0.03
                              9         0.0286           25     0.0289
                             10         0.0299           26     0.0299
                             11            0.03          27     0.0279
                             12         0.0295           28     0.0311
                             13          0.031           29     0.0293
                             14         0.0316           30      0.032
                             15         0.0283           31     0.0278
                             16         0.0294           32     0.0319

En este caso particular, se conoce la desviación estándar poblacional y los datos tienen una
distribución normal. Esto indica que se debe utilizar el estadístico de prueba Z.


Se desea entonces probar si la media poblacional µ es 0.03 mm. Para esto se utiliza una prueba
de hipótesis de dos colas, teniendo en cuenta que la hipótesis del investigador es negar que la
media poblacional sea de 0.03 mm; la prueba de hipótesis se formula entonces así:


                                        Ho : µ = 0.03mm
                                        H 1 : µ ≠ 0.03mm


Como la prueba es de dos colas, el rango de aceptación estará dado por dos valores críticos de la
estadística Z o dos valores críticos de P-value. Ahora el investigador define que su nivel de
significancia α es de 0.05 y procede a realizar las pruebas:




                                                                                                 10
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                       aleatorio.

El estimador de punto para la media poblacional µ es X , este se halla sacando el promedio de
los grosores tomados en la muestra.


     0.031 + 0.0285 + 0.029... + 0.0319
X=                                      = 0.029553
                    32


Teniendo en cuenta que el estadístico de prueba Z es:


                                            σ                      σ
                               X − Zα / 2       ≤ µ ≤ X + Zα / 2
                                            n                      n


Se procede a utilizar el programa Minitab para realizar los cálculos:


    1. En el menú de stat, en basic statistics se hace clik sobre 1-sample Z debido a que se tiene
        una muestra:




    2. Después se despliega una ventana donde se escoge la opción samples in columns
        debido a que se tienen todos los datos tomados de la muestra. En caso de tener los
        datos de tamaño de muestra y media, se escogería entonces la opción de
        sumarized data. En la casilla de samples in columns se pone entonces la columna

                                                                                               11
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                   aleatorio.

   que contiene los datos (grosor). Luego en la casilla de standard deviation se pone
   el valor de la desviación estándar poblacional y en la casilla de test mean, se pone
   el valor de la media o promedio que estamos probando.




3. Al hacer click en el botón de ok se obtienen los siguientes resultados:


Variable       N       Mean      StDev     SE Mean          95% CI                Z
Grosor (cm)   32   0.029553   0.001276    0.000177   (0.029207, 0.029900)     -2.53

Variable          P
Grosor (cm)   0.011




Los resultados muestran un valor P de 0.011, este valor es menor a 0.05 que es el
nivel de significancia  0.011 < 0.05 por lo tanto se rechaza la hipótesis nula y
                       →
entonces la media o el grueso promedio de las tabletas producidas no es igual a 0.03
mm.




                                                                                      12
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                       aleatorio.

   2. Definiciones

Diseño de Experimentos: La experimentación es una técnica utilizada para encontrar el
comportamiento de una variable a partir de diferentes combinaciones de factores o
variables de entrada de un proceso, que al cambiar afectan la respuesta. Para entrar a
experimentar es necesario pasar primero por el diseño de experimentos, esta técnica
busca la manipulación sistemática de las variables de entrada de un proceso para entender
el efecto que estas pueden causar en la variable respuesta. Es ampliamente utilizado en
las empresas debido a que éste permite visualizar situaciones que pueden suceder a partir
de la realización de un proceso. En la industria se utiliza principalmente para buscar el
mejoramiento del rendimiento de un proceso, para reducir la variabilidad y permitir que
haya un mayor acercamiento a los parámetros de la empresa, para reducir tiempos de
procesamiento y reducir costos. Cualquier problema experimental incluye: diseño del
experimento y análisis de los datos.

Diseño del Experimento: Se refiere al proceso de planear el experimento que se desea.
Es la adquisición de los datos apropiadamente para analizarlos de manera estadística.
Cuando se tiene un proceso para análisis, es importante definirlo correctamente y
proceder a buscar el mejor diseño de experimentos, de manera que se le pueda sacar el
mejor provecho a los datos colectados por medio del análisis estadístico. Las bases de un
diseño de experimentos son: replicación, aleatoriedad y bloqueo.

Replicación o Repetición: Es el número de ocasiones que se efectúa una misma
condición experimental en la prueba o experimento que se está haciendo. Si por ejemplo
se desea probar el efecto que produce el cambio de temperatura (100 oC y 200 oC) y el
cambio de presión (3 PSI y 6 PSI)           en un componente, se tendría una condición
experimental al establecer la prueba con 100 oC de temperatura y 3 PSI de presión; si
bajo esta condición experimental se hacen dos pruebas, entonces se están realizando dos
replicas o repeticiones. La siguiente figura ilustra la situación:




                                                                                      13
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                      aleatorio.

                                                   Factor 1: Temperatura
                                       Nivel 1 del factor          Nivel 2 del factor
                                         temperatura:                temperatura:
     Factor 2: Presión

                                            100 oC                       200 oC
Nivel 1 del factor Presión:       X1    Respuestas bajo la                 Y1

           3 PSI                  X2    condición 100 oC y 3 PSI           Y2
Nivel 2 del factor Presión:                   W1                           Z1

           6 PSI                              W2                           Z2

Las letras de color rojo, indican las respuestas a la primera réplica bajo las condiciones
allí mostradas. Las letras de color negro, indican las respuestas a la segunda replica bajo
las condiciones allí mostradas.

Aleatoriedad: Es el orden en que se ejecutan las condiciones experimentales en el
experimento. Bajo la aleatoriedad todos los tratamientos tiene la misma oportunidad de
ser seleccionados. Es usada con el propósito de cancelar efectos de variables que no se
están controlando (como efectos del ambiente en el que se realiza el experimento →
            lando
humedad). La aleatoriedad cancela el efecto de factores que quizá no conocemos que
están allí, incluso estos pueden estar cambiando sus niveles a medida que corremos el
experimento. Cuando se conoce la fuente de variabilidad y se puede controlar, se usa una
                                                                                     un
técnica llamada bloqueo.




                                                                                        14
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                      aleatorio.

La figura muestra dos bolsas que representan el factor, dentro de cada una se encuentran
4 papeles que están etiquetados con los niveles para cada factor. Una forma de hacer un
procedimiento aleatorio, para el caso del ejemplo mencionado en la definición de
replicación, seria tomar de cada bolsa sin mirar, un papelito. Allí se ilustra una mano
tomando un papelito de cada bolsa, la misma persona entonces toma un papel de la bolsa
de temperatura y luego otro papel de la bolsa de presión y se establece entonces la
primera condición experimental. Una vez establecida estos papeles se dejan afuera de las
bolsas y se prosigue con la siguiente condición experimental. Una vez no hayan papeles
en la bolsa se ha terminado de establecer la primera réplica; si se desea tener más de una
réplica, entonces se ingresan los papeles a las bolsas y se repite el procedimiento hasta
completar la segunda replica.

Bloqueo: Es una técnica utilizada con el fin de aumentar la precisión del experimento. Se
usa cuando se conoce la fuente de variabilidad y se puede controlar. Al controlarla se
reduce la variabilidad introducida por esta fuente y se evita que esta influya en la
respuesta cuando no se está interesado en el efecto de la misma. Un bloque es una
porción del material experimental que debe ser más homogénea que el conjunto completo
del material.

Factores: Los factores son las variables de interés para las cuales se quiere estudiar el
impacto que tienen las mismas en la respuesta. Las variables temperatura y presión
utilizadas para el ejemplo descrito en la definición de replica, son los factores de interés
en la experimentación. Estos se puede clasificar como variables controlables: que pueden
a su vez clasificarse en variables cualitativas (tipo de material sujeto) y cuantitativas
(temperatura y presión). Las variables no controlables afectan el experimento y en
ocasiones no son tenidas en cuenta; estas son medibles mas no están bajo el control del
experimentador (humedad, la cual se mide mas no se controla). Los factores también
pueden ser clasificados de manera fija o aleatoria. Se clasifican de manera fija cuando los
niveles del factor (en el caso de factor temperatura antes mencionado, sus niveles son 2:
100 oC y 200 oC) son los únicos niveles de interés; es decir que el rango experimental se
abarca por completo con esos niveles. Los factores se clasifican de manera aleatoria,


                                                                                         15
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                      aleatorio.

cuando los niveles del factor son una muestra que salen de una población mayor y se
desea hacer inferencia en la población a partir de los niveles seleccionados.

Niveles: Es el número de alternativas o ajustes para cada factor. La figura mostrada en la
definición de replicación, ilustra los niveles para cada factor. En el caso de ese ejemplo
en particular se tienen dos niveles para cada uno de los factores.

Variables de salida: Son las variables respuesta del experimento. La respuesta puede ser
univariada (una sola salida de interés) o multivariada (múltiples salidas de interés). Estas
pueden clasificarse en variables cualitativas y cuantitativas. Se clasifican como
cualitativas cuando por ejemplo: se refiere a características, donde la respuesta es un si o
un no (cuando se desea saber si un producto es aceptable o no de acuerdo a características
observadas, o cuando se tienen en cuenta las características de una persona para tomar
una decisión). Se clasifican como cuantitativas cuando se mide algo numérico como la
viscosidad, el lead time de los procesos, el tiempo, el peso etc.

Modelos según las variables analizadas

                                    Variable de entrada o factor (X)

   Variable de                      Cuantitativa                    Cualitativa
   salida       o Cuantitativa Diagramas de dispersión, Análisis de varianza
   respuesta(Y)                     Regresión                       (ANOVA)
                    Cualitativa     Regresión Logística             Tablas           de
                                                                    contingencia


Pasos a seguir en el diseño de experimentos:


   1. Reconocimiento y establecimiento del problema
   2. Selección de los factores y niveles de cada uno de estos
   3. Selección de la variable respuesta
   4. Determinación del diseño experimental que debe llevarse a cabo


                                                                                          16
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                       aleatorio.

   5. Realización del experimento para la obtención de los datos de la respuesta
   6. Análisis de los datos
   7. Conclusiones y recomendaciones
   8. Estudio de confirmación


Grados de libertad: Estos se refieren al número de términos independientes en un test
particular. Teniendo n como el número de términos, los grados de libertad se calculan
mediante n-1.


ANOVA (Análisis de varianza)

Las pruebas de hipótesis son una herramienta útil cuando se trata de comparar dos
tratamientos. La experimentación usualmente requiere comparación de más de dos
tratamientos simultáneamente, es allí donde se introduce Anova (teniendo en cuenta que
es un procedimiento para análisis de factores cualitativos).

El análisis de varianza se deriva de la partición de la variabilidad total en las partes que la
componen. ANOVA establece que la variabilidad total en los datos, medida por la suma
de cuadrados total, puede ser dividida en una suma de cuadrados de la diferencia entre los
promedios de los tratamientos y el gran promedio total más una suma de cuadrados de la
diferencia de las observaciones entre tratamientos del promedio del tratamiento. Anova,
nos da la herramienta para distinguir si un factor afecta la respuesta en promedio.

Presunciones de Anova:

   1. Los errores o residuales son independientes y distribuidos de manera normal o
       gaussiana, con promedio equivalente a 0 y varianza constante. Si su promedio no
       fuese 0, el modelo estaría subestimando o sobreestimando.

   2. Anova presume que todas las varianzas de los niveles del factor son iguales y
       toma un solo cálculo de varianza llamado Spooled o varianza conjunta.



Anova mira los promedios de cada nivel contra el promedio general y lo llama entre
tratamientos. Anova queda con dos estimados de varianza, dentro y entre los niveles; con

                                                                                            17
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                           aleatorio.

   estos se saca un cociente, si las 2 varianzas se parecen, es decir, el cociente es
   aproximadamente 1, el factor no tiene ningún impacto en la respuesta, pero si este
   cociente resulta ser grande, entonces el factor tiene mucho impacto en la respuesta.

   Para ilustrar se presenta a continuación un ejemplo teniendo en cuenta un solo factor
   aleatorio:

                 Observaciones ( n replicas)

Niveles del      1          2     …         n          Totales         Promedios
  factor                                                 Yi.               Yi.

    1           Y11       Y21     …         Yn1     Y11+ Y21+…             Y1.
                                                        Yn1

    2           Y12       Y22     …         Yn2     Y12+ Y22+…             Y2 .
                                                        Yn2

     .           .          .     …          .            .                …
     .           .          .                .            .

    a           Y1a        Y2a    …         Yna   Y1a+ Y2a+… Yan           Ya .

                      Totales                            Y..               Y..




   A partir de la anterior tabla, se presenta la forma manual de hacer Anova con el fin de
   entender el concepto que maneja el análisis de varianza. Inicialmente se debe calcular la
   suma de cuadrados de los tratamientos:

                          1 a 2 Y..2
                       = ( ∑ Yi. ) −
                                                                 Fuente de variación entre
    SSTratamientos                                               tratamientos
                          n i =1     N
   Donde:

   n = Numero de tratamientos por cada nivel
                                                                                             18
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                      aleatorio.

N = Numero de tratamientos en total

i = 1, 2, 3… a

Luego se debe calcular la suma de cuadrados total:


                                            a    n
                                                   Y..2
                           SSTotal    = (∑∑ Y ) −     2
                                                     ij
                                         i =1 j =1 N

Donde:

N = Numero de tratamientos en total

i = 1, 2, 3… a

j = 1, 2, 3…n

Para estimar la suma de cuadrados de los errores se hace la diferencia de la suma de
cuadrados total y la suma de cuadrados de los tratamientos:


SS E = SSTotal − SSTratamientos
                                                             Fuente de variación dentro de los
                                                             tratamientos


La tabla de Anova quedaría así:

                                        ANOVA
Fuente           de Suma          de Grados          de Promedio            de Estadístico de
variación           cuadrados         libertad            los cuadrados prueba Fo
                    (SS)                                  (MS)
Tratamientos        SS tratamientos   a-1                 SS tratamientos       MS tratamientos
                                                              a −1               MS error
Error               SS error          N-a                 SS error
                                                          N −a
Total               SS total          N-1


                                                                                                  19
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                       aleatorio.

   3. Experimento de un solo factor aleatorio.

Este tipo de experimento es el más sencillo y consiste en analizar un solo factor evaluado
en diferentes niveles, de manera que se compara las medias de la respuesta en cada uno
de esos niveles y se establece si hay diferencia entre ellas.

El modelo correspondiente a este experimento esta dado por la ecuación IV.

  yij = µ + τ i + ε ij
                                                                                          I


Donde µ es un parámetro común para todos los tratamientos llamado la media general,
τ representa el efecto del tratamiento i y ε ij corresponde al error que incorpora todas las
fuentes de variabilidad en el experimento.

   Las hipótesis evaluadas son:

    H 0 : τ 1 = τ 2 = ...τ a


    H1 : τ 1 ≠ τ 2 ≠ ...τ a


Lo que se desea investigar es si existe diferencia o no entre los niveles del factor en
consideración.

Ejemplo 1 (Tomado del libro Design and analysis of Experiments, de Douglas C.
Montgomery, 6ta edición. Página 70)

En muchos procesos de manufactura de circuitos integrados, los “wafers” son revestidos
con una capa de material como dióxido de silicona o un metal. Luego, el material que no
se necesita es removido haciendo los grabados necesarios para crear los patrones de los
circuitos, interconexiones eléctricas y áreas donde se hacen los depósitos de metal. Un
proceso de grabado tipo plasma es ampliamente usado para esta operación. La energía
para el proceso es suplida por un generador de radio frecuencia RF que hace que el
plasma sea generado en el intervalo entre electrodos. El ingeniero del proceso está


                                                                                         20
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                        aleatorio.

interesado en determinar si diferentes niveles de poder de la RF afecta la tasa de grabado.
Debido a que se tiene un solo factor, el ingeniero ha decidido hacer un experimento de un
solo factor aleatorio con 5 replicas. Al correr el experimento se obtuvo las siguientes
respuestas:

Poder RF      Tasa de grabado observada (replicas)     Totales           Promedios
(W)
              1           2     3     4        5              Yi.                Yi.

160           575         542   530   539      570     2756              551.2
180           565         593   590   579      610     2937              587.4
200           600         651   610   637      629     3127              625.4
220           725         700   715   685      710     3535              707.0
                                                       Y.. = 12,355      Y.. = 617.75


Ahora, las hipótesis que el investigador desea probar son:

Ho: Las medias de los niveles son iguales µ160 = µ180 = µ 200 = µ 220


H1: Algunas medias son diferentes

Teniendo claras las hipótesis y habiendo corrido el experimento, se procede a realizar los
cálculos matemáticos que permitan llegar al estadístico de prueba Fo para tomar una
decisión.


                  a
                     Y..2
                      n
                                                   12,355
SSTotal = (∑∑Y ) − = (5752 + 5422 + ... + 7102 ) −
                           2
                          ij                              = 72,209.75
           i =1 j =1 N                               20


            1 a 2 Y..2 1                           12,355
SSTrat   = ( ∑ Yi. ) −  = [27562 + ... + 35352 ] −        = 66,870.55
            n i=1      N 5                           20


                                                                                        21
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                      aleatorio.


SS E = SSTotal − SSTratamientos = 72,209.75 − 66,870.55 = 5339.20


                                         ANOVA
 Fuente de Suma            de Grados de Promedio          de    los Estadístico       de
 variación     cuadrados      libertad      cuadrados (MS)           prueba Fo
               (SS)
 Poder RF      66,870.55      3             66,870.55                 22,290.18
                                                      = 22,290.18               = 66.80
                                                3                      333.70
 Error         5339.20        16            5339.20
                                                    = 333.70
                                              16
 Total         72,209.75      19

El experimentador obtiene un valor de Fo = 66.80. Tomando un nivel de significancia de
0.05, teniendo 3 grados de libertad del factor y 16 del error, se procede a buscar en la
tabla de la distribución F y se obtiene un valor de 3.24. Como 66.80 > 3.24 entonces se
concluye que las medias de los niveles del factor difieren y por tanto se procede a
rechazar Ho.

Es importante notar que el procedimiento descrito anteriormente es hecho a mano. Para
esto existen programas como Minitab quienes realizan los cálculos a partir de los datos
ingresados. A continuación se ilustra el procedimiento en Minitab:

    1. En el menú de stat se busca la opción anova, allí se hace doble click en la opción
         one way anova como muestra la figura




                                                                                      22
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                  aleatorio.




2. Aparece entonces una ventana que permite ingresar las columnas de valores para
   el análisis. En la primera casilla que dice response, se ingresa la columna que
   contiene los valores de la respuesta, en la siguiente casilla de factor, se ingresa la
   columna que tiene los niveles del factor, se dejo una confianza del 95% que
   equivale al nivel de significancia de 0.05 utilizado en los cálculos manuales:




3. Al dar clik en OK se obtiene la siguiente respuesta:



                                                                                      23
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                  aleatorio.

                             One-way ANOVA: Respuesta versus Niveles

                             Source           DF           SS             MS           F                   P
                             Niveles           3        66871          22290       66.80               0.000
                             Error            16         5339            334
                             Total            19        72210

                             S = 18.27                R-Sq = 92.61%                R-Sq(adj) = 91.22%



Se obtienen los mismos valores que se obtuvieron con los cálculos manuales. En este
caso se ve que el P-value es de 0, esto implica un valor menor al del nivel de
significancia (0.005). al ser 0 < 0.005 se rechaza Ho y el investigador puede concluir
entonces que los niveles del poder afectan la tasa de grabado.

4. Al dar clik en OK se obtiene también una grafica con 4 métodos de análisis
    graficos para los residuales, esto con el fin de cotejar la idoneidad del modelo:


                                                              Residual Plots for Respuesta
                         Normal Probability Plot of the Residuals                                     Residuals Versus the Fitted Values
                        99
                                                                                               20
                        90
                                                                                               10
                                                                                    Residual
        Percent




                        50                                                                      0

                                                                                               -10
                        10
                                                                                               -20
                        1
                         -50           -25            0          25           50                     550           600          650         700
                                                   Residual                                                           Fitted Value

                                     Histogram of the Residuals                                  Residuals Versus the Order of the Data
                        4
                                                                                               20
                        3
            Frequency




                                                                                               10
                                                                                    Residual




                        2                                                                       0

                                                                                               -10
                        1
                                                                                               -20
                        0
                               -30     -20   -10      0     10    20     30                           2    4   6     8   10 12 14      16   18    20
                                                   Residual                                                        Observation Order




•   Normal probability plot of the residuals (trazo de probabilidad normal): Este
    grafico muestra que los residuales se encuentran al rededor de la línea del medio,
    lo cual quiere decir que no hay ninguna desviación significativa de la presunción
    de normalidad para los residuales.




                                                                                                                                                       24
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                      aleatorio.

   •   Residuals versus the fitted values (trazo de residuales contra los valores
       estimados): este grafico muestra que no hay un patrón definido.
   •   Histogram of the residuals (histograma de los residuales): la forma del mismo
       muestra un comportamiento aproximadamente normal o gaussiano.
   •   Residuals versus the order of the data (trazo de residuales vs orden de la
       experimentación): Este grafico muestra que los datos no siguen ningún patrón.

Ejemplo 2

La compañía Mush, productora de setas, ha elaborado un proceso de deshidratación de
las mismas. Para el proceso se estableció una caja de cartón equipada con una entrada de
aire, una chimenea, una parrilla para poner las setas a deshidratar y un foco debajo de la
misma, el cual provee el calor necesario para deshidratar las setas. El ingeniero
encargado del proceso sabe que 150 gramos de setas tardan de 9 a 18 horas en
deshidratarse pero no sabe el tiempo exacto. Se sabe también que las setas deben llegar a
reducir su peso en un 87% aproximadamente para considerarse deshidratadas. Debido a
esto se estableció un experimento tomando un solo factor en consideración (tiempo). El
experimentador determino 4 niveles de tiempo entre 9 y 18 horas con intervalos de 3
horas entre cada nivel.

Lo anterior conlleva entonces a la siguiente configuración:

                                       Factor: Tiempo
 Nivel 1: 9 horas         Nivel 2: 12 horas    Nivel 3: 15 horas       Nivel 4: 18 horas
           X                     X                      X                      X

El experimentador sabe que debe realizar replicas de su experimento; para esto el realizó
una prueba de poder y tamaño de muestra (power and sample size) en el programa
Minitab.

El poder es la probabilidad de que la prueba rechace la hipótesis nula (en este caso es que
no exista diferencia entre las medias de los pesos para los niveles de la variable tiempo o


                                                                                        25
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                      aleatorio.

que no haya diferencia entre el efecto de los niveles de la variable) cuando la misma es
falsa; se denomina como 1- β , siendo β la probabilidad de aceptar algo que debió ser
rechazado. Se presumieron 3 valores para el poder (0.7, 0.8 y 0.9) para evaluar la
cantidad de replicas de acuerdo a cada uno de ellos. En cuanto a la diferencia entre las
medias de los factores, el experimentador hizo una presunción de 4 gramos de manera
que se pueda detectar la diferencia entre los efectos de los niveles cuando las medias
varíen en más de 4 gramos la una de la otra. El valor de la desviación estándar de los
pesos era previamente conocido (2.845 gramos). Los valores del poder, la diferencia
entre medias, la desviación estándar y un nivel de significancia de 0.05 fueron ingresados
a Minitab de la siguiente manera:

   1. En Minitab, en el menú de stat se encuentra la opción de power and sample size y
       allí la opción de one way anova como muestra la próxima figura:




   2. Al abrir la opción one way anova, se encuentra entonces la pantalla donde se
       ingresan los datos del experimento, es decir, el numero de niveles del factor, el
       valor de la diferencia máxima que se desea entre las medias de los pesos para
       cada uno de los niveles, los valores del poder y la desviación estándar de los
       pesos. La siguiente figura ilustra el procedimiento:

                                                                                           26
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                      aleatorio.




   3. Al dar click en el botón de OK se obtiene el siguiente resultado:


         Power and Sample Size

         One-way ANOVA
         Alpha = 0.05 Assumed standard deviation = 2.845   Number of Levels = 4
            SS   Sample Target                   Maximum
         Means    Size    Power Actual Power Difference
             8      10     0.7      0.704069          4
             8      13     0.8      0.834820          4
             8      16     0.9      0.913369          4
         The sample size is for each level.




El experimentador entonces concluye que para obtener un poder de 0.704069 debe
realizar 10 replicas del experimento, para un poder de 0.834820 debe hacer 13 replicas y
para un poder de 0.913369 debe hacer 16 replicas. Debido a que el mínimo de replicas es
de 10, el experimentador decide entonces buscar el poder que se conseguiría al realizar
11 replicas del experimento. Este procedimiento se hace mediante la misma herramienta
de Minitab pero dejando en blanco la casilla de power y poniendo el número 11 en
sample size. A continuación se ilustra el procedimiento y la respuesta obtenida:




                                                                                     27
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                      aleatorio.




     Power and Sample Size

     One-way ANOVA

     Alpha = 0.05     Assumed standard deviation = 2.845     Number of Levels = 4


        SS   Sample                 Maximum
     Means     Size      Power   Difference
         8       11   0.754440            4


     The sample size is for each level.


Según el anterior resultado, al realizar 11 replicas se obtiene un poder de 0.7544 que el
experimentador considera razonable para los resultados que desea obtener. Por lo anterior
el número de replicas que se deben realizar en el experimento de un solo factor aleatorio
es de 11.

Después el experimentador hace la aleatoriedad con la que va a realizar la
experimentación para cada replica, es decir, en el programa Minitab se ingresan los
valores de los niveles (9,12, 15 y 18 horas) y se hace un procedimiento para obtener el
orden en que se van a hacer las corridas para cada replica. La siguiente figura ilustra el
procedimiento en el programa Minitab:




                                                                                       28
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                  aleatorio.

1. En el menú de calc, en la opción Random data, se despliega otro menú donde se
   escoge la opción sample from column:




2. Al hacer click en sample from column se despliega una ventana donde se ingresa
   el numero de filas que contienen los datos a organizar, luego una casilla donde se
   ingresa la columna de la cual se hace la aleatoriedad, esto haciendo doble click en
   los nombres de las columnas que se despliegan en la casilla de la izquierda,
   finalmente en la última casilla se ingresa el nombre de la columna donde se desea
   que se almacene el resultado (la organización aleatoria de la réplica). La siguiente
   figura ilustra el procedimiento:




                                                                                    29
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                      aleatorio.




   3. Al hacer click en OK se despliega el siguiente resultado:




Entonces el experimentador debe correr la primera réplica poniendo las setas en la caja
por 9 horas inicialmente, luego debe sacarlas, pesarlas y poner un segundo lote de setas
en la caja por 15 horas y así hasta completar la réplica. Para la aleatoriedad de las demás
replicas, se repite el procedimiento anteriormente mencionado

Los resultados de los pesos en gramos para las 11 replicas son:




                                                                                        30
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                      aleatorio.

                                           Factor: Tiempo
            Replica   Nivel 1: 9     Nivel 2:      Nivel 3:      Nivel 4:
                         horas       12 horas      15 horas      18 horas
               1         21.73         20.80         20.80        21.30
               2         20.10         20.20         18.30        19.50
               3         18.05         18.14         18.40        17.62
               4         20.05         19.30         18.85        19.30
               5         19.01         19.42         20.27        18.75
               6         21.64         21.81         20.06        21.88
               7         23.21         20.22         19.04        22.02
               8         20.34         18.20         18.74        18.85
               9         18.50         18.02         18.30        19.30
              10         19.34         20.05         19.53        18.70
              11         19.39         18.90         21.43        20.54

El experimentador ingreso los datos a Minitab y realizo el análisis de los mismos de la
siguiente manera:

   1. En el menú de stat, se despliegan diferentes opciones, debido a que se desea
       realizar un análisis de varianza, se despliega entonces el menú de ANOVA, donde
       se escoge la opción de General linear model como muestra la figura:




                                                                                    31
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                  aleatorio.




2. Al dar click en General linear model se obtiene una ventana donde se ingresa en
   la primera casilla la columna de respuestas denominada como pesos, en la casilla
   de Model se ingresa el modelo, en este caso el factor tiempo y las replicas, siendo
   el factor tiempo un factor fijo y las replicas un factor aleatorio. En la última
   casilla (random factors) se especifica que el factor replica es aleatorio




                                                                                   32
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                   aleatorio.

3. La ventana muestra 7 botones que permiten especificar o adquirir información
   adicional en el análisis. Para este caso, se oprime el botón factor plots y se obtiene
   la siguiente ventana:




4. La anterior opción permite realiza un grafico de los efectos principales de los
   niveles del factor. En la casilla Factors se ingresa entonces el factor tiempo, se
   oprime OK y regresa a la ventana principal donde se oprime OK de nuevo y se
   obtiene el siguiente resultado:

General Linear Model: Pesos versus Tiempos, Replicas

Factor     Type     Levels   Values
Tiempos    fixed         4   9, 12, 15, 18
Replicas   random       11   1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11


Analysis of Variance for Pesos, using Adjusted SS for Tests

Source     DF    Seq SS     Adj SS    Adj MS      F       P        El valor P es mayor
Tiempos     3    3.1996     3.1996    1.0665   1.39   0.264        al valor de alfa de
Replicas   10   47.6228    47.6228    4.7623   6.21   0.000        0.05 por lo tanto no
Error      30   22.9890    22.9890    0.7663                       se puede rechazar Ho
Total      43   73.8114                                            y se determina que no
                                                                   hay diferencia entre
                                                                   los     niveles   del
S = 0.875386     R-Sq = 68.85%       R-Sq(adj) = 55.36%            factor.

                                                                                        33
Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor
                                   aleatorio.



Unusual Observations for Pesos

Obs                  Pesos       Fit   SE Fit     Residual         St Resid
 25                19.0400   20.8327   0.4938      -1.7927            -2.48 R
 26                23.2100   21.5273   0.4938       1.6827             2.33 R
 44                21.4300   19.7752   0.4938       1.6548             2.29 R

R denotes an observation with a large standardized residual.


Residual Plots for Pesos


Main Effects Plot (fitted means) for Pesos



                                Main Effects Plot (fitted means) for Pesos
                   20.2
                                       µ nivel1
                   20.1

                   20.0

                                                                                                 µ nivel 4
   Mean of Pesos




                   19.9

                   19.8

                   19.7

                   19.6                                µ nivel 2

                   19.5
                                                                                µ nivel 3
                   19.4
                               9                  12                    15                  18
                                                          Tiempos



El experimentador deduce que no hay diferencia entre los niveles del factor tiempo
debido a su valor P. Al observar la grafica se encuentra que la diferencia entre las
medias de los niveles no sobrepasan los 4 gramos de diferencia entre las medias que
el experimentador quería detectar, por lo tanto, el tiempo que debe durar el proceso de
deshidratación es de 9 horas.




                                                                                                             34
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino


   1. Bloque Completamente Aleatorio
En cualquier experimento puede existir alguna fuente de variación que puede afectar los resultados.
Muchas veces esta fuente de variación es desconocida e incontrolable. La aleatoriedad es una
técnica de diseño que se utiliza con el propósito de cancelar efectos de variables que no estamos
controlando ya sea porque no podamos controlarlas o porque no se conoce. Cuando se habla de
aleatoriedad significa que se conduce al azar y no se le impone una estructura. Cuando esa fuente de
variación se conoce y se controla (ya sea por aleatoriedad) se utiliza una técnica llamada bloque para
eliminar sistemáticamente el efecto de la fuente de variación en las comparaciones estadísticas entre
tratamientos.



Descripción:

       Un diseño de experimento es completamente aleatorio cuando hay:
           •    Un factor de interés.
           •    Una fuente bloqueada.


Si hay alguna fuente de variación que está incidiendo en el experimento y que no está en el modelo,
el efecto de esta fuente de variación se va a reflejar en el error si la variable que representa dicha
variación no es bloqueada. La aleatoriedad ocurre dentro del bloque.




                           Figura 1. Diseño de bloque completamente aleatorio.




                                                                                                  35
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino

Modelo Estadístico:

                                                          i = 1,2,..., a
                             y ij = µ + τ i + β j + ε ij 
                                                          j = 1,2,..., b
                                                                          ,


donde:
 y ij → observación j del tratamiento i
µ → promedio general
τ i → efecto del tratamiento i
ε ij → error o residual de la observación j en el tratamiento i
β j → efecto del bloque j

En los experimentos que envuelven diseños de bloques completamente aleatorio, se interesa probar
la igualdad de los promedios de los tratamientos. Por lo tanto, las hipótesis de interés son
                                           H 0 : µ1 = µ 2 = ⋅ ⋅ ⋅ = µ a
                                           H1 : at ⋅ least ⋅ one ⋅ µ i ≠ µ j

Debido a que el promedio del tratamiento i es µ i = µ + τ i , una forma equivalente de escribir la
hipótesis es en términos de los efectos en los tratamientos, entonces
                                           H 0 : τ1 = τ 2 = ⋅ ⋅ ⋅ = τ a = 0
                                           H1 : τ i ≠ 0 ⋅ at ⋅ least ⋅ one ⋅ i


Análisis de Varianza (ANOVA) para este modelo:


El análisis de varianza se deriva de la partición de la variabilidad total en las partes que la
componen. ANOVA establece que la variabilidad total en la data, medida por la suma de cuadrados
total, puede ser dividida en una suma de cuadrados de la diferencia entre los promedios de los
tratamientos y el gran promedio total más una suma de cuadrados de la diferencia de las
observaciones entre tratamientos del promedio del tratamiento. Para aclarar la definición primero
definiremos las variables que componen las ecuaciones de ANOVA.




                                                                                               36
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino


Tenemos que yi• es el total de todas las observaciones tomadas bajo el tratamiento i, y • j es el total de

todas las observaciones tomadas en el bloque j, y •• es el gran total de todas las observaciones y
N = ab es el número total de observaciones. Expresadas en forma matemática tenemos
                                                                             b
                                                                  yi • = ∑ yij                   i = 1,2, K , a
                                                                             j =1
                                                                              a
                                                                  y • j = ∑ y ij                 j = 1,2, K , b
                                                                             i =1
                                                                            a     b                a           b
                                                                y•• = ∑ ∑ y ij = ∑ yi • = ∑ y • j
                                                                        i =1 j =1                 i =1         j =1



De igual forma, y i • es el promedio de las observaciones tomadas en el tratamiento i, y • j es el
promedio de las observaciones en el bloque j y y •• es el promedio del gran total de todas las
observaciones. Esto es,

                                                y i • = yi • b                   y • j = y• j a          y •• = y •• N

La suma de cuadrados total puede ser expresada como


                   ∑∑ (y                        ) = ∑∑ [(y                                ) (                  ) (                                   )]
                     a        b                 2           a     b
                                                                                                                                                      2
                                  ij   − y ••                           i•    − y •• + y • j − y •• + y ij − y i• − y • j + y ••
                     i =1 j =1                              i =1 j =1



Expandiendo el lado derecho de la ecuación y haciendo algebra simple pero tediosa obtenemos la
ecuación que representa una partición del total de la suma de cuadrados pero que es una de las
ecuaciones fundamentales en ANOVA para el diseño de bloque completamente aleatorio. La
ecuación es


         ∑∑ (y                         )                (               )                    (            ) + ∑∑ (y                                            )
          a    b                                    a                                 b                               a     b
                                           = b∑ y i• − y ••                   + a ∑ y • j − y ••
                                       2                                2                                  2                                                   2
                         ij   − y ••                                                                                              ij   − y • j − y i• + y ••
         i =1 j =1                              i =1                                  j =1                            i =1 j =1


Esta suma expresada de forma simbólica seria de la siguiente manera

                                                        SS T = SS Treatments + SS Blocks + SS E

Otro parámetro a considerar es el grado de libertad de cada una de las partes de la suma de
cuadrados. Los grados de libertad son el número de elementos independientes en cada una de las



                                                                                                                                                                   37
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino

sumas de cuadrados. Este parámetro nos ayuda a determinar el número de datos que necesitamos
para hacer un estimado.
Debido a que hay N observaciones, SST tiene N-1 grados de libertad. Hay a tratamientos y b bloques,
por lo tanto, SSTreatments tiene a-1 grados de libertad y SSBlocks tiene b-1 grados de libertad. La suma de
cuadrados del error SSE tiene (a-1)(b-1) grados de libertad debido a la diferencia entre la suma de
cuadrados del tratamiento y los bloques.

Ahora podemos obtener los promedios de los cuadrados dividiendo la suma de los cuadrados por sus
grados de libertad.
Para probar la igualdad de los promedios de los tratamientos usamos la prueba estadística F

                                                             MS Treatments
                                                      Fo =
                                                               MS E

                                 Fa −1,(a −1)(b −1)
La cual está distribuida como                         si la hipótesis nula es cierta. La región crítica es la cola
                                                                                          F0 > Fα , a −1,(a −1)(b −1)
superior de la distribución F, por eso rechazamos la hipótesis nula Ho si                                               . De
forma alterna podemos utilizar el P-value para la toma de decisiones. El P-value es la probabilidad
de que la prueba estadística va a tomar un valor que es al menos tan extrema como el valor
observado de la estadística cuando la hipótesis nula es cierta. El P-value se define como el nivel de
significancia más pequeño que llevaría al rechazo de la hipótesis nula Ho.

El error puede estar inflado por lo que es el error de verdad mas todo aquello que no contabilicé,
por lo tanto, debo bloquear las variables que son. Un procedimiento aproximado que resulta
razonable para investigar el efecto de la variable bloqueada es examinar el radio de MSBlocks entre
MSE. Si este radio es grande, implica que el factor bloque tiene un efecto grande y que la reducción
de ruido obtenida por el bloque probablemente es útil en mejorar la precisión en la comparación de
los promedios de los tratamientos.

El procedimiento para el análisis de varianza se resume en una tabla de ANOVA como la que se
presenta a continuación.




                                                                                                                         38
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino

Ecuaciones de ANOVA
   Fuente de               Suma de                 Grados de             Promedio
  Variación               Cuadrados                Libertad              Cuadrado           F0
                                                                         SSTreatments   MSTreatments
  Tratamientos        SSTreatments           a-1
                                                                            a-1           MSE
                                                                          SSBlocks
  Bloques             SSBlocks               b-1
                                                                            b-1
                                                                            SSE
  Error               SSE                    (a-1)(b-1)
                                                                         (a-1)(b-1)
  Total               SST                    N-1

Estos valores se pueden calcular en una hoja de cálculo de Excel pero también se pueden obtener
de forma manual calculando las formulas expresadas en términos de los tratamientos y bloques
totales. Estas formulas son
                                                    a     b
                                                                 y •2•
                                           SS T = ∑∑ y ij −
                                                       2

                                                    i =1 j =1    N

                                                          1 a 2 y •2•
                                        SS Treatments =     ∑ y i• − N
                                                          b i =1

                                                        1 b 2 y •2•
                                         SS Blocks =      ∑ y• j − N
                                                        a j =1

Y el error se obtiene restando como sigue

                                     SS E = SS T − SS Treatments − SS Blocks


Ejemplo 1

Un fabricante de dispositivo médico produce injertos vasculares (venas artificiales). Éstos injertos
son producidos insertando a presión resina de politetrafluoetileno combinado con un lubricante
dentro de los tubos. Con frecuencia, algunos de los tubos en un funcionamiento de producción
contienen salientes pequeñas y duras en la superficie externa. Estos defectos se conocen como "
flicks." El defecto es causa para el rechazo de la unidad.




                                                                                                       39
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino

El desarrollador del producto responsable de los injertos vasculares sospecha que la presión de
insertar la resina afecta a la ocurrencia del " flicks" y, por lo tanto, se prepone conducir un
experimento para investigar esta hipótesis. Sin embargo, la resina es fabricada por un suplidor
externo y es entregada al fabricante del dispositivo médico en lotes. El ingeniero también sospecha
que puede haber una variación significativa de lote-a-lote, porque mientras que el material debe ser
constante con respecto a parámetros tales como peso molecular, tamaño de partícula promedio,
retención, y cociente de la altura de pico, esta variación no es probablemente debido a la variación
de la fabricación en el suplidor de la resina y a la variación natural en el material. Sin embargo, el
desarrollador del producto decide investigar el efecto de los cuatro niveles diferentes de la presión
de inserción en los “flicks” usando un diseño completamente aleatorio considerando los lotes de la
resina como bloques. La variable respuesta es el rendimiento o el porcentaje de tubos en la
producción que no contiene “flicks".


A continuación se presenta la tabla que contiene los datos con respecto a este experimento.


Datos del ejemplo numérico.




Ejemplo calculando y i• :
                             6

                         ∑y
                         i =1
                                 8500•   = y 8500(1) + y 8500( 2 ) + y 8500( 3) + y 8500( 4 ) + y 8500(5) + y 8500( 6 )
Para la presión 8500 →       6

                         ∑y
                         i =1
                                 8500•   = 90.3 + 89.2 + 98.2 + 93.9 + 87.4 + 97.9 = 556.9


Ejemplo calculando y • j :




                                                                                                                          40
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino

                                                          4

                                                          ∑y
                                                          j=1
                                                                •1   = y (8500)1 + y (8700)1 + y (8900)1 + y (9100)1
Para el Lote de Resina 1 (Bloque 1) →                     4

                                                          ∑y
                                                          j=1
                                                                •1   = 90.3 + 92.5 + 85.5 + 82.5 = 350.8

Ejemplo calculando y •• :

Se puede calcular sumando cada uno de los tratamientos de los diferentes bloques o simplemente
            4               6
y •• = ∑ y i • + ∑ y • j
        i =1                j=1

y •• = (556.9 + 550.1 + 533.5 + 514.6) + (350.8 + 359.0 + 364.0 + 362.2 + 341.3 + 377.8) = 2155.1


Análisis de Varianza:

Para realizar el análisis de varianza hay que calcular las siguientes sumas de cuadrados:

                4   6
                                  y •2•
SS T = ∑∑ yij −
           2

            i =1 j =1             N

      = 193,999.31 −
                     (2155.1)2                 = 480.31
                                          24

                        1 4 2 y •2•
SS Treatments =           ∑ y i• − N
                        b i =1

                          (556.9 )2 + (550.1)2 + (533.2 )2 + (514.6 )2 − (2155.1) = 178.17
                            [                                                    ]
                                                                                                2
                        1
                    =
                        6                                                   24


                 1 6 2 y •2•
SS Blocks       = ∑ y• j −
                 a j =1    N

                        [
                = (350.8) + (359.0) + L + (377.8) −
                 1       2         2             2  (2155.1) = 192.25]
                                                                                     2


                 4                                     24


SS E = SS T − SS Treatments − SS Blocks
     = 480.31 − 178.17 − 192.25 = 109.89


Llenando la tabla de ANOVA haciendo cada uno de los cálculos con las formulas en la tabla
anterior tenemos el siguiente resultado:


                                                                                                                       41
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino


                                        Resultados de ANOVA
Fuente de                   Suma de        Grados de      Promedio
Variación                   Cuadrado       Libertad       Cuadrado             F0             P-Value
Tratamientos                                                                  8.11            0.0019
                              178.17            3           59.39
(Presión de Inserción)
Bloques
                              192.25            5           38.45
(Lotes)
Error                         109.89           15            7.33
Total                         480.31           23

Usando un α = 0.05, el valor crítico de F es F0.05 ,9 ,15 = 3.29 . Este valor se obtiene de las tablas para

la distribución F. Debido a que F0 > F0.05, 9,15 = 8.11 > 3.29 , concluimos que la presión de inserción

afecta el rendimiento promedio. El P-Value de la prueba también es bien pequeño lo que significa
que el experimento es aceptable. También, los lotes de resina (bloques) parecen diferir de forma
significativa, debido a que el promedio cuadrado para los bloques es grande en relación con el
error.
Ejemplo usando MINITAB

En Minitab, en la pantalla de WORKSHEET, ingresamos la data que está en la tabla 2. Se ingresan
tres columnas de datos. Una columna que identifique el tipo de presión de inserción, otra que
identifique los lotes de resina y otra que tenga la variable respuesta, en este caso el rendimiento,
que concuerde con el tipo de presión y lote de resina.




                                                                                                        42
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino




Como queremos realizar un ANOVA con un factor y un efecto bloqueado utilizamos la opción de
“General Linear Model” y la seleccionamos como se presenta a continuación.




                                                                                          43
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino

Al hacer esta selección aparecerá la siguiente pantalla en donde tiene que seleccionar la variables
respuesta, «Response», y el modelo que esta considerando, «Model».
Para seleccionar la variable respuesta coloque el cursor en la casilla de “Response” y aparecerán las
columnas que contienen data en la casilla de la izquierda. Seleccione Rendimiento dándole doble
clic a la columna rendimiento en la casilla izquierda o selecciona la columna rendimiento y
presiona el botón de «Select». En la casilla de Model debe seleccionar tanto la columna de Presión
de Inserción como la columna de Lote de Resina. Lo único que tiene que hacer colocar el cursor en
la casilla del modelo y luego selecciona las columnas correspondientes dándolo doble clic.

En la opción de «Storage» nos permite almacenar en una columna del WORKSHEET los
residuales y los valores estimados obtenidos a través del modelo. En la opción de «Graph»
podemos obtener las graficas con las cuales podemos hacer el análisis de los residuales y
determinar si hay normalidad en los datos.




Presionar «OK» cuando haya seleccionado todo lo deseado.


                                                                                                  44
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino

Los resultados del ANOVA aparecerán en la ventana de «Session» como se muestra en la próxima
figura. La primera parte es una información general de los factores usados en el modelo, que fueron
Presión de Inserción y Lote de Resina.




Si comparamos los resultados obtenidos usando Minitab con los resultados calculados con las
ecuaciones podemos notar que son los mismos, lo que demuestra que el software de Minitab es una
herramienta muy eficaz en diseño de experimentos. Otra información útil provista por el software
de Minitab es el “R-Sq” que se define como la proporción de la variabilidad de la data explicada
por el modelo de ANOVA. Esta cantidad de calcula usando la siguiente ecuación:
       SS Model
R2 =            . A mayor porciento más confiable y deseable es el modelo utilizado. Si este
       SSTotal
porciento está por debajo del 60%, entonces el modelo utilizado no es el mejor que describe la data.


Entre las presunciones de ANOVA el análisis de varianza supone que los errores del modelo, y por
ende las observaciones, tienen una distribución normal e independiente con la misma varianza en
cada nivel del factor. Estas presunciones se pueden verificar examinando los residuales. Un
residual es la diferencia entre la observación real yij y el valor ŷij que se hubiera obtenido de un

                                                                                                 45
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino

ajuste de mínimos cuadrados del modelo de ANOVA fundamental. A continuación se presentan
las gráficas obtenidas en Minitab del análisis de residuales:




La gráfica de normalidad nos permite visualizar que los datos están normalmente distribuidos ya
que la dispersión de los residuales esta sobre la línea de normalidad. La gráfica de histograma nos
permite corroborar que los datos están normalmente distribuidos con media igual a cero ya que el
histograma tiene forma de campana centralizada en el punto cero. La grafica de los residuales
versus los valores ajustados nos permite visualizar y corroborar la presunción de independencia de
los datos ya que no siguen un patrón sino que están dispersos de forma aleatoria.


   2. Experimento Cuadrado Latino

Este tipo de diseño se utiliza cuando existen 2 fuentes de ruido o variabilidad que son conocidas
por el experimentador. En la sección anterior se definió el experimento de bloque completamente
aleatorio, el cual permite bloquear una fuente de variabilidad conocida; bajo el experimento
cuadrado latino, se permite bloquear dos fuentes de variabilidad conocidas.
El modelo que define este tipo de experimento esta dado por:


                                                                                                46
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino



                                               Efecto de
                                               la            Efecto
                                               Columna       de la
                                                             Fila
                             Efecto del
                             tratamiento


                              y ij = µ + τ i + β j + γ k + ε ik
                                                    2 Bloques
Suponga que un experimentador está investigando el efecto de 5 tipos de formulaciones de
combustible (usado en la operación de una caldera), para observar el efecto en la tasa de
combustión. Cada formula de combustible se tomó de un lote que solo da para 5 pruebas. Además
de esto, las formulas son preparadas por diferentes operadores, que al ser personas, tienen
diferentes habilidades y adquisición de experiencia. De esta manera, se puede observar dos factores
de ruido o variabilidad que son identificables por el experimentador y que se pueden bloquear: los
lotes de material y los operadores. Así, el diseño apropiado seria hacer las pruebas para observar la
tasa de combustión de las formulaciones; teniendo en cuenta que se debe hacer el test probando
cada formulación exactamente una vez en cada lote de materia prima, y, además, cada formulación
debe ser preparada exactamente una vez por cada operador. La siguiente tabla ilustra lo
anteriormente descrito:


                                                      Operadores
                  Lote de            1          2         3            4         5
                  materia
                  prima
                  Lote 1         A=24       B=20       C=19        D=24      E=24
                  Lote 2         B=17       C=24       D=30        E=27      A=36
                  Lote 3         C=18       D=38       E=26        A=27      B=21
                  Lote 4         D=26       E=31       A=26        B=23      C=22
                  Lote 5         E=22       A=30       B=20        C=29      D=31


Note que el diseño es un arreglo cuadrado y que las 5 formulaciones (A, B, C, D, E) o tratamientos,
se denotan con letras latinas; de allí el nombre de cuadrado latino.
Las columnas y las filas representan 2 RESTRICCIONES EN LA ALEATORIEDAD.


                                                                                                  47
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino

En general, un cuadrado latino para p factores, es un cuadrado que tiene p columnas y p filas en
cuyas celdas resultantes (p2), hay p letras latinas que corresponden a los tratamientos, y cada una de
estas letras ocurre una vez y solamente una vez en cada fila y cada columna. Este modelo no tiene
interacción entre las filas, columnas y tratamientos.
Al observar la tabla también se puede ver que al tener la posición de los suscritos j y k se puede
encontrar la posición del suscrito i, es decir, si j (columna) = 3 y el suscrito k (fila) = 4, entonces el
suscrito i (correspondiente a la respuesta) = 26.


Análisis de varianza para el experimento cuadrado latino:


El análisis de varianza consiste en partir la suma de cuadrados totales de las N = p2 observaciones
en componentes para las filas, columnas, tratamientos y error, por ejemplo:
                            SS Total = SS filas + SS columnas + SS tratamientos + SS Error

Los grados de libertar respectivos son:
                               p 2 − 1 = p − 1 + p − 1 + p − 1 + ( p − 2)( p − 1)
En cuanto al estadístico de prueba, para el probar la hipótesis de que no hay diferencia entre las
medias de los tratamientos y para probar los efectos de las columnas y las filas tenemos:
                                                       MStratamientos
                                                F0 =
                                                         MS E


                                                Test para el Efecto
                                               de los tratamientos

Este estadístico bajo la hipótesis nula se distribuye como: Fp-1,(p-2)(p-1).
El procedimiento para hacer el Anova en términos de los tratamientos, columnas y filas para el
cuadrado latino, resulta ser una extensión del procedimiento hecho para el experimento de bloque
completamente aleatorio. A continuación se presenta la tabla de Anova para este caso:




                                                                                                       48
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino


                              Anova para el modelo de Cuadrado latino
   Fuente de               Suma de Cuadrados       Grados     Promedio
   Variación                                         de       Cuadrado                                                              F0
                                                  Libertad
                                                  2
                                 1 p 2 y...                                                        SS tratamient o
 Tratamientos        SS trat =     ∑ yi.. − N                                   p-1
                                                                                                      p −1                        MS tratamientos
                                 p i =1                                                                                    F0 =
                                                      2
                                                                                                      SS filas                      MS E
                                 1 p       y
 Filas               SS filas   = ∑ y..2k − ..                                  p-1
                                 p k =1     N                                                          p −1
                                                  2
                                 1 p 2 y...                                                         SS columnas
 Columnas            SS col =      ∑ y. j . − N
                                 p j =1
                                                                                p-1
                                                                                                      p −1
                                                                                                       SS E
 Error              SSE se calcula por resta                            (p-2)(p-1)
                                                                                                 ( p − 2)( p − 1)
                                                                 2
                                                          y...
 Total               SS Total = ∑∑∑ y ijk −
                                      2
                                                                                p2-1
                                   i    j   k              N

Ejemplo1:
Teniendo en cuenta la situación anteriormente descrita sobre las pruebas de la tasa de combustión
de 5 formulaciones, se procede a comprobar la igualdad de los efectos de los tratamientos de la
siguiente manera:
                                                  Ho : τ A = τ B = ...τ E


                                                  H 1 : τ A ≠ τ B ≠ ...τ E


Teniendo las hipótesis a probar claras, se procede a realizar los cálculos que faciliten llegar a las
sumatorias de cuadrados de cada uno de los componentes. A continuación se presenta la tabla con
los respectivos cálculos:


                                                                     Operadores
               Lote de                  1             2                     3                4              5              y..k
             materia prima
                Lote 1            A=24          B=20                  C=19             D=24           E=24           111
                 Lote 2           B=17          C=24                  D=30             E=27           A=36           134
                 Lote 3           C=18          D=38                  E=26             A=27           B=21           130
                 Lote 4           D=26          E=31                  A=26             B=23           C=22           128
                 Lote 5           E=22          A=30                  B=20             C=29           D=31           132
                    y.j.          107           143                   121              130            134            y…= 635

                                                                                                                                                49
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino

Totales para los tratamientos (formulaciones):
                                 Letra latina           Tratamiento            Total
                                      A                     y1..          24+30+…36 = 143
                                      B                     y2..                101
                                      C                     y3..                112
                                      D                     y4..                149
                                      E                     y5..                130

Ahora se procede a calcular las sumas de cuadrados para los tratamientos, las filas, las columnas,
el error y la suma de cuadrados total:
                                                                    635 2
                         SS total   = ∑∑∑ 24 + 17 + 18 + ... + 31 −
                                                        2     2       2
                                                                          = 676 2

                                      i j k                          25
                                             1 5                                    635 2
                          SS lotes _ filas =   ∑
                                             5 K =1
                                                    [1112 + 134 2 + ... + 132 2 ] −
                                                                                     25
                                                                                          = 68

                                                1 5                                   635 2
                     SS operadores _ columnas = ∑ [107 2 + 143 2 + ... + 134 2 ] −           = 150
                                                5 j =1                                  25
                                                    1 5                                 635 2
                    SS formulaciones _ tratamientos =  ∑ [1432 + 1012... + 130 2 ] − 25 = 330
                                                    5 i =1
           SS Error = SS total   − SS lotes − SS operadores − SS formulaciones = 676 − 68 − 150 − 330 = 128

Ahora se procede a construir la tabla de Anova:
                            Anova para el modelo de Cuadrado latino
    Fuente de           Suma de    Grados de       Promedio Cuadrado
    Variación          Cuadrados    Libertad                                                                 F0


                                                                    SS tratamient o 330
 Formulaciones              330                p-1 = 5-1 = 4                       =       = 82.5
                                                                       p −1             4            F0 =
                                                                                                          MS tratamientos
                                                                             SS filas                        MS E
 Lotes                       68                  p-1 = 4                              = 17             82.5
                                                                               p −1                 =       = 7.73
                                                                          SS columnas                 10.67
 Operadores                 150                  p-1 = 4                               = 37.5
                                                                             p −1
                                               (p-2)(p-1) =             SS E
 Error                      128                                                       = 10.67
                                                    12            ( p − 2)( p − 1)
 Total                      676                 p2-1 = 24
Al calcular Fp-1,(p-2)(p-1) con un nivel de significancia de 0.05 en las tablas de la distribución F, se
obtiene el valor de F critica = 3.36. Por lo tanto:
                                     Fcalculada > Fcritica                   7.73 > 3.36

                                                                                                                        50
Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino

Al ser mayor la F calculada, se rechaza la hipótesis nula y se concluye que hay una diferencia
significativa en la tasa de combustión promedio, generada por las diferentes formulaciones del
combustible.


Ejemplo 2: situación que describe un experimento tipo cuadrado latino
Una compañía de pintura quiere evaluar la habilidad de cuatro tipos de pintura blanca para tolerar
las inclemencias del tiempo. Para efectuar esta prueba se han construido cuatro casas cuadradas en
las que se garantiza que uno de los lados mira exactamente al norte.




                                                                                               51
Sección 3: Diseño Factorial


    1. Diseño Factorial
En un experimento factorial se analizan todas las posibles combinaciones de los niveles
de los factores en cada réplica del experimento. Por ejemplo, si el factor A tiene a niveles
y el factor B tiene b niveles entonces cada replica tiene ab combinaciones posibles como
muestra la figura 1.




                          Figura 1. Combinaciones posibles para A y B.




El efecto de un factor se define como el cambio en respuesta producido por un cambio en
el nivel del factor. En algunos experimentos podemos encontrar que la diferencia en
respuesta entre los niveles de un factor no es la misma en todos los niveles del otro factor.
Cuando esto ocurre se dice que hay iteración entre los factores. Como podemos ver en la
figura 2 la interacción no está presente ya que cuando cambio el factor A de su nivel 1 al
nivel 2 la respuesta aumenta no importando en qué nivel esté el factor B. Sin embargo, en
la figura 3 podemos apreciar el comportamiento del gráfico cuando existe interacción
entre los factores.




                                                                                          52
Sección 3: Diseño Factorial



                                                 B1
                70                                                            70
                60                                                            60                           B1
                                                   B2
                50                                                            50
   Respuesta




                                                                  Respuesta
                40                                                            40
                30                                                            30
                20                                                            20
                10                                                            10                              B2

                           1            A          2                               1        A             2

  Figura 2. Grafica cuando no existe interacción                  Figura 3. Grafica cuando existe interacción
                  entre los factores.                                              entre los factores.



El factorial más pequeño es el que tiene 2 factores con 2 niveles cada uno. Las posibles
combinaciones de este experimento forman los vértices de un cuadrado como se muestra
en la figura anterior. Si utilizamos el método de variar un factor a la vez para explorar
cada una de las combinaciones nos encontramos que éste método es inefectivo debido a
que (como se muestra en la figura 4) una de las posibles combinaciones queda sin
explorar. Además, para factoriales con más de 2 factores resultaría ineficiente e
inadecuado.




               Figura 4. Gráfica que ilustra cuando se varía un factor a la vez en un factorial de 2 factores.




                                                                                                                   53
Sección 3: Diseño Factorial


Si tenemos un factorial con 3 factores cada uno con 2 niveles, las posibles combinaciones
de este experimento forman los vértices de un cubo como se muestra en la figura 5. Al
variar un factor a la vez solo se pueden explorar la mitad de las posibles combinaciones.
En la figura 4 podemos notar los espacios vacíos de las combinaciones sin explorar.




                                 2
                          Factor C




                                 1
                                     2
                                         Fa
                                           ct
                                                or
                                                   B
                                                       1
                                                           1
                                                        Factor A          2

Figura 5. Factorial de 3 factores ilustrando combinaciones sin explorar al utilizar el método de variar un
                                              factor a la vez.



Variar un factor a la vez resulta un método ineficiente y nunca va a llegar a su valor
óptimo. Es por esto que una de las ventajas de un diseño factorial es que son más
eficientes que los experimentos de un factor a la vez. Además, un diseño factorial es
necesario cuando pueden haber iteraciones presentes para evitar conclusiones engañosas.
Finalmente, los diseños factoriales permiten estimar los efectos de un factor a varios
niveles de los otros factores, generando conclusiones válidas sobre un rango de
condiciones experimentales.

Los experimentos a menos dimensiones me dan más réplicas. Si tengo un experimento
con tres dimensiones (A, B y C) y elimino la dimensión C, es como si se trasladara la
capa superior hacia abajo resultándome 2 datos por cada vértice del cuadrado resultante
como se puede apreciar en la figura 6.




                                                                                                       54
Sección 3: Diseño Factorial


    (18)                            (17)


     C                                        (23)
                      (20)
                                                                  (21, 18)              (20, 17)
    (21)
                             (20)                   Repeticiones
                                                                       B
           B                                    eliminando un factor
               (19)                          (18)                            (19, 20)    A         (18, 23)
                             A
   Figura 6. Ilustración de cómo se obtienen repeticiones cuando se elimina uno de los factores; en este
                                      ejemplo se eliminó el factor C.



La representación de ANOVA para un diseño de experimento factorial de 2 factores esta
dada por el siguiente modelo:


                                     y ijk = µ + τ i + β j + (τβ) ij + ε ijk ,

donde el término (τβ) ij es el efecto de la interacción entre el factor A y el factor B, y y ijk

es la respuesta observada cuando el factor A esta en el nivel i y el factor B está en el nivel
j para la réplica k.


La ecuación fundamental de ANOVA está dada por la suma de los cuadrados y se
expresa de la siguiente manera teniendo el factor A con a niveles y el factor B con b
niveles:


                             SS total = SS A + SS B + SS AB + SS error

La ecuación fundamental de ANOVA para un solo factor era

                                     SS total = SS Tratamient o + SS error ,

Una forma de visualizar la ecuación de ANOVA para 2 factores es como si
expandiéramos la suma de los cuadrados del tratamiento de la ecuación de un solo factor
como se muestra a continuación:



                                                                                                              55
Sección 3: Diseño Factorial




Los términos de la suma de los cuadrados se calculan como se muestra a continuación:

Suma de cuadrados totales:
                                          a     b   n
                                                              y•2••
                                SS T = ∑∑∑ yijk −
                                             2

                                         i =1 j =1 k =1       abn

Suma de los cuadrados de los efectos son:
                    1 a 2         y2                                     1 b 2            y2
            SS A =    ∑    y i•• − •••              y         SS B =       ∑     y • j • − •••
                   bn i =1        abn                                    an j =1          abn

Es conveniente obtener la suma de los cuadrados de la interacción, SS AB , en dos fases.
Primero, se calcula la suma de cuadrados entre los totales de las celdas ab que se conoce
como la suma de cuadrados debido a "subtotales":


                                               1 a b 2            y2
                              SS Subtotals =     ∑∑        yij • − •••
                                               n i =1 j =1        abn

Esta suma de cuadrados también contiene SS A y SS B . Por lo tanto, el segundo paso es
calcular la suma de cuadrados de la interacción como sigue:

                              SS AB = SS Subtotals − SS A − SS B

Ahora por substracción podemos calcular la suma de cuadrados del error como sigue:

             SS E = SST − SS AB − SS A − SS B             ó    SS E = SS T − SS Subtotals




                                                                                                 56
Sección 3: Diseño Factorial

A continuación se presenta la tabla de ANOVA para el Factorial de 2 factores:

  Fuente de        Suma de       Grados de
                                                      Cuadrado Promedio                Fo
  Variación       Cuadrados      Libertad

                                                                 SS A                 MS A
A tratamientos       SS A           a −1                  MS A =                  Fo =
                                                                 a −1                 MS E
                                                                 SS B                 MS B
B tratamientos       SS B           b −1                 MS B =                  Fo =
                                                                b −1                  MS E
                                                                 SS AB                MS AB
Interacción          SS AB      (a − 1)(b − 1)       MS AB =                     Fo =
                                                             (a − 1)(b − 1)           MS E
                                                                 SS E
Error                SS E         ab(n − 1)           MS E =
                                                              ab(n − 1)
Total                SST           abn − 1


Ejemplo Numérico:


Tenemos 2 factores (A y B) a dos niveles cada uno (1 y 2) donde cada combinación tiene
dos réplicas. Se quiere calcular la suma de cuadrados de cada efecto, (tratamientos A y
B, la interacción, el error y el total). La data se encuentra en la siguiente tabla:
                                                          A
                                                      1       2
                                                      8       4
                                                 1
                                                      9       3
                                        B
                                                     10       14
                                                 2
                                                     12       16

Realizamos la suma por fila y por columnas para facilidad de los cálculos.

                                                          A
                                                      1        2    Σ
                                                      8        4
                                                 1                 24
                                                      9        3
                                        B
                                                     10       14
                                                 2                 52
                                                     12       16
                                            Σ        39       37   76




                                                                                              57
Sección 3: Diseño Factorial

Calculando la suma de cuadrados de los efectos tenemos:

                                             39 2 + 37 2 (76)
                                                                2
                                   SS A =               −     = 0.5
                                                  4        8

                                          24 2 + 52 2 (76 )
                                                                2
                                   SS B =            −      = 98
                                               4        8


                        SS Total = 8 2 + 9 2 + ⋅ ⋅ ⋅ + 14 2 + 16 2 −
                                                                       (76 )2       = 144
                                                                         8

Para poder buscar la interacción hacemos una expansión (booleana):

                              11            21       12         22
                              8             4        10         14
                              9             3        12         16
                              17            7        22         30           76

                                          17 2 + 7 2 + 22 2 + 30 2 (76)
                                                                                2
                       SS Tratamiento   =                         −     = 139
                                                      2              8

                                   SS AB = SS Tratamientos − SS A − SS B

      = 139 − 0.5 − 98 = 40.5

SS Error = SS Total − SS A − SS B − SS AB

= 144 − 0.5 − 98 − 40.5 = 5

Si todos los factores en un experimento factorial tienen 2 niveles, conocemos estos
factores como 2k donde k es el número de factores.

2k = número de tratamientos o condiciones experimentales

En la siguiente figura se muestra como se verían representados los tratamientos o
combinaciones de este tipo de diseño experimental tomando diferentes valores de k.




                                                                                            58
Sección 3: Diseño Factorial




                                                     C
                     B

                        A                             B
                 2
                2 = 4 tratamientos ó                            A
                                                          3
                     combinaciones                       2 = 8 tratamientos




                              C

                                  B
                                          A                     D
                                       24 = 16 tratamientos



Como podemos apreciar en la figura anterior, a mayor número de factores mayor es el
número de tratamientos o combinaciones a realizar dentro del experimento. En los
siguientes temas se discutirá el diseño factorial 2k y el diseño factorial 2k con bloques,
que es cuando no se pueden realizar cada una de las posibles combinaciones o
tratamientos.




                                                                                       59
Sección 4: Regresión Lineal


   1. Regresión Lineal

Los factores envueltos en la experimentación pueden ser de tipo cuantitativos o cualitativos. Un
factor cuantitativo es aquel que sus niveles pueden ser asociados con puntos dentro de una escala
numérica, como la temperatura, el tiempo o la presión. Un factor cualitativo, es aquel que sus
niveles no pueden ser organizados por el orden de su magnitud, en este caso se pueden
                                                     magnitud,
mencionar personas u operadores, lotes de producción, turnos de trabajo etc.

La regresión lineal trabaja con factores de tipo cuantitativos. Este modelo puede ser utilizado
para predecir la respuesta en cualquier punto del espacio contenido dentro de la región
                                                  espacio
experimental, es decir, si por ejemplo los niveles de temperatura analizados son 100 y 200, el
modelo de regresión le permite al experimentador hacer inferencias sobre una temperatura que se
encuentre entre 100 y 200.

El modelo de regresión caracteriza la relación entre una variable respuesta que depende de k
     delo
variables independientes o regresoras.

Para ilustrar lo anterior, suponga que se desea medir la dureza de un elemento bajo dos niveles
                    erior,
distintos de temperatura y dos niveles distintos de presión. Al realizar las medidas se obtiene el
                               niveles
siguiente grafico:




                                                                                               60
Sección 4: Regresión Lineal

Al observarlo se puede determinar que el factor temperatura tiene una influencia mayor en la
dureza que el factor presión. Esto porque los cambios de temperatura proveen una pendiente más
inclinada que la pendiente que proveen los cambios en la presión. Para comparar entonces la
influencia de los factores en la variable respuesta es relevante encontrar la pendiente de los
factores de interés (temperatura y presión).

Un método para obtener las pendientes y establecer un modelo matemático que describa la
situación sería un modelo de regresión. Para este caso particular donde hay dos variables
predictoras y una variable respuesta el modelo seria:

                                     y = Bo + B1 X 1 + B2 X 2 + ε

Donde las B’s representan los coeficientes del modelo de regresión, siendo Bo el intercepto del
plano, B1 el cambio esperado en la variable respuesta por unidad de cambio en la variable X1
(temperatura), B2 el cambio esperado en la variable respuesta por unidad de cambio en la
variable X2 (presión) y ε representa el error o residuo del modelo.

En forma matricial, el modelo de regresión puede ser expresado así:

                                               y = BX + ε

Donde:

            y1          1X 11       X 12      ... X 1k         Bo       ε 1 
           y                                                  B         ε 
            2           1X 21       X 22       ... X 2 k       1         2
           .            .                                     .         . 
         y=          X =                                    B=       ε = 
           .            .                                     .         . 
           .            .                                     .         . 
                                                                         
            yn 
                        1X n1
                                      X n2       ... X nk       Bk 
                                                                            ε n 
                                                                               




Lo anterior muestra un vector y (de tamaño nx1) de las observaciones del experimento, X es la
matriz de diseño (de tamaño nxp) de los niveles de las variables independientes, es decir los
factores del experimento, B es un vector (de tamaño px1) de los coeficientes del modelo de
regresión y ε es un vector (de tamaño nx1) de errores o residuales.

                                                                                            61
Sección 4: Regresión Lineal

Para estimar los coeficientes de regresión B, es necesario basarse en un criterio. El criterio más
utilizado es el de minimizar la suma de cuadrados de los errores, de manera que se pueda
encontrar aquellos estimadores de los coeficientes de regresión que minimicen la suma de
cuadrados de los errores:

                                     n
                               L = ∑ ε n = ε ' ε = ( y − XB )' ( y − XB )
                                       2

                                    i =1



L puede ser expresada como:

                                 L = y ' y − B ' Xy − y ' XB + B ' X ' XB
                                 L = y ' y − 2 B ' X ' y + B ' X ' XB

El término B’X’y es un escalar al igual que su transpuesta, por esta razón se puede agrupar el
segundo término de esta manera. Ahora la derivada de L con respecto a B resulta en:

                            ∂L
                                 = −2 X ' y + 2 X ' Xb = 0 → X ' Xb = X ' y
                            ∂B b

Así los estimadores para los coeficientes que minimizan la suma de cuadrados de los errores se
obtienen:
                                                                            Formula que se utiliza
                                                                            para encontrar los
                                                                            coeficientes B

                                             b = ( X ' X ) −1 X ' y




Las propiedades de la varianza de b se expresan mediante la matriz de varianza-covarianza. Esta
es una matriz simétrica de tamaño p x p, cuyos elementos contenidos en la diagonal son la
varianza de bj y cuyo elemento (i,j) representa la covarianza entre los elementos bi y bj. La matriz
de covarianza del vector b está dada por:

                                           Cov(b) = σ 2 ( X ' X ) −1

Con regularidad será necesario estimar σ 2 . Para estimar este parámetro se toma en cuenta la
suma de cuadrados del residual, por medio de la cual se demuestra que:

                                                                                                     62
Sección 4: Regresión Lineal


                                     E ( SS ε ) = σ 2 ( n − p )

Donde el termino n-p se refiere a los grados de libertad del error. De esta manera al despejar se
consigue el estimador no sesgado para σ 2 :

                                                    SS ε
                                         σ2 =
                                                  (n − p)

Ahora para ilustrar lo descrito se toma en cuenta el siguiente ejemplo: suponga que se está
midiendo la dureza como función de dos factores, temperatura y presión. El experimentador
tomo una observación en cada una de las condiciones y obtuvo el siguiente resultado:

                  Dureza                Presión               Temperatura
                  25                    20                    100
                  35                    40                    100
                  20                    20                    200
                  22                    40                    200



Con este resultado, el experimentador utilizo el programa Minitab y realizo el cálculo para
encontrar el modelo de regresión que se ajusta a los datos:

    1. En el menú de stat, en regresión, se da click a la ventana desplegada en la opción de
        regresión como muestra la figura:




                                                                                                63
Sección 4: Regresión Lineal




2. Luego se despliega la ventana donde se ingresan los datos. En la casilla de response se
   ingresa la columna de respuestas, en la casilla de predictors, se ingresan los datos
   correspondientes a los factores predictores o variables independientes como muestra la
   figura:




3. Al hacer click en el botón de ok se obtiene el siguiente resultado:




                                                                                       64
Sección 4: Regresión Lineal

                 Regression Analysis: Dureza versus Temperatura, Presion


                 The regression equation is
                 Dureza = 30.0 - 0.0900 Temperatura + 0.300 Presion




                 Predictor              Coef   SE Coef      T         P
                 Constant          30.000        8.718   3.44    0.180
                 Temperatura    -0.09000       0.04000   -2.25   0.266
                 Presion           0.3000       0.2000   1.50    0.374




                 S = 4     R-Sq = 88.0%        R-Sq(adj) = 63.9%




La columna catalogada como coef, despliega los coeficientes predictores o betas, de esta manera
la ecuación de regresión para el ejemplo se resume en:

                           Dureza = 30.0 – 0.09Temperatura + 0.30Presion

El termino R-sq representa el R2 que define la variabilidad explicada por el modelo de regresión,
es decir, el 88% de la variabilidad está siendo explicada por el modelo de regresión para el
experimento conducido. De esta manera el modelo explica de forma suficiente los datos y por lo
tanto la regresión se ajusta a ellos.

Observando la ecuación, no se le puede dar una explicación al intercepto Bo = 30 porque
ninguno de los rangos de experimentación para los factores incluyen el cero, que es lo que se usa
de referencia para explicar el intercepto.

Ahora en el caso de los factores, el interés es encontrar cuál de ellos afecta más la respuesta. Al
observar la figura ubicada en la primera pagina de esta sección, se ve que la temperatura afecta la
respuesta en mayor proporción que la presión. Sin embargo al observar el modelo de regresión
que se ajusto al experimento, no se puede deducir lo mismo, por el contrario los coeficientes
obtenidos a simple vista hacen pensar que la presión afecta la temperatura en mayor proporción.
Esto se da porque ambos factores (temperatura y presión) están en diferentes escalas, es decir las


                                                                                                65
Sección 4: Regresión Lineal

escalas de los niveles de los factores miden diferentes características y por esto no se espera que
coincidan, por lo tanto los coeficientes de los factores no son comparables.

Para lograr una comparación entre los coeficientes de los factores, se utilizan entonces las
variables codificadas. La relación entre las variables naturales (medidas en su escala original) y
las variables codificadas está dada por:

                                                       (η i − η )
                                                Xi =
                                                        rango
                                                            2

Donde Xi es la variable codificada, η i es la variable natural yη es el promedio de los niveles de
la variable a ser codificada. Para el caso de experimentos 2k (se estudiaran más adelante) donde
hay k factores cada uno con dos niveles (como es el caso de este experimento), la codificación
produce entonces 2 niveles, +1 y -1. En el caso del ejemplo, al codificar la variable temperatura
se obtiene:

                                      (100 − 150)                          (200 − 150)
                               Xi =               = −1              Xi =               =1
                                       200 − 100                            200 − 100
                                           2                                    2

Esto describe que el nivel bajo de temperatura (100) ahora se codifico a un nivel -1 y el nivel alto
(200) se codifico a un 1. La siguiente tabla muestra las variables codificadas:

                   Dureza                  Presión                  Temperatura
                   25                      -1                       -1
                   35                      1                        -1
                   20                      -1                       1
                   22                      1                        1



Al hacer el mismo procedimiento que se hizo para las variables naturales en Minitab, se obtiene
el siguiente resultado para las variables codificadas:




                                                                                                 66
Sección 4: Regresión Lineal

            Regression Analysis: Dureza_1 versus Presion_1, Temperatura_1


            The regression equation is
            Dureza_1 = 25.5 + 3.00 Presion_1 - 4.50 Temperatura_1




            Predictor             Coef   SE Coef      T        P
            Constant            25.500    2.000    12.75    0.050
            Presion_1            3.000    2.000     1.50    0.374
            Temperatura_1       -4.500    2.000    -2.25    0.266




            S = 4      R-Sq = 88.0%      R-Sq(adj) = 63.9%




La ecuación de regresión ahora es:

                           Dureza = 25.5 – 4.5Temperatura + 3.0Presion

Ahora con este modelo se nota que el impacto mayor en la respuesta lo da el factor presión, ya
que la misma va a variar en -4.5 por cada unidad de cambio en la temperatura. La constante 25.5
es ahora el valor de dureza esperado cuando ambas variables se encuentran en el valor nominal o
nivel medio de cada variable. Por otro lado los coeficientes de las variables predictoras son
comparables porque ambos se encuentran en la misma escala.

Prueba de hipótesis para el modelo de regresión

El interés frecuentemente es probar las hipótesis para determinar que coeficientes dentro del
modelo de regresión son significativos. La hipótesis para probar la significación de cualquier
coeficiente j, está dada por:

                                             Ho : β j = 0
                                             H1 : β j ≠ 0

Si el resultado de la prueba fuera que la hipótesis nula no es rechazada, entonces se puede
concluir que la variable Xj asociada con el coeficiente β j no impacta la respuesta




                                                                                                 67
Sección 4: Regresión Lineal

significativamente y por tanto puede ser eliminada del modelo. La estadística de prueba para
efectuar la prueba de hipótesis está dada por:

                                                          bj
                                              to =
                                                     C jj (MSE )


Donde:

bj: es el estimador de β j

Cjj: elemento de la diagonal de la matriz de varianza-covarianza (X’X)-1 correspondiente al
coeficiente bj.

MSE: estimador del error

Cabe aclarar que la covarianza es una medida de la relación entre dos variables. Si estas son
independientes su covarianza es 0. Sin embargo el hecho de que la covarianza sea 0 no implica
que las variables sean independientes

Para ilustrar la ubicación de los valores Cjj se muestra la siguiente matriz:


                                               bo    b1        b2   …   bk
                                              C 00                          
                                                   C11                      
                                                                            
                                                       C 22                 
                              ( X ' X ) −1   =                              
                                              .                             
                                              .                             
                                                                            
                                              
                                                                       C kk 
                                                                             




                                                                                                68
Sección 4: Regresión Lineal

Ejemplo 1

Suponga que se tienen dos factores A y B cada uno con dos niveles 1 y 2. El experimentador
desea saber el impacto en la respuesta al variar los factores en sus diferentes niveles. Después de
realizar un experimento factorial con dos replicas se obtuvo la siguiente respuesta:




                                                    Factor A
                           Factor B            1                2
                               1               8                4
                                               9                3
                               2               10              14
                                               12              16



Teniendo las respuestas se procede a:

    1. Se define el vector de respuestas y el cual puede tener las respuestas en cualquier orden:

                                                  8 
                                                  9 
                                                   
                                                  4 
                                                   
                                                   3
                                                y= 
                                                  10
                                                   
                                                  12
                                                  14
                                                   
                                                  16
                                                   

    2. Se define la matriz X compuesta de los niveles correspondientes a la respuesta que se
        puso en el vector y. La matriz X contiene una columna por cada coeficiente a estimarse y
        una fila por cada dato de respuesta.




                                                                                                69
Sección 4: Regresión Lineal

                                                                              Coeficiente
                                                                              correspondiente a la
                                                                              interacción.
                                                    b0   b1    b2    b3
                                                                              b3 = b1 x b2
                                   8  →   1           −1   −1    + 1
                                   9      1           −1   −1    + 1
                                    →                               
                                   4  →   1           +1   −1    − 1
                                    →                               
                                   3  X = 1           +1   −1    − 1          Se puso -1 para el
                                y=
                                   10 →   1           −1   +1    − 1          nivel más bajo (1) y
                                    →                               
                                   12     1           −1   +1    − 1          +1 para el nivel más
                                   14 →   1           +1   +1    + 1          alto del factor (2)
                                                                    
                                   16 →
                                          1
                                                        +1   +1    + 1
                                                                       


3. Se procede a hallar X’X:

                                                      1      −1    −1     + 1
                                                      1      −1    −1     + 1
                                                                             
              + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1       1      +1    −1     − 1
               − 1 − 1 + 1 + 1 − 1 − 1 + 1 + 1                             
                                                       1      +1    −1     − 1
         X '=                                    X =
               − 1 − 1 − 1 − 1 + 1 + 1 + 1 + 1      1      −1    +1     − 1
                                                                           
               + 1 + 1 − 1 − 1 − 1 − 1 + 1 + 1      1      −1    +1     − 1
                                                      1      +1    +1     + 1
                                                                             
                                                      1
                                                             +1    +1     + 1
                                                                              


                                           1      −1    −1   + 1
                                           1      −1    −1   + 1
                                                                
         + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 1      +1    −1   − 1         8000 
         − 1 − 1 + 1 + 1 − 1 − 1 + 1 + 1 1      +1    −1
                                                                 
                                                              − 1         0800
                                        *                       = X'X =      
         − 1 − 1 − 1 − 1 + 1 + 1 + 1 + 1 1      −1    +1   − 1         0080
                                                                            
         + 1 + 1 − 1 − 1 − 1 − 1 + 1 + 1 1      −1    +1   − 1         0008
                                           1      +1    +1   + 1
                                                                
                                           1
                                                  +1    +1   + 1
                                                                 

4. Se procede a sacar la inversa de X’X = (X’X)-1




                                                                                                         70
Sección 4: Regresión Lineal

                                                                  Los       ceros representan la
                                                   1 000 
                        8000                     8            covarianza.         Como          puede
                        0800                    0 1 00        observarse los coeficientes en
                                                 =
                                                      8 
                  X'X =       → ( X ' X ) −1
                        0080                    00 1 0        este       caso         no      tendrán
                                                    8 
                                                                  influencia sobre los demás,
                        0008                        1 
                                                  000 8 
                                                                resultando        en     el      mismo
                                                                  estimado          del        coeficiente
                                                                  independiente           del     modelo
                                                                  lineal.

5. Se procede a hallar el vector X’y

                                                              8 
                                                              9 
                                                               
                            + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 4  76 
                            − 1 − 1 + 1 + 1 − 1 − 1 + 1 + 1 3  − 2
                      X'y =                                *  =  
                            − 1 − 1 − 1 − 1 + 1 + 1 + 1 + 1 10 28 
                                                               
                            + 1 + 1 − 1 − 1 − 1 − 1 + 1 + 1 12 18 
                                                              14
                                                               
                                                              16
                                                               

6. Por último, multiplicando la matriz (X’X)-1 y el vector X’y se obtiene el vector de
   coeficientes Bj.

                                  (X’X)-1 * X’y =       bj

                                  1 000         76               b0
                                  8      76   8 
                                 0 1 00   − 2 
                                  8  *  − 2 =  8 
                                                                     b1
                                 00 1 0 28  28                 b2
                                     8     8
                                     1    18 
                                            18
                                                                     b3
                                 000 8 
                                                 8 
                                                     

La ecuación de regresión se expresa entonces así:

                                 76 − 2      28     18
                            y=      +   XA +    XB + X AXB
                                  8   8      8       8




                                                                                                             71
Sección 4: Regresión Lineal

Según la ecuación, el factor A es el que menos afecta la respuesta al variar. Al hacer el
análisis mediante Anova, teniendo en cuenta un experimento de tipo factorial con 2 replicas
se obtiene la siguiente respuesta:

         Factorial Fit: respuesta versus a, b

         Estimated Effects and Coefficients for respuesta (coded units)

         Term         Effect      Coef    SE Coef       T       P
         Constant               9.5000     0.3953   24.03   0.000
         a           -0.5000   -0.2500     0.3953   -0.63   0.561
         b            7.0000    3.5000     0.3953    8.85   0.001
         a*b          4.5000    2.2500     0.3953    5.69   0.005


         S = 1.11803     R-Sq = 96.53%      R-Sq(adj) = 93.92%




En la respuesta se puede observar los mismos valores para los coeficientes que se obtuvieron
mediante la regresión lineal. Al observar los valores de P para los factores, se encuentra que
el factor A es no significativo debido a que 0.561 > 0.05, siendo 0.05 el nivel de
significancia utilizado para la prueba. Por lo anterior se dice entonces que el factor A no es
significativo, es decir, al variar sus niveles la respuesta no se impacta significativamente.




                                                                                                72
Sección 5: Diseño Factorial 2k


    1. Diseño Factorial 2k
El más importante de los casos especiales de los diseños factoriales es el que tiene k
factores cada uno a dos niveles. Estos niveles pueden ser cuantitativos, valores de
temperatura o presión, o pueden ser cualitativos, tales como 2 máquinas o dos
operadores, o tal vez pueda ser la presencia o ausencia de un factor. Una réplica completa
de tal diseño requiere 2 × 2 × 2 × · · · × 2 = 2k observaciones y se conoce como un diseño
factorial 2k.


Como cada factor en el experimento tiene 2 niveles, los llamaremos nivel bajo (-) y nivel
alto (+). El diseño más pequeño en este tipo de experimento es el que tiene k = 2 factores.
Es importante realizar réplicas de cada tratamiento o combinación en el experimento ya
que esto me permite comparar entre valores (datos obtenidos en los diferentes niveles de
un factor fijando los demás factores) y dentro de valores (datos obtenidos de una misma
combinación), para entender mejor lo antes establecido vea el ejemplo en l siguiente
figura:



                                                                   Réplica:
                                                                   I
                            2                    dentro
                                                                   II
                  Presión




                            B

                                  (32.5)                 (25.98)     entre
                            1
                                   (32)                   (29)


                                    1           A           2
                                           Temperatura



El número de corridas a realizarse en el experimento es 2k × # réplicas. Además, también
es importante que el orden en que se realizan las corridas sea aleatorio, es por esto que el
experimento es un experimento completamente aleatorio. Muchas veces resulta
conveniente escribir la data en orden descendente de las combinaciones de los
tratamientos. Esta forma de tabular se le conoce como el orden estándar y es como sigue:

                                                                                         73
Sección 5: Diseño Factorial 2k



                               Combinación de          Nomenclatura de
                    A    B
                                 Tratamientos           Tratamientos
                    -     -    A low, B low             a0b0 = (1)
                    +     -    A high, B low            a1b0 = a
                    -     +    A low, B high            a0b1 = b
                    +     +    A high, B high           a1b1 = ab

Cuando el factor está en su nivel bajo su exponente es 0 y cuando el factor esta en su
nivel alto su exponente es 1. Gráficamente esta nomenclatura es representada de la
siguiente manera:

                                    b                  ab
                                  (-,+)               (+,+)


                                 B


                                  (-,-)      A        (+,-)
                                   (1)                  a



En un diseño factorial 2k es fácil expresar los resultados del experimento en términos de
un modelo de regresión. Aunque para este tipo de experimentos se pueden usar modelos
de efectos como de promedios, el modelo de regresión es mucho más natural e intuitivo.
La ecuación para un modelo de regresión sería:
                                 y = β 0 + β1 x 1 + β 2 x 2 + ε


Ejemplo:


Se quiere medir el rendimiento de un químico midiendo la temperatura y la presión a la
que está expuesto. Supongamos que de los datos obtenida los valores de la temperatura
fluctúan entre 100oF y 200oF y los valores de la presión varían entre 3 y 5 Bars.




                                                                                        74
Sección 5: Diseño Factorial 2k

                                         Supongamos la siguiente ecuación resultante del
                                         modelo de regresión:
            5
                                                      No tiene una explicación, por lo tanto, no
  Presión




                                                      se puede decir que significa este intercepto.
            B
                                          y = 50 + 0.1X A + 1X B
                                          ˆ
            3

                100    A      200
                                         Para determinar cual de los dos factores tiene mas peso en el
                 Temperatura             experimento no puedo fijarme en sus coeficientes, también debo ver su
                                         tabulación ya que el rango de valores de ambos factores es diferente.


De esta forma resulta muy difícil poder llegar a conclusiones asertivas, es por esto que
para este tipo de experimento es necesario codificar las variables. La ecuación para
codificar las variables (factores) es como sigue:
                                                  X i : var iable _ codificada
                    ∈ − ∈i
                Xi = i      ,           donde     ∈i : var iable _ natural
                    rango i
                                                  ∈i : promedio _ var iable _ natural
                       2


Codificando las variables del ejemplo anterior tenemos:
Variable Temperatura:
                           100 − 150                                  200 − 150
                  X100 =             = −1                   X 200 =             = +1
                             100                                        100
                                 2                                          2
Variable Presión:
                             3− 4                                      5−4
                      X3 =        = −1                          X5 =        = +1
                              2                                         2
                                2                                         2


Supongamos que ahora con las variables codificadas la ecuación resultante del modelo de
regresión es la siguiente:
                                       y = 30 + 0.2X A + 1.3X B
                                       ˆ
El valor de la constante, 30, es el valor de mi respuesta cuando Xi está en cero (cero es el
centro de mi región experimental). Ahora tiene una explicación física porque los ceros
están contenidos.

                                                                                                      75
Sección 5: Diseño Factorial 2k


Ahora, ¿Cuál factor, XA o XB, tiene mayor peso en el experimento?
   o XB, porque como ahora los valores están codificados pues puedo utilizar el
        coeficiente para determinar cual factor tiene mayor peso.


Ahora veremos un ejemplo de ANOVA por regresión:
                                  Data:
                                                        A
                                                   1        2
                                                   8         4
                                               1
                                                   9         3
                                         B
                                                   10       14
                                               2
                                                   12       11


                                                     b 0        b1   b2   b3 
                     8                             1
                     9                                        −1   −1   + 1
                                                                              
                                                   1          −1   −1   + 1
                     4                                                     
                                                   1          +1   −1   − 1
                       3
                   y=                            X=1          +1   −1   − 1
                     10                                                    
                                                   1          −1   +1   − 1
                     12                            1
                     14                                        −1   +1   − 1
                                                                             
                                                   1          +1   +1   + 1
                     11
                                                   1
                                                                +1   +1   + 1
                                                                              

X→ debe tener una columna por cada coeficiente a estimar y una fila por cada dato en el
experimento.

y = b 0 + b1 X A + b 2 X B + b 3 X A X B + ε

b = (X ′X ) X ′Y
ˆ          −1




Resolviendo por partes:




                                                                                    76
Sección 5: Diseño Factorial 2k


                                         1                        − 1 − 1 + 1
                                         1                        − 1 − 1 + 1
                                                                             
       1    1   1   1   1   1   1   1  1                        + 1 − 1 − 1 8        0 0 0
       − 1 − 1 + 1 + 1 − 1 − 1 + 1 + 1 1                                   
                                                                   + 1 − 1 − 1 0        8 0 0
X ′X =                                                                       =             
       − 1 − 1 − 1 − 1 + 1 + 1 + 1 + 1 1                        − 1 + 1 − 1 0        0 8 0
                                                                                          
       + 1 + 1 − 1 − 1 − 1 − 1 + 1 + 1 1                        − 1 + 1 − 1 0        0 0 8
                                         1                        + 1 + 1 + 1
                                                                             
                                         1
                                                                  + 1 + 1 + 1
                                                                              

El codificar me permite entender el modelo y me da una propiedad muy útiles el las
matrices.


                                           1          0           0       0
                                            8                               
                                           0          1           0       0
                              (X ′X )−1   =             8
                                                                   1         
                                           0          0
                                                                     8
                                                                           0
                                           0          0           0       1 
                                           
                                                                           8
                                                                             

                                                        8
                                                        9
                                                         
                      1   1    1  1    1  1    1   1  4        76     
                      − 1 − 1 + 1 + 1 − 1 − 1 + 1 + 1  3  37 − 39 = −2
            (X ′Y ) =                                  =              
                      − 1 − 1 − 1 − 1 + 1 + 1 + 1 + 1 10 52 − 24 = 28
                                                                      
                      + 1 + 1 − 1 − 1 − 1 − 1 +! + 1 12  47 − 29 = 18 
                                                        14
                                                         
                                                        11
                                                         
                                        1       0           0           0   76   76 
                                         8                                         8
                                        0       1           0           0  − 2 − 2 
                  b = (X ′X ) (X ′Y ) =                                     =  8 
                  ˆ          −1                    8
                                        0       0           1           0   28   28 
                                                               8                      8
                                        0       0           0           1   18   18 
                                        
                                                                         8
                                                                                    8
                                                                                         

Si estimamos cuando A = -1 y B = -1 tenemos:

     76 2     28     18
y=     − XA +    XB + XAXB
      8 8     8       8



                                                                                                   77
Sección 5: Diseño Factorial 2k


      − (− 1) + (− 1) + (− 1)(− 1)
    76 2        28      18
  =
    8 8          8       8
    76 2 28 18 68
  =   + −      +    =   = 8.5
    8 8 8         8   8

Ahora, si A = 1 y B = 1, tenemos:

        − (1) + (1) + (1)(1) =
      76 2     28    18        120
y=                                 = 15
      8 8      8      8         8

Regresión me das más información ya que me dice quien impacta y cual es la dirección.
Una forma de visualizar el efecto de los factores y sus interacciones es utilizando cubos.
Para un experimento de 3 factores podemos visualizar los efectos principales en la
siguiente figura donde uno de los factores está en su nivel alto y los otros dos están en su
nivel bajo:




De igual manera podemos visualizar la interacción de los factores. La siguiente figura
ilustra la interacción cuando dos de los factores están en su nivel alto y uno esta en su
nivel bajo.




                                                                                         78
Sección 5: Diseño Factorial 2k


Si todos los factores en el experimento están en su nivel alto, su representación grafica es
como se muestra a continuación:



                                                     = corridas   +


                                                     = corridas
                                                                  _


                                   ABC



Si tenemos un experimento con 5 factores el número de posibles combinaciones es 32.
Los efectos principales son los 5 factores, cuando uno de ellos está en su nivel alto y el
resto en su nivel bajo, dándonos un total de 5 combinaciones (A, B, C, D, y E). Cuando
realizamos las interacciones tenemos la combinación de 2 factores en su nivel alto y 3
factores en su nivel bajo, 3 factores en su nivel alto y 2 factores en su nivel bajo, 4
factores en su nivel alto y 1 factor en su nivel alto y, por último, todos los factores en su
nivel alto. Estas posibles interacciones se muestran a continuación:


                    AB BC CD DE
                                                                  ABC ACD BCD CDE
                    AC BD CE
Interaccion _ 2 =                            Interaccion _ 3 = ABD ACE BCE
                    AD BE
                                                               ABE ADE BDE
                    AE


                    ABCD BCDE
                    ABCE
Interaccion _ 4 =                             Interaccio n _ 5 = ABCDE
                    ABDE
                    ACDE


Todas estas interacciones gráficamente representadas se verían como sigue:




                                                                                          79
Sección 5: Diseño Factorial 2k



                  bce                       abce
                                                                    bcde                  abcde
         +                       ce                      ace
                                                                               cde
                                                                                                     acde
                  be                         abe
                                                                     bde                 abde

                                 e                      ae
                                                                               de                   ade
         E
                        bc                         abc
                                                                                         abcd
                                                                      bcd
                                       c
                        C                                      ac                   cd                acd
                        b                          ab
                                                                       bd                  abd
             __              B
                                      (1)                      a
                                                   A                                d                 ad

                                                __                         D
                                                                                                +


A medida que aumenta el número de factores en el experimento, realizar las
calculaciones de cada una de las combinaciones resultantes se vuelve complicado y
tedioso, además que se dificulta visualizar la interacción de los factores de forma grafica.
Si aumentamos el número de factores, el numero de combinaciones o tratamientos a
realizar aumente y esto es sin tomar en cuenta el número de corridas que debemos
realizar para tener réplicas. Cuando un experimento de 2k envuelve muchos factores es
económicamente difícil poder realizar replicas, por esto, si uno o más de los factores es
irrelevantes se puede imponer cuadros o caras sobre cuadros o caras (trasladándolos)
permitiendo así las réplicas.


Algo muy importante que hay que tener en cuenta es que cuando no hay replicas no
tenemos estimado de error. Para esta situación, Daniels sugiere trazar los estimados de
los efectos en una grafica de probabilidad normal. De esta forma los efectos no
significativos estarán normalmente distribuidos, con promedio cero (0) y varianza σ2 y
además van a estar alineados formando una línea recta en la gráfica. Los factores que
sean significativos van a tener una distribución con promedio distinto de cero y se
                                                                                                            80
Sección 5: Diseño Factorial 2k


alejaran de la línea formada por los no significativos. Esta línea se le conoce como el
Trazo Normal de los efectos (Trazo de Daniels). Este método nos ayuda a distinguir
aquellos efectos que sobresalen para explicar la respuesta. Este método parte de la
premisa de que cuando k es lo suficientemente grande, todas las fuentes de variación no
serán relevantes; algunas de ellas deben pertenecer al error o ruido.


Ejemplo usando MINITAB:


Se realizó un experimento en una planta donde fabrican semiconductores en un esfuerzo
por mejorar el rendimiento. Cinco factores, cada uno a dos niveles, se estudiaron. Se hizo
una corrida del diseño sin réplicas y se muestra a continuación:
(1) = 7                d=8                     e=8                      de = 6
a=9                    ad = 10                 ae =12                   ade = 10
b = 34                 bd = 32                 be = 35                  bde = 30
ab = 55                abd = 50                abe =52                  abde = 53
c = 16                 cd = 18                 ce = 15                  cde =15
ac = 20                acd = 21                ace = 22                 acde = 20
bc = 40                bcd = 44                bce = 45                 bcde = 41
abc = 60               abcd =61                abce = 65                abcde = 63

**Para realizar los pasos en MINITAB refiérase al manual de MINITAB provisto.

   (a) Construya la grafica de probabilidad normal de los efectos estimados (Trazo de
       Daniels). ¿Cuáles efectos aparecen muy alejados?




                                                                                        81
Sección 5: Diseño Factorial 2k


                                     Normal Probability Plot of the Effects
                                          (response is Results, Alpha = .05)
                      99
                                                                                      Effect Type
                                                                                 B
                                                                                      Not Significant
                      95                          A                                   Significant
                                              C
                      90                                                              F actor   N ame
                                         AB
                                                                                      A         A
                      80                                                              B         B
                      70                                                              C         C
            Percent




                      60                                                              D         D
                                                                                      E         E
                      50
                      40
                      30
                      20

                      10
                       5


                       1
                           0     5        10          15     20    25      30   35
                                                      Effect
           Lenth's PSE = 0.65625



En esta gráfica podemos notar que los factores significativos para este experimento son
A, B, C y la interacción AB.


   (b) Realice un análisis de varianza para confirmar sus descubrimientos en la parte (a).

                      Analysis of Variance for Results (coded units)

                      Source                      DF      Seq SS     Adj SS      Adj MS     F      P
                      Main Effects                 5     11087.9    11087.9     2217.58     *      *
                      2-Way Interactions          10       536.3      536.3       53.63     *      *
                      3-Way Interactions          10        24.3       24.3        2.43     *      *
                      4-Way Interactions           5        15.2       15.2        3.03     *      *
                      5-Way Interactions           1         0.3        0.3        0.28     *      *
                      Residual Error               0           *          *           *
                      Total                       31     11664.0


Como podemos apreciar los residuales del error aparecen con un asterisco, esto se debe a
que en un experimento sin réplicas no se puede estimar el error. También podemos notar
que los valores de la distribución F y el P-value de los efectos y las interacciones, todas
tiene asterisco y es debido a que no se pueden estimar cuando el error es igual a cero (0)
o no se ha podido estimar.

   (c) Escriba el modelo de regresión relacionando el rendimiento con las variables
       significativas del proceso.

             Ŷ = 30.5313 + 5.9063XA + 16.9687XB + 4.8438XC + 3.9688XAB

                                                                                                        82
Sección 5: Diseño Factorial 2k




   (d) Grafique los residuales en una grafica de probabilidad normal. ¿Es satisfactoria la
       grafica resultante?


                                                                Residual Plots for Results
                         Normal Probability Plot of the Residuals                                         Residuals Versus the Fitted Values
                       99                                                                      3.0

                       90                                                                      1.5




                                                                                    Residual
             Percent




                       50                                                                      0.0


                       10                                                                      -1.5

                        1                                                                      -3.0
                             -4          -2             0             2         4                     0               15          30       45        60
                                                     Residual                                                                 Fitted Value

                                  Histogram of the Residuals                                      Residuals Versus the Order of the Data
                       6.0                                                                     3.0


                       4.5                                                                     1.5
           Frequency




                                                                                    Residual




                       3.0                                                                     0.0

                       1.5                                                                     -1.5

                       0.0                                                                     -3.0
                                  -2.4        -1.2     0.0      1.2       2.4                             2   4   6   8 10 12 14 16 18 20 22 24 26 28 30 32
                                                     Residual                                                              Observation Order




Como podemos ver los residuales están distribuidos a través de la línea de normalidad y
el histograma tiene una forma de campana mostrando que los promedios son iguales a
cero (0)


   (e) Grafique los residuales versus el rendimiento predicho y versus cada uno de los
       factores. Comente sobre las graficas resultantes.




                                                                                                                                                              83
Sección 5: Diseño Factorial 2k


                                  Residuals Versus A
                                   (response is Results)
           3


           2


           1
Residual



           0


           -1


           -2


           -3
                -1.0       -0.5               0.0          0.5   1.0
                                               A




                                  Residuals Versus B
                                   (response is Results)
           3


           2


           1
Residual




           0


           -1


           -2


           -3
                -1.0       -0.5               0.0          0.5   1.0
                                               B




                                  Residuals Versus C
                                   (response is Results)
           3


           2


           1
Residual




           0


           -1


           -2


           -3
                -1.0       -0.5               0.0          0.5   1.0
                                               C




                                                                       84
Sección 5: Diseño Factorial 2k


                                                   Residuals Versus D
                                                    (response is Results)
                            3


                            2


                            1
                 Residual



                            0


                            -1


                            -2


                            -3
                                 -1.0       -0.5               0.0          0.5   1.0
                                                                D




                                                   Residuals Versus E
                                                    (response is Results)
                            3


                            2


                            1
                 Residual




                            0


                            -1


                            -2


                            -3
                                 -1.0       -0.5               0.0          0.5   1.0
                                                                E




Como podemos ver en cada una de las graficas resultantes los residuales están entre los
valores de -1 y +1 indicándonos que nuestro modelo es razonable.


   (f) Interprete cualquier interacción significante.

Según la gráfica de probabilidad normal la única interacción significante en este
experimento es la AB.




                                                                                          85
Sección 5: Diseño Factorial 2k



                                      Interaction Plot (data means) for Results
                                      -1                1         -1            1       -1       1        -1           1
                                                                                                                           60
                                                                                                                                 A
                                                                                                                           40   -1
           A                                                                                                                     1
                                                                                                                           20

                                                                                                                           60
                                                                                                                                 B
                                                                                                                           40   -1
                                                B                                                                                1
                                                                                                                           20

                                                                                                                           60
                                                                                                                                 C
                                                                                                                           40   -1
                                                                       C                                                         1
                                                                                                                           20

                                                                                                                           60
                                                                                                                                 D
                                                                                                                           40   -1
                                                                                             D                                   1
                                                                                                                           20




                                                                                                               E




   (g) ¿Cuáles son sus recomendaciones con respecto a las condiciones en que opera el
       proceso?

Eliminar los factores D y E y realizar más replicas con los factores que resultaron
significativos para poder tener un análisis comparativo. Entiendo que si no son
significativos pueden ser eliminados del experimento. Esto se puede probar con la gráfica
del “main effect”.


                                                    Main Effects Plot (data means) for Results
                                                    A                               B                     C
                                 50


                                 40


                                 30
               Mean of Results




                                 20


                                 10
                                           -1                 1            -1            1           -1            1
                                                    D                               E
                                 50

                                 40


                                 30


                                 20

                                 10
                                           -1                 1            -1            1




                                                                                                                                     86
Sección 5: Diseño Factorial 2k


(h) Proyecte el diseño 25 en un problema 2k tomando en cuenta los factores
   importantes o significativos.


        Factorial Fit: Results versus A, B, C

       Estimated   Effects and Coefficients for Results (coded
       units)
       Term        Effect         Coef   SE Coef        T         P
       Constant                 30.531    0.3021   101.07     0.000
       A           11.813        5.906    0.3021    19.55     0.000
       B           33.937       16.969    0.3021    56.17     0.000
       C            9.688        4.844    0.3021    16.03     0.000
       A*B          7.938        3.969    0.3021    13.14     0.000


       S = 1.70884         R-Sq = 99.32%     R-Sq(adj) = 99.22%




                           Cube Plot (data means) for Results


                             42.50                              62.25




                   32.75                              52.50
             1




             B               16.00                              20.75
                                                                        1


                                                                    C
                   7.25                               10.25
             -1                                               -1
                    -1                                  1
                                         A




                                                                            87
Sección 6: Diseño Factorial 2^k con bloques


   1. Diseño Factorial 2k con bloques
Existen muchas situaciones en las cuales no es posible efectuar todos los tratamientos del
experimento factorial bajo las mismas condiciones. En este caso usted puede considerar
uno o varios factores como fuentes a ser bloqueadas. Un ejemplo de factores a ser
bloqueados pueden ser lotes de materiales, operadores, etc.

En los experimentos de diseño factorial 2k vimos la importancia de codificar las
variables. Codificamos presumiendo que los factores son de naturaleza continua.
Ejemplo: entre el -1 y +1 existe el 0, pero entre Máquina 1 y Máquina 2 no hay nada
central. Cuando tengo factores de naturaleza discreta los puntos centrales se duplican
aumentando así los costos experimentales.


Como todas las combinaciones o tratamientos en un experimento 2k no pueden realizarse
bajo las mismas condiciones, tenemos que asignar un subconjunto de los tratamientos a
cierto nivel de una fuente de ruido que queremos bloquear. Esto lo conocemos como la
técnica de Fundir, donde el tamaño del bloque es más pequeño que el número de
tratamientos en una réplica. Por ahora vamos a considerar experimentos 2k contenidos en
2p bloques, donde p < k. En esta estructura solo será posible construir experimentos con
un número de bloques equivalentes a una potencia de 2, o sea, 2 bloques (p = 1), 4
bloques (p = 2), 8 bloques (p = 3) y así sucesivamente.


Supongamos que se va a realizar un experimento con dos factores cada uno a dos niveles.
En el siguiente ejemplo vamos a mostrar dos escenarios con dos distintas notaciones
para identificar los tratamientos de este experimento. Si suponemos que un tratamiento
toma cierto número de horas lo que resulta en obtener solo dos observaciones cada día,
entonces tenemos que preguntarnos que tratamientos ejecutaremos cada día. Una vez
contestada esta pregunta, dicha contestación va a determinar la fuente o las fuentes de
variación que se van a fundir con el efecto bloque.


Ejemplo de Experimento más pequeño 22:



                                                                                       88
Sección 6: Diseño Factorial 2^k con bloques


                  b                           ab
               (-,+)                          (+,+)        Tenemos 2 Lotes:

                                                             Lote 1      Lote 2

              B



              (-,-)            A               (+,-)
              (1)                                a




                                       b                        ab
                                    (-,+)                      (+,+)



                                   B



                                   (-,-)               A        (+,-)
                                    (1)                             a


                        Escenario 1                            Escenario 2

                      Lote 1           Lote 2                 Lote 1         Lote 2

                       (1)                a                     a             (1)

                       ab                 b                     ab             b


En el escenario 1, al seleccionar la diagonal, la misma corresponde a la intersección, por
lo tanto, estamos fundiendo el lote con la intersección. Sin embargo, en el escenario 2, el
lote esta fundido con el factor A. El lote 1 del escenario 2 tiene los tratamientos cuando el
factor A esta en su nivel alto, y el lote 2 tiene los tratamientos cuando el factor A esta en
su nivel bajo, por lo tanto, las fuentes bloques y el factor A se encuentran fundidos. La
asignación del escenario 2 es una muy pobre ya que sacrifico la información de un efecto
principal.


Los contrastes ortogonales serían:
                                                                                          89
Sección 6: Diseño Factorial 2^k con bloques


                                          Contrastes Ortogonales
                       Tratamiento      A            B         AB
                           (1)          -            -           +
                             a          +            -           -
                             b          -            +           -
                            ab          +            +           +

Establecemos un dogma en el que si voy a fundir (o tengo que fundir) algo, o sea, perder
información, entonces seleccionamos aquella interacción que tenga el mayor número de
factores contenidos.
En un diseño 23 en bloque, tenemos un experimento con 8 tratamientos y un bloque. En
este experimento, seleccionar los tratamientos que componen las caras del cubo para
fundir un bloque, no son una buena selecciona ya que estaría fundiendo los efectos
principales y no cumpliríamos con el dogma. Ahora, vamos a ver que sucede al hacer las
siguientes selecciones:


1)

                          ab
                          c

            c
                                                 Tratamientos         A     B       AB
                                                        (1)           -     -        +
                                                        Ab            +     +        +
                            ab
                                                        C             -     -        +
                                                        Abc           +     +        +
            (1)




Al seleccionar estos tratamientos para el bloque podemos ve que se construye una cara
que me divide la cara de A con B. También cómo podemos apreciar los signos de ambos
factores son exactamente igual indicando que hay una relación y que el lote esta fundido
con AB. Por lo tanto, esta no es una buena selección.


                                                                                         90
Sección 6: Diseño Factorial 2^k con bloques



2)

                         a
                         b                     Tratamiento        A        C       AC
                                  ac                (1)            -       -       +
                                                    B             +        +       +
                                                    Ac             -       -       +
 b                                                 Abc            +        +       +


            (1)



En este caso podemos apreciar que la selección de estos tratamientos me forman una cara
que me divide las caras de A y de C, por lo tanto el lote esta fundido con AC. Nos
podemos dar cuenta de esto por los signos de los factores indicando que entre ellos hay
relación.


3)


                         a

                                               Tratamiento A           B       C   ABC
              c
                                                    A         +        -       -   +
                                                    B         -        +       -   +
     b                                              C         -        -       +   +
                                                   Abc        +        +       +   +
                                    a




Para este caso podemos notar que se forman dos líneas que cruzan la cara de A y B pero
en diferentes direcciones de C. De esta forma no se generan nuevas caras y tampoco se
funden los efectos principales, lo que lo hace factibles. Además, podemos ver que se

                                                                                       91
Sección 6: Diseño Factorial 2^k con bloques


cumple el dogma de fundir la interacción que contiene mayor factores. La práctica común
cuando se realizan este tipo de experimento es la de fundir con los bloques aquellos
efectos de las interacciones que mayor factores contenga.


Ahora, en un experimento 24 en bloque, tenemos un experimento con 16 tratamientos y
dos bloques. Nuevamente tenemos que asegurarnos de no seleccionar aquellos
tratamientos que formen las caras de los cubos para no fundir los efectos principales,
además, de evitar formar nuevas caras. Tomando esto en cuenta hacemos las siguientes
selecciones:


               bc                                                             abcd

                                                ac
                                                                     cd
       C


                                        ab
                                                     bd
                B

                      (1)           A                                                     ad

                                                          D

Como podemos apreciar, los tratamientos del primer cuadrado son la interacción ABC y
el segundo cuadrado son la interacción ABC rotando en el factor D. Si nos fijamos en la
tabla podemos notar que los signos de D y de la interacción ABC son iguales indicando
que hay una relación entre ellos.




                                                                                     92
Sección 6: Diseño Factorial 2^k con bloques


  Tratamientos          A            B              C              D          ABC
      Lote 1
        bd              -            +              -              +           +
        ad              +             -             -              +           +
         cd             -             -             +              +           +
       abcd             +            +              +              +           +
      Lote 2
        (1)             -             -             -              -           -
        ab              +            +              -              -           -
         bc             -            +              +              -           -
         ac             +             -             +              -           -



En experimentos 2k todas las fuentes, tanto efectos principales como las interacciones,
tienen un (1) grado de libertad, excepto el error. Si una fuente a bloquearse tiene 2
niveles, fundimos una fuente para contabilizar por ese grado de libertad.


Generalizando Factorial 2k en 2p bloques donde 2p bloques es el número de niveles. En un
factorial 24 en bloque tengo 4 niveles, el número de niveles podría ser, por ejemplo, el
número de lotes. En este experimento tengo 16 tratamientos y 3 grados de libertad, lo que
implica que de todas las fuentes que me pueden interesar, 3 de ellas se van a fundir.
Ahora, ¿Cuáles tres? Aquí es donde está el reto.


Veamos un ejemplo de un factorial 24 con 16 tratamientos y 4 niveles. Se seleccionan 4
tratamientos de los cuales se deben encontrar los 3 efectos a ser fundidos.




                                                                                      93
Sección 6: Diseño Factorial 2^k con bloques


                                      abc         bcd



 C




        B

               (1)            A                                                          ad

                                                        D

Los efectos de este experimento por número de factores contenidos son:
A                                           ABC
B              AB        BC                 ABD
C              AC BD                        ACD
D              AD CD                        BCD             ABCD
4                6                           4                1


De estos 15 efectos, 3 deben tener el mismo signo en cada tratamiento, ya sea positivo (+)
o negativo (-). Tabulando tenemos los siguientes resultados:


Tratamientos         A            B          C          D      BC      ACD         ABD
     (1)             -            -          -          -      +         -           -
     Abc             +            +          +          -      +         -           -
     Bcd             -            +          +          +      +         -           -
     Ad              +            -          -          +      +         -           -


Las preguntas claves son: 1) ¿Cómo conseguimos los efectos a ser fundidos?, 2) ¿Qué
pasó con el dogma?



                                                                                         94
Sección 6: Diseño Factorial 2^k con bloques


Contestando la pregunta uno, los efectos a ser fundido los conseguimos proyectando los
tratamientos seleccionados uno a la vez, o sea, moviendo un factor a la vez ya sea de su
nivel alto a su nivel bajo o viceversa.


Ilustrando como conseguimos los efectos en este ejemplo, para el primer efecto
proyectamos el factor de A de su nivel alto a su nivel bajo quedándonos los 4
tratamientos fundidos en la interacción BC como se muestra a continuación.



                                    abc      bcd



 C




        B

                (1)        A                                                          ad

                                                    D
                                     abc      bcd



  C




         B

                 (1)        A                                                          ad

                                                    D


                                                                                     95
Sección 6: Diseño Factorial 2^k con bloques


Ahora, buscando la interacción ACD procedemos a proyectar los puntos seleccionados en
el factor B. Recuerde que para realizar la segunda proyección tengo que devolver los
puntos a su posición original y luego vuelvo a proyectar. Tomando esto en cuenta, la
interacción se encontraría así:

                                     abc         bcd



C




      B

               (1)          A                                                    ad

                                                       D

                                           abc         bcd



    C




           B

                     (1)         A                                                      ad

                                                           D

Por último, vamos a buscar la interacción ABD proyectando los puntos seleccionados
originalmente sobre el factor C. Esto se obtiene como sigue:




                                                                                  96
Sección 6: Diseño Factorial 2^k con bloques




                                                bcd



C




        B

                (1)          A                                                  ad

                                                       D
                             abc
                                          abc         bcd



    C




            B

                      (1)          A                                                 ad

                                                            D

Como ya sabemos este es un experimento 24 en bloques de 2p donde 2p es igual a 4, lo
que implica que p=2. La variable p es el número de efectos fundidos o generadores
independientes, o sea, en este experimento tenemos 2 generadores independientes.
Sabemos que este experimento al ser de 4 niveles tiene 3 grados de libertad lo que
implica que se tienen que fundir 3 efectos. Como podemos encontrar dos generadores
independientes, el tercer factor se puede determinar en base de los dos generadores


                                                                                 97
Sección 6: Diseño Factorial 2^k con bloques


independientes encontrados. Del ejemplo anterior si ponemos al efecto BC y al efecto
ACD como los generadores independientes, obtenemos el tercer generador como sigue:

g 3 = g 1g 2 = ( BC)( ACD ) = ABC 2 D = ABC 0 D = ABD

Los exponentes pares son equivalentes a tener un exponente de grado 0 y los exponentes
impares es equivalente a exponente de grado1. Ahora, si los generadores independientes
son ACD y ABD, entonces el tercer generador seria:

g 3 = g 1g 2 = (ACD)(ABD) = A 2 BCD 2 = A 0 BCD 0 = BC

Si volvemos a las preguntas formuladas anteriormente, nos falta por contestar que paso
con el dogma de fundir aquellos efectos que más factores contenga. En este experimento
el efecto con más factores es el ABCD. Si tomamos este efecto y un efecto que contenga
3 factores, como por ejemplo ABC, el tercer generador sería:

g 3 = g 1g 2 = ( ABCD)( ABC) = A 0 B 0 C 0 D = D

Como podemos ver no es una buena selección ya que funde uno de los efectos
principales. Ahora si en vez de tomar un efecto que contiene 3 factores, tomamos uno que
contenga solo dos factores y mantenemos el efecto ABCD, el tercer generador sería:

g 3 = g 1g 2 = (ABCD)(AB) = A 2 B 2 CD = A 0 B 0 CD = CD

Podemos notar que se funden dos efectos que contienen solo 2 factores, a diferencia de
los efectos encontrados originalmente que dos de ellos contenían 3 factores y uno dos
factores. Es por esto que fundir el efecto que más factores tiene a veces puede ser
inapropiado ya que funde más efectos con menos factores contenidos.


Otro método de construir los bloques es el método de combinación lineal que utiliza la
ecuación:
                             L = α1 x 1 + α 2 x 2 + ⋅ ⋅ ⋅ + α k x k


                                                                                     98
Sección 6: Diseño Factorial 2^k con bloques


Donde xi es el nivel del factor i que aparece en un tratamiento en particular y αi es el
exponente que aparece en el factor i en el efecto a ser fundido. Cuando el factor está en
su nivel bajo xi=0 y xi=1 cuando el factor está en su nivel alto. Esta ecuación se le conoce
como definiendo el contraste. Los tratamientos que producen el mismo valor de L
(mod2) se colocaran en el mismo bloque. Debido a que los valores posibles de L (mod2)
son 0 y 1, esto asignará los 2k tratamientos a exactamente dos bloques. Usando el ejemplo
anterior para el generador 1, ACD, tenemos:


                    L1 = 1X 1 + 0X 2 + 1X 3 + 1X 4 = X 1 + X 3 + X 4


Hay que ir sobre los 16 tratamientos determinando que tratamientos van en que bloque.
Hay que recordar que los números pares resultantes equivalen a 0 y los números impares
equivalen a 1. Examinando los tratamientos tenemos:


                                  ab = 1 + 0 + 0 = 1
           (1) = 0 + 0 + 0 = 0                                   abc = 1 + 0 + 1 = 2 = 0
                                  ac = 1 + 1 + 0 = 2 = 0
           a = 1+ 0 + 0 = 1                                      acd = 1 + 1 + 1 = 3 = 1
                                  bc = 0 + 1 + 0 = 1
           b = 0+0+0 = 0                                         bcd = 0 + 1 + 1 = 2 = 0
                                  ad = 1 + 0 + 1 = 2 = 0
           c = 0 +1+ 0 = 1                                       abd = 1 + 0 + 1 = 2 = 0
                                  bd = 0 + 0 + 1 = 1
           d = 0 + 0 +1 = 1                                      abcd = 1 + 1 + 1 = 3 = 1
                                  cd = 0 + 1 + 1 = 2 = 0


Me dividió los 16 tratamientos en 2 partes, los que son 0 y los que son 1. Ahora
evaluamos para el generador 2, BC, y tenemos:
                                       L = X 2 + X3
Los tratamientos quedarían como sigue:
                                       ab = 1
                        (1) = 0                               abc = 2 = 0
                                       ac = 1
                        a=0                                   abd = 1
                                       ad = 0
                        b =1                                  acd = 1
                                       bc = 2 = 0
                        c =1                                  bcd = 2 = 0
                                       bd = 1
                        d=0                                   abcd = 2 = 0
                                       cd = 1
Ahora para determinar cómo formar los bloques consideramos la siguiente figura:

                                                                                            99
Sección 6: Diseño Factorial 2^k con bloques


                                       g1




                            g2    0          1



                        0             1 0           1


Ahora podemos agrupar los tratamientos en los diferentes bloques usando estas
combinaciones lineales para estos dos generadores utilizados, por lo tanto, los bloques
resultarían de la siguiente manera:

               L1 = 0                 L1 = 0             L1 = 1       L1 = 1
               L2 = 0                 L2 = 1             L2 = 0       L2 = 0
                (1)                     b                D               c
                 ad                    ac                A             adc
                bcd                    cd                Bc            bd
                abc                   abd               Abcd            ab

                                 Este es el bloque principal.

Otra forma de determinar los tratamientos que van en los diferentes bloques es que una
vez se haya seleccionados los tratamientos iniciales para determinar los generadores,
multiplicamos estos tratamientos por el factor por el que se proyectan los tratamientos
cuando se están buscando los generadores. Ejemplo: si el bloque principal es
multiplicado por el factor B como resultado tenemos el segundo bloque que está en la
figura anterior. En otras palabras, si multiplicamos el bloque principal por el factor que
no está contenido os resulta en los bloques faltantes.


Como forma de repaso vamos a realizar un ejemplo adicional de un experimento 24 en
bloques tomando 4 tratamientos diferentes. El ejemplo es como sigue:




                                                                                      100
Sección 6: Diseño Factorial 2^k con bloques



         bc



                                            ac
    C


                                                                          abd

          B
                                                          d
                           A

                                                  D

Determinamos los generadores proyectando. Si proyectamos en D tenemos lo siguiente:




                                       ac
C


                                                                        abd

     B
                                                      d
                      A

                                              D




                                                                                 101
Sección 6: Diseño Factorial 2^k con bloques




                                               ac
C


                                                                               abd

       B
                                                          d
                           A

                                                    D
    El generador resultante es el siguiente:
                     Tratamiento          A         B         C          ABC
                          Bc               -        +         +           -
                          Ac              +         -         +           -
                           D               -        -         -           -
                         Abd              +         +         -           -


    Ahora, buscando el segundo generador proyectamos en C y tenemos lo siguiente:




                                                                                     102
Sección 6: Diseño Factorial 2^k con bloques




                                  ac
C


                                                              abd

        B
                                                    d
                 A

                                            D



                                       ac
    C


                                                                abd

            B
                                                        d
                     A

                                                D




                                                                      103
Sección 6: Diseño Factorial 2^k con bloques

El generador resultante es:


                Tratamiento          A         B           D         ABD
                     Bc              -         +           -         +
                     Ac              +          -          -         +
                      D              -          -          +         +
                     Abd             +         +           +         +


Ahora, buscando el tercer generador tenemos:
(ABC)(ABD) = A 2 B 2 CD = CD

Si L1 = X1 + X 2 + X 3 y L 2 = X1 + X 2 + X 4 , entonces cuando L1 = 0 y L2 = 0 el
bloque resultante es el bloque principal que es el que sigue:


                                         (1)
                                         ab
                                         bcd
                                         acd


Si aplicamos la técnica de multiplicar el bloque principal por el factor que no está
contenido tenemos lo siguiente:


        (1)     *c             C                          (1)   *b             b
        ab      *c   →         A                          ab    *b    →        a
       bcd      *c             Cd                         bcd   *b            cd
       acd      *c            abcd                        acd   *b           abcd


Una sugerencia, para concluir con los diseños de experimentos factoriales 2k en bloques
cuando se realizan réplicas, es que podemos fundir cada réplica con una fuente distinta.
Esta técnica se le conoce como la Fundición Parcial de Réplicas y se vería representado
como se muestra a continuación:

                                                                                      104
Sección 6: Diseño Factorial 2^k con bloques



                            Réplica I                       Réplica II

                      (1)                a            (1)                 a

                      ab                b             Ab                 b

                      ac                 c            Ac                  c

                      bc                abc            Bc                abc

                     Bloque y/o ABC                    Bloque y/o AB




Ejemplo utilizando MINITAB:

Considere los datos que se muestran en la siguiente tabla. Suponga que es necesario
correr el diseño en cuatro bloques con ACDE y BCD (y consecuentemente ABE)
fundidos. Analice los datos de este diseño.

       (1)=7                       d=8                     e=8                    de=6
         a=9                      ad=10                   ae=12                  ade=10
       b=34                      bd=32                    be=35                 bde=30
      ab=55                     abd=50                   abe=52                 abde=53
        c=16                      cd=18                   ce=15                  cde=15
       ac=20                     acd=21                  ace=22                 acde=20
      bc=40                     bcd=44                   bce=45                 bcde=41
      abc=60                    abcd=61                 abce=65                abcde=63

Haciendo el procedimiento en Minitab se obtiene:

Full Factorial Design

Factors:    5     Base Design:                5, 32   Resolution with blocks:    IV
Runs:      32     Replicates:                     1
Blocks:     4     Center pts (total):             0

Block Generators: ACDE, BCD

Alias Structure
I

Blk1 = ACDE
Blk2 = BCD
Blk3 = ABE


                                                                                          105
Sección 6: Diseño Factorial 2^k con bloques


    Factorial Fit: Results versus Block, A, B, C, D, E

    Estimated Effects and Coefficients for Results (coded units)

    Term          Effect      Coef
    Constant               30.5313
    Block 1                -0.1562
    Block 2                -0.2813
    Block 3                 0.4687
    A            11.8125    5.9062
    B            33.9375   16.9687
    C             9.6875    4.8438
    D            -0.8125   -0.4062
    E             0.4375    0.2188
    A*B           7.9375    3.9688
    A*C           0.4375    0.2187
    A*D          -0.0625   -0.0313
    A*E           0.9375    0.4688
    B*C           0.0625    0.0312
    B*D          -0.6875   -0.3438
    B*E           0.5625    0.2813
    C*D           0.8125    0.4063
    C*E           0.3125    0.1563
    D*E          -1.1875   -0.5938
    A*B*C        -0.4375   -0.2188
    A*B*D         0.3125    0.1563
    A*C*D        -0.4375   -0.2188
    A*C*E         0.3125    0.1562
    A*D*E         0.8125    0.4062
    B*C*E         0.9375    0.4688
    B*D*E         0.1875    0.0938
    C*D*E        -0.8125   -0.4062
    A*B*C*D      -0.0625   -0.0312
    A*B*C*E       0.1875    0.0937
    A*B*D*E       0.9375    0.4687
    B*C*D*E      -0.9375   -0.4687
    A*B*C*D*E    -0.1875   -0.0937


    S = *

    Analysis of Variance for Results (coded units)

    Source                 DF    Seq SS    Adj SS    Adj MS   F   P
    Blocks                  3       2.6       2.6      0.86   *   *
    Main Effects            5   11087.9   11087.9   2217.58   *   *
    2-Way Interactions     10     536.3     536.3     53.63   *   *
    3-Way Interactions      8      22.5      22.5      2.81   *   *
    4-Way Interactions      4      14.4      14.4      3.59   *   *
    5-Way Interactions      1       0.3       0.3      0.28   *   *
    Residual Error          0         *         *         *
    Total                  31   11664.0


Del Anova se puede observar que los efectos más relevantes son para los factores A, B, C
y la interacción AB. Con el fin de comprobar, se realiza entonces el siguiente grafico que
nos muestra los efectos principales en el experimento:



                                                                                       106
Sección 6: Diseño Factorial 2^k con bloques


                                    Normal Probability Plot of the Effects
                                         (response is Results, Alpha = .05)
                   99
                                                                                         Effect Type
                                                                                   B     Not Significant
                   95                            A                                       Significant
                   90                        C                                          F actor   N ame
                                        AB
                                                                                        A         A
                   80                                                                   B         B
                   70                                                                   C         C
         Percent




                   60                                                                   D         D
                                                                                        E         E
                   50
                   40
                   30
                   20

                   10
                   5


                   1
                        0       5        10          15     20    25       30      35
                                                     Effect
        Lenth's PSE = 0.65625




Eliminando las variables insignificantes en el análisis tenemos:

        Factorial Fit: Results versus Block, A, B, C

        Estimated Effects and Coefficients for Results (coded units)

        Term                Effect        Coef        SE Coef        T         P
        Constant                       30.5313         0.3151    96.90     0.000
        Block 1                        -0.1562         0.5458    -0.29     0.777
        Block 2                        -0.2813         0.5458    -0.52     0.611
        Block 3                         0.4687         0.5458     0.86     0.399
        A               11.8125         5.9062         0.3151    18.74     0.000
        B               33.9375        16.9687         0.3151    53.85     0.000
        C                9.6875         4.8438         0.3151    15.37     0.000
        A*B              7.9375         3.9688         0.3151    12.60     0.000

        S = 1.78244            R-Sq = 99.35%             R-Sq(adj) = 99.16%

        Analysis of Variance for Results (coded units)

        Source                          DF        Seq SS     Adj SS       Adj MS          F           P
        Blocks                           3           2.6        2.6         0.86       0.27       0.845
        Main Effects                     3       11081.1    11081.1      3693.70    1162.61       0.000
        2-Way Interactions               1         504.0      504.0       504.03     158.65       0.000
        Residual Error                  24          76.3       76.3         3.18
        Total                           31       11664.0




                                                                                                           107
Sección 6: Diseño Factorial 2^k con bloques


                                               Residual Plots for Results
                 Normal Probability Plot of the Residuals                                        Residuals Versus the Fitted Values
                99                                                                      2




                                                                Standardized Residual
                90                                                                      1
Percent




                50                                                                      0


                10                                                                      -1

                1                                                                       -2
                      -2        -1       0       1      2                                    0                15          30       45        60
                               Standardized Residual                                                                  Fitted Value

                           Histogram of the Residuals                                        Residuals Versus the Order of the Data
                8                                                                       2




                                                                Standardized Residual
                6                                                                       1
    Frequency




                4                                                                       0

                2                                                                       -1

                0                                                                       -2
                     -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5     2.0                                      2   4   6    8 10 12 14 16 18 20 22 24 26 28 30 32
                              Standardized Residual                                                                Observation Order




                                         Cube Plot (data means) for Results


                                           42.50                                                                       62.25




                                 32.75                                                                       52.50
                       1




                       B                   16.00                                                                       20.75
                                                                                                                                 1


                                                                                                                             C
                                  7.25                                                                       10.25
                       -1                                                                                             -1
                                   -1                                                                          1
                                                            A




                                                                                                                                                      108
Sección 6: Diseño Factorial 2^k con bloques


                                      Main Effects Plot (data means) for Results
                                            A                                B
                            50

                            40

                            30
          Mean of Results




                            20

                            10
                                 -1                 1               -1             1
                                            C
                            50

                            40

                            30

                            20

                            10
                                 -1                 1



Se observa que la respuesta aumenta en promedio cuando A, B y C están en su nivel alto.




                                                                                       109
Sección 7: Experimentos Fraccionarios 2^k


   1. Experimentos Fraccionarios 2k
A medida que el número de factores en un diseño 2k se incrementa, el número de
tratamientos que se deben realizar aumenta rápidamente. Si se tiene un experimento con 5
factores sería un diseño 25 con un total de 32 tratamientos requeridos. Este diseño tiene 5
grados de libertad de los efectos principales y 10 grados de libertad debido a las
interacciones. Debido a que a veces es difícil llevar a cabo todos los tratamientos se
puede presumir que no todas las interacciones son significativas, por lo tanto, se puede
realizar una fracción de los tratamientos. A esto se le conoce como Experimentos
Fraccionarios 2k, donde fraccionarios viene de la porción que representa el número de
tratamientos que se van a llevar a cabo de todos los tratamientos posibles.

Los Experimentos Fraccionarios 2k están basados en un dogma estadístico que se
desglosa en los siguientes preceptos:


   1. Cuando existen múltiples factores en un proceso, el mismo va a estar explicado
       primordialmente sólo por algunos de los efectos principales y de las interacciones
       de orden bajo.
   2. No todas las fuentes de variación pueden ser significativas, por lo tanto, el
       experimento esta conformado por las variables significativas.
   3. Se puede combinar las observaciones de dos o más experimentos fraccionarios
       para generar una secuencia que permita estimar los efectos deseados.

Empecemos con un ejemplo para un experimento factorial de 3 factores donde solo hay
presupuesto para realizar la mitad de los tratamientos. A este experimento se le llamaría
la mitad del factorial o se denotaría como un experimento 23-1.

1           8
  de un 23 → = 4 tratamientos
2           2




                                                                                       110
Sección 7: Experimentos Fraccionarios 2^k




                                           Tratamientos seleccionados:
   C                                                   (a)
                                                       (b)
                                                       (c)
       B                                              (abc)
                      A

Realizando la tabla de signos tenemos:


Tratamientos           A            B       C         AB         AC       BC       ABC
        a              +            -       -          -          -        +        +
        b              -            +       -          -          +        -        +
        c              -            -       +          +          -        -        +
       abc             +            +       +          +          +        +        +




                                    Hay una relación porque tienen
                                         los mismos signos.

De este ejemplo podemos notar que los signos de los cuatro tratamientos son positivos
(+) para ABC. Por lo tanto, el efecto ABC se elimina, ha sido sacrificado, ya que sólo fue
observado en su nivel alto. Cuando este efecto ocurre se le denomina como generador.
También podemos observar que hay tratamientos que son idénticos ya que tienen el
mismo signo en los tratamientos como resultado algunos efectos están confundidos. Esto
es una consecuencia de haber efectuado solo una fracción de la totalidad de los
tratamientos.


Del ejemplo anterior tenemos que:

                           A = BC        B = AC         C = AB

Lo que esto nos indica es que cuando estimamos A estamos estimando BC y así
sucesivamente con los demás efectos. Cuando dos o más efectos tienen esta propiedad se

                                                                                      111
Sección 7: Experimentos Fraccionarios 2^k


les conoce como aliases, o sea, que esta estimación se conoce como la estructura de
aliases. La estructura de aliases se puede determinar no sólo observando los signos de los
efectos es una tabla sino que también se puede determinar usando los efectos
generadores. Una vez se conoce(n) el(los) generador(es) se multiplica(n) el(los) efecto(s)
de interés por el generador y así se obtiene(n) el(los) alias(es).


Del ejemplo anterior tenemos que el generador es ABC, también conocido como
generador identidad. Si multiplicamos el generador por los efectos principales obtenemos
los aliases de los mismos:
                                   A( ABC ) = A 2 BC = BC
                                   A = BC


                                   B( ABC ) = AB 2 C = AC
                                   B = AC


                                   C ( ABC ) = ABC 2 = AB
                                   C = AB


La fracción que contiene el lado positivo es conocida como la fracción principal.
Aunque hubiésemos seleccionado los otro cuatro tratamientos que componen un
experimento 23, o sea, el otro lado de la fracción, la estructura de aliases hubiese sido la
misma ya que ambas fracciones pertenecen a la misma familia. Este experimento es
pobre ya que los aliases son los efectos que contienen pocos factores no cumpliendo así
con el dogma de fundir aquellos tratamientos que más efectos contenga.


Para un experimento factorial que contiene 5 factores tendríamos un total de 32
tratamientos. Si solo es posible realizar la mitad de los tratamientos entonces tendríamos
1             32
  de un 2 5 =    = 16 ; esto implica que el mejor generador esta dado por la interacción
2              2
que contenga el mayor número de factores. En este caso particular el mejor generador es
la interacción ABCDE. Si multiplicamos el factor A por el generador tenemos que
A( ABCDE ) = A 2 BCDE = BCDE , por lo tanto, A = BCDE . Si la interacción BCDE sale

                                                                                        112
Sección 7: Experimentos Fraccionarios 2^k


significativa, entonces se lo adjudicamos al factor A ya que es el que menos letras
consume y es mas fácil de realizar. Este tipo de relaciones donde los factores principales
tienen como aliases interacciones compuestos por muchos factores se dan cuando k es
grande.


Los experimentos fraccionarios están clasificados de acuerdo a su resolución. La
resolución del experimento nos proporciona una idea del tipo de estructura de aliases que
el diseño posee ya que se define por el número de factores del generador con menor
numero de factores contenidos en el experimento. Los diseños con particular importancia
son aquellos de resolución III, IV y V. A continuación se presenta cada una de estas
resoluciones:


1. Diseño de Resolución III. En este tipo de experimentos ninguno de los efectos
   principales es alias de ningún otro efecto principal pero si son aliases de las
   interacciones de dos factores. También puede ser que interacciones de dos factores
   sean aliases entre sí. Un ejemplo de este diseño es el que discutimos previamente de
    1
      de un 23, o sea, un 23-1.
    2
2. Diseño de Resolución IV. En este diseño ningún de los efectos principales es aliases
   de otro efecto principal ni de las interacciones de dos factores, pero las interacciones
   de dos factores son aliases entre sí. Un ejemplo es el diseño 24-1 teniendo como
   generador la interacción ABCD.
3. Diseño de Resolución V. En este tipo de diseño ninguno de los efectos principales ni
   de las interacciones de dos factores son alias de otro efecto principal o de alguna
   interacción de dos factores, pero las interacciones de dos factores son alias de las
   interacciones de tres factores. Un ejemplo es el que vimos para un experimento 25-1
   ya que el generador es ABCDE y contiene 5 (V) factores.


Algunos diseños fraccionarios necesitan más de un generador. Mientras mayor sea la
resolución del experimento mayor cantidad de información podemos obtener de la
experimentación.


                                                                                       113
Sección 7: Experimentos Fraccionarios 2^k


Los experimentos con diseño 2k-1, fracción de un medio, son un recurso adecuado para
reducir el número de corridas que se requieren en un experimento pero a veces es común
encontrar que fracciones menores proporcionan casi la misma cantidad de información
útil pero siendo menos costoso. De forma general, un experimento 2k puede correrse en
                  1
fracciones de      p
                     también conocido como un diseño factorial fraccionado 2 k − p . Por
                 2
                            1                          1                              1
ejemplo, una fracción de      se conoce como 2k-2, para se conoce como 2 k −3 , para    se
                            4                          8                             16
conoce como 2k-4, y así sucesivamente. Mientras mas pequeña es la fracción mas aliases
va a tener el factor principal.


Si realizamos un experimento de 25 en 2p bloques donde p = 2, entonces tenemos un
                                 1             32
experimento con fracción           de un 2 5 =    = 8 tratamientos. También se conoce como un
                                 4              4
diseño 2 5−2 = 2 3 = 8 tratamientos. Los factores de este experimento son A, B, C, D y E. A
continuación vamos a mostrar de forma grafica los tratamientos y los generadores
obtenidos del experimento a través del uso de los cubos. Debemos recordar que una vez
seleccionamos los tratamientos podemos encontrar 2 de los generadores, g1 y g 2 , y el
tercer generador lo podemos calcular multiplicando los dos generadores encontrados
previamente, g 1 ∗ g 2 = g 3 .
Los tratamientos seleccionados son:
                                               (1)
                                               Abc
                                               Bcd
                                               Ad
                                               Be
                                               Ace
                                               Abde
                                               Cde




                                                                                         114
Sección 7: Experimentos Fraccionarios 2^k




E




    C




        B

                            A
                                            D

Para obtener los generadores vamos a aplicar las técnicas utilizadas en la sección de
Diseño Factorial 2k con bloques. Para este ejemplo, comenzamos proyectando el factor C
de su nivel bajo a su nivel alto fundiendo los tratamientos en la interacción ABDE como
se muestra en la siguiente figura:




                                                                                   115
Sección 7: Experimentos Fraccionarios 2^k




            E



                C


                    B

                                 A
                                              D

Una vez hallamos realizado las proyecciones podemos determinar el generador viendo
cuales factores varían en el sistema.




        E




                C



                    B

                                A                                             116
                                              D
Sección 7: Experimentos Fraccionarios 2^k


Para buscar el segundo generador debemos devolver los tratamientos a su posición
original y entonces proyectamos nuevamente. Proyectamos el factor A de su nivel alto a
su nivel bajo y los de nivel bajo a su nivel alto y obtenemos el generador BCE como se
muestra a continuación.




   E




        C




            B

                             A
                                             D



Una vez se haya proyectado, determinamos la interacción que viene a ser el generador.




                                                                                    117
Sección 7: Experimentos Fraccionarios 2^k




       E




           C



                B

                             A
                                           D


Para determinar el tercer generador podemos aplicar la técnica de multiplicar los dos
generadores ya encontrados y así obtenemos el tercer generador. Haciendo esto tenernos:


                          G1 ∗ G2 = G3
                           ABDE * BCE = AB 2 CDE 2 = ACD


El tercer generador encontrado es ACD. Para comprobar que los generadores obtenidos
son correctos y válidos procedemos a realizar la tabulación de los tratamientos y los
factores usando los signos para definir que factores están contenidos en el tratamiento
seleccionado.




                                                                                    118
Sección 7: Experimentos Fraccionarios 2^k



Tratamientos      A         B          C       D       E      ABDE       BCE       ACD
     (1)          -         -          -       -       -         -         +         -
     abc          +         +          +       -       -         -         +         -
     bcd          -         +          +       +       -         -         +         -
      ad          +         -          -       +       -         -         +         -
      be          -         +          -       -       +         -         +         -
     ace          +         -          +       -       +         -         +         -
    abde          +         +          -       +       +         -         +         -
     cde          -         -          +       +       +         -         +         -

Las tres fuentes sacrificados son los tres generadores encontrados: ABDE, BCE y ACD.
Para determinar los alias de los factores principales en este experimento, los obtenemos
multiplicando los factores principales por cada uno de los generadores. Tomando como
ejemplo el factor A realizamos las diferentes multiplicaciones y obtenemos lo siguiente:
                                   A(BCE ) = ABCE
                                   A( ABDE ) = BDE
                                   A( ACD ) = CD
                                  ∴
                                   A = ABCE = BDE = CD
Si hacemos eso mismo para cada uno de los factores, los diferentes aliases obtenidos para
cada factor son los siguientes:


                                   B = CE = ADE = ABCD
                                   C = BE = ABCDE = AD
                                   D = BCDE = ABE = AC
                                   E = BC = ABD = ACDE


Como podemos notar el total de fuentes en este experimento son 2 5 − 1 = 31 fuentes.
Hasta ahora solo tenemos 23 fuentes, por lo tanto, debemos encontrar aquellas fuentes
que no están contempladas. Todos los factores principales ya se encontraron, por lo tanto,
procedemos a buscar las interacciones de 2 factores para determinar las que faltan. Entre
las interacciones de 2 factores tenemos:
                                  AD   BC     CD
                                  AC   BE     CE

                                                                                      119
Sección 7: Experimentos Fraccionarios 2^k


Sólo se encontraron 6 interacciones de dos factores. Para determinar las demás
interacciones que hacen falta comenzamos determinando una interacción de dos factores
que no se ha contemplado aún y se multiplica por los generadores para así obtener parte
de las interacciones restantes. La primera interacción de dos factores que no se contempló
es AB y si multiplicamos esta interacción por los generadores obtenemos las siguientes
interacciones como se muestra a continuación:


                                 AB(BCE) = AB 2 CE = ACE
                                 AB(ABDE ) = A 2 B 2 DE = DE
                                 AB(ACD) = A 2 BCD = BCD
                                 ∴
                                 AB = ACE = DE = BCD


Ahora tenemos 27 fuentes de las 31 fuentes que componen este experimento. Añadimos
las interacciones de dos factores que se encontraron y procedemos a buscar aquellas
interacciones de dos factores que aún no se han contemplado. Por lo tanto, las nuevas
interacciones de dos factores son: AB y DE. Podemos notar que la interacción AE no está
contemplada aún, por lo tanto, procedemos a buscar sus aliases como los hicimos
anteriormente.


                              AE(BCE ) = ABCE 2 = ABC
                              AE(ABDE) = A 2 BDE 2 = BD
                              AE(ACD) = A 2 CDE = CDE
                             ∴
                              AE = ABC = BD = CDE


Como podemos notar ya encontramos las 31 fuentes que componen este experimento,
determinando así todos los aliases que se muestran a continuación en resumen:




                                                                                      120
Sección 7: Experimentos Fraccionarios 2^k


                               A = ABCE = BDE = CD
                               B = CE = ADE = ABCD
                               C = BE = ABCDE = AD
                               D = BCDE = ABE = AC
                               E = BC = ABD = ACDE
                               AB = ACE = DE = BCD
                               AE = ABC = BD = CDE


De este experimento podemos concluir que es un experimento con 7 grados de libertad y
es un experimento de Resolución III ya que el generador que contiene el menor número
de factores es un generador de 3 factores y en este experimento dos de los generadores
contienen 3 factores. También podemos observar que mientras más pequeña es la
fracción de tratamientos que se van a llevar a cabo más complicada es la relación de los
factores.

Ejemplo 1. Utilizando MINITAB:

Un ingeniero realizó un experimento en el cual se utilizó un diseño 2(5-1) con I=ABCDE
para investigar los efectos de cinco factores en la temperatura de un proceso de
esterilizacion. Los factores son A, B, C, D y E. Los resultados obtenidos son como
siguen:
e= -0.63              d=6.79
a= 2.51               ade= 5.47
b= -2.68              bde= 3.45
abe=1.66              abd=5.68
c= 2.06               cde= 5.22
ace=1.22              acd=4.38
bce=-2.09             bcd=4.30
abc=1.93              abcde= 4.05

Para generar la fracción de los efectos que componen este experimento en Minitab
seleccionamos la opción de STAT, de forma subsiguiente seleccione DOE luego
Factorial y, por ultimo, seleccione Create Factorial Design como se muestra en la
siguiente figura:




                                                                                    121
Sección 7: Experimentos Fraccionarios 2^k




Como consecuencia aparecerá una pantalla, como la que se muestra a continuación, en la
cual se especifica el tipo de diseño y el número de factores. Para el ejemplo que estamos
evaluando seleccionamos la primera opción, “default generators”, ya que el generador
no esta especificado en el problema y tenemos cinco factores.




                                                                                     122
Sección 7: Experimentos Fraccionarios 2^k


En esta pantalla tenemos una opción de Design en el cual nos permite seleccionar si el
diseño se va a correr con todos los tratamientos o solo con una fracción de ellos. Al
oprimir el botón de Design aparece la siguiente pantalla:




En nuestro ejemplo se estarán efectuando solamente la mitad de los tratamientos
requeridos, por lo tanto, seleccionamos la opción de ½ fraction. Para efectos del ejemplo
solo tenemos una replica, no hay puntos centrales y solo hay un bloque debido a que las
condiciones experimentales se presumen homogéneas. Como resultado se generan los
efectos que se muestran en la próxima figura. Como podemos notar se generaron solo 16
efectos. A la hora de ingresar los datos tenemos que tener cuidado ya que debemos tener
en cuenta los signos de los factores para saber a que efecto pertenece. Por ejemplo, en el
primer tratamiento generado tenemos: A = -1, B = 1, C = -1, D = 1 y E = 1, por lo tanto el
tratamiento corresponde a la interacción BDE que tiene un valor de 3.45 (según los datos
dados en el enunciado). Así sucesivamente se van ingresando los datos al efecto
correspondiente. También podemos notar que el software determinó el generador que esta
dado por E = ABCD.




                                                                                      123
Sección 7: Experimentos Fraccionarios 2^k




Como parte de la información que podemos obtener al generar este diseño es la estructura
de aliases que es la siguiente:
                                    Alias Structure

                                       I + ABCDE

                                        A + BCDE
                                        B + ACDE
                                        C + ABDE
                                        D + ABCE
                                        E + ABCD
                                        AB + CDE
                                        AC + BDE
                                        AD + BCE
                                        AE + BCD
                                        BC + ADE
                                        BD + ACE
                                        BE + ACD
                                        CD + ABE
                                        CE + ABD
                                        DE + ABC


                                                                                    124
Sección 7: Experimentos Fraccionarios 2^k


Para realizar el análisis de este diseño hay que seleccionar STAT, de forma subsiguiente
se selecciona DOE, luego Factorial y, por ultimo, Analyze Factorial Design como se
muestra a continuación:




La pantalla que aparece a continuación nos permite seleccionar la columna en donde se
encuentran los resultados de este experimento.




                                                                                    125
Sección 7: Experimentos Fraccionarios 2^k


Para obtener las gráficas de normalidad y las graficas de los residuales se selecciona la
opción de Graphs del Analyze Factorial Design y se obtiene la siguiente pantalla.




Preguntas concernientes al planteamiento:

   a) Prepare un plano normal de los efectos. ¿Cuál de los efectos aparecen relevantes?

                              Normal Probability Plot of the Effects
                                     (response is Color Effect, Alpha = .05)
              99
                                                                                       Effect Ty pe
                                                                                       Not Significant
              95                                                               D       Significant
              90                                                                       F actor   N ame
                                                                                       A         A
              80                                                                       B         B
              70                                                                       C         C
    Percent




              60                                                                       D         D
                                                                                       E         E
              50
              40
              30
              20

              10
              5


              1
                   -2   -1       0           1            2     3        4         5
                                                 Effect
   Lenth's PSE = 0.76125
                                                                                                         126
Sección 7: Experimentos Fraccionarios 2^k


En esta gráfica podemos observar que sólo el factor D es significativo.

   b) Calcule los residuales. Construya la gráfica de probabilidad normal de los
      residuales y grafique los residuales versus los valores ajustados. Comente sobre
      las gráficas.

Factorial Fit: Color Effect versus A, B, C, D, E

Estimated Effects and Coefficients for Color Effect (coded units)

Term        Effect       Coef
Constant               2.7075
A           1.3100     0.6550
B          -1.3400    -0.6700
C          -0.1475    -0.0738
D           4.4200     2.2100
E          -0.8275    -0.4138
A*B         1.2750     0.6375
A*C        -0.7875    -0.3937
A*D        -1.3550    -0.6775
A*E         0.3025     0.1513
B*C         0.1675     0.0838
B*D         0.2450     0.1225
B*E         0.2875     0.1437
C*D        -0.7125    -0.3562
C*E        -0.2400    -0.1200
D*E         0.0875     0.0437


S = *


Analysis of Variance for Color Effect (coded units)

Source                 DF   Seq SS   Adj SS   Adj MS    F   P
Main Effects            5    95.02    95.02   19.004    *   *
2-Way Interactions     10    19.67    19.67    1.967    *   *
Residual Error          0        *        *        *
Total                  15   114.69



Como podemos notar no es posible obtener las graficas de normalidad y residuales
debido a que no hay error ya que en este experimento no hay réplicas, además, que no
todos los tratamientos se llevaron a cabo, es por esto que los grados de libertad del error
son cero. Para poder contestar esta pregunta es necesario eliminar de mi análisis todos
aquellos factores que no son significativos en mi experimento ya que con todos los
factores incluidos el error me da a 0 y no tengo P-values ni F. Según la grafica de
normalidad de los efectos el único factor significativo es D, por lo tanto, se mantienen los
factores principales y todas las interacciones en las cuales el factor D este contenido.



                                                                                           127
Sección 7: Experimentos Fraccionarios 2^k


Esto lo podemos conseguir seleccionando la opción de Term en la pantalla de Analyze
Factorial Design. Al oprimir esta opción aparece la siguiente pantalla.




   Seleccionamos solo los factores principales y las interacciones que contienen al factor
   D y seleccionamos OK. Los resultados obtenidos son los siguientes:

Factorial Fit: Resultados versus A, B, C, D, E

Estimated Effects and Coefficients for Resultados (coded units)

Term        Effect      Coef   SE Coef       T       P
Constant              2.7075    0.2098   12.91   0.000
A           1.3100    0.6550    0.2098    3.12   0.026
B          -1.3400   -0.6700    0.2098   -3.19   0.024
C          -0.1475   -0.0738    0.2098   -0.35   0.739
D           4.4200    2.2100    0.2098   10.54   0.000
E          -0.8275   -0.4138    0.2098   -1.97   0.106
A*B         1.2750    0.6375    0.2098    3.04   0.029
A*D        -1.3550   -0.6775    0.2098   -3.23   0.023
B*D         0.2450    0.1225    0.2098    0.58   0.585
C*D        -0.7125   -0.3563    0.2098   -1.70   0.150
D*E         0.0875    0.0438    0.2098    0.21   0.843


S = 0.839035    R-Sq = 96.93%      R-Sq(adj) = 90.79%


Analysis of Variance for Resultados (coded units)

                                                                                      128
Sección 7: Experimentos Fraccionarios 2^k


Source                            DF    Seq SS    Adj SS      Adj MS        F          P
Main Effects                       5    95.018    95.018     19.0037    26.99      0.001
2-Way Interactions                 5    16.148    16.148      3.2296     4.59      0.060
Residual Error                     5     3.520     3.520      0.7040
Total                             15   114.686


Effects Plot for Resultados

Alias Structure
I + A*B*C*D*E
A + B*C*D*E
B + A*C*D*E
C + A*B*D*E
D + A*B*C*E
E + A*B*C*D
A*B + C*D*E
A*D + B*C*E
B*D + A*C*E
C*D + A*B*E
D*E + A*B*C


                           Normal Probability Plot of the Standardized Effects
                                         (response is Resultados, Alpha = .05)
               99
                                                                                            Effect Ty pe
                                                                                            Not Significant
               95                                                                           Significant
                                                                                        D
               90                                                                           F actor   N ame
                                                                                            A         A
                                                       A
               80                                                                           B         B
                                                      AB                                    C         C
               70                                                                           D         D
     Percent




               60                                                                           E         E
               50
               40
               30
               20
                             B
               10
                             AD
               5


               1
                    -5.0     -2.5       0.0      2.5      5.0         7.5        10.0
                                           Standardized Effect




                                                                                                              129
Sección 7: Experimentos Fraccionarios 2^k


                                                    Residual Plots for Resultados
                       Normal Probability Plot of the Residuals                                  Residuals Versus the Fitted Values
                      99
                                                                                      0.6
                      90
                                                                                      0.3




                                                                           Residual
      Percent




                      50                                                              0.0

                      10                                                              -0.3

                      1                                                               -0.6
                           -1.0       -0.5     0.0       0.5         1.0                          -2         0          2       4         6
                                             Residual                                                              Fitted Value

                                  Histogram of the Residuals                             Residuals Versus the Order of the Data
                      4
                                                                                      0.6
                      3
          Frequency




                                                                                      0.3


                                                                           Residual
                      2                                                               0.0

                      1                                                               -0.3

                      0                                                               -0.6
                           -0.6 -0.4 -0.2    0.0 0.2    0.4    0.6   0.8                     1    2    3 4   5 6    7   8   9 10 11 12 13 14 15 16
                                             Residual                                                        Observation Order



Como podemos observar en la gráfica de normalidad, aumentó el número de efectos
significativos debido a la eliminación de las interacciones que no componían el efecto
significativo inicial generando así replicas con las cuales se pudo estimar el error. Ahora
los efectos significativos en el experimento son A, B, D, AB y AD.

   c) Si cualquier factor es despreciable, colapse el diseño a un 2^(5-1) full factorial en
            los factores significativos. Comente en los resultados del diseño e interprete los
            resultados.


Como el número de efectos significativos obtenidos en el experimento original fueron 3
factores (A, B y D) entonces creamos un diseño full factorial 2^3 de la siguiente manera:


   Esta vez utilizamos solo 3 efectos y sería:




                                                                                                                                                     130
Sección 7: Experimentos Fraccionarios 2^k




En la opción de Design, seleccionamos un Full Factorial. Pero en la opción de
Number of replicates seleccionamos dos replicas ya que el efecto de eliminar las
variables no significativas (C y E) me generan replicas a los tratamientos que
resultaron significativos.




La tabla resultante sería:




                                                                            131
Sección 7: Experimentos Fraccionarios 2^k




Como podemos notar el software genera 3 factores A, B, C, pero debemos tener cuidado
ya que el factor C generado corresponde al factor D en el experimento que fue uno de los
factores significativos. Se hace el cambio en el nombre para evitar confusiones al entrar
la data. El total de tratamientos generados son 8 pero duplicados ya que tenemos dos
réplicas. Para determinar que tratamientos son replicas de otros tratamientos procedemos
a eliminar aquellos factores que no salieron significativos de utilizando el método de
cubos. Primero procedemos a identificar todos los tratamientos del experimento original
2^(5-1) de la siguiente manera:




                                                                                     132
Sección 7: Experimentos Fraccionarios 2^k



             bce
                                                                     abcde
        +                                  ace                 cde

                                   abe
                                                     bde
                       e
                                                                     ade
        E
                                         abc
                                                      bcd
                               c
                   C                                                           acd
                   b
                                                                       abd
            __         B
                                                 a
                                                               d
                                     A

                                    __                     D
                                                                           +


Ahora, identificando los tratamientos generados aleatoriamente por MINITAB para el
diseño 2^3 tenemos:




                                                                                     133
Sección 7: Experimentos Fraccionarios 2^k




         +




         E


                   C

                   b                 ab
                                                    bd             abd
             __        B
                              (1)          a
                                     A                       d             ad

                                    __              D
                                                                       +


Para obtener las replicas lo que se hace es eliminar factores uniendo caras, para poder
identificar como se van obteniendo las replicas del problema usando los datos obtenidos
de los tratamientos del experimento original vamos a unir los dos bloques en donde los
tratamientos color azul son los tratamientos actuales y los rojos van a ser las replicas de
los mismos. Los datos obtenidos son para los tratamientos de rojo. Uniendo ambos
bloques tenemos:




                                                                                       134
Sección 7: Experimentos Fraccionarios 2^k



                  bce
                                                                                 abcde
         +                                             ace
                                                                           cde
                                           abe
                                                                 bde
                                e
                                                                                         ade
         E
                                                 abc
                                                                  bcd
                                      c
                    C                                                                      acd
                        b                        ab
                                                                   bd             abd
             __             B
                                     (1)                     a
                                                 A                          d              ad

                                             __                    D
                                                                                    +


Comenzamos eliminando uno de los factores que inicialmente no fueron significativos.
Escogemos el factor E y eliminamos de esta manera:

                  bce
                                                                                 abcde
         +                                             ace
                                                                           cde
                                           abe
                                                                 bde
                                 e
                                                                                         ade
         E
                                                 abc
                                                                   bcd
                                      c
                        C                                                                  acd
                        b                        ab
                                                                   bd             abd
             __             B
                                     (1)                     a
                                                 A                          d              ad

                                             __                        D
                                                                                     +

                                                                                                 135
Sección 7: Experimentos Fraccionarios 2^k

Obtenemos el siguiente resultado:

                      bce               abc
                                                                       abcde
                                                      bcd
                                  c            ace
                     C                                          cde            acd
                       b                ab = abe
                                                                        abd
                           B                         bd=bde
                               (1)=e           a
                                         A                      d         ad=ade

                                        __             D
                                                                          +


Nos resta eliminar el otro factor no significativo que fue el factor C y esto lo hacemos de
la siguiente manera:

                      bce               abc
                                                                       abcde
                                                      bcd
                                  c            ace
                     C                                          cde            acd
                       b                ab = abe
                                                                        abd
                           B                         bd=bde
                               (1)=e           a
                                         A                      d         ad=ade

                                        __             D
                                                                          +

Resultando en:


                     b=bce        ab = abe=abc       bd=bde=bcd       abd=abcde


                 B

                 (1)=e=c               a=ace            d=cde       ad=ade=acd
                                 A



                                       __             D
                                                                         +



                                                                                        136
Sección 7: Experimentos Fraccionarios 2^k


Los tratamientos de este diseño y sus replicas correspondientes a los datos de los
tratamientos del diseño anterior (se toma los valores de esos tratamientos como réplicas)
están dados en la siguiente gráfica:

                       Tratamientos actuales      Replica 1        Replica 2
                               AD                  ADE              ACD
                                D                    D               CDE
                                A                    A               ACE
                               AB                  ABC               ABE
                               BD                  BCD               BDE
                                B                    B               BCE
                              ABD                  ABD             ABCDE
                               (1)                   E                C

Factorial Fit: Results versus A, B, D

Estimated Effects and Coefficients for Results (coded units)

Term          Effect       Coef   SE Coef          T        P
Constant                 2.7244    0.2522      10.80    0.000
A           1.3437       0.6719    0.2522       2.66    0.029
B          -1.3063      -0.6531    0.2522      -2.59    0.032
D           4.3863       2.1931    0.2522       8.70    0.000
A*B         1.3087       0.6544    0.2522       2.59    0.032
A*D        -1.3888      -0.6944    0.2522      -2.75    0.025
B*D         0.2112       0.1056    0.2522       0.42    0.686
A*B*D      -0.2737      -0.1369    0.2522      -0.54    0.602


S = 1.00873     R-Sq = 92.87%       R-Sq(adj) = 86.63%

Analysis of Variance for Results (coded units)

Source                   DF    Seq SS    Adj SS         Adj MS       F       P
Main Effects              3    91.005   91.0046        30.3349   29.81   0.000
2-Way Interactions        3    14.744   14.7443         4.9148    4.83   0.033
3-Way Interactions        1     0.300    0.2998         0.2998    0.29   0.602
Residual Error            8     8.140    8.1403         1.0175
  Pure Error              8     8.140    8.1404         1.0175
Total                    15   114.189

Effects Plot for Results
Alias Structure
I
A
B
D
A*B
A*D
B*D
A*B*D




                                                                                     137
Sección 7: Experimentos Fraccionarios 2^k


De los resultados podemos notar que los efectos significativos fueron los efectos
principales (A, B y D) y las interacciones AB y AD. Este resultado es exactamente igual
al ejercicio anterior pero una vez se hubiesen eliminado los efectos de las interacciones
no significativos. Comprobando este resultado analizamos los gráficos resultantes.


                         Normal Probability Plot of the Standardized Effects
                                       (response is Results, Alpha = .05)
               99
                                                                                     Effect Type
                                                                                     Not Significant
               95                                                                    Significant

               90                                                           C        F actor   N ame
                                                                                     A         A
               80                                                                    B         B
                                                 A                                   C         D
               70
     Percent




                                                 AB
               60
               50
               40
               30
                          B
               20

               10         AC
               5


               1
                    -4     -2      0       2       4           6        8       10
                                       Standardized Effect



**Recuerde que aquí el efecto C corresponde al factor significativo D, por lo tanto, C=D
                                      y AC=AD.




                                                                                                       138
Sección 7: Experimentos Fraccionarios 2^k


                                                             Residual Plots for Results
                       Normal Probability Plot of the Residuals                                       Residuals Versus the Fitted Values
                      99
                                                                                             1
                      90




                                                                                  Residual
      Percent




                      50                                                                     0


                      10
                                                                                             -1
                      1
                           -2            -1         0            1           2                        -2               0              2         4         6
                                                 Residual                                                                      Fitted Value

                                   Histogram of the Residuals                                     Residuals Versus the Order of the Data
                      4
                                                                                             1
                      3
          Frequency




                                                                                  Residual
                      2                                                                      0

                      1
                                                                                             -1
                      0
                                -1.5   -1.0   -0.5 0.0     0.5   1.0   1.5                        1   2    3   4   5       6   7   8   9 10 11 12 13 14 15 16
                                                  Residual                                                             Observation Order




Ejemplo 2. tomado del libro “Design and Analysis of Experiments” de Douglas C.
Montgomery, 6ta edición. Problema 8-6, pag. 336


Use un diseño 2^ (5-2) para investigar el efecto de A=condensación de temperatura, B=
cantidad de material 1, C= volumen del solvente, D=tiempo de Condensación, y
E=cantidad de material 2 en rendimiento. Los resultados obtenidos son como sigue:
e= 23.2                            ad=16.9                  cd=23.8              bde=16.8
ab=15.5                            bc=16.2                  ace=23.4             abcde=18.1


   (a) Verifique que los generadores del diseño utilizados son I=ACE and I=BDE.



Este ejercicio se corre casi exactamente igual al anterior utilizando Stat, selecciona DOE,
Factorial y luego Create a Factorial Design. La diferencia es que en vez de dejar que el
software genere los generadores del experimento, los mismos se van a ingresar ya que
son conocidos. Los pasos serían:




                                                                                                                                                                139
Sección 7: Experimentos Fraccionarios 2^k




En la opción Designs se selecciona ¼ fraction.




Una vez en esta opción seleccionamos la opción de Generators…, para ingresar los
generadores dados.




                                                                            140
Sección 7: Experimentos Fraccionarios 2^k




Los resultados son:

    Fractional Factorial Design

    Factors:   5      Base Design:          5, 8   Resolution:    III
    Runs:      8      Replicates:              1   Fraction:      1/4
    Blocks:    1      Center pts (total):      0

    * NOTE * Some main effects are confounded with two-way interactions.

    Design Generators: D = AB, E = AC

    Alias Structure

    I + ABD + ACE + BCDE


    Por lo tanto, debo rehacer mi diseño para incluir los generadores deseados.

    Fractional Factorial Design

    Factors:   5      Base Design:          3, 8   Resolution:    III
    Runs:      8      Replicates:              1   Fraction:      1/4
    Blocks:    1      Center pts (total):      0

    * NOTE * Some main effects are confounded with two-way interactions.

    Design Generators: D = ABC, E = AC


    Alias Structure (up to order 3)

    I + ACE + BDE




                                                                                  141
Sección 7: Experimentos Fraccionarios 2^k

   (b) Escriba las relaciones y los aliases completes definidos para este diseño.

A = CE = BCD = ABDE
B = DE = ACD = ABCE
C = AE = ABD = BCDE
D = BE = ABC = ACDE
E = AC = BD = ABCDE
AB = CD = ADE = BCE
AD = BC = ABE = CDE
ABCD



   (c) Estime los efectos principales.

Estimated Effects and Coefficients for Response (coded units)

Term       Effect     Coef
Constant            19.238
A          -1.525   -0.763
B          -5.175   -2.588
C           2.275    1.138
D          -0.675   -0.337
E           2.275    1.138
A*B         1.825    0.913
A*D        -1.275   -0.637

   (d) Prepare un análisis de la tabla de varianza. Verifique que las interacciones AB y
      AD están disponibles para usarse como error.
     Factorial Fit: Response versus A, B, C, D, E

     Estimated Effects and Coefficients for Response (coded units)

     Term        Effect      Coef       SE Coef       T         P
     Constant              19.238        0.7871   24.44     0.002
     A           -1.525    -0.763        0.7871   -0.97     0.435
     B           -5.175    -2.588        0.7871   -3.29     0.081
     C            2.275     1.138        0.7871    1.45     0.285
     D           -0.675    -0.337        0.7871   -0.43     0.710
     E            2.275     1.137        0.7871    1.45     0.285


     S = 2.22626      R-Sq = 88.95%        R-Sq(adj) = 61.34%


     Analysis of Variance for Response (coded units)

     Source               DF   Seq SS    Adj SS    Adj MS       F       P
     Main Effects          5   79.826    79.826    15.965    3.22   0.254
     Residual Error        2    9.913     9.913     4.956
     Total                 7   89.739




                                                                                    142
Sección 7: Experimentos Fraccionarios 2^k


(e) Grafique los residuales versus los valores estimados. Además, construya una
   grafica de probabilidad normal de los residuales.


                                                         Residual Plots for Response
                 Normal Probability Plot of the Residuals                                          Residuals Versus the Fitted Values
               99                                                                         2

               90                                                                         1




                                                                               Residual
     Percent




               50                                                                         0


               10                                                                         -1

                1                                                                         -2
                 -3.0           -1.5            0.0          1.5         3.0                        15.0    17.5      20.0       22.5       25.0
                                              Residual                                                         Fitted Value

                           Histogram of the Residuals                                          Residuals Versus the Order of the Data
               2.0                                                                        2


               1.5                                                                        1
   Frequency




                                                                               Residual




               1.0                                                                        0

               0.5                                                                        -1

               0.0                                                                        -2
                        -1.5   -1.0    -0.5     0.0    0.5   1.0   1.5                         1      2    3     4     5     6          7    8
                                              Residual                                                      Observation Order




                                                                                                                                                   143
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas


   1. Experimento Gauge R & R.

Este tipo de experimento se usa para estudiar los componentes de variabilidad en un sistema de
medida. Los componentes de usual interés son repetibilidad y reproducibilidad. La repetibilidad
está asociada al instrumento, refleja la variación observada cuando la misma parte es medida por
el mismo operador. La reproducibilidad refleja la variabilidad adicional en el sistema de medida,
la cual resulta del uso del instrumento por el operador. El modelo esta dado por la ecuación I, la
ecuación II muestra los componentes de varianza. Es el más sencillo y consiste en analizar un
solo factor evaluado en diferentes niveles, de manera que se compara las medias de la respuesta
en cada uno de esos niveles y se establece si hay diferencia entre ellas.

         Yijk = µ + τ i + β j + (τβ )ij + ε îjk
                                                                                           I

Donde:

         τ i = Parte o la pieza que está siendo medida

         β j = Personas u operadores que miden las partes

         (τβ )ij = Interacción entre las piezas y el operador

         ε ijk = Error debido al instrumento de medida



En cuanto a los componentes de varianza tenemos:

         σ y 2 = σ τ 2 + σ β 2 + σ τβ 2 + σ ε 2                                            II




Donde:

         σ τ 2 = Componente de varianza para la parte o pieza

         σ β 2 = Componente de varianza para el operador o persona

         σ τβ 2 = Componente de varianza para la interacción entre la persona y la pieza


         σ ε 2 = Componente de varianza para el error

                                                                                                144
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas
                                                 Medias

El interés de este tipo de experimento es saber cuanta varianza aporta cada uno de los
componentes. Las hipótesis en cuestión se describen a continuación:


       H0 : στ 2 = 0         H1 : σ τ 2 ≠ 0


       H0 : σ β 2 = 0        H1 : σ β 2 ≠ 0


       H 0 : σ τβ 2 = 0      H1 : σ τβ 2 ≠ 0


La aspiración máxima del experimento es que toda la variabilidad se deba a las piezas de manera
que se pueda concluir que el instrumento es capaz de distinguir entre diferentes niveles de
productos.

La calibración de un instrumento está asociada a la exactitud, la precisión está asociada al
experimento Gauge R & R. A continuación se ilustran los conceptos de precisión y exactitud:




                                                                                              145
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas

Este experimento es completamente aleatorio, es decir, además de que las corridas se deben
realizar de manera aleatoria, los factores involucrados (piezas y personas) son aleatorios porque
representan una muestra tomada de una población mayor sobre la cual se desea hacer inferencia.

Ejemplo 1

Para realizar la experimentación concerniente a la deshidratación de setas, el ingeniero del
proceso de deshidratación de la empresa Mush, realizó un experimento para validar la balanza
donde se pesan las mismas. Se tomo una balanza digital, se tomaron 5 pesas avaladas por el
ANSI (American National Standards Institute). Los pesos a medir fueron de 100, 50, 20, 10 y 5
gramos (la balanza se uso para tomar pesos de las setas entre 25 y 100 gramos); las mediciones
se hicieron por dos operarios y se realizaron 10 repeticiones. Con el fin de asegurar la
aleatoriedad del experimento, se utilizo el programa Minitab.

A continuación se presenta el procedimiento realizado por el experimentador para hacer los
arreglos aleatorios:

   1. Se busco la opción de crear un experimento factorial completo, asumiendo como factores
       los operarios y los diferentes pesos, donde los operarios son un factor con 2 niveles y los
       pesos son un factor con 5 niveles. La figura ilustra el procedimiento en Minitab:




                                                                                              146
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas

2. Se hizo click en la opción create factorial design para obtener los arreglos aleatorios. La
   ventana desplegada se muestra en la siguiente figura, donde se escoge la opción de
   general full factorial design y se pone el número 2 en la casilla de number of factors,
   luego se hace click en la opción designs para especificar el tipo de diseño que se desea;
   en la casilla correspondiente al nombre del factor A se puso el nombre del factor
   personas, así mismo en la siguiente casilla se puso el nombre del factor piezas; luego en
   la casilla correspondiente al número de niveles por factor (number of levels), se puso dos
   niveles para las personas (porque son dos quienes van a tomar los pesos) y 5 niveles para
   las piezas (5, 10, 20, 50 y 100 gr). En la casilla correspondiente al número de replicas se
   puso un total de 10 que son las deseadas por el experimentador :




                                                                                          147
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas

3. Al oprimir el botón de ok en las anteriores ventanas se obtiene entonces el siguiente
   arreglo. Minitab despliega en la columna de piezas valores del 1 al 5, para efectos de
   visualización, se cambiaron los valores de manera que se vieran los pesos. El valor de 1
   corresponde al peso más alto (100) y el de 5 al más bajo (5). Se tomaron las medidas de
   acuerdo a los arreglos y se obtuvieron las respuestas ingresadas bajo la columna de
   Medidas de la Balanza:


   StdOrder    RunOrder   PtType   Blocks   Piezas   Personas   Medidas de la Balanza
      74           1        1        1         50       2              50.01
      22           2        1        1        100       2              99.99
      31           3        1        1        100       1              99.99
      40           4        1        1         5        2               5.00
      71           5        1        1        100       1              99.99
      55           6        1        1         20       1              19.99
      69           7        1        1         5        1               5.00
      50           8        1        1         5        2               5.00
      11           9        1        1        100       1              99.99
      28          10        1        1         10       2              10.00
      98          11        1        1         10       2              10.00
      95          12        1        1         20       1              20.00
      21          13        1        1        100       1              99.99
      20          14        1        1         5        2               5.00
      57          15        1        1         10       1               9.99
      66          16        1        1         20       2              20.00
       7          17        1        1         10       1              10.00
       2          18        1        1        100       2              99.99
      32          19        1        1        100       2              99.99
      61          20        1        1        100       1              99.99
      44          21        1        1         50       2              50.01
      63          22        1        1         50       1              50.01
      16          23        1        1         20       2              20.00
      18          24        1        1         10       2              10.00
      12          25        1        1        100       2              99.99
      81          26        1        1        100       1              99.99
      86          27        1        1         20       2              20.00
      91          28        1        1        100       1              99.99
      51          29        1        1        100       1              99.99
      70          30        1        1         5        2               5.00
      87          31        1        1         10       1              10.00


                                                                                        148
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas


49         32        1      1       5        1             5.00
82         33        1      1      100       2             99.99
43         34        1      1       50       1             50.01
60         35        1      1       5        2             5.00
97         36        1      1       10       1             10.00
3          37        1      1       50       1             50.01
52         38        1      1      100       2            100.00
76         39        1      1       20       2             20.00
56         40        1      1       20       2             20.01
30         41        1      1       5        2             5.00
9          42        1      1       5        1             5.00
80         43        1      1       5        2             5.00
100        44        1      1       5        2             5.00
73         45        1      1       50       1             50.00
37         46        1      1       10       1             10.00
23         47        1      1       50       1             50.01
64         48        1      1       50       2             50.01
19         49        1      1       5        1             5.00
68         50        1      1       10       2             10.00
90         51        1      1       5        2             5.00
94         52        1      1       50       2             50.01
25         53        1      1       20       1             20.00
26         54        1      1       20       2             20.00
83         55        1      1       50       1             50.01
29         56        1      1       5        1             5.00
48         57        1      1       10       2             10.00
8          58        1      1       10       2             10.00
15         59        1      1       20       1             20.01
72         60        1      1      100       2             99.99
27         61        1      1       10       1             10.00
47         62        1      1       10       1             10.00
4          63        1      1       50       2             50.01
17         64        1      1       10       1             9.99
67         65        1      1       10       1             10.00
39         66        1      1       5        1             5.00
45         67        1      1       20       1             20.01
6          68        1      1       20       2             20.01
93         69        1      1       50       1             50.01
10         70        1      1       5        2             5.01
33         71        1      1       50       1             50.01
14         72        1      1       50       2             50.00


                                                                     149
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas


       96         73         1        1        20         2               20.00
       89         74         1        1        5          1               5.00
       1          75         1        1       100         1               99.99
       79         76         1        1        5          1               5.00
       42         77         1        1       100         2               99.99
       41         78         1        1       100         1               99.99
       24         79         1        1        50         2               50.01
       53         80         1        1        50         1               50.01
       77         81         1        1        10         1               10.00
       84         82         1        1        50         2               50.01
       99         83         1        1        5          1               5.00
       46         84         1        1        20         2               20.00
       5          85         1        1        20         1               20.01
       36         86         1        1        20         2               20.01
       88         87         1        1        10         2               10.00
       34         88         1        1        50         2               50.01
       13         89         1        1        50         1               50.01
       38         90         1        1        10         2               10.00
       35         91         1        1        20         1               20.01
       54         92         1        1        50         2               50.01
       92         93         1        1       100         2               99.99
       78         94         1        1        10         2               10.00
       85         95         1        1        20         1               20.01
       75         96         1        1        20         1               20.01
       65         97         1        1        20         1               20.01
       62         98         1        1       100         2               99.99
       59         99         1        1        5          1               5.00
       58         100        1        1        10         2               10.00

4. Luego para realizar el análisis de los datos se ingresa al menú de stat, quality tools, gauge
   study y luego se hace click en Gauge R & R study (crossed) como muestra la figura:




                                                                                            150
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas




5. Al hacer click se despliega una pantalla donde en la primera casilla se ingresa la columna
   correspondiente a las piezas, en la segunda (operators) se ingresa la columna
   correspondiente a las personas que van a realizar el experimento, finalmente en la casilla
   de measurement data se ingresa la columna correspondiente a las respuestas (medidas de
   la balanza). Se hace click en la opción de anova para hacer el análisis de varianza.




6. Después de dar click en el botón de ok, se obtiene la siguiente respuesta:




                                                                                          151
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas

        Gage R&R Study - ANOVA Method
        Two-Way ANOVA Table With Interaction

        Source                 DF         SS         MS             F       P
        Piezas                  4     123578    30894.5    1669974646   0.000
        Personas                1          0        0.0             0   0.828
        Piezas * Personas       4          0        0.0             1   0.233
        Repeatability          90          0        0.0
        Total                  99     123578


        Gage R&R

                                               %Contribution
        Source                      VarComp     (of VarComp)
        Total Gage R&R                 0.00             0.00
          Repeatability                0.00             0.00
          Reproducibility              0.00             0.00
            Personas                   0.00             0.00
            Personas*Piezas            0.00             0.00
        Part-To-Part                1544.73           100.00
        Total Variation             1544.73           100.00




Se observa un valor P de 0 para las piezas, 0.828 para los operarios y de 0.233 para la interacción
pesos-operarios. Estos valores permiten concluir que la hipótesis nula para las piezas se rechaza,
es decir, la variabilidad del experimento se debe a la diferencia entre las piezas y la balanza
entonces, tiene la capacidad de diferenciar entre varios tipos de piezas, alcanzando así el
propósito del experimento, es decir que la balanza puede ser utilizada para medir objetos en un
rango de 5 a 100 gramos con precisión. Los valores de P para los operarios y la interacción entre
pesos y operarios muestran que estos no aportan una variación significativa al experimento.

En la figura se observa también la contribución de variación de cada uno de los componentes y
se ratifica que la variación total se debe a las piezas.

Lo anterior muestra que la balanza es precisa. El experimentador observó que la calibración de la
misma se hace manualmente, la balanza tiene en una esquina un dispositivo con una burbuja de
aire que debe ser puesta en la mitad del círculo para asegurar la calibración.


    2. Reglas para obtener las medias cuadradas esperadas (EMS: Expected
       mean squares)



                                                                                               152
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas




                                                                 153
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas




                                                                 154
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas




                                                                 155
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas




                                                                 156
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas




                                                                 157
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas




Ejemplo 1 (Tomado del libro Design and analysis of Experiments, de Douglas C. Montgomery, 6
edición, página 523)


Considere un experimento factorial con cuatro factores, donde el factor A tiene a niveles, el
factor B tiene b niveles, el factor C tiene c niveles, el factor D tiene d niveles y hay n replicas.
Escriba las sumas de cuadrados, los grados de libertad y las medias cuadradas esperadas para los
siguientes casos:
a) A, B, C, y D son factores fijos.
b) A, B, C, y D son factores aleatorios.
c) A es fijo y B, C, y D son aleatorios.


La suma de cuadrados y los grados de libertad son iguales para las partes a, b y c




                                                                                                158
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas

               Fuente de variación    Suma de cuadrados        Grados de libertad
               A                      SSA                      a-1
               B                      SSB                      b-1
               C                      SSC                      c-1
               D                      SSD                      d-1
               AB                     SSAB                     (a-1)(b-1)
               AC                     SSAC                     (a-1)(c-1)
               AD                     SSAD                     (a-1)(d-1)
               BC                     SSBC                     (b-1)(c-1)
               BD                     SSBD                     (b-1)(d-1)
               CD                     SSCD                     (c-1)(d-1)
               ABC                    SSABC                    (a-1)(b-1)(c-1)
               ABD                    SSABD                    (a-1)(b-1)(d-1)
               ACD                    SSACD                    (a-1)(c-1)(d-1)
               BCD                    SSBCD                    (b-1)(c-1)(d-1)
               ABCD                   SSABCD                   (a-1)(b-1)(c-1)(d-1)

 a) Para el caso donde A, B, C, y D son factores fijos :                        Componente de
                                                                                varianza para el
                                                                                factor fijo τi

Factores        F    F     F     F    R                        EMS
                a    b     c     d    e
                i    j     k     l    m
     τi         0    B     c     d    n               σ2 + [bcdn Σ τ2i] / (a-1)
     βj         a    0     c     d    n              σ2 + [acdn Σ β2j] / (b-1)
     γk         a    B     0     d    n              σ2 + [abdn Σ γ2k] / (c-1)
     δl         a    B     c     0    n              σ2 + [abcn Σ δ2l] / (d-1)
  (τβ)ij        0    0     c     d    n         σ + [cdn ΣΣ (τβ)2ij] / (a-1) (b-1)
                                                  2

  (τγ)ik        0    B     0     d    n         σ2 + [bdn ΣΣ (τγ)2ik] / (a-1) (c-1)
  (τδ)il        0    B     c     0    n          σ2 + [bcn ΣΣ (τδ)2il] / (a-1) (d-1)
  (βγ)jk        a    0     0     d    n         σ2 + [adn ΣΣ (βγ)2jk] / (b-1) (c-1)
  (βδ)jl        a    0     c     0    n         σ2 + [acn ΣΣ (βδ)2jl] / (b-1) (d-1)
  (γδ)kl        a    B     0     0    n         σ2 + [abn ΣΣ (γδ)2jl] / (c-1) (d-1)
 (τβγ)ijk       0    0     0     d    n      σ + [dn ΣΣΣ (τβγ)2 ijl] / (a-1) (b-1) (c-1)
                                              2

 (τβδ)ijl       0    0     c     0    n     σ2 + [dn ΣΣΣ (τβδ)2 ijl] / (a-1) (b-1) (d-1)
 (τγδ)ikl       0    B     0     0    n     σ2 + [dn ΣΣΣ (τγδ)2 ikl] / (a-1) (c-1) (d-1)
 (βγδ)jkl       a    0     0     0    n     σ2 + [dn ΣΣΣ (βγδ)2 jkl] / (b-1) (c-1) (d-1)
(τβγδ)ijkl      0    0     0     0    n σ2 + [dn ΣΣΣΣ (τβγδ)2 ijkl] / (a-1) (b-1) (c-1) (d-1)
  ε(ijkl)m      1    1     1     1    1                         σ2

 b) Para el caso donde A, B, C, y D son factores aleatorios:




                                                                                                   159
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas

   Factores          R   R   R   R R                                     EMS
                     a   b   c   d e
                     i   j   k   l m
          τi         1   b   c   D n     σ2+nσ2τβγδ +bnσ2τ γδ +cnσ2τβδ +dnσ2τ βγ +bcnσ2 τ δ +bdnσ2 τ γ +cdnσ2τβ
                                         +bcdnσ2 τ
         βj          a   1   c   d   n   σ2+nσ2τβγδ +anσ2βγδ +cnσ2τβδ +dnσ2τ βγ +acnσ2 βδ +adnσ2βγ +cdnσ2τβ
                                         +acdnσ2β
         γk          a   b   1   d   n   σ2 + nσ2 τβγδ + anσ2 βγδ + dnσ2 τβγ + abnσ2 τδ + adnσ2 βγ + cnσ2 τγ +
                                         abdnσ2 δ
         δl          a   b   c   1   n   σ2 + nσ2 τβγδ + anσ2 βγδ + cnσ2 τβδ + abnσ2 τδ + acnσ2 βδ + bcnσ2 τδ +
                                         abcnσ2 δ
        (τβ)ij       1   1   c   d   n   σ2 + nσ2 τβγδ + cnσ2 τβδ + dnσ2 τβγ + cdnσ2 τβ
    (τγ)ik           1   b   1   d   n   σ2 + nσ2 τβγδ + bnσ2 τγδ + dnσ2 τβγ + bcnσ2 τγ
        (τδ)il       1   b   c   1   n   σ2 + nσ2 τβγδ + bnσ2 τγδ + cnσ2 τβδ + bcnσ2 τδ
    (βγ)jk           a   1   1   d   n   σ2 + nσ2 τβγδ + anσ2 βγδ + dnσ2 τβδ + adnσ2 βγ
     (βδ)jl          a   1   c   1   n   σ2 + nσ2 τβγδ + anσ2 βγδ + cnσ2 τβδ + acnσ2 βδ
    (γδ)kl           a   b   1   1   n   σ2 + nσ2 τβγδ + anσ2 βγδ + abnσ2 γδ
    (τβγ)ijk         1   1   1   d   n   σ2 + nσ2 τβγδ + dnσ2 τβγ
    (τβδ)ijl         1   1   c   1   n   σ2 + nσ2 τβγδ + cnσ2 τβδ
    (τγδ)ikl         1   b   1   1   n   σ2 + nσ2 τβγδ + bnσ2 τγδ
   (βγδ)jkl          a   1   1   1   n   σ2 + nσ2 τβγδ + anσ2 βγδ
   (τβγδ)ijkl        1   1   1   1   n   σ2 + nσ2 τβγδ
    ε(ijkl)m         1   1   1   1   1   σ2

    c) Para el caso donde A es fijo y B, C, y D son aleatorios:

Factores         F       R   R R R                                     EMS
                 a       b   c d e
                 i       j   k l m
   τi            0       b   c d n σ2+nσ2τβγδ +bnσ2τ γδ +cnσ2τβδ +dnσ2τ βγ +bcnσ2 τ δ +bdnσ2 τ γ +cdnσ2τβ
                                   +(bcdnΣτ2i)/(a-1)
   βj            a       1   c d n σ2 + anσ2 βγδ + acnσ2 βδ + adnσ2 βγ + abdnσ2 β
   γk            a       b   1 d n σ2 + anσ2 βγδ + abnσ2 δγ + adnσ2 βγ + abdnσ2 δ
   δl            a       b   c 1 n σ2 + anσ2 βγδ + abnσ2 δγ + acnσ2 βδ + abcnσ2 δ
 (τβ)ij          0       1   c d n σ2 + nσ2 τβγδ + cnσ2 τβδ + dnσ2 τβγ + cdnσ2 τβ
 (τγ)ik          0       b   1 d n σ2 + nσ2 τβγδ + bnσ2 τγδ + dnσ2 τβγ + bdnσ2 τγ
 (τδ)il          0       b   c 1 n σ2 + nσ2 τβγδ + bnσ2 τγδ + cnσ2 τβδ + bcnσ2 τδ
 (βγ)jk          a       1   1 d n σ2 + anσ2 βγδ + adnσ2 βγ
 (βδ)jl          a       1   c 1 n σ2 + anσ2 βγδ + acnσ2 βδ
 (γδ)kl          a       b   1 1 n σ2 + anσ2 βγδ + abnσ2 γδ
(τβγ)ijk         0       1   1 d n σ2 + nσ2 τβγδ + dnσ2 τβγ
(τβδ)ijl         0       1   c 1 n σ2 + nσ2 τβγδ + cnσ2 τβδ
(τγδ)ikl         0       b   1 1 n σ2 + nσ2 τβγδ + bnσ2 τγδ
(βγδ)jkl         a       1   1 1 n σ2 + anσ2 βγδ

                                                                                                              160
Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas

(τβγδ)ijkl   0   1   1   1   n σ2 + nσ2 τβγδ
  ε(ijkl)m   0   1   1   1   1 σ2




                                                                                  161
Sección 9: Experimentos anidados y Anidados Factoriales


   1. EXPERIMENTOS ANIDADOS O JERARQUICOS “NESTED”
Existen ocasiones donde los niveles de un factor B son similares pero no idénticos para
diferentes niveles del factor A. Es decir, diferentes niveles del factor A ven niveles del factor B
que son similares para cada nivel del factor A pero por no ser idénticos, se encuentran anidados
en el nivel al que correspondan para el factor A.

Para ilustrar lo descrito, suponga que tiene una máquina de refrescos compuesta de 3 bombas y
cada una de ellas suple a dos dispensadores como muestra la figura:
                              dispens




En la figura se observa entonces un experimento anidado de dos niveles, esto porque los
dispensadores componen un nivel del “nested” que están anidados en las bombas (que componen
un segundo nivel) y ellas a su vez anidadas en la máquina. Allí se observa la teoría descrita ya
                                                         .
que las bombas son componentes similares pero no iguales porque cada una de ellas tiene un
funcionamiento independiente, y, de la misma manera, los dispensadores son un factor con
               independiente
componentes similares pero no idénticos; por este motivo si lo que se desea es analizar una
respuesta con respecto a los factores bomba y dispensador, se debe hacer entonces un
experimento anidado o jerárquico.

El modelo que describe estos experimentos es:


                                                                                               161
Sección 9: Experimentos anidados y Anidados Factoriales


                       Yijk = µ + M i + B j ( i ) + Dk (ij ) + ε ( ijk ) l
Donde:

µ = media _ general
M i = Maquina
B j ( i ) = Bomba
Dk ( ij ) = Dispensador
ε ( ijk ) l = error

i: corresponde al suscrito para la máquina que en el ejemplo corresponde a 1, si tuviera mas
m’aquinas correspondería a 1…a

j(i): corresponde al suscrito de las bombas que en el ejemplo corresponde a j = 1, 2, 3 anidadas
en i = 1 máquina. Si tuviera más bombas el suscrito seria j = 1…b

k(ij): corresponde al suscrito de los dispensadores k = 1,2 anidados en las bombas j y las
máquinas i. Si tuviera más dispensadores k = 1…c

(ijk)l: corresponde al termino del error

Para realizar el experimento descrito anteriormente como uno tipo factorial, tendrían que
cambiarse los dispensadores para las bombas cada vez que se haga una corrida, de manera que
los dispensadores fueran los mismos dos para las 3 bombas. Esto resulta inútil ya que este tipo de
maquinas requieren un arreglo como el que se describió anteriormente. De esta manera por ser
éste un experimento anidado, no hay interacciones presentes entre los factores.

Suponiendo que adicional a la máquina presentada en la figura, se tiene otra más, la tabla de
análisis de varianza para las dos maquinas, con 3 bombas cada una y cada bomba con dos
dispensadores es:




                                                                                              162
Sección 9: Experimentos anidados y Anidados Factoriales

                Análisis de Varianza para un experimento anidado en 3 niveles

Fuente de variación        Suma de cuadrados                                                Grados de Medias cuadradas esperadas para A
                                                                                            libertad  y B fijos y C aleatorio
A (máquinas)
                                    ∑(y                     − y.... ) 2                     a-1                      bcn τ
                                                                                                                              2
                           bcn
                                        i
                                                    i ...
                                                                                                       σ 2 + nσ c 2 +
                                                                                                                          ∑     i

                                                                                                                         a −1
B (bombas dentro de cn
                                ∑(y           ij ..     − y.... )     2                     a(b-1)                      cn∑∑ β
                                                                                                                                             2

A)                                  i                                                                  σ + nσ c +
                                                                                                            2     2                 j (i )

                                                                                                                          a (b − 1)
C        (dispensadores n
                            ∑(y             ijk .     − y.... )   2                         ab(c-1)    σ + nσ c
                                                                                                            2     2

dentro de B)                    i
Error
                           ∑∑∑∑ ( y                              ijkl     − y ijk . ) 2     abc(n-1)   σ2
                            i           j    k          l
Total
                           ∑∑∑∑ ( y                              ijkl     − y.... ) 2       abcn-1
                            i           j    k          l




Ejemplo

Suponga que se está estudiando la dureza de la superficie de un material de acuerdo a 3
máquinas que se encuentran en 3 plantas de producción diferentes. Estas máquinas son operadas
por 3 personas diferentes cada una que se escogieron de manera aleatoria. Cada persona que
opera la máquina toma 3 medidas para la dureza del material. Se obtuvieron las siguientes
respuestas:

                       Máquina 1                                                          Máquina 2                     Máquina 3
Personas        1          2                         3                       1               2          3       1           2                     3
               78         96                        47                      93               86        74       88         52                    43
               61         76                        58                     100               80        66       75         55                    54
               75         65                        55                      90               90        80       67         50                    63


A continuación se presenta el procedimiento en Minitab:

   1. Se introducen los datos como muestra la grafica:




                                                                                                                                                  163
Sección 9: Experimentos anidados y Anidados Factoriales




2. En el menú stat se hace click sobre la opción ANOVA y allí se hace click sobre la opción
   Balanced Anova como muestra la figura:




3. En la pantalla que se despliega se pone en la casilla responses la columna que contiene
   las respuestas, y, en la casilla Model, se pone la columna de máquina y la columna de
   personas. Nótese que después de la columna de personas se encuentra la columna de


                                                                                        164
Sección 9: Experimentos anidados y Anidados Factoriales

   máquinas entre paréntesis, esto indica a Minitab que las personas están anidadas dentro
   de las máquinas.




4. Al hacer click en el botón de graphs se despliega un menú de graficas, se hace click sobre
   la opción four in one de manera que se muestren las 4 graficas de los residuales en una.
   Se da ok a todas las pantallas y se obtienen los resultados.




5. Los resultados se muestran a continuación:



                                                                                          165
Sección 9: Experimentos anidados y Anidados Factoriales

                ANOVA: respuesta versus maquina, personas

                Factor                   Type     Levels    Values
                maquina                  fixed         3    1, 2, 3
                personas(maquina)        random        3    1, 2, 3


                Analysis of Variance for respuesta

                Source                   DF        SS          MS      F       P
                maquina                   2   2627.56     1313.78   2.77   0.141
                personas(maquina)         6   2845.11      474.19   6.26   0.001
                Error                    18   1363.33       75.74
                Total                    26   6836.00


                S = 8.70292       R-Sq = 80.06%         R-Sq(adj) = 71.19%




Se observa que no existe diferencia significativa en el factor máquinas a pesar de que las mismas
se encuentran en diferentes plantas, sin embargo, se observa diferencia en las personas ya que su
valor p es menor al nivel de significancia utilizado para la prueba (0.05). Debido a que hay
diferencia entre las personas que operan las maquinas, el interés mayor es saber en qué máquina
están difiriendo estas personas pero el análisis hecho con anterioridad no permite obtener esta
información, ya que el mismo se realizó de manera global.

Para obtener un análisis por cada máquina se realiza entonces un análisis para un solo factor
aleatorio para cada una de las maquinas. El factor en consideración para cada análisis es las
personas con 3 niveles. En la sección correspondiente a un solo factor aleatorio de este material
se muestra el procedimiento para la realización del mismo en Minitab, de manera que se procede
a mostrar aquí los resultados.

   1. Análisis de un solo factor aleatorio para la máquina 1:

       One-way ANOVA: respuesta versus personas

       Source      DF       SS    MS      F       P
       personas     2     1042   521   4.32   0.069
       Error        6      723   121
       Total        8     1765

       S = 10.98        R-Sq = 59.02%     R-Sq(adj) = 45.35%


                                       Individual 95% CIs For Mean Based on


                                                                                             166
Sección 9: Experimentos anidados y Anidados Factoriales

                                Pooled StDev
   Level   N    Mean    StDev   -----+---------+---------+---------+----
   1       3   71.33     9.07                (----------*---------)
   2       3   79.00    15.72                     (----------*---------)
   3       3   53.33     5.69   (----------*---------)
                                -----+---------+---------+---------+----
                                    45         60        75         90




2. Análisis de un solo factor aleatorio para la máquina 2:

      One-way ANOVA: respuesta m2 versus personas m2

      Source           DF      SS        MS      F       P
      personas m2       2   666.0     333.0   9.89   0.013
      Error             6   202.0      33.7
      Total             8   868.0

      S = 5.802      R-Sq = 76.73%       R-Sq(adj) = 68.97%


                                      Individual 95% CIs For Mean Based on
                                      Pooled StDev
      Level    N    Mean    StDev     -----+---------+---------+---------+----
      1        3   94.33     5.13                           (-------*--------)
      2        3   85.33     5.03                  (-------*--------)
      3        3   73.33     7.02     (-------*--------)
                                      -----+---------+---------+---------+----
                                          70         80        90       100

      Pooled StDev = 5.80




3. Análisis de un solo factor aleatorio para la máquina 3:

      One-way ANOVA: respuesta m3 versus Personas m3

      Source           DF       SS       MS      F       P
      Personas m3       2   1137.6    568.8   7.79   0.021
      Error             6    438.0     73.0
      Total             8   1575.6

      S = 8.544      R-Sq = 72.20%       R-Sq(adj) = 62.93%


                                       Individual 95% CIs For Mean Based on
                                       Pooled StDev
      Level    N     Mean     StDev    ---+---------+---------+---------+------
      1        3   76.667    10.599                    (-------*-------)
      2        3   52.333     2.517    (-------*-------)
      3        3   53.333    10.017     (-------*-------)
                                       ---+---------+---------+---------+------
                                         45         60       75        90

      Pooled StDev = 8.544



                                                                                  167
Sección 9: Experimentos anidados y Anidados Factoriales

Se observa que al sumar la suma de cuadrados para el factor persona de cada una de las
máquinas, se obtiene la suma de cuadrados total que se observa en el análisis global. Es decir:
1042+666+1137.6 = 2845.6.


Con los análisis realizados para un solo factor aleatorio se puede observar que hay diferencia
significativa entre las personas de las máquinas 2 y 3. Sin embargo se podría decir que en la
máquina uno también puede haber una diferencia entre las personas ya que el valor p no está
muy lejano del nivel de significancia de la prueba (0.05).


   2. Experimentos anidados cruzados o anidados factoriales


Hay ocasiones donde se tienen experimentos en que algunos factores están organizados de
manera factorial y otros anidados dentro de alguno de estos factores factoriales. De manera
entonces que en este tipo de experimentos hay interacción entre los factores factoriales.


El modelo para estos experimentos esta descrito por:



               Yijkl = µ + τ i + B j ( i ) + yk ( j ) + τβij + τyik ( j ) + ε ( ijk ) l


       Donde:


       τ i : Es el efecto del factor factorial A
        β j : Es el efecto del factor factorial B

        y k ( j ) : Es el efecto del factor C anidado en B

       τβ ij : Es la interacción de los factores A y B

       τy ik ( j ) : Es la interacción entre el factor A y el factor C anidado en B

       ε ( ijk ) l : Es el error experimental



                                                                                            168
Sección 9: Experimentos anidados y Anidados Factoriales

Ejemplo

Un profesor está estudiando la velocidad de ensamble de los alumnos al armar carritos con unos
legos. El diseñó 3 formas de ensamblaje y dos estaciones de trabajo. Para la práctica selecciono 4
alumnos de manera aleatoria para asignarlos a la combinación entre forma de ensamble y
estación de trabajo. Las estaciones de trabajo se ubicaron cada una en un salón de clase diferente,
de manera que los cuatro alumnos seleccionados para cada trabajo son diferentes para cada
estación. Para cada combinación se realizaron 2 replicas.

Debido a que los alumnos son diferentes para cada estación de trabajo, estos se van a encontrar
anidados dentro de las estaciones de trabajo, pero como las tres formas de ensamble son las
mismas para las dos estaciones de trabajo, estos dos factores son factoriales y por tanto pueden
interactuar.

A continuación se presenta la tabla con las velocidades de ensamble para cada tratamiento:


                           Estación de trabajo 1                 Estación de trabajo 2
         Alumno        1        2         3        4         1        2         3         4
        Ensamble      22       23        28        25       26       27        28        24
            1         24       24        29        23       28       25        25        23
        Ensamble      30       29        30        27       29       30        24        28
            2         27       28        32        25       28       27        23        30
        Ensamble      25       24        27        26       27       26        24        28
            3         21       22        25        23       25       24        27        27


Una vez se tienen las respuestas al experimento se procede a realizar el análisis mediante el
programa Minitab:

   1. En el menú stat, se hace click sobre la opción ANOVA, allí se puede escoger para este
       caso, la opción Balanced Anova o General linear model, cualquiera de los dos funciona
       porque se tiene un diseño balanceado. En este caso haga click sobre la opción Balanced
       Anova como muestra la figura:




                                                                                               169
Sección 9: Experimentos anidados y Anidados Factoriales




2. En la pantalla que se despliega (mostrada en la figura) se introduce el modelo. En la
   casilla de response se hace click a la columna de respuestas, en la casilla de model, se
   introducen las columnas correspondientes al modelo como se muestra en la figura.
   Observe que cuando se introduce el factor alumno, se pone entre parentecis las estaciones
   de trabajo, esto se hace para darle a entender a Minitab que los alumnos se encuentran
   anidados dentro de las estaciones de trabajo. También observe que se ponen interacciones
   entre los tipos de ensamble y las estaciones de trabajo porque ambas estaciones ven todos
   los tipos de ensamble, igualmente los alumnos de cada estación ven los mismos tipos de
   ensamble, de manera que estos interactúan. Sin embargo no hay interaccion entre las
   estaciones de trabajo y los alumnos porque los mismos varian para cada estación de
   trabajo, es decir, se encuentran anidados dentro de las estaciones. En la casilla de
   Random factors se pone el factor alumnos porque el interés del experimentador es hacer
   inferencia en una población mayor de los mismos:




                                                                                        170
Sección 9: Experimentos anidados y Anidados Factoriales




3. Al hacer click en el botón de graphs, se obtiene una pantalla donde se escoge la opción de
   four in one para que el programa muestre las 4 graficas para los residuales en una misma
   como muestra la figura. Una vez escogida la opción se da ok:




4. Al regresar a la pantalla principal, se hace click sobre el botón de options con el fin de
   que el programa despliegue la pantalla mostrada en la figura. En esta pantalla se de click
   sobre la casilla que dice Use the restricted form of the model para que entonces Minitab
   entienda que debe hacer el análisis considerando el modelo restringido. Esto quiere decir


                                                                                                171
Sección 9: Experimentos anidados y Anidados Factoriales

      que los cálculos para la estadística F se hacen presumiendo que los estimados de varianza
      que sean negativos son iguales a cero.




5. Al dar ok en la pantalla de la figura anterior, se regresa al menú principal donde se da de
      nuevo ok para obtener los siguientes resultados:

  ANOVA: Respuesta versus Estacion de trabajo, Tipo de ensamble, Alumno

  Factor                            Type       Levels    Values
  Estacion de trabajo               fixed           2    1, 2
  Alumno(Estacion de trabajo)       random          4    1, 2, 3, 4
  Tipo de ensamble                  fixed           3    1, 2, 3


  Analysis of Variance for Respuesta

  Source                                       DF        SS         MS      F       P
  Estacion de trabajo                           1     4.083      4.083   0.34   0.581
  Alumno(Estacion de trabajo)                   6    71.917     11.986   5.14   0.002
  Tipo de ensamble                              2    82.792     41.396   7.55   0.008
  Estacion de trabajo*Tipo de ensamble          2    19.042      9.521   1.74   0.218
  Tipo de ensamble*Alumno(                     12    65.833      5.486   2.35   0.036
    Estacion de trabajo)
  Error                                        24     56.000     2.333
  Total                                        47    299.667


  S = 1.52753       R-Sq = 81.31%     R-Sq(adj) = 63.40%



                                                     Variance    Error
       Source                                       component     term
  1    Estacion de trabajo                                           2


                                                                                            172
Sección 9: Experimentos anidados y Anidados Factoriales

     2   Alumno(Estacion de trabajo)                      1.609       6
     3   Tipo de ensamble                                             5
     4   Estacion de trabajo*Tipo de ensamble                         5
     5   Tipo de ensamble*Alumno(                         1.576       6
           Estacion de trabajo)
     6   Error                                            2.333

                                                    Expected Mean Square
                                                    for Each Term (using
         Source                                     restricted model)
     1   Estacion de trabajo                        (6) + 6 (2) + 24 Q[1]
     2   Alumno(Estacion de trabajo)                (6) + 6 (2)
     3   Tipo de ensamble                           (6) + 2 (5) + 16 Q[3]
     4   Estacion de trabajo*Tipo de ensamble       (6) + 2 (5) + 8 Q[4]
     5   Tipo de ensamble*Alumno(                   (6) + 2 (5)
           Estacion de trabajo)
     6   Error                                      (6)




Se observa entonces que no existe diferencia significativa en la respuesta cuando se cambia la
estación de trabajo, sin embargo, los factores alumnos dentro de las estaciones y los tipos de
ensamble afectan la respuesta significativamente al cambiar sus niveles. Una forma de observar
cuando disminuye el tiempo de ensamble, seria con la grafica de los efectos de los factores
principales. Para obtener esta grafica se hace click sobre el menú stat, luego en ANOVA y en el
menú que se despliega se hace click sobre Main Effects Plot (grafico de los efectos principales)
como muestra la figura:




En la pantalla que se depliega, se pone la columna de respuestas en la casilla correspondiente a
Responses y en la casilla de Factors se ponen los factores del modelo que son de tipo factorial.
Una vez se hayan puesto los factores y la respuesta se da click en ok como muestra la figura:

                                                                                                 173
Sección 9: Experimentos anidados y Anidados Factoriales




Al dar ok se obtiene la siguiente grafica:


                                                Main Effects Plot (data means) for Respuesta
                                                     Estacion de trabajo           Tipo de ensamble
                                         28.0


                                         27.5
                     Mean of Respuesta




                                         27.0


                                         26.5


                                         26.0


                                         25.5


                                         25.0
                                                 1                         2   1          2           3




Aunque la diferencia entre las estaciones de trabajo no es significativa, se observa que la
respuesta puede ser un poco más pequeña al trabajar en la estación 1. En cuanto a los tipos de
ensamble, se observa que entre el tipo de ensamble 1 y 3 la diferencia de tiempo no es
significativa, sin embargo, el tipo de ensamble 2 hace que la respuesta aumente
considerablemente; de manera que se recomienda entonces utilizar el tipo de ensamble 1 o 3 en
la estación de trabajo 1, aunque si es más económico usar la estación de trabajo 2, también puede
ser usada sin afectar la respuesta. En cuanto a los operadores, se tendría que realizar un análisis
similar al mostrado en la sección de experimentos anidados, es decir que se haría un análisis
considerando las estaciones de trabajo por aparte.




                                                                                                          174
Sección 10: Experimentos de Parcelas o Cuadrantes Partidas


    1. Experimento Split-Plot (Parcelas o cuadrantes partidas/os):

Este tipo de experimento se utiliza cuando no existe la posibilidad de aleatorizar por
completo el orden de las corridas. Maneja tratamientos que ocurren de manera simultánea
incluso con algunas restricciones en la aleatoriedad. El modelo que describe este tipo de
experimento es:


                                                                                     i = 1, 2,..., r
                                                                                     
yijk = µ + τ i + β j + (τβ )ij + γ k + (τγ )ik + ( βγ ) jk + (τβγ )ijk + ε ijk        j = 1, 2,..., a
                                                                                     k = 1, 2,..., b
                                                                                     

Donde:

τ i = Bloques o replicas
β j = Factor involucrado en el plot principal (A)

τβij = Error del plot principal

γ k = Factor involucrado en el sub-plot (B)
(τγ )ik = Replicas x factor (B)

( βγ )ij = Interacción entre los factores A y B

(τβγ )ijk = Error del sub-plot


Las hipótesis que se desean probar para este modelo son:

         H 0 : τ 1 = τ 2 = ...τ a                          Ho : µ1 = µ 2 = ...µ a
                                     Equivalente a
         H1 : τ 1 ≠ τ 2 ≠ ...τ a                           H 1 : µ1 ≠ µ 2 ≠ ...µ a


Donde τ es el efecto del tratamiento a y µ es la media del tratamiento a. La hipótesis
alterna (hipótesis del investigador) busca probar que existe una diferencia entre los
niveles de los factores en consideración, de manera que al variar el nivel, la respuesta
varíe.


                                                                                                         175
Sección 10: Experimentos de Parcelas o Cuadrantes Partidas


Ejemplo 1


Se desea analizar el largo de vida (Y) de componentes electrónicos al variar la
temperatura (T) y el tiempo de horneado (H). Se analizan 4 niveles de temperatura y 3
niveles de tiempo de horneado. El experimentador decide hacer 3 réplicas. La siguiente
tabla muestra las respuestas obtenidas para cada uno de los arreglos:


                                          Temperatura (grados centígrados)

Réplica        Tiempo          580            600             620          640
               (minutos)
I              5               217            158             229          223
               10              233            138             186          227
               15              175            152             155          156
II             5               188            126             160          201
               10              201            130             170          181
               15              195            147             161          172
III            5               162            122             167          182
               10              170            185             181          201
               15              213            180             182          199


Análisis:
Este experimento podría conducirse como un factorial. Si se hiciera de esa manera,
entonces el experimentador tendría que haber seleccionado una combinación de las
cuatro temperaturas y los 3 tiempos de manera aleatoria, colocar un componente en el
horno por el tiempo seleccionado y proseguir de esta manera hasta que todos los
tratamientos fueran realizados. Se piensa entonces que al establecer una temperatura y
tomar por ejemplo el tiempo de 15, se hubiera podido aprovechar y sacar el componente
en un tiempo de 5 y uno de 10, de manera que se obtengan 3 respuestas en 15 minutos.
Hacer esto es algo que un experimento de tipo factorial no permite. Si se realizara el
experimento como uno factorial, se estaría desperdiciando tiempo y saldría más costoso.


                                                                                    176
Sección 10: Experimentos de Parcelas o Cuadrantes Partidas


Para esta situación, se establece el experimento Split-Plot porque permite manejar
tratamientos de manera simultánea aun con restricciones en la aleatoriedad; para este
ejemplo se restringiría la aleatoriedad del factor tiempo.


Una forma lógica de conducir este experimento, seria seleccionar una de las cuatro
temperaturas de forma aleatoria y colocar tres componentes (diferentes unidades
experimentales) para entonces analizarlos de acuerdo al tiempo asignado para cada
componente; en otras palabras, a una temperatura dada (teniendo en cuenta que debe ser
escogida de manera aleatoria) los 3 componentes son puestos en el horno por tres
períodos de tiempo distintos. En este caso la temperatura actúa como cuadrante o parcela
(Plot) y el tiempo es quien parte la parcela (Split). Luego la temperatura se ajusta a otro
nivel y se repite éste procedimiento hasta que las cuatro temperaturas sean tomadas en
consideración, a esto se le llama una replica del experimento (el ejemplo muestra 3).


El modelo que describe el experimento esta dado por:


yijk = µ + τ i + Tj + Tτ ij + TI k + τTI ik + TTI jk + τTTI ijk
       1442443 14444244443                 4              4
            Parcela −completa               Parcela − partida




Donde τ i es el efecto de las réplicas, Tj es el efecto de las temperaturas y TIk es el efecto
de los tiempos. Se podría pensar que el efecto de tiempo en este experimento se encuentra
anidado dentro de las temperaturas, pero esto no es así ya que los mismos niveles de
tiempo se efectúan en todas las temperaturas.


Para realizar el análisis de los datos, se procede entonces a realizar un análisis de varianza
en el programa Minitab:


   1. En el menú de stat, en la opción de anova se encuentra la opción de general linear
       model como muestra la figura:




                                                                                          177
Sección 10: Experimentos de Parcelas o Cuadrantes Partidas




2. Al dar click se muestra la pantalla donde se ingresan los datos; en la casilla de
   responses se ingresa la columna de respuestas, en la casilla de model se ingresa el
   modelo, en el caso del Split plot se tiene interacción entre todos los factores
   (replica| tiempo| temperatura) donde el símbolo | hace que el programa entienda
   que hay interacción entre todos los factores. En la casilla de random factors se
   ingresa la columna correspondiente a las replicas porque es el único factor
   aleatorio, los demás son considerados fijos.




3. En la opción de graphs se pueden obtener los gráficos correspondientes a los
   residuales del modelo, allí se oprime como preferencia four in one con el fin de


                                                                                  178
Sección 10: Experimentos de Parcelas o Cuadrantes Partidas


        que se muestre un solo grafico que contenga los 4 graficos del análisis de
        residuales:




    4. Finalmente al dar clik en ok se obtiene la siguiente respuesta:


General Linear Model: respuesta versus replica, tiempo, temperatura

Factor         Type      Levels    Values
replica        random         3    1, 2, 3
tiempo         fixed          3    5, 10, 15
temperatura    fixed          4    580, 600, 620, 640


Analysis of Variance for respuesta, using Adjusted SS for Tests

Source                            DF     Seq SS      Adj SS     Adj MS       F       P
replica                            2    1962.72     1962.72     981.36    0.54   0.618 x
tiempo                             2     566.22      566.22     283.11    0.16   0.856
temperatura                        3   12494.31    12494.31    4164.77   14.09   0.004
replica*tiempo                     4    7021.28     7021.28    1755.32    7.23   0.003
replica*temperatura                6    1773.94     1773.94     295.66    1.22   0.362
tiempo*temperatura                 6    2600.44     2600.44     433.41    1.79   0.185
replica*tiempo*temperatura        12    2912.06     2912.06     242.67      **
Error                              0          *           *          *
Total                             35   29330.97

x Not an exact F-test.
** Denominator of F-test is zero.
* NOTE * Could not graph the specified residual type because MSE = 0 or the
         degrees of freedom for error = 0.
Teniendo en cuenta un nivel de significancia de 0.05 que es el que asume Minitab, se
nota que el único factor que afecta la respuesta al cambiar sus niveles es el factor

                                                                                           179
Sección 10: Experimentos de Parcelas o Cuadrantes Partidas


temperatura, esto porque el valor p es menor al valor de significancia (0.004 < 0.005). El
efecto que causan las replicas no es de interés ya que las mismas se hacen para reducir el
error experimental. El resultado muestra también que no se realizaron gráficos para los
residuales debido a que los estimados del error son 0.


Ejemplo 2


Se desea saber bajo que condiciones se da mejor la deshidratación de setas Pleurotus
pulmonarius. Para la experimentación se utilizó una caja de cartón con una parrilla donde
se ubicaron las setas. Se realizó la experimentación teniendo en cuenta 3 variables de
entrada o factores:


    1. Focos: Se realizaron pruebas con 2 tipos de focos, uno de 40 vatios y otro de 60
        vatios.
    2. Diedrita: Esta es una piedra que absorbe la humedad. Se localizó en la entrada de
        aire de la caja y se hizo la experimentación con y sin diedrita.
    3. Ventilación: Se tuvo en cuenta aire inducido por un ventilador y sin el mismo.


Se desea saber como cambia el peso de las setas teniendo en cuenta tiempos de intervalos
de 5 horas, comenzando en 5 y terminando en 30. Para el mismo se estableció la
realización de 2 replicas.


Por lo anterior, el experimento fue conducido como un Split-Plot. En este caso en
particular se tienen 3 factores en el Plot (focos, diedrita y ventilación), cada uno con dos
niveles (40 y 60 vatios, con diedrita y sin diedrita, con ventilación y sin ventilación). Se
realizó una asignación aleatoria para los factores del Plot mediante el programa Minitab.
El tiempo fue tomado como el factor Split el cual no fue asignado aleatoriamente ya que
la intención es no perder información. Se presenta las siguientes tablas con el fin de
ilustrar el experimento y proveer información sobre las respuestas obtenidas después de
haber realizado la experimentación. La primera tabla se da para visualización del modelo;
la segunda tabla ilustra la entrada de los datos en el programa Minitab.

                                                                                        180
Sección 10: Experimentos de Parcelas o Cuadrantes Partidas

                                                Plot o parcela con 3 factores


                               Con ventilación                            Sin ventilación
            Split
                       Con diedrita        Sin diedrita          Con diedrita        Sin diedrita

            Tiempo     40        60        40         60         40        60        40        60
              en     voltios   voltios   voltios    voltios    voltios   voltios   voltios   voltios
            horas

              5
Replica 1
              10

              15

              20

              25

              30

              5

Replica 2
              10

              15

              20

              25

              30




                                                                                                181
Sección 10: Experimentos de Parcelas o Cuadrantes Partidas

                        Datos ingresados al programa Minitab
StdOrder   RunOrder   CenterPt Réplica Tiempo Ventilación        Diedrita   Focos    Peso
      14          1          1       1         5             1         -1       1     6.07
      14          1          1       1        10             1         -1       1     3.55
      14          1          1       1        15             1         -1       1     3.97
      14          1          1       1        20             1         -1       1     3.88
      14          1          1       1        25             1         -1       1     3.65
      14          1          1       1        30             1         -1       1     3.71
       2          2          1       1         5             1         -1      -1    16.14
       2          2          1       1        10             1         -1      -1     7.43
       2          2          1       1        15             1         -1      -1     4.32
       2          2          1       1        20             1         -1      -1     4.46
       2          2          1       1        25             1         -1      -1     3.97
       2          2          1       1        30             1         -1      -1     4.62
      12          3          1       1         5             1          1      -1    15.53
      12          3          1       1        10             1          1      -1     4.33
      12          3          1       1        15             1          1      -1     4.75
      12          3          1       1        20             1          1      -1     4.36
      12          3          1       1        25             1          1      -1     4.26
      12          3          1       1        30             1          1      -1     4.26
       8          4          1       1         5             1          1       1    12.31
       8          4          1       1        10             1          1       1      6.5
       8          4          1       1        15             1          1       1     5.38
       8          4          1       1        20             1          1       1     5.16
       8          4          1       1        25             1          1       1     4.45
       8          4          1       1        30             1          1       1     5.08
      10          5          1       2         5             1         -1      -1    11.61
      10          5          1       2        10             1         -1      -1     4.14
      10          5          1       2        15             1         -1      -1      3.5
      10          5          1       2        20             1         -1      -1     3.11
      10          5          1       2        25             1         -1      -1     2.98
      10          5          1       2        30             1         -1      -1     3.09
       9          6          1       1         5           -1          -1      -1    11.74
       9          6          1       1        10           -1          -1      -1     3.76
       9          6          1       1        15           -1          -1      -1      4.4
       9          6          1       1        20           -1          -1      -1     4.09
       9          6          1       1        25           -1          -1      -1     4.23
       9          6          1       1        30           -1          -1      -1     4.52
       4          7          1       2         5             1          1      -1     12.5
       4          7          1       2        10             1          1      -1     4.88
       4          7          1       2        15             1          1      -1     4.93
       4          7          1       2        20             1          1      -1     4.21
       4          7          1       2        25             1          1      -1      5.2
       4          7          1       2        30             1          1      -1     4.67
       1          8          1       2         5           -1          -1      -1    13.19
       1          8          1       2        10           -1          -1      -1     5.73
       1          8          1       2        15           -1          -1      -1     5.73
       1          8          1       2        20           -1          -1      -1     5.64


                                                                                    182
Sección 10: Experimentos de Parcelas o Cuadrantes Partidas

 1         8          1        2       25            -1       -1   -1     5.29
 1         8          1        2       30            -1       -1   -1     4.66
11         9          1        1        5            -1        1   -1    14.59
11         9          1        1       10            -1        1   -1      5.5
11         9          1        1       15            -1        1   -1     4.68
11         9          1        1       20            -1        1   -1      4.4
11         9          1        1       25            -1        1   -1     4.07
11         9          1        1       30            -1        1   -1     4.51
 6        10          1        2        5             1       -1    1     6.09
 6        10          1        2       10             1       -1    1     3.95
 6        10          1        2       15             1       -1    1     3.73
 6        10          1        2       20             1       -1    1      3.8
 6        10          1        2       25             1       -1    1     3.69
 6        10          1        2       30             1       -1    1     3.71
 3        11          1        2        5            -1        1   -1    14.56
 3        11          1        2       10            -1        1   -1     4.38
 3        11          1        2       15            -1        1   -1     3.89
 3        11          1        2       20            -1        1   -1     3.77
 3        11          1        2       25            -1        1   -1     3.65
 3        11          1        2       30            -1        1   -1      3.9
13        12          1        1        5            -1       -1    1     9.53
13        12          1        1       10            -1       -1    1     4.52
13        12          1        1       15            -1       -1    1     4.54
13        12          1        1       20            -1       -1    1     4.08
13        12          1        1       25            -1       -1    1     4.19
13        12          1        1       30            -1       -1    1     4.21
15        13          1        1        5            -1        1    1    11.09
15        13          1        1       10            -1        1    1     5.13
15        13          1        1       15            -1        1    1     5.49
15        13          1        1       20            -1        1    1     5.05
15        13          1        1       25            -1        1    1     5.05
15        13          1        1       30            -1        1    1     4.38
 7        14          1        2        5            -1        1    1    10.47
 7        14          1        2       10            -1        1    1     4.44
 7        14          1        2       15            -1        1    1     4.59
 7        14          1        2       20            -1        1    1     4.77
 7        14          1        2       25            -1        1    1     4.64
 7        14          1        2       30            -1        1    1     4.38
16        15          1        2        5             1        1    1    12.65
16        15          1        2       10             1        1    1     4.82
16        15          1        2       15             1        1    1     4.83
16        15          1        2       20             1        1    1     4.83
16        15          1        2       25             1        1    1     5.01
16        15          1        2       30             1        1    1     4.89
 5        16          1        2        5            -1       -1    1     9.37
 5        16          1        2       10            -1       -1    1     4.43
 5        16          1        2       15            -1       -1    1     4.68
 5        16          1        2       20            -1       -1    1     4.64


                                                                        183
Sección 10: Experimentos de Parcelas o Cuadrantes Partidas

         5          16           1         2       25             -1        -1        1     4.73
         5          16           1         2       30             -1        -1        1     4.66



Los valores de -1 y 1 indican los niveles del factor, donde: la ventilación es -1 cuando no
se induce y 1 cuando se usa un abanico; la diedrita es -1 cuando no se usa y 1 cuando se
pone en la entrada de aire y los focos son -1 cuando es de 40 vatios y 1 cuando es de 60.
El tiempo se considera de acuerdo a las horas en que se saco cada muestra. En la misma
caja fueron puestas 6 muestras de setas y se saco 1 muestra cada 5 horas para tomar su
peso (en gramos), siendo el peso la variable respuesta.


A continuación se presenta el procedimiento de análisis del experimento en Minitab:


   1. En la barra de herramientas, se entra al menú stat y se escoge la opción ANOVA,
       ésta despliega un menú donde se escoge la opción general linear model como
       muestra la figura:




                                                                                          184
Sección 10: Experimentos de Parcelas o Cuadrantes Partidas


2. Luego en la ventana que se abre se ingresa el modelo. Se tiene en cuenta que en
   un experimento de este tipo hay interacción de todos los factores entre ellos y con
   las réplicas, para lo cual se utiliza el símbolo | teniendo en cuenta que éste hace
   que todos los factores interactúen. En la casilla de responses se ingresa la celda
   peso haciendo doble clic sobre la palabra peso que aparece en la ventana del lado
   izquierdo, en esa ventana aparecen todas las celdas que están en la hoja de trabajo.
   Luego en la casilla model se ingresan los factores del modelo teniendo en cuenta
   que interactúan. En la casilla de random factors se ingresó solo las réplicas porque
   fue el único factor considerado aleatorio para este experimento.




3. Se hace clic sobre el botón de Factor Plots para ingresar los factores principales y
   observar el cambio de la respuesta en promedio con respecto al cambio de nivel
   de cada factor. Esta opción permite ver gráficamente el cambio en la respuesta, en
   la casilla de factors se ingresan los factores principales, finalmente se oprime ok
   para esta ventana y la ventana subsiguiente con el fin de obtener resultados.

                                                                                   185
Sección 10: Experimentos de Parcelas o Cuadrantes Partidas




   4. Los resultados obtenidos se muestran en la hoja de session de Minitab.


General Linear Model: Peso versus Rep, Tiempo, ...

Factor        Type     Levels   Values
Rep           random        2   1, 2
Tiempo        fixed         6   5, 10, 15, 20, 25, 30
Ventilación   fixed         2   -1, 1
Diedrita      fixed         2   -1, 1
Focos         fixed         2   -1, 1


Analysis of Variance for Peso, using Adjusted SS for Tests

Source                                DF     Seq SS     Adj SS     Adj MS        F
Rep                                    1     1.7281     1.7281     1.7281       **
Tiempo                                 5   698.5910   698.5910   139.7182   296.29
Ventilación                            1     0.8400     0.8400     0.8400     0.26
Diedrita                               1    13.0833    13.0833    13.0833    34.66
Focos                                  1     8.9793     8.9793     8.9793    20.15
Rep*Tiempo                             5     2.3578     2.3578     0.4716     1.32
Rep*Ventilación                        1     3.2856     3.2856     3.2856     0.62
Rep*Diedrita                           1     0.3775     0.3775     0.3775     0.13
Rep*Focos                              1     0.4455     0.4455     0.4455       **
Tiempo*Ventilación                     5     0.8865     0.8865     0.1773     0.37


                                                                                     186
Sección 10: Experimentos de Parcelas o Cuadrantes Partidas

Tiempo*Diedrita                      5       14.8796   14.8796    2.9759   28.38
Tiempo*Focos                         5       57.2298   57.2298   11.4460   29.19
Ventilación*Diedrita                 1        6.9338    6.9338    6.9338    1.08
Ventilación*Focos                    1        0.3408    0.3408    0.3408    0.11
Diedrita*Focos                       1        8.5085    8.5085    8.5085   18.53
Rep*Tiempo*Ventilación               5        2.4045    2.4045    0.4809    0.94
Rep*Tiempo*Diedrita                  5        0.5242    0.5242    0.1048      **
Rep*Tiempo*Focos                     5        1.9604    1.9604    0.3921    0.69
Rep*Ventilación*Diedrita             1        6.4377    6.4377    6.4377    1.65
Rep*Ventilación*Focos                1        3.1032    3.1032    3.1032    0.66
Rep*Diedrita*Focos                   1        0.4593    0.4593    0.4593    0.12
Tiempo*Ventilación*Diedrita          5        1.3299    1.3299    0.2660    5.40
Tiempo*Ventilación*Focos             5        1.4671    1.4671    0.2934    0.35
Tiempo*Diedrita*Focos                5        3.6857    3.6857    0.7371    6.83
Ventilación*Diedrita*Focos           1        2.2265    2.2265    2.2265    0.53
Rep*Tiempo*Ventilación*Diedrita      5        0.2461    0.2461    0.0492    0.13
Rep*Tiempo*Ventilación*Focos         5        4.2483    4.2483    0.8497    2.19
Rep*Tiempo*Diedrita*Focos            5        0.5394    0.5394    0.1079    0.28
Rep*Ventilación*Diedrita*Focos       1        4.2336    4.2336    4.2336   10.93
Tiempo*Ventilación*Diedrita*Focos    5       13.2619   13.2619    2.6524    6.85
Rep*Tiempo*Ventilación*Diedrita*     5        1.9372    1.9372    0.3874      **
  Focos
Error                                0          *            *         *
Total                               95   866.5321

Source                                   P
Rep
Tiempo                              0.000
Ventilación                         0.702
Diedrita                            0.107
Focos                               0.140
Rep*Tiempo                          0.673 x
Rep*Ventilación                     0.686 x
Rep*Diedrita                        0.890 x
Rep*Focos
Tiempo*Ventilación                  0.851
Tiempo*Diedrita                     0.001
Tiempo*Focos                        0.001
Ventilación*Diedrita                0.488
Ventilación*Focos                   0.796
Diedrita*Focos                      0.145
Rep*Tiempo*Ventilación              0.612 x
Rep*Tiempo*Diedrita
Rep*Tiempo*Focos                    0.686     x
Rep*Ventilación*Diedrita            0.449     x
Rep*Ventilación*Focos               0.545     x
Rep*Diedrita*Focos                  0.797     x
Tiempo*Ventilación*Diedrita         0.044
Tiempo*Ventilación*Focos            0.866
Tiempo*Diedrita*Focos               0.027
Ventilación*Diedrita*Focos          0.601
Rep*Tiempo*Ventilación*Diedrita     0.980
Rep*Tiempo*Ventilación*Focos        0.205
Rep*Tiempo*Diedrita*Focos           0.907
Rep*Ventilación*Diedrita*Focos      0.021
Tiempo*Ventilación*Diedrita*Focos   0.027
Rep*Tiempo*Ventilación*Diedrita*
  Focos
Error
Total




                                                                                   187
Sección 10: Experimentos de Parcelas o Cuadrantes Partidas


El nivel de significancia utilizado en el modelo fue de 0.05 (nivel de significancia tomado
por defecto en Minitab) de manera que la hipótesis nula se rechaza cuando el valor P sea
menor al nivel de significancia. Según los resultados, los factores en los cuales el cambiar
el nivel altera las condiciones del horno son: tiempo, diedrita y foco; aunque el valor P
para los factores diedrita y foco indica que variar los niveles para estos factores no es
significativo, las interacciones de dos factores para tiempo*diedrita y tiempo*foco
indican que si hay diferencia al variar estos factores. Las interacciones de 3 y 4 factores
no aportan mayor información pero al observar el valor P para las mismas, se encuentra
que la interacción entre tiempo*diedrita*foco resulta ser significativa.

Por los resultados del ANOVA se puede concluir que la respuesta cambia al cambiar los
niveles de los factores tiempo, diedrita y foco. Con el fin de evaluar que bajo que niveles
se da una mayor perdida de peso, se utilizó el gráfico para los factores principales donde
se observa que la mayor perdida de peso se da cuando no hay diedrita y cuando se utiliza
un foco de 60 vatios. En cuanto al tiempo se nota una estabilidad aproximada después de
las 10 horas de proceso.




                                                                                        188
Sección 11: Metodología de Respuesta


    1. Metodología de respuesta
En las secciones anteriores se ha estudiado el comportamiento de la variable respuesta cuando se
ve afectada por diferentes factores, sin embargo no se ha tocado el tema a cerca de llegar a la
combinación optima de factores y sus niveles de manera que se logre optimizar la respuesta. Las
metodologías de superficie de respuesta son usadas para analizar una respuesta de interés que se
ve afectada por unas variables y para la cual se necesita llegar a un óptimo.

Suponga que un ingeniero quiere encontrar los niveles de ventilación (a) y humedad (b) que
maximizan la respuesta (y) de un proceso. De esta manera la respuesta se ve como una función
de las variables a y b:

                                          y = f (a,b) + e

Donde a y b son las variables independientes o factores y e se refiere al error o ruido observado
en la respuesta. La figura muestra la superficie de respuesta para la variable y en diferentes
niveles de las variables independientes a y b. La metodología de respuesta busca llegar al punto
óptimo, representado por el punto azul, donde se encuentra la mejor combinación de los factores
a y b para la respuesta optima de y.



                                                  Yo = Valor optimo
                 y                                para la respuesta




                                                  b




                                           a


En ocasiones con un modelo de primer orden se llega a un lugar donde se puede encontrar una
respuesta factible, mas no optima. Las respuestas optima generalmente se encuentran en un lugar


                                                                                             189
Sección 11: Metodología de Respuesta


cóncavo ( ∪) o convexo ( ∩) y por lo tanto se encuentra curvatura, de manera que un modelo de
primer orden no es suficiente para llegar al óptimo. La metodología simplex es una manera de
llegar a un punto óptimo, sin embargo no me permite saber el factor que conduce a ésta
respuesta. A continuación se presenta un modelo con el cual se llega a un valor óptimo para la
respuesta y se logra identificar el factor que lo condujo allí.

Método de máxima pendiente de ascenso (Steepest Ascent)

Este modelo permite moverse de manera secuencial hacia la respuesta óptima. Si se desea una
maximización en la respuesta entonces el modelo se llama máxima pendiente de ascenso porque
se mueve en dirección ascendente hasta encontrar el incremento máximo de la respuesta. Si se
desea una minimización en la respuesta, el modelo se llamaría máxima pendiente de descenso de
manera que se pueda llegar al máximo decremento en la respuesta. Esta metodología consta de
los siguientes pasos:

   1. Al tener el experimento que se desea hacer, construya un modelo de primer orden como
       por ejemplo un modelo factorial 2k y, en lo posible, agregue puntos centrales para
       observar si existe curvatura.
   2. Coteje si existe curvatura. Si no existe, un modelo de primer orden es suficiente, y, a
       partir de este, se debe buscar el paso que conduzca a la mejora, se debe permanecer en él
       hasta que no haya evidencia de que se sigue dando la mejora. Si existe curvatura, se debe
       hacer un modelo de segundo orden con el fin de llegar al óptimo. Para los modelos de
       segundo orden se tiene la opción de hacer experimentos tipo 3k sin embargo no son
       eficientes debido al número de tratamientos que se requieren, además que la precisión del
       modelo no es igual en todas las direcciones. De esta manera, cuando se requiera un
       modelo de segundo orden, se recomienda hacer un experimento central compuesto.
   3. Una vez se tiene el modelo a seguir se debe determinar el paso de máxima pendiente de
       ascenso o descenso dependiendo de si se desea maximizar o minimizar la respuesta.
   4. En el paso determinado se deben conducir experimentos para observar el cambio en la
       variable respuesta. Se debe continuar hasta que la variable respuesta no muestre más
       mejoras, lo cual indicaría entonces que el modelo aplicado ya no tiene buen carácter
       predictivo.


                                                                                            190
Sección 11: Metodología de Respuesta


   5. Al llegar al punto donde no hay mas mejoras, se debe construir un modelo de primer
       orden de nuevo pero con puntos centrales en espera de que los mismos determinen la
       necesidad de curvatura y entonces se procede a la localización del óptimo. En caso de que
       la prueba de carencia de ajuste no sea significativa, se hace una búsqueda desde el paso 3.
       Cuando no mejora más, se intenta entonces un modelo de orden mayor.

Para ilustrar mejor lo descrito anteriormente se realizo el siguiente ejemplo:

Ejemplo

Un ingeniero industrial está interesado en encontrar las condiciones que maximizan la
producción de una línea. El proceso de producción está influenciado por dos variables
independientes o factores: Tiempo y temperatura del vapor de agua. Las condiciones actuales
muestran que hay una producción de aproximadamente 35% al operar con un tiempo de 35
minutos y una temperatura de 100 grados centígrados. El ingeniero considera que se puede
aumentar la producción y desea encontrar los niveles de los factores a los cuales se obtiene un
porcentaje óptimo de producción.

Para la solución del problema se siguen los siguientes pasos:

    1. Se establecen los niveles de experimentación de las variables independientes y se realiza
        la experimentación con un modelo de primer orden con puntos centrales para verificar
        curvatura. Para este caso particular se ajusta un modelo 22 con 5 puntos centrales. Los
        niveles de experimentación para las variables independientes son:


                                            Tiempo Temperatura de vapor
                            Niveles
                                              (A)          (B)
                            Bajo               30          90
                            Alto               40         110
                       Puntos centrales        35         100

    2. A continuación se muestra la tabla donde se observan los tratamientos y la respuesta
        correspondiente para los mismos:




                                                                                              191
Sección 11: Metodología de Respuesta


               Variables naturales      Variables codificadas          Respuesta
                 A           B            X1            X2                Y
                30           90           -1             -1              34.3
                30          110           -1              1               35
                40           90            1             -1              35.9
                40          110            1              1              36.4
                35          100            0              0              35.6
                35          100            0              0              35.3
                35          100            0              0              35.2
                35          100            0              0              35.7
                35          100            0              0              35.5


    3. El análisis para el experimento se hizo en Minitab. El procedimiento es el mismo que se
        mostró para experimentos 2k. Al realizarlo se obtuvo la siguiente respuestas:

           Factorial Fit: Respuesta versus A, B

           Estimated Effects and Coefficients for Respuesta (coded units)

           Term        Effect      Coef   SE Coef          T       P
           Constant             35.4000    0.1037     341.43   0.000
           A           1.5000    0.7500    0.1037       7.23   0.002
           B           0.6000    0.3000    0.1037       2.89   0.044
           A*B        -0.1000   -0.0500    0.1037      -0.48   0.655
           Ct Pt                 0.0600    0.1391       0.43   0.688


           S = 0.207364     R-Sq = 93.86%       R-Sq(adj) = 87.71%


           Analysis of Variance for Respuesta (coded units)

           Source                DF    Seq SS     Adj SS    Adj MS         F       P
           Main Effects           2   2.61000    2.61000   1.30500     30.35   0.004
           2-Way Interactions     1   0.01000    0.01000   0.01000      0.23   0.655
             Curvature            1   0.00800    0.00800   0.00800      0.19   0.688
           Residual Error         4   0.17200    0.17200   0.04300
             Pure Error           4   0.17200    0.17200   0.04300
           Total                  8   2.80000




Se observa que los factores principales A y B (Tiempo y temperatura de vapor) resultan ser
significativos, sin embargo la interacción y la curvatura no. Debido a que no hay significancia en
la curvatura se concluye que un modelo de primer orden es suficiente para encontrar el paso de
ascenso con el cual se espera llegar a la respuesta óptima. La tabla muestra los coeficientes
regresores para cada factor, de esta manera la ecuación que describe el modelo es:


                                                                                              192
Sección 11: Metodología de Respuesta


                                   Y = 35.4 + 0.75X1 + 0.30X2

   En el modelo se observa que al moverse en X1 se da un mayor incremento en la respuesta
   que es el objetivo del experimento, (buscar los niveles óptimos de los factores para lograr
   una maximización en la respuesta). De esta manera se propone entonces incrementar en
   un paso de 1 en términos de X1 y en un paso de una fracción en términos de X2. La
   fracción se determina de la siguiente manera:

                                              ∧
                                              bi       0.30
                                     ∆X i =   ∧
                                                   =        = 0.4
                                                       0.75
                                              bj


   De esta manera los incrementos serian: ∆X 1 = 1 y ∆X 2 = 0.4 . Teniendo estos
   incrementos se procede entonces a verificar como quedarían los niveles de los factores al
   realizar los incrementos porque los mismos están codificados. Al pasarlo a variables
   naturales se obtiene:

                                         10 
                                    A =   * 1 + 35 = 40
                                        2
                                         20 
                                    B =   * 0.4 + 100 = 104
                                         2 

4. Sabiendo entonces el procedimiento para calcular los incrementos en los niveles de las
   variables o factores, tiempo y temperatura de vapor, se procede a realizar incrementos
   hasta encontrar que la variable respuesta deje de mostrar mejoras. Esto quiere decir
   entonces que se deben hacer experimentos en diferentes niveles de las variables de
   entrada y tomar datos de la respuesta hasta encontrar que la misma deje de incrementar.
   La siguiente tabla muestra un resumen para las respuestas obtenidas en diferentes niveles
   de los factores A y B.




                                                                                          193
Sección 11: Metodología de Respuesta


                           Variables naturales                    Variables codificadas          Respuesta
    Pasos de ascenso         A           B                         X1              X2                Y
        Origen              35          100                         0              0               35.46
      Magnitud de
      incremento                       5             4                1           0.4
        Paso 1                         40            104               2          0.8              36.5
        Paso 2                         45            108               3          1.2              38.4
        Paso 3                         50            112               4          1.6              42.6
        Paso 4                         55            116               5          2.0              45.2
        Paso 5                         60            120               6          2.4              49.3
        Paso 6                         65            124               7          2.8              55.4
        Paso 7                         70            128               8          3.2              60.3
        Paso 8                         75            132               9          3.6              65.7
        Paso 9                         80            136              10          4.0              72.9
        Paso 10                        85            140              11          4.4              75.1
        Paso 11                        90            144              12          4.8              71.3
        Paso 12                        95            148              13          5.2              70.4


La siguiente figura muestra gráficamente la reducción en la respuesta después del paso 10:



                                        80
                                        70
                                        60
                          Porcentaje




                                        50
                                        40
                                        30                                      Porcentaje de
                                        20                                      produccion (Y)
                                        10
                                         0
                                             2   4       6   8   10   12
                                             Pasos dados en busca de mejora




        Se encuentra entonces que en el paso 10 donde la respuesta es de 75.1 se llega a un valor
        máximo de la misma. Debido a que se alcanza este valor máximo y no se ve mejora en
        los pasos siguientes, se determina entonces hacer un nuevo modelo de primer orden para
        verificar si se debe cambiar el paso o si se ha llegado a un punto donde hay curvatura y
        se deba ajustar un modelo de segundo orden.

                                                                                                             194
Sección 11: Metodología de Respuesta


5. Se procede a hacer un nuevo experimento 22 teniendo como puntos centrales los valores
   que maximizan la respuesta en el procedimiento hecho anteriormente. De manera que se
   establece la temperatura de vapor en 140 grados centígrados y el tiempo en 35 minutos,
   siendo estos los niveles que se establecen para los puntos centrales. La siguiente tabla
   muestra el nuevo experimento realizado:

          Variables naturales       Variables codificadas           Respuesta
            A           B             X1            X2                 Y
           80          130            -1             -1               71.3
           80          150            -1              1               73.2
           90          130             1             -1               74.1
           90          150             1              1               74.5
           85          140             0              0               75.1
           85          140             0              0               75.8
           85          140             0              0               74.9
           85          140             0              0               75.2
           85          140             0              0               75.6


   Teniendo las respuestas se procedió a realizar un análisis en Minitab para observar si se
   encuentra curvatura. La siguiente tabla muestra los resultados:

     Factorial Fit: Respuesta versus A, B

     Estimated Effects and Coefficients for Respuesta (coded units)

     Term        Effect      Coef    SE Coef          T       P
     Constant             73.2750     0.1851     395.94   0.000
     A           2.0500    1.0250     0.1851       5.54   0.005
     B           1.1500    0.5750     0.1851       3.11   0.036
     A*B        -0.7500   -0.3750     0.1851      -2.03   0.113
     Ct Pt                 2.0450     0.2483       8.24   0.001


     S = 0.370135     R-Sq = 96.56%        R-Sq(adj) = 93.12%


     Analysis of Variance for Respuesta (coded units)

     Source                 DF    Seq SS     Adj SS   Adj MS          F       P
     Main Effects            2    5.5250    5.52500   2.7625      20.16   0.008
     2-Way Interactions      1    0.5625    0.56250   0.5625       4.11   0.113
       Curvature             1    9.2934    9.29339   9.2934      67.83   0.001
     Residual Error          4    0.5480    0.54800   0.1370
       Pure Error            4    0.5480    0.54800   0.1370
     Total                   8   15.9289




                                                                                        195
Sección 11: Metodología de Respuesta


        Los resultados muestran un p value de 0.001 para la curvatura, esto nos dice entonces
        que un modelo de primer orden no es suficiente para llegar al punto optimo, de manera
        que se concluye que después de analizar los datos con el primer modelo de primer orden
        hecho, se debe pasar a uno de segundo orden con el fin de llegar a la configuración de
        factores que dan la respuesta optima para el problema.

    6. Se procede entonces a hacer un modelo considerando puntos axiales. El modelo que se
        usa en este caso para ajustar uno de segundo orden tiene el nombre de diseño central
        compuesto. El número de puntos axiales que debe existir en el modelo se obtiene
        multiplicando 2*k, siendo k el numero de factores. De esta manera para este modelo
        donde se tienen 2 factores, el número de puntos axiales corresponde a 2*2 = 4 puntos.
        Ahora para encontrar la distancia en valores codificados a los cuales deben ponerse esos
        puntos se tiene en cuenta lo siguiente:

                                              α = ( 2 k )1 / 4

Donde k corresponde al número de factores. Por lo tanto para este ejemplo particular, la distancia
a la que deben estar los puntos axiales es:


                                          (0, 1.41)

                                (-1, 1)                     (1, 1)




               (-1.41, 0)                                              (1.41, 0)


                                                                      Todos      los     puntos
                             (-1, - 1)                      (1,- 1)   marcados con la raya
                                                                      verde son los puntos
                                                                      axiales, note que están
                                                                      fuera de los niveles a los
                                          (0, -1.41)




                                                                                                   196
Sección 11: Metodología de Respuesta


Teniendo entonces los puntos axiales, se procede a realizar el experimento en esos niveles para
obtener datos de la respuesta.

La siguiente tabla muestra las respuestas obtenidas, donde se incluyen las respuestas obtenidas
en el experimento anterior y las respuestas obtenidas en los niveles de los puntos axiales:

                             Variables codificadas          Respuesta
                              X1              X2                Y
                                  -1           -1              71.3
                                  -1           1               73.2
                                  1            -1              74.1
                                  1            1               74.5
                                  0            0               75.1
                                  0            0               75.8
                                  0            0               74.9
                                  0            0               75.2
                                  0            0               75.6
                             -1.41             0               72.3
                                 1.41          0               74.8
                                  0          -1.41             73.5
                                  0          1.41              75.1


    7. Teniendo las respuestas, se ingresan los datos a Minitab de la siguiente manera:

            •   En el menú de stat, se hace clik sobre el menú de DOE, luego se hace click sobre
                la opción de Response Surface, allí se hace click sobre la opción de create a
                response surface design. La siguiente figura ilustra lo anterior:




                                                                                              197
Sección 11: Metodología de Respuesta




•   La siguiente figura, muestra las opciones para realizar el análisis. Para este caso
    se toma la opción de central composite y se definen los dos factores que se
    involucraron en el ejemplo:




•   Luego se hace click sobre la opción Designs, para definir el tipo de diseño que se
    desea. La siguiente figura ilustra lo descrito:




                                                                                   198
Sección 11: Metodología de Respuesta




•   Al dar click sobre el botón de ok se obtienen los siguientes resultados (se anadio
    la columna correspondiente a las respuestas):




                                                                                   199
Sección 11: Metodología de Respuesta


•   Teniendo el diseño, se procede a analizar las respuestas. Para el análisis, en el
    menú de response surface se hace click sobre la opción analyze response surface
    design, como muestra la siguiente figura:




•   Se despliega la siguiente ventana donde se procede a especificar la columna de
    respuestas y si las variables están en su forma codificada como es el caso de este
    ejemplo:




                                                                                  200
Sección 11: Metodología de Respuesta


•   En el menú de terms, se procede a especificar los términos que están incluidos
    dentro del modelo como muestra la figura:




•   Al dar clik en el botón de ok, se obtienen los siguientes resultados:

Response Surface Regression: Respuesta_1 versus A, B

The analysis was done using coded units.

Estimated Regression Coefficients for Respuesta_1

Term          Coef     SE Coef         T        P
Constant   75.3215      0.2003   375.959    0.000
A           0.9560      0.1586     6.027    0.001
B           0.5712      0.1586     3.601    0.009
A*A        -1.0524      0.1706    -6.170    0.000
B*B        -0.6752      0.1706    -3.958    0.005
A*B        -0.3750      0.2240    -1.674    0.138

S = 0.4480     R-Sq = 93.5%      R-Sq(adj) = 88.8%


Analysis of Variance for Respuesta_1

Source            DF    Seq SS     Adj SS    Adj MS       F       P
Regression         5   20.1459    20.1459    4.0292   20.08   0.001
  Linear           2    9.8916     9.8916    4.9458   24.64   0.001
  Square           2    9.6918     9.6918    4.8459   24.15   0.001
  Interaction      1    0.5625     0.5625    0.5625    2.80   0.138
Residual Error     7    1.4049     1.4049    0.2007
  Lack-of-Fit      3    0.8569     0.8569    0.2856    2.08   0.245
  Pure Error       4    0.5480     0.5480    0.1370
Total             12   21.5508


                                                                              201
Sección 11: Metodología de Respuesta


Se puede ver como los componentes cuadráticos de los factores resultan ser
significativos, de manera que un modelo lineal no hubiese podido describir
adecuadamente lo que sucede a la respuesta al variar los niveles de los factores.
Ademas de esto se observa un componente adicional en el Anova: Lack of fit. Este
componente muestra no ser significativo, sin embargo, si lo hubiese sido, implicaría
entonces que es necesario aplicar un modelo de mayor orden para describir lo que
sucede a la respuesta al variar los niveles de los factores.

•   Para observar lo que sucede a la respuesta cuando se varían los niveles de los
    factores se realiza entonces el grafico de superficie. En Minitab en el menú de
    graph se escoge la opción 3D surface plot como muestra la siguiente figura:




•   Luego se escoge el tipo de grafico que se desea como muestra la figura:




•   En la siguiente ventana se introducen las columnas correspondientes a la
    respuesta y los factores:




                                                                                202
Sección 11: Metodología de Respuesta




•   Se da click en el botón de ok y se obtiene el siguiente grafico:

                                 Surface Plot of Respuesta_1 vs A, B




                            76



                            74
              Respuesta_1



                            72
                                                                      1
                                                                  0   A
                                    -1                       -1
                                             0
                                         B        1




Se observa entonces que la respuesta aumenta cuando A esta en su nivel alto y B esta
en niveles entre 0 y 1. De manera que el ingeniero debe usar una combinación de
estos dos niveles para lograr un incremento en el porcentaje de producción.




                                                                                203

Más contenido relacionado

PPTX
Prueba de hipotesis grupo 4
PDF
14.범주형자료분석
PPTX
Coeficientes constantes
DOCX
Dca y bca
PDF
Ejercicios cuadrados latinos ejercicio 1
PDF
Ejercicios cuadrados latinos ejercicio 2
PPTX
Prueba de Hipótesis
PPTX
Prueba de Hipótesis
Prueba de hipotesis grupo 4
14.범주형자료분석
Coeficientes constantes
Dca y bca
Ejercicios cuadrados latinos ejercicio 1
Ejercicios cuadrados latinos ejercicio 2
Prueba de Hipótesis
Prueba de Hipótesis

Similar a Manual completo de diseño (20)

PPTX
Prueba de hipótesis
DOCX
Unidad5 angel wha
PDF
Unidad5
DOCX
Tercera unidad
PPTX
Prueba de hipotesis
PPT
Prueba de hipotesis(1)
DOCX
1.1 prueba de hipotesis
PPT
Pruebas de hipotesis
PDF
Pruebas de hipotesis
DOCX
Blog prueba de hipotesis
PPTX
Lic. mata
PDF
SESIÓN 08 - ESTADISTICA Y TECNICAS ES INTRUMENTOS
PPT
Contraste de hipotesis1 tema de clase
PPTX
Expo extadistica1
PPT
PPT
Contrastes de hipotesis
DOCX
Intervalos de confianza
PPTX
Mateematicas
DOC
7 prueba de hipotesis
PPT
DiseñO De Invstigacion
Prueba de hipótesis
Unidad5 angel wha
Unidad5
Tercera unidad
Prueba de hipotesis
Prueba de hipotesis(1)
1.1 prueba de hipotesis
Pruebas de hipotesis
Pruebas de hipotesis
Blog prueba de hipotesis
Lic. mata
SESIÓN 08 - ESTADISTICA Y TECNICAS ES INTRUMENTOS
Contraste de hipotesis1 tema de clase
Expo extadistica1
Contrastes de hipotesis
Intervalos de confianza
Mateematicas
7 prueba de hipotesis
DiseñO De Invstigacion
Publicidad

Manual completo de diseño

  • 1. Preparado Por: David Gonzales, Ph. D. Cynthia Rodríguez, MS. Student Ángela Anaya, ME.
  • 2. SECCIONES 1. Principios Básicos, Definiciones y Experimentos de un solo Factor Aleatorio…………..1 2. Bloque Completamente Aleatorio y Cuadrado Latino…………………………………..35 3. Diseño Factorial………………………………………………………………………….52 4. Regresión Lineal…………………………………………………………………………60 5. Diseño Factorial 2k……………………………………………………………………….73 6. Diseño Factorial 2k con Bloques…………………………………………………………88 7. Experimentos Fraccionarios 2k…………………………………………………………110 8. Experimentos Gauge R & R……………………………………………………………144 9. Experimentos Anidados y Anidados Factoriales……………………………………….161 10. Experimentos de Parcelas o Cuadrantes Partidas………………………………………175 11. Metodología de Respuesta……………………………………………………………...189
  • 3. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. 1. Principios Básicos Para iniciar en el curso de Diseño de experimentos, es necesario tener algunos conceptos claros en la parte de probabilidad y estadística. A continuación se presentan los conceptos más relevantes. Estadísticas Pueden ser Descriptivas: donde se Inferenciales: donde se describe el comportamiento de modelan patrones a partir de unos datos mediante unos datos, haciendo estimados y algunos métodos inferencias a partir de métodos gráficos. como pruebas de hipótesis. Parámetros: describen la población de elementos. Son tomados como la verdad. Como ejemplo se puede mencionar la media poblacional o µ . Un censo poblacional es un ejemplo donde se toma la población completa y a partir de ella se sacan parámetros que la describan. Estimados: describen una muestra tomada de la población de elementos. Generalmente se trabaja con muestras de elementos de una población en cuestión. Las muestras se describen entonces por los estimados; para el caso de la media poblacional µ , su estimado es la media muestral X . Los estimados se clasifican en medidas de tendencia central y medidas de dispersión: 1
  • 4. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. Medidas de tendencia central: ~ Prom edio ( X ) M ediana (X ) M oda Tie ne un inconve niente y es Dato central cua ndo la D ato que ocurre con m ayor qu e pued e ser influenciado m uestra e sta organizada de fre cuencia po r datos extremos. m ane ra a scendente Medidas de dispersión: Varianza (σ ) 2 D esviación ( σ ) Rango (R i) estándar M edida de ruido . Cuan Usada pa ra ver la disp ersión D iferencia entre la distintas son las de los datos a su m edia ob servac ión má xim a y ob servac iones, prome dia la m inim a d e la muestra distancia de cada ob servac ión de la mue stra a su prome dio. En diseño de experimentos se hacen análisis y se toman decisiones basándose en las hipótesis planteadas. A continuación se explican algunos conceptos concernientes a las pruebas de hipótesis. Valor P (P value) Se define como el nivel mínimo de significancia al cual la hipótesis nula Ho sería rechazada. En el análisis de varianza con que se analiza el experimento, se tienen en cuenta el valor P y el valor de la distribución F. Las tomas de decisión se dan de acuerdo a: Si P < α Se rechaza Ho Si P > α No se rechaza Ho 2
  • 5. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. Si Fcalculada > Fcritica Se rechaza Ho Si Fcalculada < Fcritica No se rechaza Ho Para ilustrar una toma de decisión, se tiene la siguiente figura: Valor P Valor α + ∞ F calculada F crítica La figura muestra que la hipótesis nula Ho no puede ser rechazada debido a que la F calculada es menor a la F crítica y de igual manera el valor P es menor al nivel de significancia alfa. El valor P se puede interpretar como la posibilidad de que la hipótesis nula no sea rechazada; magnitudes altas del mismo se asocian con no poder rechazar la hipótesis nula. La distribución F presume que las variables analizadas tienen un comportamiento Gausiano o normal. La misma se calcula como el promedio de cuadrados de los tratamientos, entre el promedio de cuadrados del error (el promedio de cuadrados usa la suma de cuadrados entre los grados de libertad). Los programas estadísticos como Minitab, dan los valores para P y F en el resumen mostrado al realizar un análisis de varianza. El investigador usualmente toma la decisión basado en el valor P por comodidad, esto porque él mismo decide el nivel de 3
  • 6. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. significancia de la prueba y no entra en la necesidad de buscar un valor de F crítico en tablas. Pruebas de hipótesis estadísticas Las hipótesis estadísticas son supuestos hechos por el investigador acerca de cierto parámetro como la media o la desviación estándar, de una o más poblaciones de interés. La estructura de las pruebas de hipótesis está dada por la formulación de dos términos: Ho: µ = µo Hipótesis nula que establece el valor exacto del parámetro que se desea probar H1: µ ≠ µo Hipótesis alterna que establece la posibilidad de que el valor del parámetro se encuentre entre una serie de valores distintos al establecido en Ho. (formulación dada para hipótesis alterna de dos colas) µ < µo Formulación para hipótesis alternas de una cola µ > µo No rechazar la hipótesis nula implica que la muestra analizada no ofrece suficiente evidencia para decir que la misma no pueda ser cierta. Sin embargo, si ésta es rechazada, la prueba entonces ofrece suficiente evidencia para decir que la misma no es cierta. Cuando se rechaza Ho, se da paso a la aceptación de H1. Para realizar una prueba de hipótesis se debe tener en cuenta los siguientes pasos: 1. Establecer Ho (ej: que no exista diferencia entre las medias de los niveles de un factor o variable de entrada) 2. Establecer H1 (ej: que exista diferencia entre las medias de los niveles de un factor o variable de entrada) 3. Establecer α que es el valor que marca el límite entre aceptación y rechazo. 4. Seleccionar el estadístico de prueba (ej: la media, es decir, la función de la muestra aleatoria que se utiliza para tomar una decisión) 4
  • 7. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. 5. Establecer la región critica 6. Calcular el valor de la estadística de prueba para la muestra analizada 7. Comparar la estadística de prueba con la región crítica y tomar una decisión en cuanto a si se rechaza o no Ho. Cuando se realizan pruebas de hipótesis se puede caer en dos tipos de errores: • Error tipo I: Rechazar Ho cuando no debió ser rechazada. Para este error se define la probabilidad α , siendo ésta, la probabilidad de rechazar algo dado que estaba bueno o de rechazar dado que debí aceptar. Este error se considera como el error del productor porque se rechaza algo del lote de producción que debió ser aceptado. α es seleccionado por el investigador. • Error tipo II: No rechazar Ho cuando debió ser rechazada. Para este error se define la probabilidad β , siendo ésta, la probabilidad de aceptar algo dado que debió ser rechazado. Así este error se considera como el riesgo del consumidor, ya que al cometerse, el productor acepta algo que debió ser rechazado y lo lanza a la venta estando defectuoso. β solo se controla a través del tamaño de muestra. Si el investigador disminuye α entonces β aumenta porque están inversamente relacionados pero la suma de α + β ≠ 1. Ho es cierto Ho es falso No rechazo Ho Decisión correcta Error tipo II Rechazo Ho Error tipo I Decisión correcta Adicional a lo anterior, es importante definir el potencial de la prueba (1- β ), siendo este la probabilidad de rechazar Ho cuando debió rechazarse. Experimentalmente con el fin de aumentar el potencial de la prueba en experimentos corridos de manera completa, se hace una prueba de poder para determinar el número de replicas que se deben correr para obtener un poder aceptable (este fluye entre 0.7 y 1 aproximadamente. Cuando el poder 5
  • 8. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. es menor a este, se corre un riesgo mayor de aceptar Ho cuando debió rechazarse y por ende un fallo en la respuesta del experimento). Ejemplo 1 El tiempo promedio que tardan los estudiantes en registrarse para las clases de otoño en una universidad ha sido de 50 minutos con una desviación estándar de 10 minutos. Se está probando un nuevo método de registro con computadoras modernas. Si se toma una muestra aleatoria de 12 estudiantes que tuvieron un tiempo de registro promedio de 42 minutos con una desviación estándar de 11.9 minutos quienes se registraron con el nuevo método de registro. Pruebe la hipótesis de que la media poblacional es ahora menor a 50 minutos usando un nivel de significancia de 0.05 y de 0.01. Asuma que los datos de tiempo se distribuyen normalmente. Solución En este caso en particular se tiene la desviación estándar muestral conocida, de manera que se trabaja entonces con la estadística t. La hipótesis del investigador H1 es que la media del tiempo que tardan los estudiantes en registrarse sea menor a la anterior que era 50 minutos así: H 0 : µ = 50 min H1 : µ < 50 min Como no se conoce la desviación poblacional para el nuevo método entonces se debe usar la estadística t ya que los datos que se tienen son de una muestra proveniente de una población mayor: X −µ 42 − 50 t= = = −2.33 S / n 11.9 / 12 Para la toma de decisión se tiene en cuenta que: 6
  • 9. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. Si tcalculada < tcritica se rechaza Ho Si tcalculada > tcritica no hay suficiente evidencia para rechazar Ho Se procede entonces a buscar los valores de t crítica en la tabla, se debe tener en cuenta que la tabla pide el valor correspondiente al nivel de significancia y el valor correspondiente a los grados de libertad: Con un alfa de 0.05 y 11 grados de libertad T = -1.796 Con un alfa de 0.01 y 11 grados de libertad T = -2.718 A un nivel de significancia del 0.05 se rechaza H0 porque t calculada es menor a t critica, pero a un nivel de significancia de 0.01 no hay suficiente evidencia para rechazar H0 porque t calculada es mayor a t critica. Esto indica que hay gran probabilidad de que la media poblacional sea menor que 50 pero no es mucha la diferencia y quizá no es suficiente garantía para soportar el costo que requiere la compra del nuevo método de registro. Procedimiento con Minitab: 1. En el menú de stat en basic statistics se hace click sobre la opción 1 sample t: 7
  • 10. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. 2. Se despliega una ventana donde se ingresan los datos para la media muestral, la desviación estándar muestral y el tamaño de muestra, ya que en este caso no se tienen los datos sino un resumen de ellos: 3. El problema pide que se pruebe que la media del nuevo procedimiento sea menor a la media del procedimiento anterior, es decir, se hace una prueba de hipótesis de una cola. Para esto se hace click sobre el botón options donde se despliega una ventana que permite poner el nivel de confianza que en este caso es de 95 ya que el nivel de significancia inicial a probar es α = 5%. En la casilla de alternative se despliegan las opciones y se escoge la opción less than para que se pruebe que la media sea menor a 50. 8
  • 11. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. 4. Al hacer ok se obtienen los siguientes resultados: One-Sample T Test of mu = 50 vs < 50 95% Upper N Mean StDev SE Mean Bound T P 12 42.0000 11.9000 3.4352 48.1693 -2.33 0.020 El resultado despliega un valor de t de -2.33 igual al obtenido con los cálculos manuales. En este caso con un nivel de significancia de 0.05 se obtiene un valor p de 0.02, siendo este menor a 0.05 de manera que se rechaza la hipótesis nula y entonces el tiempo promedio que tardan los estudiantes en registrarse con el procedimiento nuevo es menor al que se tomaban con el procedimiento anterior. Para el caso del nivel de significancia de 0.01 se hace el mismo procedimiento anteriormente descrito pero cambiando el nivel de confianza a 99.0%. Ejemplo 2 La especificación para el grueso de una tableta es de 0.03 mm. Se sabe que el grosor de las tabletas sigue una distribución normal con σ = 0.001 . Se toma una muestra aleatoria de 32 tabletas del proceso y se les mide el grosor. El ingeniero del proceso desea saber si es correcto decir que el promedio de las tabletas en el lote es de 0.03 mm. 9
  • 12. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. A continuación se muestra una tabla con los datos de los grosores para un lote de 32 tabletas: Grosor Grosor Observacion (mm) Observacion (mm) 1 0.031 17 0.0283 2 0.0285 18 0.0291 3 0.029 19 0.0287 4 0.0279 20 0.0291 5 0.0286 21 0.0309 6 0.028 22 0.0298 7 0.0305 23 0.0313 8 0.0279 24 0.03 9 0.0286 25 0.0289 10 0.0299 26 0.0299 11 0.03 27 0.0279 12 0.0295 28 0.0311 13 0.031 29 0.0293 14 0.0316 30 0.032 15 0.0283 31 0.0278 16 0.0294 32 0.0319 En este caso particular, se conoce la desviación estándar poblacional y los datos tienen una distribución normal. Esto indica que se debe utilizar el estadístico de prueba Z. Se desea entonces probar si la media poblacional µ es 0.03 mm. Para esto se utiliza una prueba de hipótesis de dos colas, teniendo en cuenta que la hipótesis del investigador es negar que la media poblacional sea de 0.03 mm; la prueba de hipótesis se formula entonces así: Ho : µ = 0.03mm H 1 : µ ≠ 0.03mm Como la prueba es de dos colas, el rango de aceptación estará dado por dos valores críticos de la estadística Z o dos valores críticos de P-value. Ahora el investigador define que su nivel de significancia α es de 0.05 y procede a realizar las pruebas: 10
  • 13. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. El estimador de punto para la media poblacional µ es X , este se halla sacando el promedio de los grosores tomados en la muestra. 0.031 + 0.0285 + 0.029... + 0.0319 X= = 0.029553 32 Teniendo en cuenta que el estadístico de prueba Z es: σ σ X − Zα / 2 ≤ µ ≤ X + Zα / 2 n n Se procede a utilizar el programa Minitab para realizar los cálculos: 1. En el menú de stat, en basic statistics se hace clik sobre 1-sample Z debido a que se tiene una muestra: 2. Después se despliega una ventana donde se escoge la opción samples in columns debido a que se tienen todos los datos tomados de la muestra. En caso de tener los datos de tamaño de muestra y media, se escogería entonces la opción de sumarized data. En la casilla de samples in columns se pone entonces la columna 11
  • 14. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. que contiene los datos (grosor). Luego en la casilla de standard deviation se pone el valor de la desviación estándar poblacional y en la casilla de test mean, se pone el valor de la media o promedio que estamos probando. 3. Al hacer click en el botón de ok se obtienen los siguientes resultados: Variable N Mean StDev SE Mean 95% CI Z Grosor (cm) 32 0.029553 0.001276 0.000177 (0.029207, 0.029900) -2.53 Variable P Grosor (cm) 0.011 Los resultados muestran un valor P de 0.011, este valor es menor a 0.05 que es el nivel de significancia  0.011 < 0.05 por lo tanto se rechaza la hipótesis nula y → entonces la media o el grueso promedio de las tabletas producidas no es igual a 0.03 mm. 12
  • 15. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. 2. Definiciones Diseño de Experimentos: La experimentación es una técnica utilizada para encontrar el comportamiento de una variable a partir de diferentes combinaciones de factores o variables de entrada de un proceso, que al cambiar afectan la respuesta. Para entrar a experimentar es necesario pasar primero por el diseño de experimentos, esta técnica busca la manipulación sistemática de las variables de entrada de un proceso para entender el efecto que estas pueden causar en la variable respuesta. Es ampliamente utilizado en las empresas debido a que éste permite visualizar situaciones que pueden suceder a partir de la realización de un proceso. En la industria se utiliza principalmente para buscar el mejoramiento del rendimiento de un proceso, para reducir la variabilidad y permitir que haya un mayor acercamiento a los parámetros de la empresa, para reducir tiempos de procesamiento y reducir costos. Cualquier problema experimental incluye: diseño del experimento y análisis de los datos. Diseño del Experimento: Se refiere al proceso de planear el experimento que se desea. Es la adquisición de los datos apropiadamente para analizarlos de manera estadística. Cuando se tiene un proceso para análisis, es importante definirlo correctamente y proceder a buscar el mejor diseño de experimentos, de manera que se le pueda sacar el mejor provecho a los datos colectados por medio del análisis estadístico. Las bases de un diseño de experimentos son: replicación, aleatoriedad y bloqueo. Replicación o Repetición: Es el número de ocasiones que se efectúa una misma condición experimental en la prueba o experimento que se está haciendo. Si por ejemplo se desea probar el efecto que produce el cambio de temperatura (100 oC y 200 oC) y el cambio de presión (3 PSI y 6 PSI) en un componente, se tendría una condición experimental al establecer la prueba con 100 oC de temperatura y 3 PSI de presión; si bajo esta condición experimental se hacen dos pruebas, entonces se están realizando dos replicas o repeticiones. La siguiente figura ilustra la situación: 13
  • 16. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. Factor 1: Temperatura Nivel 1 del factor Nivel 2 del factor temperatura: temperatura: Factor 2: Presión 100 oC 200 oC Nivel 1 del factor Presión: X1 Respuestas bajo la Y1 3 PSI X2 condición 100 oC y 3 PSI Y2 Nivel 2 del factor Presión: W1 Z1 6 PSI W2 Z2 Las letras de color rojo, indican las respuestas a la primera réplica bajo las condiciones allí mostradas. Las letras de color negro, indican las respuestas a la segunda replica bajo las condiciones allí mostradas. Aleatoriedad: Es el orden en que se ejecutan las condiciones experimentales en el experimento. Bajo la aleatoriedad todos los tratamientos tiene la misma oportunidad de ser seleccionados. Es usada con el propósito de cancelar efectos de variables que no se están controlando (como efectos del ambiente en el que se realiza el experimento → lando humedad). La aleatoriedad cancela el efecto de factores que quizá no conocemos que están allí, incluso estos pueden estar cambiando sus niveles a medida que corremos el experimento. Cuando se conoce la fuente de variabilidad y se puede controlar, se usa una un técnica llamada bloqueo. 14
  • 17. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. La figura muestra dos bolsas que representan el factor, dentro de cada una se encuentran 4 papeles que están etiquetados con los niveles para cada factor. Una forma de hacer un procedimiento aleatorio, para el caso del ejemplo mencionado en la definición de replicación, seria tomar de cada bolsa sin mirar, un papelito. Allí se ilustra una mano tomando un papelito de cada bolsa, la misma persona entonces toma un papel de la bolsa de temperatura y luego otro papel de la bolsa de presión y se establece entonces la primera condición experimental. Una vez establecida estos papeles se dejan afuera de las bolsas y se prosigue con la siguiente condición experimental. Una vez no hayan papeles en la bolsa se ha terminado de establecer la primera réplica; si se desea tener más de una réplica, entonces se ingresan los papeles a las bolsas y se repite el procedimiento hasta completar la segunda replica. Bloqueo: Es una técnica utilizada con el fin de aumentar la precisión del experimento. Se usa cuando se conoce la fuente de variabilidad y se puede controlar. Al controlarla se reduce la variabilidad introducida por esta fuente y se evita que esta influya en la respuesta cuando no se está interesado en el efecto de la misma. Un bloque es una porción del material experimental que debe ser más homogénea que el conjunto completo del material. Factores: Los factores son las variables de interés para las cuales se quiere estudiar el impacto que tienen las mismas en la respuesta. Las variables temperatura y presión utilizadas para el ejemplo descrito en la definición de replica, son los factores de interés en la experimentación. Estos se puede clasificar como variables controlables: que pueden a su vez clasificarse en variables cualitativas (tipo de material sujeto) y cuantitativas (temperatura y presión). Las variables no controlables afectan el experimento y en ocasiones no son tenidas en cuenta; estas son medibles mas no están bajo el control del experimentador (humedad, la cual se mide mas no se controla). Los factores también pueden ser clasificados de manera fija o aleatoria. Se clasifican de manera fija cuando los niveles del factor (en el caso de factor temperatura antes mencionado, sus niveles son 2: 100 oC y 200 oC) son los únicos niveles de interés; es decir que el rango experimental se abarca por completo con esos niveles. Los factores se clasifican de manera aleatoria, 15
  • 18. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. cuando los niveles del factor son una muestra que salen de una población mayor y se desea hacer inferencia en la población a partir de los niveles seleccionados. Niveles: Es el número de alternativas o ajustes para cada factor. La figura mostrada en la definición de replicación, ilustra los niveles para cada factor. En el caso de ese ejemplo en particular se tienen dos niveles para cada uno de los factores. Variables de salida: Son las variables respuesta del experimento. La respuesta puede ser univariada (una sola salida de interés) o multivariada (múltiples salidas de interés). Estas pueden clasificarse en variables cualitativas y cuantitativas. Se clasifican como cualitativas cuando por ejemplo: se refiere a características, donde la respuesta es un si o un no (cuando se desea saber si un producto es aceptable o no de acuerdo a características observadas, o cuando se tienen en cuenta las características de una persona para tomar una decisión). Se clasifican como cuantitativas cuando se mide algo numérico como la viscosidad, el lead time de los procesos, el tiempo, el peso etc. Modelos según las variables analizadas Variable de entrada o factor (X) Variable de Cuantitativa Cualitativa salida o Cuantitativa Diagramas de dispersión, Análisis de varianza respuesta(Y) Regresión (ANOVA) Cualitativa Regresión Logística Tablas de contingencia Pasos a seguir en el diseño de experimentos: 1. Reconocimiento y establecimiento del problema 2. Selección de los factores y niveles de cada uno de estos 3. Selección de la variable respuesta 4. Determinación del diseño experimental que debe llevarse a cabo 16
  • 19. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. 5. Realización del experimento para la obtención de los datos de la respuesta 6. Análisis de los datos 7. Conclusiones y recomendaciones 8. Estudio de confirmación Grados de libertad: Estos se refieren al número de términos independientes en un test particular. Teniendo n como el número de términos, los grados de libertad se calculan mediante n-1. ANOVA (Análisis de varianza) Las pruebas de hipótesis son una herramienta útil cuando se trata de comparar dos tratamientos. La experimentación usualmente requiere comparación de más de dos tratamientos simultáneamente, es allí donde se introduce Anova (teniendo en cuenta que es un procedimiento para análisis de factores cualitativos). El análisis de varianza se deriva de la partición de la variabilidad total en las partes que la componen. ANOVA establece que la variabilidad total en los datos, medida por la suma de cuadrados total, puede ser dividida en una suma de cuadrados de la diferencia entre los promedios de los tratamientos y el gran promedio total más una suma de cuadrados de la diferencia de las observaciones entre tratamientos del promedio del tratamiento. Anova, nos da la herramienta para distinguir si un factor afecta la respuesta en promedio. Presunciones de Anova: 1. Los errores o residuales son independientes y distribuidos de manera normal o gaussiana, con promedio equivalente a 0 y varianza constante. Si su promedio no fuese 0, el modelo estaría subestimando o sobreestimando. 2. Anova presume que todas las varianzas de los niveles del factor son iguales y toma un solo cálculo de varianza llamado Spooled o varianza conjunta. Anova mira los promedios de cada nivel contra el promedio general y lo llama entre tratamientos. Anova queda con dos estimados de varianza, dentro y entre los niveles; con 17
  • 20. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. estos se saca un cociente, si las 2 varianzas se parecen, es decir, el cociente es aproximadamente 1, el factor no tiene ningún impacto en la respuesta, pero si este cociente resulta ser grande, entonces el factor tiene mucho impacto en la respuesta. Para ilustrar se presenta a continuación un ejemplo teniendo en cuenta un solo factor aleatorio: Observaciones ( n replicas) Niveles del 1 2 … n Totales Promedios factor Yi. Yi. 1 Y11 Y21 … Yn1 Y11+ Y21+… Y1. Yn1 2 Y12 Y22 … Yn2 Y12+ Y22+… Y2 . Yn2 . . . … . . … . . . . . a Y1a Y2a … Yna Y1a+ Y2a+… Yan Ya . Totales Y.. Y.. A partir de la anterior tabla, se presenta la forma manual de hacer Anova con el fin de entender el concepto que maneja el análisis de varianza. Inicialmente se debe calcular la suma de cuadrados de los tratamientos: 1 a 2 Y..2 = ( ∑ Yi. ) − Fuente de variación entre SSTratamientos tratamientos n i =1 N Donde: n = Numero de tratamientos por cada nivel 18
  • 21. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. N = Numero de tratamientos en total i = 1, 2, 3… a Luego se debe calcular la suma de cuadrados total: a n Y..2 SSTotal = (∑∑ Y ) − 2 ij i =1 j =1 N Donde: N = Numero de tratamientos en total i = 1, 2, 3… a j = 1, 2, 3…n Para estimar la suma de cuadrados de los errores se hace la diferencia de la suma de cuadrados total y la suma de cuadrados de los tratamientos: SS E = SSTotal − SSTratamientos Fuente de variación dentro de los tratamientos La tabla de Anova quedaría así: ANOVA Fuente de Suma de Grados de Promedio de Estadístico de variación cuadrados libertad los cuadrados prueba Fo (SS) (MS) Tratamientos SS tratamientos a-1 SS tratamientos MS tratamientos a −1 MS error Error SS error N-a SS error N −a Total SS total N-1 19
  • 22. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. 3. Experimento de un solo factor aleatorio. Este tipo de experimento es el más sencillo y consiste en analizar un solo factor evaluado en diferentes niveles, de manera que se compara las medias de la respuesta en cada uno de esos niveles y se establece si hay diferencia entre ellas. El modelo correspondiente a este experimento esta dado por la ecuación IV. yij = µ + τ i + ε ij I Donde µ es un parámetro común para todos los tratamientos llamado la media general, τ representa el efecto del tratamiento i y ε ij corresponde al error que incorpora todas las fuentes de variabilidad en el experimento. Las hipótesis evaluadas son: H 0 : τ 1 = τ 2 = ...τ a H1 : τ 1 ≠ τ 2 ≠ ...τ a Lo que se desea investigar es si existe diferencia o no entre los niveles del factor en consideración. Ejemplo 1 (Tomado del libro Design and analysis of Experiments, de Douglas C. Montgomery, 6ta edición. Página 70) En muchos procesos de manufactura de circuitos integrados, los “wafers” son revestidos con una capa de material como dióxido de silicona o un metal. Luego, el material que no se necesita es removido haciendo los grabados necesarios para crear los patrones de los circuitos, interconexiones eléctricas y áreas donde se hacen los depósitos de metal. Un proceso de grabado tipo plasma es ampliamente usado para esta operación. La energía para el proceso es suplida por un generador de radio frecuencia RF que hace que el plasma sea generado en el intervalo entre electrodos. El ingeniero del proceso está 20
  • 23. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. interesado en determinar si diferentes niveles de poder de la RF afecta la tasa de grabado. Debido a que se tiene un solo factor, el ingeniero ha decidido hacer un experimento de un solo factor aleatorio con 5 replicas. Al correr el experimento se obtuvo las siguientes respuestas: Poder RF Tasa de grabado observada (replicas) Totales Promedios (W) 1 2 3 4 5 Yi. Yi. 160 575 542 530 539 570 2756 551.2 180 565 593 590 579 610 2937 587.4 200 600 651 610 637 629 3127 625.4 220 725 700 715 685 710 3535 707.0 Y.. = 12,355 Y.. = 617.75 Ahora, las hipótesis que el investigador desea probar son: Ho: Las medias de los niveles son iguales µ160 = µ180 = µ 200 = µ 220 H1: Algunas medias son diferentes Teniendo claras las hipótesis y habiendo corrido el experimento, se procede a realizar los cálculos matemáticos que permitan llegar al estadístico de prueba Fo para tomar una decisión. a Y..2 n 12,355 SSTotal = (∑∑Y ) − = (5752 + 5422 + ... + 7102 ) − 2 ij = 72,209.75 i =1 j =1 N 20 1 a 2 Y..2 1 12,355 SSTrat = ( ∑ Yi. ) − = [27562 + ... + 35352 ] − = 66,870.55 n i=1 N 5 20 21
  • 24. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. SS E = SSTotal − SSTratamientos = 72,209.75 − 66,870.55 = 5339.20 ANOVA Fuente de Suma de Grados de Promedio de los Estadístico de variación cuadrados libertad cuadrados (MS) prueba Fo (SS) Poder RF 66,870.55 3 66,870.55 22,290.18 = 22,290.18 = 66.80 3 333.70 Error 5339.20 16 5339.20 = 333.70 16 Total 72,209.75 19 El experimentador obtiene un valor de Fo = 66.80. Tomando un nivel de significancia de 0.05, teniendo 3 grados de libertad del factor y 16 del error, se procede a buscar en la tabla de la distribución F y se obtiene un valor de 3.24. Como 66.80 > 3.24 entonces se concluye que las medias de los niveles del factor difieren y por tanto se procede a rechazar Ho. Es importante notar que el procedimiento descrito anteriormente es hecho a mano. Para esto existen programas como Minitab quienes realizan los cálculos a partir de los datos ingresados. A continuación se ilustra el procedimiento en Minitab: 1. En el menú de stat se busca la opción anova, allí se hace doble click en la opción one way anova como muestra la figura 22
  • 25. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. 2. Aparece entonces una ventana que permite ingresar las columnas de valores para el análisis. En la primera casilla que dice response, se ingresa la columna que contiene los valores de la respuesta, en la siguiente casilla de factor, se ingresa la columna que tiene los niveles del factor, se dejo una confianza del 95% que equivale al nivel de significancia de 0.05 utilizado en los cálculos manuales: 3. Al dar clik en OK se obtiene la siguiente respuesta: 23
  • 26. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. One-way ANOVA: Respuesta versus Niveles Source DF SS MS F P Niveles 3 66871 22290 66.80 0.000 Error 16 5339 334 Total 19 72210 S = 18.27 R-Sq = 92.61% R-Sq(adj) = 91.22% Se obtienen los mismos valores que se obtuvieron con los cálculos manuales. En este caso se ve que el P-value es de 0, esto implica un valor menor al del nivel de significancia (0.005). al ser 0 < 0.005 se rechaza Ho y el investigador puede concluir entonces que los niveles del poder afectan la tasa de grabado. 4. Al dar clik en OK se obtiene también una grafica con 4 métodos de análisis graficos para los residuales, esto con el fin de cotejar la idoneidad del modelo: Residual Plots for Respuesta Normal Probability Plot of the Residuals Residuals Versus the Fitted Values 99 20 90 10 Residual Percent 50 0 -10 10 -20 1 -50 -25 0 25 50 550 600 650 700 Residual Fitted Value Histogram of the Residuals Residuals Versus the Order of the Data 4 20 3 Frequency 10 Residual 2 0 -10 1 -20 0 -30 -20 -10 0 10 20 30 2 4 6 8 10 12 14 16 18 20 Residual Observation Order • Normal probability plot of the residuals (trazo de probabilidad normal): Este grafico muestra que los residuales se encuentran al rededor de la línea del medio, lo cual quiere decir que no hay ninguna desviación significativa de la presunción de normalidad para los residuales. 24
  • 27. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. • Residuals versus the fitted values (trazo de residuales contra los valores estimados): este grafico muestra que no hay un patrón definido. • Histogram of the residuals (histograma de los residuales): la forma del mismo muestra un comportamiento aproximadamente normal o gaussiano. • Residuals versus the order of the data (trazo de residuales vs orden de la experimentación): Este grafico muestra que los datos no siguen ningún patrón. Ejemplo 2 La compañía Mush, productora de setas, ha elaborado un proceso de deshidratación de las mismas. Para el proceso se estableció una caja de cartón equipada con una entrada de aire, una chimenea, una parrilla para poner las setas a deshidratar y un foco debajo de la misma, el cual provee el calor necesario para deshidratar las setas. El ingeniero encargado del proceso sabe que 150 gramos de setas tardan de 9 a 18 horas en deshidratarse pero no sabe el tiempo exacto. Se sabe también que las setas deben llegar a reducir su peso en un 87% aproximadamente para considerarse deshidratadas. Debido a esto se estableció un experimento tomando un solo factor en consideración (tiempo). El experimentador determino 4 niveles de tiempo entre 9 y 18 horas con intervalos de 3 horas entre cada nivel. Lo anterior conlleva entonces a la siguiente configuración: Factor: Tiempo Nivel 1: 9 horas Nivel 2: 12 horas Nivel 3: 15 horas Nivel 4: 18 horas X X X X El experimentador sabe que debe realizar replicas de su experimento; para esto el realizó una prueba de poder y tamaño de muestra (power and sample size) en el programa Minitab. El poder es la probabilidad de que la prueba rechace la hipótesis nula (en este caso es que no exista diferencia entre las medias de los pesos para los niveles de la variable tiempo o 25
  • 28. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. que no haya diferencia entre el efecto de los niveles de la variable) cuando la misma es falsa; se denomina como 1- β , siendo β la probabilidad de aceptar algo que debió ser rechazado. Se presumieron 3 valores para el poder (0.7, 0.8 y 0.9) para evaluar la cantidad de replicas de acuerdo a cada uno de ellos. En cuanto a la diferencia entre las medias de los factores, el experimentador hizo una presunción de 4 gramos de manera que se pueda detectar la diferencia entre los efectos de los niveles cuando las medias varíen en más de 4 gramos la una de la otra. El valor de la desviación estándar de los pesos era previamente conocido (2.845 gramos). Los valores del poder, la diferencia entre medias, la desviación estándar y un nivel de significancia de 0.05 fueron ingresados a Minitab de la siguiente manera: 1. En Minitab, en el menú de stat se encuentra la opción de power and sample size y allí la opción de one way anova como muestra la próxima figura: 2. Al abrir la opción one way anova, se encuentra entonces la pantalla donde se ingresan los datos del experimento, es decir, el numero de niveles del factor, el valor de la diferencia máxima que se desea entre las medias de los pesos para cada uno de los niveles, los valores del poder y la desviación estándar de los pesos. La siguiente figura ilustra el procedimiento: 26
  • 29. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. 3. Al dar click en el botón de OK se obtiene el siguiente resultado: Power and Sample Size One-way ANOVA Alpha = 0.05 Assumed standard deviation = 2.845 Number of Levels = 4 SS Sample Target Maximum Means Size Power Actual Power Difference 8 10 0.7 0.704069 4 8 13 0.8 0.834820 4 8 16 0.9 0.913369 4 The sample size is for each level. El experimentador entonces concluye que para obtener un poder de 0.704069 debe realizar 10 replicas del experimento, para un poder de 0.834820 debe hacer 13 replicas y para un poder de 0.913369 debe hacer 16 replicas. Debido a que el mínimo de replicas es de 10, el experimentador decide entonces buscar el poder que se conseguiría al realizar 11 replicas del experimento. Este procedimiento se hace mediante la misma herramienta de Minitab pero dejando en blanco la casilla de power y poniendo el número 11 en sample size. A continuación se ilustra el procedimiento y la respuesta obtenida: 27
  • 30. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. Power and Sample Size One-way ANOVA Alpha = 0.05 Assumed standard deviation = 2.845 Number of Levels = 4 SS Sample Maximum Means Size Power Difference 8 11 0.754440 4 The sample size is for each level. Según el anterior resultado, al realizar 11 replicas se obtiene un poder de 0.7544 que el experimentador considera razonable para los resultados que desea obtener. Por lo anterior el número de replicas que se deben realizar en el experimento de un solo factor aleatorio es de 11. Después el experimentador hace la aleatoriedad con la que va a realizar la experimentación para cada replica, es decir, en el programa Minitab se ingresan los valores de los niveles (9,12, 15 y 18 horas) y se hace un procedimiento para obtener el orden en que se van a hacer las corridas para cada replica. La siguiente figura ilustra el procedimiento en el programa Minitab: 28
  • 31. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. 1. En el menú de calc, en la opción Random data, se despliega otro menú donde se escoge la opción sample from column: 2. Al hacer click en sample from column se despliega una ventana donde se ingresa el numero de filas que contienen los datos a organizar, luego una casilla donde se ingresa la columna de la cual se hace la aleatoriedad, esto haciendo doble click en los nombres de las columnas que se despliegan en la casilla de la izquierda, finalmente en la última casilla se ingresa el nombre de la columna donde se desea que se almacene el resultado (la organización aleatoria de la réplica). La siguiente figura ilustra el procedimiento: 29
  • 32. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. 3. Al hacer click en OK se despliega el siguiente resultado: Entonces el experimentador debe correr la primera réplica poniendo las setas en la caja por 9 horas inicialmente, luego debe sacarlas, pesarlas y poner un segundo lote de setas en la caja por 15 horas y así hasta completar la réplica. Para la aleatoriedad de las demás replicas, se repite el procedimiento anteriormente mencionado Los resultados de los pesos en gramos para las 11 replicas son: 30
  • 33. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. Factor: Tiempo Replica Nivel 1: 9 Nivel 2: Nivel 3: Nivel 4: horas 12 horas 15 horas 18 horas 1 21.73 20.80 20.80 21.30 2 20.10 20.20 18.30 19.50 3 18.05 18.14 18.40 17.62 4 20.05 19.30 18.85 19.30 5 19.01 19.42 20.27 18.75 6 21.64 21.81 20.06 21.88 7 23.21 20.22 19.04 22.02 8 20.34 18.20 18.74 18.85 9 18.50 18.02 18.30 19.30 10 19.34 20.05 19.53 18.70 11 19.39 18.90 21.43 20.54 El experimentador ingreso los datos a Minitab y realizo el análisis de los mismos de la siguiente manera: 1. En el menú de stat, se despliegan diferentes opciones, debido a que se desea realizar un análisis de varianza, se despliega entonces el menú de ANOVA, donde se escoge la opción de General linear model como muestra la figura: 31
  • 34. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. 2. Al dar click en General linear model se obtiene una ventana donde se ingresa en la primera casilla la columna de respuestas denominada como pesos, en la casilla de Model se ingresa el modelo, en este caso el factor tiempo y las replicas, siendo el factor tiempo un factor fijo y las replicas un factor aleatorio. En la última casilla (random factors) se especifica que el factor replica es aleatorio 32
  • 35. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. 3. La ventana muestra 7 botones que permiten especificar o adquirir información adicional en el análisis. Para este caso, se oprime el botón factor plots y se obtiene la siguiente ventana: 4. La anterior opción permite realiza un grafico de los efectos principales de los niveles del factor. En la casilla Factors se ingresa entonces el factor tiempo, se oprime OK y regresa a la ventana principal donde se oprime OK de nuevo y se obtiene el siguiente resultado: General Linear Model: Pesos versus Tiempos, Replicas Factor Type Levels Values Tiempos fixed 4 9, 12, 15, 18 Replicas random 11 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 Analysis of Variance for Pesos, using Adjusted SS for Tests Source DF Seq SS Adj SS Adj MS F P El valor P es mayor Tiempos 3 3.1996 3.1996 1.0665 1.39 0.264 al valor de alfa de Replicas 10 47.6228 47.6228 4.7623 6.21 0.000 0.05 por lo tanto no Error 30 22.9890 22.9890 0.7663 se puede rechazar Ho Total 43 73.8114 y se determina que no hay diferencia entre los niveles del S = 0.875386 R-Sq = 68.85% R-Sq(adj) = 55.36% factor. 33
  • 36. Sección 1: Principios básicos, Definiciones y Experimentos de un solo factor aleatorio. Unusual Observations for Pesos Obs Pesos Fit SE Fit Residual St Resid 25 19.0400 20.8327 0.4938 -1.7927 -2.48 R 26 23.2100 21.5273 0.4938 1.6827 2.33 R 44 21.4300 19.7752 0.4938 1.6548 2.29 R R denotes an observation with a large standardized residual. Residual Plots for Pesos Main Effects Plot (fitted means) for Pesos Main Effects Plot (fitted means) for Pesos 20.2 µ nivel1 20.1 20.0 µ nivel 4 Mean of Pesos 19.9 19.8 19.7 19.6 µ nivel 2 19.5 µ nivel 3 19.4 9 12 15 18 Tiempos El experimentador deduce que no hay diferencia entre los niveles del factor tiempo debido a su valor P. Al observar la grafica se encuentra que la diferencia entre las medias de los niveles no sobrepasan los 4 gramos de diferencia entre las medias que el experimentador quería detectar, por lo tanto, el tiempo que debe durar el proceso de deshidratación es de 9 horas. 34
  • 37. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino 1. Bloque Completamente Aleatorio En cualquier experimento puede existir alguna fuente de variación que puede afectar los resultados. Muchas veces esta fuente de variación es desconocida e incontrolable. La aleatoriedad es una técnica de diseño que se utiliza con el propósito de cancelar efectos de variables que no estamos controlando ya sea porque no podamos controlarlas o porque no se conoce. Cuando se habla de aleatoriedad significa que se conduce al azar y no se le impone una estructura. Cuando esa fuente de variación se conoce y se controla (ya sea por aleatoriedad) se utiliza una técnica llamada bloque para eliminar sistemáticamente el efecto de la fuente de variación en las comparaciones estadísticas entre tratamientos. Descripción: Un diseño de experimento es completamente aleatorio cuando hay: • Un factor de interés. • Una fuente bloqueada. Si hay alguna fuente de variación que está incidiendo en el experimento y que no está en el modelo, el efecto de esta fuente de variación se va a reflejar en el error si la variable que representa dicha variación no es bloqueada. La aleatoriedad ocurre dentro del bloque. Figura 1. Diseño de bloque completamente aleatorio. 35
  • 38. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino Modelo Estadístico:  i = 1,2,..., a y ij = µ + τ i + β j + ε ij   j = 1,2,..., b , donde: y ij → observación j del tratamiento i µ → promedio general τ i → efecto del tratamiento i ε ij → error o residual de la observación j en el tratamiento i β j → efecto del bloque j En los experimentos que envuelven diseños de bloques completamente aleatorio, se interesa probar la igualdad de los promedios de los tratamientos. Por lo tanto, las hipótesis de interés son H 0 : µ1 = µ 2 = ⋅ ⋅ ⋅ = µ a H1 : at ⋅ least ⋅ one ⋅ µ i ≠ µ j Debido a que el promedio del tratamiento i es µ i = µ + τ i , una forma equivalente de escribir la hipótesis es en términos de los efectos en los tratamientos, entonces H 0 : τ1 = τ 2 = ⋅ ⋅ ⋅ = τ a = 0 H1 : τ i ≠ 0 ⋅ at ⋅ least ⋅ one ⋅ i Análisis de Varianza (ANOVA) para este modelo: El análisis de varianza se deriva de la partición de la variabilidad total en las partes que la componen. ANOVA establece que la variabilidad total en la data, medida por la suma de cuadrados total, puede ser dividida en una suma de cuadrados de la diferencia entre los promedios de los tratamientos y el gran promedio total más una suma de cuadrados de la diferencia de las observaciones entre tratamientos del promedio del tratamiento. Para aclarar la definición primero definiremos las variables que componen las ecuaciones de ANOVA. 36
  • 39. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino Tenemos que yi• es el total de todas las observaciones tomadas bajo el tratamiento i, y • j es el total de todas las observaciones tomadas en el bloque j, y •• es el gran total de todas las observaciones y N = ab es el número total de observaciones. Expresadas en forma matemática tenemos b yi • = ∑ yij i = 1,2, K , a j =1 a y • j = ∑ y ij j = 1,2, K , b i =1 a b a b y•• = ∑ ∑ y ij = ∑ yi • = ∑ y • j i =1 j =1 i =1 j =1 De igual forma, y i • es el promedio de las observaciones tomadas en el tratamiento i, y • j es el promedio de las observaciones en el bloque j y y •• es el promedio del gran total de todas las observaciones. Esto es, y i • = yi • b y • j = y• j a y •• = y •• N La suma de cuadrados total puede ser expresada como ∑∑ (y ) = ∑∑ [(y ) ( ) ( )] a b 2 a b 2 ij − y •• i• − y •• + y • j − y •• + y ij − y i• − y • j + y •• i =1 j =1 i =1 j =1 Expandiendo el lado derecho de la ecuación y haciendo algebra simple pero tediosa obtenemos la ecuación que representa una partición del total de la suma de cuadrados pero que es una de las ecuaciones fundamentales en ANOVA para el diseño de bloque completamente aleatorio. La ecuación es ∑∑ (y ) ( ) ( ) + ∑∑ (y ) a b a b a b = b∑ y i• − y •• + a ∑ y • j − y •• 2 2 2 2 ij − y •• ij − y • j − y i• + y •• i =1 j =1 i =1 j =1 i =1 j =1 Esta suma expresada de forma simbólica seria de la siguiente manera SS T = SS Treatments + SS Blocks + SS E Otro parámetro a considerar es el grado de libertad de cada una de las partes de la suma de cuadrados. Los grados de libertad son el número de elementos independientes en cada una de las 37
  • 40. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino sumas de cuadrados. Este parámetro nos ayuda a determinar el número de datos que necesitamos para hacer un estimado. Debido a que hay N observaciones, SST tiene N-1 grados de libertad. Hay a tratamientos y b bloques, por lo tanto, SSTreatments tiene a-1 grados de libertad y SSBlocks tiene b-1 grados de libertad. La suma de cuadrados del error SSE tiene (a-1)(b-1) grados de libertad debido a la diferencia entre la suma de cuadrados del tratamiento y los bloques. Ahora podemos obtener los promedios de los cuadrados dividiendo la suma de los cuadrados por sus grados de libertad. Para probar la igualdad de los promedios de los tratamientos usamos la prueba estadística F MS Treatments Fo = MS E Fa −1,(a −1)(b −1) La cual está distribuida como si la hipótesis nula es cierta. La región crítica es la cola F0 > Fα , a −1,(a −1)(b −1) superior de la distribución F, por eso rechazamos la hipótesis nula Ho si . De forma alterna podemos utilizar el P-value para la toma de decisiones. El P-value es la probabilidad de que la prueba estadística va a tomar un valor que es al menos tan extrema como el valor observado de la estadística cuando la hipótesis nula es cierta. El P-value se define como el nivel de significancia más pequeño que llevaría al rechazo de la hipótesis nula Ho. El error puede estar inflado por lo que es el error de verdad mas todo aquello que no contabilicé, por lo tanto, debo bloquear las variables que son. Un procedimiento aproximado que resulta razonable para investigar el efecto de la variable bloqueada es examinar el radio de MSBlocks entre MSE. Si este radio es grande, implica que el factor bloque tiene un efecto grande y que la reducción de ruido obtenida por el bloque probablemente es útil en mejorar la precisión en la comparación de los promedios de los tratamientos. El procedimiento para el análisis de varianza se resume en una tabla de ANOVA como la que se presenta a continuación. 38
  • 41. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino Ecuaciones de ANOVA Fuente de Suma de Grados de Promedio Variación Cuadrados Libertad Cuadrado F0 SSTreatments MSTreatments Tratamientos SSTreatments a-1 a-1 MSE SSBlocks Bloques SSBlocks b-1 b-1 SSE Error SSE (a-1)(b-1) (a-1)(b-1) Total SST N-1 Estos valores se pueden calcular en una hoja de cálculo de Excel pero también se pueden obtener de forma manual calculando las formulas expresadas en términos de los tratamientos y bloques totales. Estas formulas son a b y •2• SS T = ∑∑ y ij − 2 i =1 j =1 N 1 a 2 y •2• SS Treatments = ∑ y i• − N b i =1 1 b 2 y •2• SS Blocks = ∑ y• j − N a j =1 Y el error se obtiene restando como sigue SS E = SS T − SS Treatments − SS Blocks Ejemplo 1 Un fabricante de dispositivo médico produce injertos vasculares (venas artificiales). Éstos injertos son producidos insertando a presión resina de politetrafluoetileno combinado con un lubricante dentro de los tubos. Con frecuencia, algunos de los tubos en un funcionamiento de producción contienen salientes pequeñas y duras en la superficie externa. Estos defectos se conocen como " flicks." El defecto es causa para el rechazo de la unidad. 39
  • 42. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino El desarrollador del producto responsable de los injertos vasculares sospecha que la presión de insertar la resina afecta a la ocurrencia del " flicks" y, por lo tanto, se prepone conducir un experimento para investigar esta hipótesis. Sin embargo, la resina es fabricada por un suplidor externo y es entregada al fabricante del dispositivo médico en lotes. El ingeniero también sospecha que puede haber una variación significativa de lote-a-lote, porque mientras que el material debe ser constante con respecto a parámetros tales como peso molecular, tamaño de partícula promedio, retención, y cociente de la altura de pico, esta variación no es probablemente debido a la variación de la fabricación en el suplidor de la resina y a la variación natural en el material. Sin embargo, el desarrollador del producto decide investigar el efecto de los cuatro niveles diferentes de la presión de inserción en los “flicks” usando un diseño completamente aleatorio considerando los lotes de la resina como bloques. La variable respuesta es el rendimiento o el porcentaje de tubos en la producción que no contiene “flicks". A continuación se presenta la tabla que contiene los datos con respecto a este experimento. Datos del ejemplo numérico. Ejemplo calculando y i• : 6 ∑y i =1 8500• = y 8500(1) + y 8500( 2 ) + y 8500( 3) + y 8500( 4 ) + y 8500(5) + y 8500( 6 ) Para la presión 8500 → 6 ∑y i =1 8500• = 90.3 + 89.2 + 98.2 + 93.9 + 87.4 + 97.9 = 556.9 Ejemplo calculando y • j : 40
  • 43. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino 4 ∑y j=1 •1 = y (8500)1 + y (8700)1 + y (8900)1 + y (9100)1 Para el Lote de Resina 1 (Bloque 1) → 4 ∑y j=1 •1 = 90.3 + 92.5 + 85.5 + 82.5 = 350.8 Ejemplo calculando y •• : Se puede calcular sumando cada uno de los tratamientos de los diferentes bloques o simplemente 4 6 y •• = ∑ y i • + ∑ y • j i =1 j=1 y •• = (556.9 + 550.1 + 533.5 + 514.6) + (350.8 + 359.0 + 364.0 + 362.2 + 341.3 + 377.8) = 2155.1 Análisis de Varianza: Para realizar el análisis de varianza hay que calcular las siguientes sumas de cuadrados: 4 6 y •2• SS T = ∑∑ yij − 2 i =1 j =1 N = 193,999.31 − (2155.1)2 = 480.31 24 1 4 2 y •2• SS Treatments = ∑ y i• − N b i =1 (556.9 )2 + (550.1)2 + (533.2 )2 + (514.6 )2 − (2155.1) = 178.17 [ ] 2 1 = 6 24 1 6 2 y •2• SS Blocks = ∑ y• j − a j =1 N [ = (350.8) + (359.0) + L + (377.8) − 1 2 2 2 (2155.1) = 192.25] 2 4 24 SS E = SS T − SS Treatments − SS Blocks = 480.31 − 178.17 − 192.25 = 109.89 Llenando la tabla de ANOVA haciendo cada uno de los cálculos con las formulas en la tabla anterior tenemos el siguiente resultado: 41
  • 44. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino Resultados de ANOVA Fuente de Suma de Grados de Promedio Variación Cuadrado Libertad Cuadrado F0 P-Value Tratamientos 8.11 0.0019 178.17 3 59.39 (Presión de Inserción) Bloques 192.25 5 38.45 (Lotes) Error 109.89 15 7.33 Total 480.31 23 Usando un α = 0.05, el valor crítico de F es F0.05 ,9 ,15 = 3.29 . Este valor se obtiene de las tablas para la distribución F. Debido a que F0 > F0.05, 9,15 = 8.11 > 3.29 , concluimos que la presión de inserción afecta el rendimiento promedio. El P-Value de la prueba también es bien pequeño lo que significa que el experimento es aceptable. También, los lotes de resina (bloques) parecen diferir de forma significativa, debido a que el promedio cuadrado para los bloques es grande en relación con el error. Ejemplo usando MINITAB En Minitab, en la pantalla de WORKSHEET, ingresamos la data que está en la tabla 2. Se ingresan tres columnas de datos. Una columna que identifique el tipo de presión de inserción, otra que identifique los lotes de resina y otra que tenga la variable respuesta, en este caso el rendimiento, que concuerde con el tipo de presión y lote de resina. 42
  • 45. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino Como queremos realizar un ANOVA con un factor y un efecto bloqueado utilizamos la opción de “General Linear Model” y la seleccionamos como se presenta a continuación. 43
  • 46. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino Al hacer esta selección aparecerá la siguiente pantalla en donde tiene que seleccionar la variables respuesta, «Response», y el modelo que esta considerando, «Model». Para seleccionar la variable respuesta coloque el cursor en la casilla de “Response” y aparecerán las columnas que contienen data en la casilla de la izquierda. Seleccione Rendimiento dándole doble clic a la columna rendimiento en la casilla izquierda o selecciona la columna rendimiento y presiona el botón de «Select». En la casilla de Model debe seleccionar tanto la columna de Presión de Inserción como la columna de Lote de Resina. Lo único que tiene que hacer colocar el cursor en la casilla del modelo y luego selecciona las columnas correspondientes dándolo doble clic. En la opción de «Storage» nos permite almacenar en una columna del WORKSHEET los residuales y los valores estimados obtenidos a través del modelo. En la opción de «Graph» podemos obtener las graficas con las cuales podemos hacer el análisis de los residuales y determinar si hay normalidad en los datos. Presionar «OK» cuando haya seleccionado todo lo deseado. 44
  • 47. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino Los resultados del ANOVA aparecerán en la ventana de «Session» como se muestra en la próxima figura. La primera parte es una información general de los factores usados en el modelo, que fueron Presión de Inserción y Lote de Resina. Si comparamos los resultados obtenidos usando Minitab con los resultados calculados con las ecuaciones podemos notar que son los mismos, lo que demuestra que el software de Minitab es una herramienta muy eficaz en diseño de experimentos. Otra información útil provista por el software de Minitab es el “R-Sq” que se define como la proporción de la variabilidad de la data explicada por el modelo de ANOVA. Esta cantidad de calcula usando la siguiente ecuación: SS Model R2 = . A mayor porciento más confiable y deseable es el modelo utilizado. Si este SSTotal porciento está por debajo del 60%, entonces el modelo utilizado no es el mejor que describe la data. Entre las presunciones de ANOVA el análisis de varianza supone que los errores del modelo, y por ende las observaciones, tienen una distribución normal e independiente con la misma varianza en cada nivel del factor. Estas presunciones se pueden verificar examinando los residuales. Un residual es la diferencia entre la observación real yij y el valor ŷij que se hubiera obtenido de un 45
  • 48. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino ajuste de mínimos cuadrados del modelo de ANOVA fundamental. A continuación se presentan las gráficas obtenidas en Minitab del análisis de residuales: La gráfica de normalidad nos permite visualizar que los datos están normalmente distribuidos ya que la dispersión de los residuales esta sobre la línea de normalidad. La gráfica de histograma nos permite corroborar que los datos están normalmente distribuidos con media igual a cero ya que el histograma tiene forma de campana centralizada en el punto cero. La grafica de los residuales versus los valores ajustados nos permite visualizar y corroborar la presunción de independencia de los datos ya que no siguen un patrón sino que están dispersos de forma aleatoria. 2. Experimento Cuadrado Latino Este tipo de diseño se utiliza cuando existen 2 fuentes de ruido o variabilidad que son conocidas por el experimentador. En la sección anterior se definió el experimento de bloque completamente aleatorio, el cual permite bloquear una fuente de variabilidad conocida; bajo el experimento cuadrado latino, se permite bloquear dos fuentes de variabilidad conocidas. El modelo que define este tipo de experimento esta dado por: 46
  • 49. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino Efecto de la Efecto Columna de la Fila Efecto del tratamiento y ij = µ + τ i + β j + γ k + ε ik 2 Bloques Suponga que un experimentador está investigando el efecto de 5 tipos de formulaciones de combustible (usado en la operación de una caldera), para observar el efecto en la tasa de combustión. Cada formula de combustible se tomó de un lote que solo da para 5 pruebas. Además de esto, las formulas son preparadas por diferentes operadores, que al ser personas, tienen diferentes habilidades y adquisición de experiencia. De esta manera, se puede observar dos factores de ruido o variabilidad que son identificables por el experimentador y que se pueden bloquear: los lotes de material y los operadores. Así, el diseño apropiado seria hacer las pruebas para observar la tasa de combustión de las formulaciones; teniendo en cuenta que se debe hacer el test probando cada formulación exactamente una vez en cada lote de materia prima, y, además, cada formulación debe ser preparada exactamente una vez por cada operador. La siguiente tabla ilustra lo anteriormente descrito: Operadores Lote de 1 2 3 4 5 materia prima Lote 1 A=24 B=20 C=19 D=24 E=24 Lote 2 B=17 C=24 D=30 E=27 A=36 Lote 3 C=18 D=38 E=26 A=27 B=21 Lote 4 D=26 E=31 A=26 B=23 C=22 Lote 5 E=22 A=30 B=20 C=29 D=31 Note que el diseño es un arreglo cuadrado y que las 5 formulaciones (A, B, C, D, E) o tratamientos, se denotan con letras latinas; de allí el nombre de cuadrado latino. Las columnas y las filas representan 2 RESTRICCIONES EN LA ALEATORIEDAD. 47
  • 50. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino En general, un cuadrado latino para p factores, es un cuadrado que tiene p columnas y p filas en cuyas celdas resultantes (p2), hay p letras latinas que corresponden a los tratamientos, y cada una de estas letras ocurre una vez y solamente una vez en cada fila y cada columna. Este modelo no tiene interacción entre las filas, columnas y tratamientos. Al observar la tabla también se puede ver que al tener la posición de los suscritos j y k se puede encontrar la posición del suscrito i, es decir, si j (columna) = 3 y el suscrito k (fila) = 4, entonces el suscrito i (correspondiente a la respuesta) = 26. Análisis de varianza para el experimento cuadrado latino: El análisis de varianza consiste en partir la suma de cuadrados totales de las N = p2 observaciones en componentes para las filas, columnas, tratamientos y error, por ejemplo: SS Total = SS filas + SS columnas + SS tratamientos + SS Error Los grados de libertar respectivos son: p 2 − 1 = p − 1 + p − 1 + p − 1 + ( p − 2)( p − 1) En cuanto al estadístico de prueba, para el probar la hipótesis de que no hay diferencia entre las medias de los tratamientos y para probar los efectos de las columnas y las filas tenemos: MStratamientos F0 = MS E Test para el Efecto de los tratamientos Este estadístico bajo la hipótesis nula se distribuye como: Fp-1,(p-2)(p-1). El procedimiento para hacer el Anova en términos de los tratamientos, columnas y filas para el cuadrado latino, resulta ser una extensión del procedimiento hecho para el experimento de bloque completamente aleatorio. A continuación se presenta la tabla de Anova para este caso: 48
  • 51. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino Anova para el modelo de Cuadrado latino Fuente de Suma de Cuadrados Grados Promedio Variación de Cuadrado F0 Libertad 2 1 p 2 y... SS tratamient o Tratamientos SS trat = ∑ yi.. − N p-1 p −1 MS tratamientos p i =1 F0 = 2 SS filas MS E 1 p y Filas SS filas = ∑ y..2k − .. p-1 p k =1 N p −1 2 1 p 2 y... SS columnas Columnas SS col = ∑ y. j . − N p j =1 p-1 p −1 SS E Error SSE se calcula por resta (p-2)(p-1) ( p − 2)( p − 1) 2 y... Total SS Total = ∑∑∑ y ijk − 2 p2-1 i j k N Ejemplo1: Teniendo en cuenta la situación anteriormente descrita sobre las pruebas de la tasa de combustión de 5 formulaciones, se procede a comprobar la igualdad de los efectos de los tratamientos de la siguiente manera: Ho : τ A = τ B = ...τ E H 1 : τ A ≠ τ B ≠ ...τ E Teniendo las hipótesis a probar claras, se procede a realizar los cálculos que faciliten llegar a las sumatorias de cuadrados de cada uno de los componentes. A continuación se presenta la tabla con los respectivos cálculos: Operadores Lote de 1 2 3 4 5 y..k materia prima Lote 1 A=24 B=20 C=19 D=24 E=24 111 Lote 2 B=17 C=24 D=30 E=27 A=36 134 Lote 3 C=18 D=38 E=26 A=27 B=21 130 Lote 4 D=26 E=31 A=26 B=23 C=22 128 Lote 5 E=22 A=30 B=20 C=29 D=31 132 y.j. 107 143 121 130 134 y…= 635 49
  • 52. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino Totales para los tratamientos (formulaciones): Letra latina Tratamiento Total A y1.. 24+30+…36 = 143 B y2.. 101 C y3.. 112 D y4.. 149 E y5.. 130 Ahora se procede a calcular las sumas de cuadrados para los tratamientos, las filas, las columnas, el error y la suma de cuadrados total: 635 2 SS total = ∑∑∑ 24 + 17 + 18 + ... + 31 − 2 2 2 = 676 2 i j k 25 1 5 635 2 SS lotes _ filas = ∑ 5 K =1 [1112 + 134 2 + ... + 132 2 ] − 25 = 68 1 5 635 2 SS operadores _ columnas = ∑ [107 2 + 143 2 + ... + 134 2 ] − = 150 5 j =1 25 1 5 635 2 SS formulaciones _ tratamientos = ∑ [1432 + 1012... + 130 2 ] − 25 = 330 5 i =1 SS Error = SS total − SS lotes − SS operadores − SS formulaciones = 676 − 68 − 150 − 330 = 128 Ahora se procede a construir la tabla de Anova: Anova para el modelo de Cuadrado latino Fuente de Suma de Grados de Promedio Cuadrado Variación Cuadrados Libertad F0 SS tratamient o 330 Formulaciones 330 p-1 = 5-1 = 4 = = 82.5 p −1 4 F0 = MS tratamientos SS filas MS E Lotes 68 p-1 = 4 = 17 82.5 p −1 = = 7.73 SS columnas 10.67 Operadores 150 p-1 = 4 = 37.5 p −1 (p-2)(p-1) = SS E Error 128 = 10.67 12 ( p − 2)( p − 1) Total 676 p2-1 = 24 Al calcular Fp-1,(p-2)(p-1) con un nivel de significancia de 0.05 en las tablas de la distribución F, se obtiene el valor de F critica = 3.36. Por lo tanto: Fcalculada > Fcritica 7.73 > 3.36 50
  • 53. Sección 2: Bloque Completamente Aleatorio y Cuadrado Latino Al ser mayor la F calculada, se rechaza la hipótesis nula y se concluye que hay una diferencia significativa en la tasa de combustión promedio, generada por las diferentes formulaciones del combustible. Ejemplo 2: situación que describe un experimento tipo cuadrado latino Una compañía de pintura quiere evaluar la habilidad de cuatro tipos de pintura blanca para tolerar las inclemencias del tiempo. Para efectuar esta prueba se han construido cuatro casas cuadradas en las que se garantiza que uno de los lados mira exactamente al norte. 51
  • 54. Sección 3: Diseño Factorial 1. Diseño Factorial En un experimento factorial se analizan todas las posibles combinaciones de los niveles de los factores en cada réplica del experimento. Por ejemplo, si el factor A tiene a niveles y el factor B tiene b niveles entonces cada replica tiene ab combinaciones posibles como muestra la figura 1. Figura 1. Combinaciones posibles para A y B. El efecto de un factor se define como el cambio en respuesta producido por un cambio en el nivel del factor. En algunos experimentos podemos encontrar que la diferencia en respuesta entre los niveles de un factor no es la misma en todos los niveles del otro factor. Cuando esto ocurre se dice que hay iteración entre los factores. Como podemos ver en la figura 2 la interacción no está presente ya que cuando cambio el factor A de su nivel 1 al nivel 2 la respuesta aumenta no importando en qué nivel esté el factor B. Sin embargo, en la figura 3 podemos apreciar el comportamiento del gráfico cuando existe interacción entre los factores. 52
  • 55. Sección 3: Diseño Factorial B1 70 70 60 60 B1 B2 50 50 Respuesta Respuesta 40 40 30 30 20 20 10 10 B2 1 A 2 1 A 2 Figura 2. Grafica cuando no existe interacción Figura 3. Grafica cuando existe interacción entre los factores. entre los factores. El factorial más pequeño es el que tiene 2 factores con 2 niveles cada uno. Las posibles combinaciones de este experimento forman los vértices de un cuadrado como se muestra en la figura anterior. Si utilizamos el método de variar un factor a la vez para explorar cada una de las combinaciones nos encontramos que éste método es inefectivo debido a que (como se muestra en la figura 4) una de las posibles combinaciones queda sin explorar. Además, para factoriales con más de 2 factores resultaría ineficiente e inadecuado. Figura 4. Gráfica que ilustra cuando se varía un factor a la vez en un factorial de 2 factores. 53
  • 56. Sección 3: Diseño Factorial Si tenemos un factorial con 3 factores cada uno con 2 niveles, las posibles combinaciones de este experimento forman los vértices de un cubo como se muestra en la figura 5. Al variar un factor a la vez solo se pueden explorar la mitad de las posibles combinaciones. En la figura 4 podemos notar los espacios vacíos de las combinaciones sin explorar. 2 Factor C 1 2 Fa ct or B 1 1 Factor A 2 Figura 5. Factorial de 3 factores ilustrando combinaciones sin explorar al utilizar el método de variar un factor a la vez. Variar un factor a la vez resulta un método ineficiente y nunca va a llegar a su valor óptimo. Es por esto que una de las ventajas de un diseño factorial es que son más eficientes que los experimentos de un factor a la vez. Además, un diseño factorial es necesario cuando pueden haber iteraciones presentes para evitar conclusiones engañosas. Finalmente, los diseños factoriales permiten estimar los efectos de un factor a varios niveles de los otros factores, generando conclusiones válidas sobre un rango de condiciones experimentales. Los experimentos a menos dimensiones me dan más réplicas. Si tengo un experimento con tres dimensiones (A, B y C) y elimino la dimensión C, es como si se trasladara la capa superior hacia abajo resultándome 2 datos por cada vértice del cuadrado resultante como se puede apreciar en la figura 6. 54
  • 57. Sección 3: Diseño Factorial (18) (17) C (23) (20) (21, 18) (20, 17) (21) (20) Repeticiones B B eliminando un factor (19) (18) (19, 20) A (18, 23) A Figura 6. Ilustración de cómo se obtienen repeticiones cuando se elimina uno de los factores; en este ejemplo se eliminó el factor C. La representación de ANOVA para un diseño de experimento factorial de 2 factores esta dada por el siguiente modelo: y ijk = µ + τ i + β j + (τβ) ij + ε ijk , donde el término (τβ) ij es el efecto de la interacción entre el factor A y el factor B, y y ijk es la respuesta observada cuando el factor A esta en el nivel i y el factor B está en el nivel j para la réplica k. La ecuación fundamental de ANOVA está dada por la suma de los cuadrados y se expresa de la siguiente manera teniendo el factor A con a niveles y el factor B con b niveles: SS total = SS A + SS B + SS AB + SS error La ecuación fundamental de ANOVA para un solo factor era SS total = SS Tratamient o + SS error , Una forma de visualizar la ecuación de ANOVA para 2 factores es como si expandiéramos la suma de los cuadrados del tratamiento de la ecuación de un solo factor como se muestra a continuación: 55
  • 58. Sección 3: Diseño Factorial Los términos de la suma de los cuadrados se calculan como se muestra a continuación: Suma de cuadrados totales: a b n y•2•• SS T = ∑∑∑ yijk − 2 i =1 j =1 k =1 abn Suma de los cuadrados de los efectos son: 1 a 2 y2 1 b 2 y2 SS A = ∑ y i•• − ••• y SS B = ∑ y • j • − ••• bn i =1 abn an j =1 abn Es conveniente obtener la suma de los cuadrados de la interacción, SS AB , en dos fases. Primero, se calcula la suma de cuadrados entre los totales de las celdas ab que se conoce como la suma de cuadrados debido a "subtotales": 1 a b 2 y2 SS Subtotals = ∑∑ yij • − ••• n i =1 j =1 abn Esta suma de cuadrados también contiene SS A y SS B . Por lo tanto, el segundo paso es calcular la suma de cuadrados de la interacción como sigue: SS AB = SS Subtotals − SS A − SS B Ahora por substracción podemos calcular la suma de cuadrados del error como sigue: SS E = SST − SS AB − SS A − SS B ó SS E = SS T − SS Subtotals 56
  • 59. Sección 3: Diseño Factorial A continuación se presenta la tabla de ANOVA para el Factorial de 2 factores: Fuente de Suma de Grados de Cuadrado Promedio Fo Variación Cuadrados Libertad SS A MS A A tratamientos SS A a −1 MS A = Fo = a −1 MS E SS B MS B B tratamientos SS B b −1 MS B = Fo = b −1 MS E SS AB MS AB Interacción SS AB (a − 1)(b − 1) MS AB = Fo = (a − 1)(b − 1) MS E SS E Error SS E ab(n − 1) MS E = ab(n − 1) Total SST abn − 1 Ejemplo Numérico: Tenemos 2 factores (A y B) a dos niveles cada uno (1 y 2) donde cada combinación tiene dos réplicas. Se quiere calcular la suma de cuadrados de cada efecto, (tratamientos A y B, la interacción, el error y el total). La data se encuentra en la siguiente tabla: A 1 2 8 4 1 9 3 B 10 14 2 12 16 Realizamos la suma por fila y por columnas para facilidad de los cálculos. A 1 2 Σ 8 4 1 24 9 3 B 10 14 2 52 12 16 Σ 39 37 76 57
  • 60. Sección 3: Diseño Factorial Calculando la suma de cuadrados de los efectos tenemos: 39 2 + 37 2 (76) 2 SS A = − = 0.5 4 8 24 2 + 52 2 (76 ) 2 SS B = − = 98 4 8 SS Total = 8 2 + 9 2 + ⋅ ⋅ ⋅ + 14 2 + 16 2 − (76 )2 = 144 8 Para poder buscar la interacción hacemos una expansión (booleana): 11 21 12 22 8 4 10 14 9 3 12 16 17 7 22 30 76 17 2 + 7 2 + 22 2 + 30 2 (76) 2 SS Tratamiento = − = 139 2 8 SS AB = SS Tratamientos − SS A − SS B = 139 − 0.5 − 98 = 40.5 SS Error = SS Total − SS A − SS B − SS AB = 144 − 0.5 − 98 − 40.5 = 5 Si todos los factores en un experimento factorial tienen 2 niveles, conocemos estos factores como 2k donde k es el número de factores. 2k = número de tratamientos o condiciones experimentales En la siguiente figura se muestra como se verían representados los tratamientos o combinaciones de este tipo de diseño experimental tomando diferentes valores de k. 58
  • 61. Sección 3: Diseño Factorial C B A B 2 2 = 4 tratamientos ó A 3 combinaciones 2 = 8 tratamientos C B A D 24 = 16 tratamientos Como podemos apreciar en la figura anterior, a mayor número de factores mayor es el número de tratamientos o combinaciones a realizar dentro del experimento. En los siguientes temas se discutirá el diseño factorial 2k y el diseño factorial 2k con bloques, que es cuando no se pueden realizar cada una de las posibles combinaciones o tratamientos. 59
  • 62. Sección 4: Regresión Lineal 1. Regresión Lineal Los factores envueltos en la experimentación pueden ser de tipo cuantitativos o cualitativos. Un factor cuantitativo es aquel que sus niveles pueden ser asociados con puntos dentro de una escala numérica, como la temperatura, el tiempo o la presión. Un factor cualitativo, es aquel que sus niveles no pueden ser organizados por el orden de su magnitud, en este caso se pueden magnitud, mencionar personas u operadores, lotes de producción, turnos de trabajo etc. La regresión lineal trabaja con factores de tipo cuantitativos. Este modelo puede ser utilizado para predecir la respuesta en cualquier punto del espacio contenido dentro de la región espacio experimental, es decir, si por ejemplo los niveles de temperatura analizados son 100 y 200, el modelo de regresión le permite al experimentador hacer inferencias sobre una temperatura que se encuentre entre 100 y 200. El modelo de regresión caracteriza la relación entre una variable respuesta que depende de k delo variables independientes o regresoras. Para ilustrar lo anterior, suponga que se desea medir la dureza de un elemento bajo dos niveles erior, distintos de temperatura y dos niveles distintos de presión. Al realizar las medidas se obtiene el niveles siguiente grafico: 60
  • 63. Sección 4: Regresión Lineal Al observarlo se puede determinar que el factor temperatura tiene una influencia mayor en la dureza que el factor presión. Esto porque los cambios de temperatura proveen una pendiente más inclinada que la pendiente que proveen los cambios en la presión. Para comparar entonces la influencia de los factores en la variable respuesta es relevante encontrar la pendiente de los factores de interés (temperatura y presión). Un método para obtener las pendientes y establecer un modelo matemático que describa la situación sería un modelo de regresión. Para este caso particular donde hay dos variables predictoras y una variable respuesta el modelo seria: y = Bo + B1 X 1 + B2 X 2 + ε Donde las B’s representan los coeficientes del modelo de regresión, siendo Bo el intercepto del plano, B1 el cambio esperado en la variable respuesta por unidad de cambio en la variable X1 (temperatura), B2 el cambio esperado en la variable respuesta por unidad de cambio en la variable X2 (presión) y ε representa el error o residuo del modelo. En forma matricial, el modelo de regresión puede ser expresado así: y = BX + ε Donde:  y1  1X 11 X 12 ... X 1k   Bo  ε 1  y    B  ε   2 1X 21 X 22 ... X 2 k   1  2 .  .  .  .  y=  X =  B=  ε =  .  .  .  .  .  .  .  .           yn    1X n1  X n2 ... X nk   Bk    ε n    Lo anterior muestra un vector y (de tamaño nx1) de las observaciones del experimento, X es la matriz de diseño (de tamaño nxp) de los niveles de las variables independientes, es decir los factores del experimento, B es un vector (de tamaño px1) de los coeficientes del modelo de regresión y ε es un vector (de tamaño nx1) de errores o residuales. 61
  • 64. Sección 4: Regresión Lineal Para estimar los coeficientes de regresión B, es necesario basarse en un criterio. El criterio más utilizado es el de minimizar la suma de cuadrados de los errores, de manera que se pueda encontrar aquellos estimadores de los coeficientes de regresión que minimicen la suma de cuadrados de los errores: n L = ∑ ε n = ε ' ε = ( y − XB )' ( y − XB ) 2 i =1 L puede ser expresada como: L = y ' y − B ' Xy − y ' XB + B ' X ' XB L = y ' y − 2 B ' X ' y + B ' X ' XB El término B’X’y es un escalar al igual que su transpuesta, por esta razón se puede agrupar el segundo término de esta manera. Ahora la derivada de L con respecto a B resulta en: ∂L = −2 X ' y + 2 X ' Xb = 0 → X ' Xb = X ' y ∂B b Así los estimadores para los coeficientes que minimizan la suma de cuadrados de los errores se obtienen: Formula que se utiliza para encontrar los coeficientes B b = ( X ' X ) −1 X ' y Las propiedades de la varianza de b se expresan mediante la matriz de varianza-covarianza. Esta es una matriz simétrica de tamaño p x p, cuyos elementos contenidos en la diagonal son la varianza de bj y cuyo elemento (i,j) representa la covarianza entre los elementos bi y bj. La matriz de covarianza del vector b está dada por: Cov(b) = σ 2 ( X ' X ) −1 Con regularidad será necesario estimar σ 2 . Para estimar este parámetro se toma en cuenta la suma de cuadrados del residual, por medio de la cual se demuestra que: 62
  • 65. Sección 4: Regresión Lineal E ( SS ε ) = σ 2 ( n − p ) Donde el termino n-p se refiere a los grados de libertad del error. De esta manera al despejar se consigue el estimador no sesgado para σ 2 : SS ε σ2 = (n − p) Ahora para ilustrar lo descrito se toma en cuenta el siguiente ejemplo: suponga que se está midiendo la dureza como función de dos factores, temperatura y presión. El experimentador tomo una observación en cada una de las condiciones y obtuvo el siguiente resultado: Dureza Presión Temperatura 25 20 100 35 40 100 20 20 200 22 40 200 Con este resultado, el experimentador utilizo el programa Minitab y realizo el cálculo para encontrar el modelo de regresión que se ajusta a los datos: 1. En el menú de stat, en regresión, se da click a la ventana desplegada en la opción de regresión como muestra la figura: 63
  • 66. Sección 4: Regresión Lineal 2. Luego se despliega la ventana donde se ingresan los datos. En la casilla de response se ingresa la columna de respuestas, en la casilla de predictors, se ingresan los datos correspondientes a los factores predictores o variables independientes como muestra la figura: 3. Al hacer click en el botón de ok se obtiene el siguiente resultado: 64
  • 67. Sección 4: Regresión Lineal Regression Analysis: Dureza versus Temperatura, Presion The regression equation is Dureza = 30.0 - 0.0900 Temperatura + 0.300 Presion Predictor Coef SE Coef T P Constant 30.000 8.718 3.44 0.180 Temperatura -0.09000 0.04000 -2.25 0.266 Presion 0.3000 0.2000 1.50 0.374 S = 4 R-Sq = 88.0% R-Sq(adj) = 63.9% La columna catalogada como coef, despliega los coeficientes predictores o betas, de esta manera la ecuación de regresión para el ejemplo se resume en: Dureza = 30.0 – 0.09Temperatura + 0.30Presion El termino R-sq representa el R2 que define la variabilidad explicada por el modelo de regresión, es decir, el 88% de la variabilidad está siendo explicada por el modelo de regresión para el experimento conducido. De esta manera el modelo explica de forma suficiente los datos y por lo tanto la regresión se ajusta a ellos. Observando la ecuación, no se le puede dar una explicación al intercepto Bo = 30 porque ninguno de los rangos de experimentación para los factores incluyen el cero, que es lo que se usa de referencia para explicar el intercepto. Ahora en el caso de los factores, el interés es encontrar cuál de ellos afecta más la respuesta. Al observar la figura ubicada en la primera pagina de esta sección, se ve que la temperatura afecta la respuesta en mayor proporción que la presión. Sin embargo al observar el modelo de regresión que se ajusto al experimento, no se puede deducir lo mismo, por el contrario los coeficientes obtenidos a simple vista hacen pensar que la presión afecta la temperatura en mayor proporción. Esto se da porque ambos factores (temperatura y presión) están en diferentes escalas, es decir las 65
  • 68. Sección 4: Regresión Lineal escalas de los niveles de los factores miden diferentes características y por esto no se espera que coincidan, por lo tanto los coeficientes de los factores no son comparables. Para lograr una comparación entre los coeficientes de los factores, se utilizan entonces las variables codificadas. La relación entre las variables naturales (medidas en su escala original) y las variables codificadas está dada por: (η i − η ) Xi = rango 2 Donde Xi es la variable codificada, η i es la variable natural yη es el promedio de los niveles de la variable a ser codificada. Para el caso de experimentos 2k (se estudiaran más adelante) donde hay k factores cada uno con dos niveles (como es el caso de este experimento), la codificación produce entonces 2 niveles, +1 y -1. En el caso del ejemplo, al codificar la variable temperatura se obtiene: (100 − 150) (200 − 150) Xi = = −1 Xi = =1 200 − 100 200 − 100 2 2 Esto describe que el nivel bajo de temperatura (100) ahora se codifico a un nivel -1 y el nivel alto (200) se codifico a un 1. La siguiente tabla muestra las variables codificadas: Dureza Presión Temperatura 25 -1 -1 35 1 -1 20 -1 1 22 1 1 Al hacer el mismo procedimiento que se hizo para las variables naturales en Minitab, se obtiene el siguiente resultado para las variables codificadas: 66
  • 69. Sección 4: Regresión Lineal Regression Analysis: Dureza_1 versus Presion_1, Temperatura_1 The regression equation is Dureza_1 = 25.5 + 3.00 Presion_1 - 4.50 Temperatura_1 Predictor Coef SE Coef T P Constant 25.500 2.000 12.75 0.050 Presion_1 3.000 2.000 1.50 0.374 Temperatura_1 -4.500 2.000 -2.25 0.266 S = 4 R-Sq = 88.0% R-Sq(adj) = 63.9% La ecuación de regresión ahora es: Dureza = 25.5 – 4.5Temperatura + 3.0Presion Ahora con este modelo se nota que el impacto mayor en la respuesta lo da el factor presión, ya que la misma va a variar en -4.5 por cada unidad de cambio en la temperatura. La constante 25.5 es ahora el valor de dureza esperado cuando ambas variables se encuentran en el valor nominal o nivel medio de cada variable. Por otro lado los coeficientes de las variables predictoras son comparables porque ambos se encuentran en la misma escala. Prueba de hipótesis para el modelo de regresión El interés frecuentemente es probar las hipótesis para determinar que coeficientes dentro del modelo de regresión son significativos. La hipótesis para probar la significación de cualquier coeficiente j, está dada por: Ho : β j = 0 H1 : β j ≠ 0 Si el resultado de la prueba fuera que la hipótesis nula no es rechazada, entonces se puede concluir que la variable Xj asociada con el coeficiente β j no impacta la respuesta 67
  • 70. Sección 4: Regresión Lineal significativamente y por tanto puede ser eliminada del modelo. La estadística de prueba para efectuar la prueba de hipótesis está dada por: bj to = C jj (MSE ) Donde: bj: es el estimador de β j Cjj: elemento de la diagonal de la matriz de varianza-covarianza (X’X)-1 correspondiente al coeficiente bj. MSE: estimador del error Cabe aclarar que la covarianza es una medida de la relación entre dos variables. Si estas son independientes su covarianza es 0. Sin embargo el hecho de que la covarianza sea 0 no implica que las variables sean independientes Para ilustrar la ubicación de los valores Cjj se muestra la siguiente matriz: bo b1 b2 … bk C 00   C11     C 22  ( X ' X ) −1 =  .  .      C kk   68
  • 71. Sección 4: Regresión Lineal Ejemplo 1 Suponga que se tienen dos factores A y B cada uno con dos niveles 1 y 2. El experimentador desea saber el impacto en la respuesta al variar los factores en sus diferentes niveles. Después de realizar un experimento factorial con dos replicas se obtuvo la siguiente respuesta: Factor A Factor B 1 2 1 8 4 9 3 2 10 14 12 16 Teniendo las respuestas se procede a: 1. Se define el vector de respuestas y el cual puede tener las respuestas en cualquier orden: 8  9    4    3 y=  10   12 14   16   2. Se define la matriz X compuesta de los niveles correspondientes a la respuesta que se puso en el vector y. La matriz X contiene una columna por cada coeficiente a estimarse y una fila por cada dato de respuesta. 69
  • 72. Sección 4: Regresión Lineal Coeficiente correspondiente a la interacción. b0 b1 b2 b3 b3 = b1 x b2 8  → 1 −1 −1 + 1 9  1 −1 −1 + 1  →   4  → 1 +1 −1 − 1  →   3  X = 1 +1 −1 − 1 Se puso -1 para el y= 10 → 1 −1 +1 − 1 nivel más bajo (1) y  →   12 1 −1 +1 − 1 +1 para el nivel más 14 → 1 +1 +1 + 1 alto del factor (2)     16 →   1  +1 +1 + 1  3. Se procede a hallar X’X: 1 −1 −1 + 1 1 −1 −1 + 1   + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 1 +1 −1 − 1  − 1 − 1 + 1 + 1 − 1 − 1 + 1 + 1   1 +1 −1 − 1 X '=   X =  − 1 − 1 − 1 − 1 + 1 + 1 + 1 + 1 1 −1 +1 − 1      + 1 + 1 − 1 − 1 − 1 − 1 + 1 + 1 1 −1 +1 − 1 1 +1 +1 + 1   1  +1 +1 + 1  1 −1 −1 + 1 1 −1 −1 + 1   + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 1 +1 −1 − 1 8000  − 1 − 1 + 1 + 1 − 1 − 1 + 1 + 1 1 +1 −1  − 1 0800  * = X'X =   − 1 − 1 − 1 − 1 + 1 + 1 + 1 + 1 1 −1 +1 − 1 0080       + 1 + 1 − 1 − 1 − 1 − 1 + 1 + 1 1 −1 +1 − 1 0008 1 +1 +1 + 1   1  +1 +1 + 1  4. Se procede a sacar la inversa de X’X = (X’X)-1 70
  • 73. Sección 4: Regresión Lineal Los ceros representan la  1 000  8000   8  covarianza. Como puede 0800 0 1 00 observarse los coeficientes en = 8  X'X =   → ( X ' X ) −1 0080 00 1 0 este caso no tendrán    8  influencia sobre los demás, 0008  1  000 8    resultando en el mismo estimado del coeficiente independiente del modelo lineal. 5. Se procede a hallar el vector X’y 8  9    + 1 + 1 + 1 + 1 + 1 + 1 + 1 + 1 4  76  − 1 − 1 + 1 + 1 − 1 − 1 + 1 + 1 3  − 2 X'y =  *  =   − 1 − 1 − 1 − 1 + 1 + 1 + 1 + 1 10 28        + 1 + 1 − 1 − 1 − 1 − 1 + 1 + 1 12 18  14   16   6. Por último, multiplicando la matriz (X’X)-1 y el vector X’y se obtiene el vector de coeficientes Bj. (X’X)-1 * X’y = bj  1 000  76  b0  8  76   8  0 1 00   − 2   8  *  − 2 =  8  b1 00 1 0 28  28  b2  8     8  1    18  18 b3 000 8     8    La ecuación de regresión se expresa entonces así: 76 − 2 28 18 y= + XA + XB + X AXB 8 8 8 8 71
  • 74. Sección 4: Regresión Lineal Según la ecuación, el factor A es el que menos afecta la respuesta al variar. Al hacer el análisis mediante Anova, teniendo en cuenta un experimento de tipo factorial con 2 replicas se obtiene la siguiente respuesta: Factorial Fit: respuesta versus a, b Estimated Effects and Coefficients for respuesta (coded units) Term Effect Coef SE Coef T P Constant 9.5000 0.3953 24.03 0.000 a -0.5000 -0.2500 0.3953 -0.63 0.561 b 7.0000 3.5000 0.3953 8.85 0.001 a*b 4.5000 2.2500 0.3953 5.69 0.005 S = 1.11803 R-Sq = 96.53% R-Sq(adj) = 93.92% En la respuesta se puede observar los mismos valores para los coeficientes que se obtuvieron mediante la regresión lineal. Al observar los valores de P para los factores, se encuentra que el factor A es no significativo debido a que 0.561 > 0.05, siendo 0.05 el nivel de significancia utilizado para la prueba. Por lo anterior se dice entonces que el factor A no es significativo, es decir, al variar sus niveles la respuesta no se impacta significativamente. 72
  • 75. Sección 5: Diseño Factorial 2k 1. Diseño Factorial 2k El más importante de los casos especiales de los diseños factoriales es el que tiene k factores cada uno a dos niveles. Estos niveles pueden ser cuantitativos, valores de temperatura o presión, o pueden ser cualitativos, tales como 2 máquinas o dos operadores, o tal vez pueda ser la presencia o ausencia de un factor. Una réplica completa de tal diseño requiere 2 × 2 × 2 × · · · × 2 = 2k observaciones y se conoce como un diseño factorial 2k. Como cada factor en el experimento tiene 2 niveles, los llamaremos nivel bajo (-) y nivel alto (+). El diseño más pequeño en este tipo de experimento es el que tiene k = 2 factores. Es importante realizar réplicas de cada tratamiento o combinación en el experimento ya que esto me permite comparar entre valores (datos obtenidos en los diferentes niveles de un factor fijando los demás factores) y dentro de valores (datos obtenidos de una misma combinación), para entender mejor lo antes establecido vea el ejemplo en l siguiente figura: Réplica: I 2 dentro II Presión B (32.5) (25.98) entre 1 (32) (29) 1 A 2 Temperatura El número de corridas a realizarse en el experimento es 2k × # réplicas. Además, también es importante que el orden en que se realizan las corridas sea aleatorio, es por esto que el experimento es un experimento completamente aleatorio. Muchas veces resulta conveniente escribir la data en orden descendente de las combinaciones de los tratamientos. Esta forma de tabular se le conoce como el orden estándar y es como sigue: 73
  • 76. Sección 5: Diseño Factorial 2k Combinación de Nomenclatura de A B Tratamientos Tratamientos - - A low, B low a0b0 = (1) + - A high, B low a1b0 = a - + A low, B high a0b1 = b + + A high, B high a1b1 = ab Cuando el factor está en su nivel bajo su exponente es 0 y cuando el factor esta en su nivel alto su exponente es 1. Gráficamente esta nomenclatura es representada de la siguiente manera: b ab (-,+) (+,+) B (-,-) A (+,-) (1) a En un diseño factorial 2k es fácil expresar los resultados del experimento en términos de un modelo de regresión. Aunque para este tipo de experimentos se pueden usar modelos de efectos como de promedios, el modelo de regresión es mucho más natural e intuitivo. La ecuación para un modelo de regresión sería: y = β 0 + β1 x 1 + β 2 x 2 + ε Ejemplo: Se quiere medir el rendimiento de un químico midiendo la temperatura y la presión a la que está expuesto. Supongamos que de los datos obtenida los valores de la temperatura fluctúan entre 100oF y 200oF y los valores de la presión varían entre 3 y 5 Bars. 74
  • 77. Sección 5: Diseño Factorial 2k Supongamos la siguiente ecuación resultante del modelo de regresión: 5 No tiene una explicación, por lo tanto, no Presión se puede decir que significa este intercepto. B y = 50 + 0.1X A + 1X B ˆ 3 100 A 200 Para determinar cual de los dos factores tiene mas peso en el Temperatura experimento no puedo fijarme en sus coeficientes, también debo ver su tabulación ya que el rango de valores de ambos factores es diferente. De esta forma resulta muy difícil poder llegar a conclusiones asertivas, es por esto que para este tipo de experimento es necesario codificar las variables. La ecuación para codificar las variables (factores) es como sigue: X i : var iable _ codificada ∈ − ∈i Xi = i , donde ∈i : var iable _ natural rango i ∈i : promedio _ var iable _ natural 2 Codificando las variables del ejemplo anterior tenemos: Variable Temperatura: 100 − 150 200 − 150 X100 = = −1 X 200 = = +1 100 100 2 2 Variable Presión: 3− 4 5−4 X3 = = −1 X5 = = +1 2 2 2 2 Supongamos que ahora con las variables codificadas la ecuación resultante del modelo de regresión es la siguiente: y = 30 + 0.2X A + 1.3X B ˆ El valor de la constante, 30, es el valor de mi respuesta cuando Xi está en cero (cero es el centro de mi región experimental). Ahora tiene una explicación física porque los ceros están contenidos. 75
  • 78. Sección 5: Diseño Factorial 2k Ahora, ¿Cuál factor, XA o XB, tiene mayor peso en el experimento? o XB, porque como ahora los valores están codificados pues puedo utilizar el coeficiente para determinar cual factor tiene mayor peso. Ahora veremos un ejemplo de ANOVA por regresión: Data: A 1 2 8 4 1 9 3 B 10 14 2 12 11 b 0 b1 b2 b3  8 1 9  −1 −1 + 1    1 −1 −1 + 1 4     1 +1 −1 − 1 3 y=  X=1 +1 −1 − 1 10     1 −1 +1 − 1 12 1 14 −1 +1 − 1     1 +1 +1 + 1 11   1  +1 +1 + 1  X→ debe tener una columna por cada coeficiente a estimar y una fila por cada dato en el experimento. y = b 0 + b1 X A + b 2 X B + b 3 X A X B + ε b = (X ′X ) X ′Y ˆ −1 Resolviendo por partes: 76
  • 79. Sección 5: Diseño Factorial 2k 1 − 1 − 1 + 1 1 − 1 − 1 + 1   1 1 1 1 1 1 1 1  1 + 1 − 1 − 1 8 0 0 0 − 1 − 1 + 1 + 1 − 1 − 1 + 1 + 1 1  + 1 − 1 − 1 0 8 0 0 X ′X =   =  − 1 − 1 − 1 − 1 + 1 + 1 + 1 + 1 1 − 1 + 1 − 1 0 0 8 0      + 1 + 1 − 1 − 1 − 1 − 1 + 1 + 1 1 − 1 + 1 − 1 0 0 0 8 1 + 1 + 1 + 1   1  + 1 + 1 + 1  El codificar me permite entender el modelo y me da una propiedad muy útiles el las matrices. 1 0 0 0  8  0 1 0 0 (X ′X )−1 = 8 1  0 0 8 0 0 0 0 1    8  8 9   1 1 1 1 1 1 1 1  4   76  − 1 − 1 + 1 + 1 − 1 − 1 + 1 + 1  3  37 − 39 = −2 (X ′Y ) =    =   − 1 − 1 − 1 − 1 + 1 + 1 + 1 + 1 10 52 − 24 = 28      + 1 + 1 − 1 − 1 − 1 − 1 +! + 1 12  47 − 29 = 18  14   11   1 0 0 0   76   76   8   8 0 1 0 0  − 2 − 2  b = (X ′X ) (X ′Y ) =    =  8  ˆ −1 8 0 0 1 0   28   28  8   8 0 0 0 1   18   18    8   8   Si estimamos cuando A = -1 y B = -1 tenemos: 76 2 28 18 y= − XA + XB + XAXB 8 8 8 8 77
  • 80. Sección 5: Diseño Factorial 2k − (− 1) + (− 1) + (− 1)(− 1) 76 2 28 18 = 8 8 8 8 76 2 28 18 68 = + − + = = 8.5 8 8 8 8 8 Ahora, si A = 1 y B = 1, tenemos: − (1) + (1) + (1)(1) = 76 2 28 18 120 y= = 15 8 8 8 8 8 Regresión me das más información ya que me dice quien impacta y cual es la dirección. Una forma de visualizar el efecto de los factores y sus interacciones es utilizando cubos. Para un experimento de 3 factores podemos visualizar los efectos principales en la siguiente figura donde uno de los factores está en su nivel alto y los otros dos están en su nivel bajo: De igual manera podemos visualizar la interacción de los factores. La siguiente figura ilustra la interacción cuando dos de los factores están en su nivel alto y uno esta en su nivel bajo. 78
  • 81. Sección 5: Diseño Factorial 2k Si todos los factores en el experimento están en su nivel alto, su representación grafica es como se muestra a continuación: = corridas + = corridas _ ABC Si tenemos un experimento con 5 factores el número de posibles combinaciones es 32. Los efectos principales son los 5 factores, cuando uno de ellos está en su nivel alto y el resto en su nivel bajo, dándonos un total de 5 combinaciones (A, B, C, D, y E). Cuando realizamos las interacciones tenemos la combinación de 2 factores en su nivel alto y 3 factores en su nivel bajo, 3 factores en su nivel alto y 2 factores en su nivel bajo, 4 factores en su nivel alto y 1 factor en su nivel alto y, por último, todos los factores en su nivel alto. Estas posibles interacciones se muestran a continuación: AB BC CD DE ABC ACD BCD CDE AC BD CE Interaccion _ 2 = Interaccion _ 3 = ABD ACE BCE AD BE ABE ADE BDE AE ABCD BCDE ABCE Interaccion _ 4 = Interaccio n _ 5 = ABCDE ABDE ACDE Todas estas interacciones gráficamente representadas se verían como sigue: 79
  • 82. Sección 5: Diseño Factorial 2k bce abce bcde abcde + ce ace cde acde be abe bde abde e ae de ade E bc abc abcd bcd c C ac cd acd b ab bd abd __ B (1) a A d ad __ D + A medida que aumenta el número de factores en el experimento, realizar las calculaciones de cada una de las combinaciones resultantes se vuelve complicado y tedioso, además que se dificulta visualizar la interacción de los factores de forma grafica. Si aumentamos el número de factores, el numero de combinaciones o tratamientos a realizar aumente y esto es sin tomar en cuenta el número de corridas que debemos realizar para tener réplicas. Cuando un experimento de 2k envuelve muchos factores es económicamente difícil poder realizar replicas, por esto, si uno o más de los factores es irrelevantes se puede imponer cuadros o caras sobre cuadros o caras (trasladándolos) permitiendo así las réplicas. Algo muy importante que hay que tener en cuenta es que cuando no hay replicas no tenemos estimado de error. Para esta situación, Daniels sugiere trazar los estimados de los efectos en una grafica de probabilidad normal. De esta forma los efectos no significativos estarán normalmente distribuidos, con promedio cero (0) y varianza σ2 y además van a estar alineados formando una línea recta en la gráfica. Los factores que sean significativos van a tener una distribución con promedio distinto de cero y se 80
  • 83. Sección 5: Diseño Factorial 2k alejaran de la línea formada por los no significativos. Esta línea se le conoce como el Trazo Normal de los efectos (Trazo de Daniels). Este método nos ayuda a distinguir aquellos efectos que sobresalen para explicar la respuesta. Este método parte de la premisa de que cuando k es lo suficientemente grande, todas las fuentes de variación no serán relevantes; algunas de ellas deben pertenecer al error o ruido. Ejemplo usando MINITAB: Se realizó un experimento en una planta donde fabrican semiconductores en un esfuerzo por mejorar el rendimiento. Cinco factores, cada uno a dos niveles, se estudiaron. Se hizo una corrida del diseño sin réplicas y se muestra a continuación: (1) = 7 d=8 e=8 de = 6 a=9 ad = 10 ae =12 ade = 10 b = 34 bd = 32 be = 35 bde = 30 ab = 55 abd = 50 abe =52 abde = 53 c = 16 cd = 18 ce = 15 cde =15 ac = 20 acd = 21 ace = 22 acde = 20 bc = 40 bcd = 44 bce = 45 bcde = 41 abc = 60 abcd =61 abce = 65 abcde = 63 **Para realizar los pasos en MINITAB refiérase al manual de MINITAB provisto. (a) Construya la grafica de probabilidad normal de los efectos estimados (Trazo de Daniels). ¿Cuáles efectos aparecen muy alejados? 81
  • 84. Sección 5: Diseño Factorial 2k Normal Probability Plot of the Effects (response is Results, Alpha = .05) 99 Effect Type B Not Significant 95 A Significant C 90 F actor N ame AB A A 80 B B 70 C C Percent 60 D D E E 50 40 30 20 10 5 1 0 5 10 15 20 25 30 35 Effect Lenth's PSE = 0.65625 En esta gráfica podemos notar que los factores significativos para este experimento son A, B, C y la interacción AB. (b) Realice un análisis de varianza para confirmar sus descubrimientos en la parte (a). Analysis of Variance for Results (coded units) Source DF Seq SS Adj SS Adj MS F P Main Effects 5 11087.9 11087.9 2217.58 * * 2-Way Interactions 10 536.3 536.3 53.63 * * 3-Way Interactions 10 24.3 24.3 2.43 * * 4-Way Interactions 5 15.2 15.2 3.03 * * 5-Way Interactions 1 0.3 0.3 0.28 * * Residual Error 0 * * * Total 31 11664.0 Como podemos apreciar los residuales del error aparecen con un asterisco, esto se debe a que en un experimento sin réplicas no se puede estimar el error. También podemos notar que los valores de la distribución F y el P-value de los efectos y las interacciones, todas tiene asterisco y es debido a que no se pueden estimar cuando el error es igual a cero (0) o no se ha podido estimar. (c) Escriba el modelo de regresión relacionando el rendimiento con las variables significativas del proceso. Ŷ = 30.5313 + 5.9063XA + 16.9687XB + 4.8438XC + 3.9688XAB 82
  • 85. Sección 5: Diseño Factorial 2k (d) Grafique los residuales en una grafica de probabilidad normal. ¿Es satisfactoria la grafica resultante? Residual Plots for Results Normal Probability Plot of the Residuals Residuals Versus the Fitted Values 99 3.0 90 1.5 Residual Percent 50 0.0 10 -1.5 1 -3.0 -4 -2 0 2 4 0 15 30 45 60 Residual Fitted Value Histogram of the Residuals Residuals Versus the Order of the Data 6.0 3.0 4.5 1.5 Frequency Residual 3.0 0.0 1.5 -1.5 0.0 -3.0 -2.4 -1.2 0.0 1.2 2.4 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 Residual Observation Order Como podemos ver los residuales están distribuidos a través de la línea de normalidad y el histograma tiene una forma de campana mostrando que los promedios son iguales a cero (0) (e) Grafique los residuales versus el rendimiento predicho y versus cada uno de los factores. Comente sobre las graficas resultantes. 83
  • 86. Sección 5: Diseño Factorial 2k Residuals Versus A (response is Results) 3 2 1 Residual 0 -1 -2 -3 -1.0 -0.5 0.0 0.5 1.0 A Residuals Versus B (response is Results) 3 2 1 Residual 0 -1 -2 -3 -1.0 -0.5 0.0 0.5 1.0 B Residuals Versus C (response is Results) 3 2 1 Residual 0 -1 -2 -3 -1.0 -0.5 0.0 0.5 1.0 C 84
  • 87. Sección 5: Diseño Factorial 2k Residuals Versus D (response is Results) 3 2 1 Residual 0 -1 -2 -3 -1.0 -0.5 0.0 0.5 1.0 D Residuals Versus E (response is Results) 3 2 1 Residual 0 -1 -2 -3 -1.0 -0.5 0.0 0.5 1.0 E Como podemos ver en cada una de las graficas resultantes los residuales están entre los valores de -1 y +1 indicándonos que nuestro modelo es razonable. (f) Interprete cualquier interacción significante. Según la gráfica de probabilidad normal la única interacción significante en este experimento es la AB. 85
  • 88. Sección 5: Diseño Factorial 2k Interaction Plot (data means) for Results -1 1 -1 1 -1 1 -1 1 60 A 40 -1 A 1 20 60 B 40 -1 B 1 20 60 C 40 -1 C 1 20 60 D 40 -1 D 1 20 E (g) ¿Cuáles son sus recomendaciones con respecto a las condiciones en que opera el proceso? Eliminar los factores D y E y realizar más replicas con los factores que resultaron significativos para poder tener un análisis comparativo. Entiendo que si no son significativos pueden ser eliminados del experimento. Esto se puede probar con la gráfica del “main effect”. Main Effects Plot (data means) for Results A B C 50 40 30 Mean of Results 20 10 -1 1 -1 1 -1 1 D E 50 40 30 20 10 -1 1 -1 1 86
  • 89. Sección 5: Diseño Factorial 2k (h) Proyecte el diseño 25 en un problema 2k tomando en cuenta los factores importantes o significativos. Factorial Fit: Results versus A, B, C Estimated Effects and Coefficients for Results (coded units) Term Effect Coef SE Coef T P Constant 30.531 0.3021 101.07 0.000 A 11.813 5.906 0.3021 19.55 0.000 B 33.937 16.969 0.3021 56.17 0.000 C 9.688 4.844 0.3021 16.03 0.000 A*B 7.938 3.969 0.3021 13.14 0.000 S = 1.70884 R-Sq = 99.32% R-Sq(adj) = 99.22% Cube Plot (data means) for Results 42.50 62.25 32.75 52.50 1 B 16.00 20.75 1 C 7.25 10.25 -1 -1 -1 1 A 87
  • 90. Sección 6: Diseño Factorial 2^k con bloques 1. Diseño Factorial 2k con bloques Existen muchas situaciones en las cuales no es posible efectuar todos los tratamientos del experimento factorial bajo las mismas condiciones. En este caso usted puede considerar uno o varios factores como fuentes a ser bloqueadas. Un ejemplo de factores a ser bloqueados pueden ser lotes de materiales, operadores, etc. En los experimentos de diseño factorial 2k vimos la importancia de codificar las variables. Codificamos presumiendo que los factores son de naturaleza continua. Ejemplo: entre el -1 y +1 existe el 0, pero entre Máquina 1 y Máquina 2 no hay nada central. Cuando tengo factores de naturaleza discreta los puntos centrales se duplican aumentando así los costos experimentales. Como todas las combinaciones o tratamientos en un experimento 2k no pueden realizarse bajo las mismas condiciones, tenemos que asignar un subconjunto de los tratamientos a cierto nivel de una fuente de ruido que queremos bloquear. Esto lo conocemos como la técnica de Fundir, donde el tamaño del bloque es más pequeño que el número de tratamientos en una réplica. Por ahora vamos a considerar experimentos 2k contenidos en 2p bloques, donde p < k. En esta estructura solo será posible construir experimentos con un número de bloques equivalentes a una potencia de 2, o sea, 2 bloques (p = 1), 4 bloques (p = 2), 8 bloques (p = 3) y así sucesivamente. Supongamos que se va a realizar un experimento con dos factores cada uno a dos niveles. En el siguiente ejemplo vamos a mostrar dos escenarios con dos distintas notaciones para identificar los tratamientos de este experimento. Si suponemos que un tratamiento toma cierto número de horas lo que resulta en obtener solo dos observaciones cada día, entonces tenemos que preguntarnos que tratamientos ejecutaremos cada día. Una vez contestada esta pregunta, dicha contestación va a determinar la fuente o las fuentes de variación que se van a fundir con el efecto bloque. Ejemplo de Experimento más pequeño 22: 88
  • 91. Sección 6: Diseño Factorial 2^k con bloques b ab (-,+) (+,+) Tenemos 2 Lotes: Lote 1 Lote 2 B (-,-) A (+,-) (1) a b ab (-,+) (+,+) B (-,-) A (+,-) (1) a Escenario 1 Escenario 2 Lote 1 Lote 2 Lote 1 Lote 2 (1) a a (1) ab b ab b En el escenario 1, al seleccionar la diagonal, la misma corresponde a la intersección, por lo tanto, estamos fundiendo el lote con la intersección. Sin embargo, en el escenario 2, el lote esta fundido con el factor A. El lote 1 del escenario 2 tiene los tratamientos cuando el factor A esta en su nivel alto, y el lote 2 tiene los tratamientos cuando el factor A esta en su nivel bajo, por lo tanto, las fuentes bloques y el factor A se encuentran fundidos. La asignación del escenario 2 es una muy pobre ya que sacrifico la información de un efecto principal. Los contrastes ortogonales serían: 89
  • 92. Sección 6: Diseño Factorial 2^k con bloques Contrastes Ortogonales Tratamiento A B AB (1) - - + a + - - b - + - ab + + + Establecemos un dogma en el que si voy a fundir (o tengo que fundir) algo, o sea, perder información, entonces seleccionamos aquella interacción que tenga el mayor número de factores contenidos. En un diseño 23 en bloque, tenemos un experimento con 8 tratamientos y un bloque. En este experimento, seleccionar los tratamientos que componen las caras del cubo para fundir un bloque, no son una buena selecciona ya que estaría fundiendo los efectos principales y no cumpliríamos con el dogma. Ahora, vamos a ver que sucede al hacer las siguientes selecciones: 1) ab c c Tratamientos A B AB (1) - - + Ab + + + ab C - - + Abc + + + (1) Al seleccionar estos tratamientos para el bloque podemos ve que se construye una cara que me divide la cara de A con B. También cómo podemos apreciar los signos de ambos factores son exactamente igual indicando que hay una relación y que el lote esta fundido con AB. Por lo tanto, esta no es una buena selección. 90
  • 93. Sección 6: Diseño Factorial 2^k con bloques 2) a b Tratamiento A C AC ac (1) - - + B + + + Ac - - + b Abc + + + (1) En este caso podemos apreciar que la selección de estos tratamientos me forman una cara que me divide las caras de A y de C, por lo tanto el lote esta fundido con AC. Nos podemos dar cuenta de esto por los signos de los factores indicando que entre ellos hay relación. 3) a Tratamiento A B C ABC c A + - - + B - + - + b C - - + + Abc + + + + a Para este caso podemos notar que se forman dos líneas que cruzan la cara de A y B pero en diferentes direcciones de C. De esta forma no se generan nuevas caras y tampoco se funden los efectos principales, lo que lo hace factibles. Además, podemos ver que se 91
  • 94. Sección 6: Diseño Factorial 2^k con bloques cumple el dogma de fundir la interacción que contiene mayor factores. La práctica común cuando se realizan este tipo de experimento es la de fundir con los bloques aquellos efectos de las interacciones que mayor factores contenga. Ahora, en un experimento 24 en bloque, tenemos un experimento con 16 tratamientos y dos bloques. Nuevamente tenemos que asegurarnos de no seleccionar aquellos tratamientos que formen las caras de los cubos para no fundir los efectos principales, además, de evitar formar nuevas caras. Tomando esto en cuenta hacemos las siguientes selecciones: bc abcd ac cd C ab bd B (1) A ad D Como podemos apreciar, los tratamientos del primer cuadrado son la interacción ABC y el segundo cuadrado son la interacción ABC rotando en el factor D. Si nos fijamos en la tabla podemos notar que los signos de D y de la interacción ABC son iguales indicando que hay una relación entre ellos. 92
  • 95. Sección 6: Diseño Factorial 2^k con bloques Tratamientos A B C D ABC Lote 1 bd - + - + + ad + - - + + cd - - + + + abcd + + + + + Lote 2 (1) - - - - - ab + + - - - bc - + + - - ac + - + - - En experimentos 2k todas las fuentes, tanto efectos principales como las interacciones, tienen un (1) grado de libertad, excepto el error. Si una fuente a bloquearse tiene 2 niveles, fundimos una fuente para contabilizar por ese grado de libertad. Generalizando Factorial 2k en 2p bloques donde 2p bloques es el número de niveles. En un factorial 24 en bloque tengo 4 niveles, el número de niveles podría ser, por ejemplo, el número de lotes. En este experimento tengo 16 tratamientos y 3 grados de libertad, lo que implica que de todas las fuentes que me pueden interesar, 3 de ellas se van a fundir. Ahora, ¿Cuáles tres? Aquí es donde está el reto. Veamos un ejemplo de un factorial 24 con 16 tratamientos y 4 niveles. Se seleccionan 4 tratamientos de los cuales se deben encontrar los 3 efectos a ser fundidos. 93
  • 96. Sección 6: Diseño Factorial 2^k con bloques abc bcd C B (1) A ad D Los efectos de este experimento por número de factores contenidos son: A ABC B AB BC ABD C AC BD ACD D AD CD BCD ABCD 4 6 4 1 De estos 15 efectos, 3 deben tener el mismo signo en cada tratamiento, ya sea positivo (+) o negativo (-). Tabulando tenemos los siguientes resultados: Tratamientos A B C D BC ACD ABD (1) - - - - + - - Abc + + + - + - - Bcd - + + + + - - Ad + - - + + - - Las preguntas claves son: 1) ¿Cómo conseguimos los efectos a ser fundidos?, 2) ¿Qué pasó con el dogma? 94
  • 97. Sección 6: Diseño Factorial 2^k con bloques Contestando la pregunta uno, los efectos a ser fundido los conseguimos proyectando los tratamientos seleccionados uno a la vez, o sea, moviendo un factor a la vez ya sea de su nivel alto a su nivel bajo o viceversa. Ilustrando como conseguimos los efectos en este ejemplo, para el primer efecto proyectamos el factor de A de su nivel alto a su nivel bajo quedándonos los 4 tratamientos fundidos en la interacción BC como se muestra a continuación. abc bcd C B (1) A ad D abc bcd C B (1) A ad D 95
  • 98. Sección 6: Diseño Factorial 2^k con bloques Ahora, buscando la interacción ACD procedemos a proyectar los puntos seleccionados en el factor B. Recuerde que para realizar la segunda proyección tengo que devolver los puntos a su posición original y luego vuelvo a proyectar. Tomando esto en cuenta, la interacción se encontraría así: abc bcd C B (1) A ad D abc bcd C B (1) A ad D Por último, vamos a buscar la interacción ABD proyectando los puntos seleccionados originalmente sobre el factor C. Esto se obtiene como sigue: 96
  • 99. Sección 6: Diseño Factorial 2^k con bloques bcd C B (1) A ad D abc abc bcd C B (1) A ad D Como ya sabemos este es un experimento 24 en bloques de 2p donde 2p es igual a 4, lo que implica que p=2. La variable p es el número de efectos fundidos o generadores independientes, o sea, en este experimento tenemos 2 generadores independientes. Sabemos que este experimento al ser de 4 niveles tiene 3 grados de libertad lo que implica que se tienen que fundir 3 efectos. Como podemos encontrar dos generadores independientes, el tercer factor se puede determinar en base de los dos generadores 97
  • 100. Sección 6: Diseño Factorial 2^k con bloques independientes encontrados. Del ejemplo anterior si ponemos al efecto BC y al efecto ACD como los generadores independientes, obtenemos el tercer generador como sigue: g 3 = g 1g 2 = ( BC)( ACD ) = ABC 2 D = ABC 0 D = ABD Los exponentes pares son equivalentes a tener un exponente de grado 0 y los exponentes impares es equivalente a exponente de grado1. Ahora, si los generadores independientes son ACD y ABD, entonces el tercer generador seria: g 3 = g 1g 2 = (ACD)(ABD) = A 2 BCD 2 = A 0 BCD 0 = BC Si volvemos a las preguntas formuladas anteriormente, nos falta por contestar que paso con el dogma de fundir aquellos efectos que más factores contenga. En este experimento el efecto con más factores es el ABCD. Si tomamos este efecto y un efecto que contenga 3 factores, como por ejemplo ABC, el tercer generador sería: g 3 = g 1g 2 = ( ABCD)( ABC) = A 0 B 0 C 0 D = D Como podemos ver no es una buena selección ya que funde uno de los efectos principales. Ahora si en vez de tomar un efecto que contiene 3 factores, tomamos uno que contenga solo dos factores y mantenemos el efecto ABCD, el tercer generador sería: g 3 = g 1g 2 = (ABCD)(AB) = A 2 B 2 CD = A 0 B 0 CD = CD Podemos notar que se funden dos efectos que contienen solo 2 factores, a diferencia de los efectos encontrados originalmente que dos de ellos contenían 3 factores y uno dos factores. Es por esto que fundir el efecto que más factores tiene a veces puede ser inapropiado ya que funde más efectos con menos factores contenidos. Otro método de construir los bloques es el método de combinación lineal que utiliza la ecuación: L = α1 x 1 + α 2 x 2 + ⋅ ⋅ ⋅ + α k x k 98
  • 101. Sección 6: Diseño Factorial 2^k con bloques Donde xi es el nivel del factor i que aparece en un tratamiento en particular y αi es el exponente que aparece en el factor i en el efecto a ser fundido. Cuando el factor está en su nivel bajo xi=0 y xi=1 cuando el factor está en su nivel alto. Esta ecuación se le conoce como definiendo el contraste. Los tratamientos que producen el mismo valor de L (mod2) se colocaran en el mismo bloque. Debido a que los valores posibles de L (mod2) son 0 y 1, esto asignará los 2k tratamientos a exactamente dos bloques. Usando el ejemplo anterior para el generador 1, ACD, tenemos: L1 = 1X 1 + 0X 2 + 1X 3 + 1X 4 = X 1 + X 3 + X 4 Hay que ir sobre los 16 tratamientos determinando que tratamientos van en que bloque. Hay que recordar que los números pares resultantes equivalen a 0 y los números impares equivalen a 1. Examinando los tratamientos tenemos: ab = 1 + 0 + 0 = 1 (1) = 0 + 0 + 0 = 0 abc = 1 + 0 + 1 = 2 = 0 ac = 1 + 1 + 0 = 2 = 0 a = 1+ 0 + 0 = 1 acd = 1 + 1 + 1 = 3 = 1 bc = 0 + 1 + 0 = 1 b = 0+0+0 = 0 bcd = 0 + 1 + 1 = 2 = 0 ad = 1 + 0 + 1 = 2 = 0 c = 0 +1+ 0 = 1 abd = 1 + 0 + 1 = 2 = 0 bd = 0 + 0 + 1 = 1 d = 0 + 0 +1 = 1 abcd = 1 + 1 + 1 = 3 = 1 cd = 0 + 1 + 1 = 2 = 0 Me dividió los 16 tratamientos en 2 partes, los que son 0 y los que son 1. Ahora evaluamos para el generador 2, BC, y tenemos: L = X 2 + X3 Los tratamientos quedarían como sigue: ab = 1 (1) = 0 abc = 2 = 0 ac = 1 a=0 abd = 1 ad = 0 b =1 acd = 1 bc = 2 = 0 c =1 bcd = 2 = 0 bd = 1 d=0 abcd = 2 = 0 cd = 1 Ahora para determinar cómo formar los bloques consideramos la siguiente figura: 99
  • 102. Sección 6: Diseño Factorial 2^k con bloques g1 g2 0 1 0 1 0 1 Ahora podemos agrupar los tratamientos en los diferentes bloques usando estas combinaciones lineales para estos dos generadores utilizados, por lo tanto, los bloques resultarían de la siguiente manera: L1 = 0 L1 = 0 L1 = 1 L1 = 1 L2 = 0 L2 = 1 L2 = 0 L2 = 0 (1) b D c ad ac A adc bcd cd Bc bd abc abd Abcd ab Este es el bloque principal. Otra forma de determinar los tratamientos que van en los diferentes bloques es que una vez se haya seleccionados los tratamientos iniciales para determinar los generadores, multiplicamos estos tratamientos por el factor por el que se proyectan los tratamientos cuando se están buscando los generadores. Ejemplo: si el bloque principal es multiplicado por el factor B como resultado tenemos el segundo bloque que está en la figura anterior. En otras palabras, si multiplicamos el bloque principal por el factor que no está contenido os resulta en los bloques faltantes. Como forma de repaso vamos a realizar un ejemplo adicional de un experimento 24 en bloques tomando 4 tratamientos diferentes. El ejemplo es como sigue: 100
  • 103. Sección 6: Diseño Factorial 2^k con bloques bc ac C abd B d A D Determinamos los generadores proyectando. Si proyectamos en D tenemos lo siguiente: ac C abd B d A D 101
  • 104. Sección 6: Diseño Factorial 2^k con bloques ac C abd B d A D El generador resultante es el siguiente: Tratamiento A B C ABC Bc - + + - Ac + - + - D - - - - Abd + + - - Ahora, buscando el segundo generador proyectamos en C y tenemos lo siguiente: 102
  • 105. Sección 6: Diseño Factorial 2^k con bloques ac C abd B d A D ac C abd B d A D 103
  • 106. Sección 6: Diseño Factorial 2^k con bloques El generador resultante es: Tratamiento A B D ABD Bc - + - + Ac + - - + D - - + + Abd + + + + Ahora, buscando el tercer generador tenemos: (ABC)(ABD) = A 2 B 2 CD = CD Si L1 = X1 + X 2 + X 3 y L 2 = X1 + X 2 + X 4 , entonces cuando L1 = 0 y L2 = 0 el bloque resultante es el bloque principal que es el que sigue: (1) ab bcd acd Si aplicamos la técnica de multiplicar el bloque principal por el factor que no está contenido tenemos lo siguiente: (1) *c C (1) *b b ab *c → A ab *b → a bcd *c Cd bcd *b cd acd *c abcd acd *b abcd Una sugerencia, para concluir con los diseños de experimentos factoriales 2k en bloques cuando se realizan réplicas, es que podemos fundir cada réplica con una fuente distinta. Esta técnica se le conoce como la Fundición Parcial de Réplicas y se vería representado como se muestra a continuación: 104
  • 107. Sección 6: Diseño Factorial 2^k con bloques Réplica I Réplica II (1) a (1) a ab b Ab b ac c Ac c bc abc Bc abc Bloque y/o ABC Bloque y/o AB Ejemplo utilizando MINITAB: Considere los datos que se muestran en la siguiente tabla. Suponga que es necesario correr el diseño en cuatro bloques con ACDE y BCD (y consecuentemente ABE) fundidos. Analice los datos de este diseño. (1)=7 d=8 e=8 de=6 a=9 ad=10 ae=12 ade=10 b=34 bd=32 be=35 bde=30 ab=55 abd=50 abe=52 abde=53 c=16 cd=18 ce=15 cde=15 ac=20 acd=21 ace=22 acde=20 bc=40 bcd=44 bce=45 bcde=41 abc=60 abcd=61 abce=65 abcde=63 Haciendo el procedimiento en Minitab se obtiene: Full Factorial Design Factors: 5 Base Design: 5, 32 Resolution with blocks: IV Runs: 32 Replicates: 1 Blocks: 4 Center pts (total): 0 Block Generators: ACDE, BCD Alias Structure I Blk1 = ACDE Blk2 = BCD Blk3 = ABE 105
  • 108. Sección 6: Diseño Factorial 2^k con bloques Factorial Fit: Results versus Block, A, B, C, D, E Estimated Effects and Coefficients for Results (coded units) Term Effect Coef Constant 30.5313 Block 1 -0.1562 Block 2 -0.2813 Block 3 0.4687 A 11.8125 5.9062 B 33.9375 16.9687 C 9.6875 4.8438 D -0.8125 -0.4062 E 0.4375 0.2188 A*B 7.9375 3.9688 A*C 0.4375 0.2187 A*D -0.0625 -0.0313 A*E 0.9375 0.4688 B*C 0.0625 0.0312 B*D -0.6875 -0.3438 B*E 0.5625 0.2813 C*D 0.8125 0.4063 C*E 0.3125 0.1563 D*E -1.1875 -0.5938 A*B*C -0.4375 -0.2188 A*B*D 0.3125 0.1563 A*C*D -0.4375 -0.2188 A*C*E 0.3125 0.1562 A*D*E 0.8125 0.4062 B*C*E 0.9375 0.4688 B*D*E 0.1875 0.0938 C*D*E -0.8125 -0.4062 A*B*C*D -0.0625 -0.0312 A*B*C*E 0.1875 0.0937 A*B*D*E 0.9375 0.4687 B*C*D*E -0.9375 -0.4687 A*B*C*D*E -0.1875 -0.0937 S = * Analysis of Variance for Results (coded units) Source DF Seq SS Adj SS Adj MS F P Blocks 3 2.6 2.6 0.86 * * Main Effects 5 11087.9 11087.9 2217.58 * * 2-Way Interactions 10 536.3 536.3 53.63 * * 3-Way Interactions 8 22.5 22.5 2.81 * * 4-Way Interactions 4 14.4 14.4 3.59 * * 5-Way Interactions 1 0.3 0.3 0.28 * * Residual Error 0 * * * Total 31 11664.0 Del Anova se puede observar que los efectos más relevantes son para los factores A, B, C y la interacción AB. Con el fin de comprobar, se realiza entonces el siguiente grafico que nos muestra los efectos principales en el experimento: 106
  • 109. Sección 6: Diseño Factorial 2^k con bloques Normal Probability Plot of the Effects (response is Results, Alpha = .05) 99 Effect Type B Not Significant 95 A Significant 90 C F actor N ame AB A A 80 B B 70 C C Percent 60 D D E E 50 40 30 20 10 5 1 0 5 10 15 20 25 30 35 Effect Lenth's PSE = 0.65625 Eliminando las variables insignificantes en el análisis tenemos: Factorial Fit: Results versus Block, A, B, C Estimated Effects and Coefficients for Results (coded units) Term Effect Coef SE Coef T P Constant 30.5313 0.3151 96.90 0.000 Block 1 -0.1562 0.5458 -0.29 0.777 Block 2 -0.2813 0.5458 -0.52 0.611 Block 3 0.4687 0.5458 0.86 0.399 A 11.8125 5.9062 0.3151 18.74 0.000 B 33.9375 16.9687 0.3151 53.85 0.000 C 9.6875 4.8438 0.3151 15.37 0.000 A*B 7.9375 3.9688 0.3151 12.60 0.000 S = 1.78244 R-Sq = 99.35% R-Sq(adj) = 99.16% Analysis of Variance for Results (coded units) Source DF Seq SS Adj SS Adj MS F P Blocks 3 2.6 2.6 0.86 0.27 0.845 Main Effects 3 11081.1 11081.1 3693.70 1162.61 0.000 2-Way Interactions 1 504.0 504.0 504.03 158.65 0.000 Residual Error 24 76.3 76.3 3.18 Total 31 11664.0 107
  • 110. Sección 6: Diseño Factorial 2^k con bloques Residual Plots for Results Normal Probability Plot of the Residuals Residuals Versus the Fitted Values 99 2 Standardized Residual 90 1 Percent 50 0 10 -1 1 -2 -2 -1 0 1 2 0 15 30 45 60 Standardized Residual Fitted Value Histogram of the Residuals Residuals Versus the Order of the Data 8 2 Standardized Residual 6 1 Frequency 4 0 2 -1 0 -2 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 Standardized Residual Observation Order Cube Plot (data means) for Results 42.50 62.25 32.75 52.50 1 B 16.00 20.75 1 C 7.25 10.25 -1 -1 -1 1 A 108
  • 111. Sección 6: Diseño Factorial 2^k con bloques Main Effects Plot (data means) for Results A B 50 40 30 Mean of Results 20 10 -1 1 -1 1 C 50 40 30 20 10 -1 1 Se observa que la respuesta aumenta en promedio cuando A, B y C están en su nivel alto. 109
  • 112. Sección 7: Experimentos Fraccionarios 2^k 1. Experimentos Fraccionarios 2k A medida que el número de factores en un diseño 2k se incrementa, el número de tratamientos que se deben realizar aumenta rápidamente. Si se tiene un experimento con 5 factores sería un diseño 25 con un total de 32 tratamientos requeridos. Este diseño tiene 5 grados de libertad de los efectos principales y 10 grados de libertad debido a las interacciones. Debido a que a veces es difícil llevar a cabo todos los tratamientos se puede presumir que no todas las interacciones son significativas, por lo tanto, se puede realizar una fracción de los tratamientos. A esto se le conoce como Experimentos Fraccionarios 2k, donde fraccionarios viene de la porción que representa el número de tratamientos que se van a llevar a cabo de todos los tratamientos posibles. Los Experimentos Fraccionarios 2k están basados en un dogma estadístico que se desglosa en los siguientes preceptos: 1. Cuando existen múltiples factores en un proceso, el mismo va a estar explicado primordialmente sólo por algunos de los efectos principales y de las interacciones de orden bajo. 2. No todas las fuentes de variación pueden ser significativas, por lo tanto, el experimento esta conformado por las variables significativas. 3. Se puede combinar las observaciones de dos o más experimentos fraccionarios para generar una secuencia que permita estimar los efectos deseados. Empecemos con un ejemplo para un experimento factorial de 3 factores donde solo hay presupuesto para realizar la mitad de los tratamientos. A este experimento se le llamaría la mitad del factorial o se denotaría como un experimento 23-1. 1 8 de un 23 → = 4 tratamientos 2 2 110
  • 113. Sección 7: Experimentos Fraccionarios 2^k Tratamientos seleccionados: C (a) (b) (c) B (abc) A Realizando la tabla de signos tenemos: Tratamientos A B C AB AC BC ABC a + - - - - + + b - + - - + - + c - - + + - - + abc + + + + + + + Hay una relación porque tienen los mismos signos. De este ejemplo podemos notar que los signos de los cuatro tratamientos son positivos (+) para ABC. Por lo tanto, el efecto ABC se elimina, ha sido sacrificado, ya que sólo fue observado en su nivel alto. Cuando este efecto ocurre se le denomina como generador. También podemos observar que hay tratamientos que son idénticos ya que tienen el mismo signo en los tratamientos como resultado algunos efectos están confundidos. Esto es una consecuencia de haber efectuado solo una fracción de la totalidad de los tratamientos. Del ejemplo anterior tenemos que: A = BC B = AC C = AB Lo que esto nos indica es que cuando estimamos A estamos estimando BC y así sucesivamente con los demás efectos. Cuando dos o más efectos tienen esta propiedad se 111
  • 114. Sección 7: Experimentos Fraccionarios 2^k les conoce como aliases, o sea, que esta estimación se conoce como la estructura de aliases. La estructura de aliases se puede determinar no sólo observando los signos de los efectos es una tabla sino que también se puede determinar usando los efectos generadores. Una vez se conoce(n) el(los) generador(es) se multiplica(n) el(los) efecto(s) de interés por el generador y así se obtiene(n) el(los) alias(es). Del ejemplo anterior tenemos que el generador es ABC, también conocido como generador identidad. Si multiplicamos el generador por los efectos principales obtenemos los aliases de los mismos: A( ABC ) = A 2 BC = BC A = BC B( ABC ) = AB 2 C = AC B = AC C ( ABC ) = ABC 2 = AB C = AB La fracción que contiene el lado positivo es conocida como la fracción principal. Aunque hubiésemos seleccionado los otro cuatro tratamientos que componen un experimento 23, o sea, el otro lado de la fracción, la estructura de aliases hubiese sido la misma ya que ambas fracciones pertenecen a la misma familia. Este experimento es pobre ya que los aliases son los efectos que contienen pocos factores no cumpliendo así con el dogma de fundir aquellos tratamientos que más efectos contenga. Para un experimento factorial que contiene 5 factores tendríamos un total de 32 tratamientos. Si solo es posible realizar la mitad de los tratamientos entonces tendríamos 1 32 de un 2 5 = = 16 ; esto implica que el mejor generador esta dado por la interacción 2 2 que contenga el mayor número de factores. En este caso particular el mejor generador es la interacción ABCDE. Si multiplicamos el factor A por el generador tenemos que A( ABCDE ) = A 2 BCDE = BCDE , por lo tanto, A = BCDE . Si la interacción BCDE sale 112
  • 115. Sección 7: Experimentos Fraccionarios 2^k significativa, entonces se lo adjudicamos al factor A ya que es el que menos letras consume y es mas fácil de realizar. Este tipo de relaciones donde los factores principales tienen como aliases interacciones compuestos por muchos factores se dan cuando k es grande. Los experimentos fraccionarios están clasificados de acuerdo a su resolución. La resolución del experimento nos proporciona una idea del tipo de estructura de aliases que el diseño posee ya que se define por el número de factores del generador con menor numero de factores contenidos en el experimento. Los diseños con particular importancia son aquellos de resolución III, IV y V. A continuación se presenta cada una de estas resoluciones: 1. Diseño de Resolución III. En este tipo de experimentos ninguno de los efectos principales es alias de ningún otro efecto principal pero si son aliases de las interacciones de dos factores. También puede ser que interacciones de dos factores sean aliases entre sí. Un ejemplo de este diseño es el que discutimos previamente de 1 de un 23, o sea, un 23-1. 2 2. Diseño de Resolución IV. En este diseño ningún de los efectos principales es aliases de otro efecto principal ni de las interacciones de dos factores, pero las interacciones de dos factores son aliases entre sí. Un ejemplo es el diseño 24-1 teniendo como generador la interacción ABCD. 3. Diseño de Resolución V. En este tipo de diseño ninguno de los efectos principales ni de las interacciones de dos factores son alias de otro efecto principal o de alguna interacción de dos factores, pero las interacciones de dos factores son alias de las interacciones de tres factores. Un ejemplo es el que vimos para un experimento 25-1 ya que el generador es ABCDE y contiene 5 (V) factores. Algunos diseños fraccionarios necesitan más de un generador. Mientras mayor sea la resolución del experimento mayor cantidad de información podemos obtener de la experimentación. 113
  • 116. Sección 7: Experimentos Fraccionarios 2^k Los experimentos con diseño 2k-1, fracción de un medio, son un recurso adecuado para reducir el número de corridas que se requieren en un experimento pero a veces es común encontrar que fracciones menores proporcionan casi la misma cantidad de información útil pero siendo menos costoso. De forma general, un experimento 2k puede correrse en 1 fracciones de p también conocido como un diseño factorial fraccionado 2 k − p . Por 2 1 1 1 ejemplo, una fracción de se conoce como 2k-2, para se conoce como 2 k −3 , para se 4 8 16 conoce como 2k-4, y así sucesivamente. Mientras mas pequeña es la fracción mas aliases va a tener el factor principal. Si realizamos un experimento de 25 en 2p bloques donde p = 2, entonces tenemos un 1 32 experimento con fracción de un 2 5 = = 8 tratamientos. También se conoce como un 4 4 diseño 2 5−2 = 2 3 = 8 tratamientos. Los factores de este experimento son A, B, C, D y E. A continuación vamos a mostrar de forma grafica los tratamientos y los generadores obtenidos del experimento a través del uso de los cubos. Debemos recordar que una vez seleccionamos los tratamientos podemos encontrar 2 de los generadores, g1 y g 2 , y el tercer generador lo podemos calcular multiplicando los dos generadores encontrados previamente, g 1 ∗ g 2 = g 3 . Los tratamientos seleccionados son: (1) Abc Bcd Ad Be Ace Abde Cde 114
  • 117. Sección 7: Experimentos Fraccionarios 2^k E C B A D Para obtener los generadores vamos a aplicar las técnicas utilizadas en la sección de Diseño Factorial 2k con bloques. Para este ejemplo, comenzamos proyectando el factor C de su nivel bajo a su nivel alto fundiendo los tratamientos en la interacción ABDE como se muestra en la siguiente figura: 115
  • 118. Sección 7: Experimentos Fraccionarios 2^k E C B A D Una vez hallamos realizado las proyecciones podemos determinar el generador viendo cuales factores varían en el sistema. E C B A 116 D
  • 119. Sección 7: Experimentos Fraccionarios 2^k Para buscar el segundo generador debemos devolver los tratamientos a su posición original y entonces proyectamos nuevamente. Proyectamos el factor A de su nivel alto a su nivel bajo y los de nivel bajo a su nivel alto y obtenemos el generador BCE como se muestra a continuación. E C B A D Una vez se haya proyectado, determinamos la interacción que viene a ser el generador. 117
  • 120. Sección 7: Experimentos Fraccionarios 2^k E C B A D Para determinar el tercer generador podemos aplicar la técnica de multiplicar los dos generadores ya encontrados y así obtenemos el tercer generador. Haciendo esto tenernos: G1 ∗ G2 = G3 ABDE * BCE = AB 2 CDE 2 = ACD El tercer generador encontrado es ACD. Para comprobar que los generadores obtenidos son correctos y válidos procedemos a realizar la tabulación de los tratamientos y los factores usando los signos para definir que factores están contenidos en el tratamiento seleccionado. 118
  • 121. Sección 7: Experimentos Fraccionarios 2^k Tratamientos A B C D E ABDE BCE ACD (1) - - - - - - + - abc + + + - - - + - bcd - + + + - - + - ad + - - + - - + - be - + - - + - + - ace + - + - + - + - abde + + - + + - + - cde - - + + + - + - Las tres fuentes sacrificados son los tres generadores encontrados: ABDE, BCE y ACD. Para determinar los alias de los factores principales en este experimento, los obtenemos multiplicando los factores principales por cada uno de los generadores. Tomando como ejemplo el factor A realizamos las diferentes multiplicaciones y obtenemos lo siguiente: A(BCE ) = ABCE A( ABDE ) = BDE A( ACD ) = CD ∴ A = ABCE = BDE = CD Si hacemos eso mismo para cada uno de los factores, los diferentes aliases obtenidos para cada factor son los siguientes: B = CE = ADE = ABCD C = BE = ABCDE = AD D = BCDE = ABE = AC E = BC = ABD = ACDE Como podemos notar el total de fuentes en este experimento son 2 5 − 1 = 31 fuentes. Hasta ahora solo tenemos 23 fuentes, por lo tanto, debemos encontrar aquellas fuentes que no están contempladas. Todos los factores principales ya se encontraron, por lo tanto, procedemos a buscar las interacciones de 2 factores para determinar las que faltan. Entre las interacciones de 2 factores tenemos: AD BC CD AC BE CE 119
  • 122. Sección 7: Experimentos Fraccionarios 2^k Sólo se encontraron 6 interacciones de dos factores. Para determinar las demás interacciones que hacen falta comenzamos determinando una interacción de dos factores que no se ha contemplado aún y se multiplica por los generadores para así obtener parte de las interacciones restantes. La primera interacción de dos factores que no se contempló es AB y si multiplicamos esta interacción por los generadores obtenemos las siguientes interacciones como se muestra a continuación: AB(BCE) = AB 2 CE = ACE AB(ABDE ) = A 2 B 2 DE = DE AB(ACD) = A 2 BCD = BCD ∴ AB = ACE = DE = BCD Ahora tenemos 27 fuentes de las 31 fuentes que componen este experimento. Añadimos las interacciones de dos factores que se encontraron y procedemos a buscar aquellas interacciones de dos factores que aún no se han contemplado. Por lo tanto, las nuevas interacciones de dos factores son: AB y DE. Podemos notar que la interacción AE no está contemplada aún, por lo tanto, procedemos a buscar sus aliases como los hicimos anteriormente. AE(BCE ) = ABCE 2 = ABC AE(ABDE) = A 2 BDE 2 = BD AE(ACD) = A 2 CDE = CDE ∴ AE = ABC = BD = CDE Como podemos notar ya encontramos las 31 fuentes que componen este experimento, determinando así todos los aliases que se muestran a continuación en resumen: 120
  • 123. Sección 7: Experimentos Fraccionarios 2^k A = ABCE = BDE = CD B = CE = ADE = ABCD C = BE = ABCDE = AD D = BCDE = ABE = AC E = BC = ABD = ACDE AB = ACE = DE = BCD AE = ABC = BD = CDE De este experimento podemos concluir que es un experimento con 7 grados de libertad y es un experimento de Resolución III ya que el generador que contiene el menor número de factores es un generador de 3 factores y en este experimento dos de los generadores contienen 3 factores. También podemos observar que mientras más pequeña es la fracción de tratamientos que se van a llevar a cabo más complicada es la relación de los factores. Ejemplo 1. Utilizando MINITAB: Un ingeniero realizó un experimento en el cual se utilizó un diseño 2(5-1) con I=ABCDE para investigar los efectos de cinco factores en la temperatura de un proceso de esterilizacion. Los factores son A, B, C, D y E. Los resultados obtenidos son como siguen: e= -0.63 d=6.79 a= 2.51 ade= 5.47 b= -2.68 bde= 3.45 abe=1.66 abd=5.68 c= 2.06 cde= 5.22 ace=1.22 acd=4.38 bce=-2.09 bcd=4.30 abc=1.93 abcde= 4.05 Para generar la fracción de los efectos que componen este experimento en Minitab seleccionamos la opción de STAT, de forma subsiguiente seleccione DOE luego Factorial y, por ultimo, seleccione Create Factorial Design como se muestra en la siguiente figura: 121
  • 124. Sección 7: Experimentos Fraccionarios 2^k Como consecuencia aparecerá una pantalla, como la que se muestra a continuación, en la cual se especifica el tipo de diseño y el número de factores. Para el ejemplo que estamos evaluando seleccionamos la primera opción, “default generators”, ya que el generador no esta especificado en el problema y tenemos cinco factores. 122
  • 125. Sección 7: Experimentos Fraccionarios 2^k En esta pantalla tenemos una opción de Design en el cual nos permite seleccionar si el diseño se va a correr con todos los tratamientos o solo con una fracción de ellos. Al oprimir el botón de Design aparece la siguiente pantalla: En nuestro ejemplo se estarán efectuando solamente la mitad de los tratamientos requeridos, por lo tanto, seleccionamos la opción de ½ fraction. Para efectos del ejemplo solo tenemos una replica, no hay puntos centrales y solo hay un bloque debido a que las condiciones experimentales se presumen homogéneas. Como resultado se generan los efectos que se muestran en la próxima figura. Como podemos notar se generaron solo 16 efectos. A la hora de ingresar los datos tenemos que tener cuidado ya que debemos tener en cuenta los signos de los factores para saber a que efecto pertenece. Por ejemplo, en el primer tratamiento generado tenemos: A = -1, B = 1, C = -1, D = 1 y E = 1, por lo tanto el tratamiento corresponde a la interacción BDE que tiene un valor de 3.45 (según los datos dados en el enunciado). Así sucesivamente se van ingresando los datos al efecto correspondiente. También podemos notar que el software determinó el generador que esta dado por E = ABCD. 123
  • 126. Sección 7: Experimentos Fraccionarios 2^k Como parte de la información que podemos obtener al generar este diseño es la estructura de aliases que es la siguiente: Alias Structure I + ABCDE A + BCDE B + ACDE C + ABDE D + ABCE E + ABCD AB + CDE AC + BDE AD + BCE AE + BCD BC + ADE BD + ACE BE + ACD CD + ABE CE + ABD DE + ABC 124
  • 127. Sección 7: Experimentos Fraccionarios 2^k Para realizar el análisis de este diseño hay que seleccionar STAT, de forma subsiguiente se selecciona DOE, luego Factorial y, por ultimo, Analyze Factorial Design como se muestra a continuación: La pantalla que aparece a continuación nos permite seleccionar la columna en donde se encuentran los resultados de este experimento. 125
  • 128. Sección 7: Experimentos Fraccionarios 2^k Para obtener las gráficas de normalidad y las graficas de los residuales se selecciona la opción de Graphs del Analyze Factorial Design y se obtiene la siguiente pantalla. Preguntas concernientes al planteamiento: a) Prepare un plano normal de los efectos. ¿Cuál de los efectos aparecen relevantes? Normal Probability Plot of the Effects (response is Color Effect, Alpha = .05) 99 Effect Ty pe Not Significant 95 D Significant 90 F actor N ame A A 80 B B 70 C C Percent 60 D D E E 50 40 30 20 10 5 1 -2 -1 0 1 2 3 4 5 Effect Lenth's PSE = 0.76125 126
  • 129. Sección 7: Experimentos Fraccionarios 2^k En esta gráfica podemos observar que sólo el factor D es significativo. b) Calcule los residuales. Construya la gráfica de probabilidad normal de los residuales y grafique los residuales versus los valores ajustados. Comente sobre las gráficas. Factorial Fit: Color Effect versus A, B, C, D, E Estimated Effects and Coefficients for Color Effect (coded units) Term Effect Coef Constant 2.7075 A 1.3100 0.6550 B -1.3400 -0.6700 C -0.1475 -0.0738 D 4.4200 2.2100 E -0.8275 -0.4138 A*B 1.2750 0.6375 A*C -0.7875 -0.3937 A*D -1.3550 -0.6775 A*E 0.3025 0.1513 B*C 0.1675 0.0838 B*D 0.2450 0.1225 B*E 0.2875 0.1437 C*D -0.7125 -0.3562 C*E -0.2400 -0.1200 D*E 0.0875 0.0437 S = * Analysis of Variance for Color Effect (coded units) Source DF Seq SS Adj SS Adj MS F P Main Effects 5 95.02 95.02 19.004 * * 2-Way Interactions 10 19.67 19.67 1.967 * * Residual Error 0 * * * Total 15 114.69 Como podemos notar no es posible obtener las graficas de normalidad y residuales debido a que no hay error ya que en este experimento no hay réplicas, además, que no todos los tratamientos se llevaron a cabo, es por esto que los grados de libertad del error son cero. Para poder contestar esta pregunta es necesario eliminar de mi análisis todos aquellos factores que no son significativos en mi experimento ya que con todos los factores incluidos el error me da a 0 y no tengo P-values ni F. Según la grafica de normalidad de los efectos el único factor significativo es D, por lo tanto, se mantienen los factores principales y todas las interacciones en las cuales el factor D este contenido. 127
  • 130. Sección 7: Experimentos Fraccionarios 2^k Esto lo podemos conseguir seleccionando la opción de Term en la pantalla de Analyze Factorial Design. Al oprimir esta opción aparece la siguiente pantalla. Seleccionamos solo los factores principales y las interacciones que contienen al factor D y seleccionamos OK. Los resultados obtenidos son los siguientes: Factorial Fit: Resultados versus A, B, C, D, E Estimated Effects and Coefficients for Resultados (coded units) Term Effect Coef SE Coef T P Constant 2.7075 0.2098 12.91 0.000 A 1.3100 0.6550 0.2098 3.12 0.026 B -1.3400 -0.6700 0.2098 -3.19 0.024 C -0.1475 -0.0738 0.2098 -0.35 0.739 D 4.4200 2.2100 0.2098 10.54 0.000 E -0.8275 -0.4138 0.2098 -1.97 0.106 A*B 1.2750 0.6375 0.2098 3.04 0.029 A*D -1.3550 -0.6775 0.2098 -3.23 0.023 B*D 0.2450 0.1225 0.2098 0.58 0.585 C*D -0.7125 -0.3563 0.2098 -1.70 0.150 D*E 0.0875 0.0438 0.2098 0.21 0.843 S = 0.839035 R-Sq = 96.93% R-Sq(adj) = 90.79% Analysis of Variance for Resultados (coded units) 128
  • 131. Sección 7: Experimentos Fraccionarios 2^k Source DF Seq SS Adj SS Adj MS F P Main Effects 5 95.018 95.018 19.0037 26.99 0.001 2-Way Interactions 5 16.148 16.148 3.2296 4.59 0.060 Residual Error 5 3.520 3.520 0.7040 Total 15 114.686 Effects Plot for Resultados Alias Structure I + A*B*C*D*E A + B*C*D*E B + A*C*D*E C + A*B*D*E D + A*B*C*E E + A*B*C*D A*B + C*D*E A*D + B*C*E B*D + A*C*E C*D + A*B*E D*E + A*B*C Normal Probability Plot of the Standardized Effects (response is Resultados, Alpha = .05) 99 Effect Ty pe Not Significant 95 Significant D 90 F actor N ame A A A 80 B B AB C C 70 D D Percent 60 E E 50 40 30 20 B 10 AD 5 1 -5.0 -2.5 0.0 2.5 5.0 7.5 10.0 Standardized Effect 129
  • 132. Sección 7: Experimentos Fraccionarios 2^k Residual Plots for Resultados Normal Probability Plot of the Residuals Residuals Versus the Fitted Values 99 0.6 90 0.3 Residual Percent 50 0.0 10 -0.3 1 -0.6 -1.0 -0.5 0.0 0.5 1.0 -2 0 2 4 6 Residual Fitted Value Histogram of the Residuals Residuals Versus the Order of the Data 4 0.6 3 Frequency 0.3 Residual 2 0.0 1 -0.3 0 -0.6 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Residual Observation Order Como podemos observar en la gráfica de normalidad, aumentó el número de efectos significativos debido a la eliminación de las interacciones que no componían el efecto significativo inicial generando así replicas con las cuales se pudo estimar el error. Ahora los efectos significativos en el experimento son A, B, D, AB y AD. c) Si cualquier factor es despreciable, colapse el diseño a un 2^(5-1) full factorial en los factores significativos. Comente en los resultados del diseño e interprete los resultados. Como el número de efectos significativos obtenidos en el experimento original fueron 3 factores (A, B y D) entonces creamos un diseño full factorial 2^3 de la siguiente manera: Esta vez utilizamos solo 3 efectos y sería: 130
  • 133. Sección 7: Experimentos Fraccionarios 2^k En la opción de Design, seleccionamos un Full Factorial. Pero en la opción de Number of replicates seleccionamos dos replicas ya que el efecto de eliminar las variables no significativas (C y E) me generan replicas a los tratamientos que resultaron significativos. La tabla resultante sería: 131
  • 134. Sección 7: Experimentos Fraccionarios 2^k Como podemos notar el software genera 3 factores A, B, C, pero debemos tener cuidado ya que el factor C generado corresponde al factor D en el experimento que fue uno de los factores significativos. Se hace el cambio en el nombre para evitar confusiones al entrar la data. El total de tratamientos generados son 8 pero duplicados ya que tenemos dos réplicas. Para determinar que tratamientos son replicas de otros tratamientos procedemos a eliminar aquellos factores que no salieron significativos de utilizando el método de cubos. Primero procedemos a identificar todos los tratamientos del experimento original 2^(5-1) de la siguiente manera: 132
  • 135. Sección 7: Experimentos Fraccionarios 2^k bce abcde + ace cde abe bde e ade E abc bcd c C acd b abd __ B a d A __ D + Ahora, identificando los tratamientos generados aleatoriamente por MINITAB para el diseño 2^3 tenemos: 133
  • 136. Sección 7: Experimentos Fraccionarios 2^k + E C b ab bd abd __ B (1) a A d ad __ D + Para obtener las replicas lo que se hace es eliminar factores uniendo caras, para poder identificar como se van obteniendo las replicas del problema usando los datos obtenidos de los tratamientos del experimento original vamos a unir los dos bloques en donde los tratamientos color azul son los tratamientos actuales y los rojos van a ser las replicas de los mismos. Los datos obtenidos son para los tratamientos de rojo. Uniendo ambos bloques tenemos: 134
  • 137. Sección 7: Experimentos Fraccionarios 2^k bce abcde + ace cde abe bde e ade E abc bcd c C acd b ab bd abd __ B (1) a A d ad __ D + Comenzamos eliminando uno de los factores que inicialmente no fueron significativos. Escogemos el factor E y eliminamos de esta manera: bce abcde + ace cde abe bde e ade E abc bcd c C acd b ab bd abd __ B (1) a A d ad __ D + 135
  • 138. Sección 7: Experimentos Fraccionarios 2^k Obtenemos el siguiente resultado: bce abc abcde bcd c ace C cde acd b ab = abe abd B bd=bde (1)=e a A d ad=ade __ D + Nos resta eliminar el otro factor no significativo que fue el factor C y esto lo hacemos de la siguiente manera: bce abc abcde bcd c ace C cde acd b ab = abe abd B bd=bde (1)=e a A d ad=ade __ D + Resultando en: b=bce ab = abe=abc bd=bde=bcd abd=abcde B (1)=e=c a=ace d=cde ad=ade=acd A __ D + 136
  • 139. Sección 7: Experimentos Fraccionarios 2^k Los tratamientos de este diseño y sus replicas correspondientes a los datos de los tratamientos del diseño anterior (se toma los valores de esos tratamientos como réplicas) están dados en la siguiente gráfica: Tratamientos actuales Replica 1 Replica 2 AD ADE ACD D D CDE A A ACE AB ABC ABE BD BCD BDE B B BCE ABD ABD ABCDE (1) E C Factorial Fit: Results versus A, B, D Estimated Effects and Coefficients for Results (coded units) Term Effect Coef SE Coef T P Constant 2.7244 0.2522 10.80 0.000 A 1.3437 0.6719 0.2522 2.66 0.029 B -1.3063 -0.6531 0.2522 -2.59 0.032 D 4.3863 2.1931 0.2522 8.70 0.000 A*B 1.3087 0.6544 0.2522 2.59 0.032 A*D -1.3888 -0.6944 0.2522 -2.75 0.025 B*D 0.2112 0.1056 0.2522 0.42 0.686 A*B*D -0.2737 -0.1369 0.2522 -0.54 0.602 S = 1.00873 R-Sq = 92.87% R-Sq(adj) = 86.63% Analysis of Variance for Results (coded units) Source DF Seq SS Adj SS Adj MS F P Main Effects 3 91.005 91.0046 30.3349 29.81 0.000 2-Way Interactions 3 14.744 14.7443 4.9148 4.83 0.033 3-Way Interactions 1 0.300 0.2998 0.2998 0.29 0.602 Residual Error 8 8.140 8.1403 1.0175 Pure Error 8 8.140 8.1404 1.0175 Total 15 114.189 Effects Plot for Results Alias Structure I A B D A*B A*D B*D A*B*D 137
  • 140. Sección 7: Experimentos Fraccionarios 2^k De los resultados podemos notar que los efectos significativos fueron los efectos principales (A, B y D) y las interacciones AB y AD. Este resultado es exactamente igual al ejercicio anterior pero una vez se hubiesen eliminado los efectos de las interacciones no significativos. Comprobando este resultado analizamos los gráficos resultantes. Normal Probability Plot of the Standardized Effects (response is Results, Alpha = .05) 99 Effect Type Not Significant 95 Significant 90 C F actor N ame A A 80 B B A C D 70 Percent AB 60 50 40 30 B 20 10 AC 5 1 -4 -2 0 2 4 6 8 10 Standardized Effect **Recuerde que aquí el efecto C corresponde al factor significativo D, por lo tanto, C=D y AC=AD. 138
  • 141. Sección 7: Experimentos Fraccionarios 2^k Residual Plots for Results Normal Probability Plot of the Residuals Residuals Versus the Fitted Values 99 1 90 Residual Percent 50 0 10 -1 1 -2 -1 0 1 2 -2 0 2 4 6 Residual Fitted Value Histogram of the Residuals Residuals Versus the Order of the Data 4 1 3 Frequency Residual 2 0 1 -1 0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Residual Observation Order Ejemplo 2. tomado del libro “Design and Analysis of Experiments” de Douglas C. Montgomery, 6ta edición. Problema 8-6, pag. 336 Use un diseño 2^ (5-2) para investigar el efecto de A=condensación de temperatura, B= cantidad de material 1, C= volumen del solvente, D=tiempo de Condensación, y E=cantidad de material 2 en rendimiento. Los resultados obtenidos son como sigue: e= 23.2 ad=16.9 cd=23.8 bde=16.8 ab=15.5 bc=16.2 ace=23.4 abcde=18.1 (a) Verifique que los generadores del diseño utilizados son I=ACE and I=BDE. Este ejercicio se corre casi exactamente igual al anterior utilizando Stat, selecciona DOE, Factorial y luego Create a Factorial Design. La diferencia es que en vez de dejar que el software genere los generadores del experimento, los mismos se van a ingresar ya que son conocidos. Los pasos serían: 139
  • 142. Sección 7: Experimentos Fraccionarios 2^k En la opción Designs se selecciona ¼ fraction. Una vez en esta opción seleccionamos la opción de Generators…, para ingresar los generadores dados. 140
  • 143. Sección 7: Experimentos Fraccionarios 2^k Los resultados son: Fractional Factorial Design Factors: 5 Base Design: 5, 8 Resolution: III Runs: 8 Replicates: 1 Fraction: 1/4 Blocks: 1 Center pts (total): 0 * NOTE * Some main effects are confounded with two-way interactions. Design Generators: D = AB, E = AC Alias Structure I + ABD + ACE + BCDE Por lo tanto, debo rehacer mi diseño para incluir los generadores deseados. Fractional Factorial Design Factors: 5 Base Design: 3, 8 Resolution: III Runs: 8 Replicates: 1 Fraction: 1/4 Blocks: 1 Center pts (total): 0 * NOTE * Some main effects are confounded with two-way interactions. Design Generators: D = ABC, E = AC Alias Structure (up to order 3) I + ACE + BDE 141
  • 144. Sección 7: Experimentos Fraccionarios 2^k (b) Escriba las relaciones y los aliases completes definidos para este diseño. A = CE = BCD = ABDE B = DE = ACD = ABCE C = AE = ABD = BCDE D = BE = ABC = ACDE E = AC = BD = ABCDE AB = CD = ADE = BCE AD = BC = ABE = CDE ABCD (c) Estime los efectos principales. Estimated Effects and Coefficients for Response (coded units) Term Effect Coef Constant 19.238 A -1.525 -0.763 B -5.175 -2.588 C 2.275 1.138 D -0.675 -0.337 E 2.275 1.138 A*B 1.825 0.913 A*D -1.275 -0.637 (d) Prepare un análisis de la tabla de varianza. Verifique que las interacciones AB y AD están disponibles para usarse como error. Factorial Fit: Response versus A, B, C, D, E Estimated Effects and Coefficients for Response (coded units) Term Effect Coef SE Coef T P Constant 19.238 0.7871 24.44 0.002 A -1.525 -0.763 0.7871 -0.97 0.435 B -5.175 -2.588 0.7871 -3.29 0.081 C 2.275 1.138 0.7871 1.45 0.285 D -0.675 -0.337 0.7871 -0.43 0.710 E 2.275 1.137 0.7871 1.45 0.285 S = 2.22626 R-Sq = 88.95% R-Sq(adj) = 61.34% Analysis of Variance for Response (coded units) Source DF Seq SS Adj SS Adj MS F P Main Effects 5 79.826 79.826 15.965 3.22 0.254 Residual Error 2 9.913 9.913 4.956 Total 7 89.739 142
  • 145. Sección 7: Experimentos Fraccionarios 2^k (e) Grafique los residuales versus los valores estimados. Además, construya una grafica de probabilidad normal de los residuales. Residual Plots for Response Normal Probability Plot of the Residuals Residuals Versus the Fitted Values 99 2 90 1 Residual Percent 50 0 10 -1 1 -2 -3.0 -1.5 0.0 1.5 3.0 15.0 17.5 20.0 22.5 25.0 Residual Fitted Value Histogram of the Residuals Residuals Versus the Order of the Data 2.0 2 1.5 1 Frequency Residual 1.0 0 0.5 -1 0.0 -2 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 1 2 3 4 5 6 7 8 Residual Observation Order 143
  • 146. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas 1. Experimento Gauge R & R. Este tipo de experimento se usa para estudiar los componentes de variabilidad en un sistema de medida. Los componentes de usual interés son repetibilidad y reproducibilidad. La repetibilidad está asociada al instrumento, refleja la variación observada cuando la misma parte es medida por el mismo operador. La reproducibilidad refleja la variabilidad adicional en el sistema de medida, la cual resulta del uso del instrumento por el operador. El modelo esta dado por la ecuación I, la ecuación II muestra los componentes de varianza. Es el más sencillo y consiste en analizar un solo factor evaluado en diferentes niveles, de manera que se compara las medias de la respuesta en cada uno de esos niveles y se establece si hay diferencia entre ellas. Yijk = µ + τ i + β j + (τβ )ij + ε îjk I Donde: τ i = Parte o la pieza que está siendo medida β j = Personas u operadores que miden las partes (τβ )ij = Interacción entre las piezas y el operador ε ijk = Error debido al instrumento de medida En cuanto a los componentes de varianza tenemos: σ y 2 = σ τ 2 + σ β 2 + σ τβ 2 + σ ε 2 II Donde: σ τ 2 = Componente de varianza para la parte o pieza σ β 2 = Componente de varianza para el operador o persona σ τβ 2 = Componente de varianza para la interacción entre la persona y la pieza σ ε 2 = Componente de varianza para el error 144
  • 147. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas Medias El interés de este tipo de experimento es saber cuanta varianza aporta cada uno de los componentes. Las hipótesis en cuestión se describen a continuación: H0 : στ 2 = 0 H1 : σ τ 2 ≠ 0 H0 : σ β 2 = 0 H1 : σ β 2 ≠ 0 H 0 : σ τβ 2 = 0 H1 : σ τβ 2 ≠ 0 La aspiración máxima del experimento es que toda la variabilidad se deba a las piezas de manera que se pueda concluir que el instrumento es capaz de distinguir entre diferentes niveles de productos. La calibración de un instrumento está asociada a la exactitud, la precisión está asociada al experimento Gauge R & R. A continuación se ilustran los conceptos de precisión y exactitud: 145
  • 148. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas Este experimento es completamente aleatorio, es decir, además de que las corridas se deben realizar de manera aleatoria, los factores involucrados (piezas y personas) son aleatorios porque representan una muestra tomada de una población mayor sobre la cual se desea hacer inferencia. Ejemplo 1 Para realizar la experimentación concerniente a la deshidratación de setas, el ingeniero del proceso de deshidratación de la empresa Mush, realizó un experimento para validar la balanza donde se pesan las mismas. Se tomo una balanza digital, se tomaron 5 pesas avaladas por el ANSI (American National Standards Institute). Los pesos a medir fueron de 100, 50, 20, 10 y 5 gramos (la balanza se uso para tomar pesos de las setas entre 25 y 100 gramos); las mediciones se hicieron por dos operarios y se realizaron 10 repeticiones. Con el fin de asegurar la aleatoriedad del experimento, se utilizo el programa Minitab. A continuación se presenta el procedimiento realizado por el experimentador para hacer los arreglos aleatorios: 1. Se busco la opción de crear un experimento factorial completo, asumiendo como factores los operarios y los diferentes pesos, donde los operarios son un factor con 2 niveles y los pesos son un factor con 5 niveles. La figura ilustra el procedimiento en Minitab: 146
  • 149. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas 2. Se hizo click en la opción create factorial design para obtener los arreglos aleatorios. La ventana desplegada se muestra en la siguiente figura, donde se escoge la opción de general full factorial design y se pone el número 2 en la casilla de number of factors, luego se hace click en la opción designs para especificar el tipo de diseño que se desea; en la casilla correspondiente al nombre del factor A se puso el nombre del factor personas, así mismo en la siguiente casilla se puso el nombre del factor piezas; luego en la casilla correspondiente al número de niveles por factor (number of levels), se puso dos niveles para las personas (porque son dos quienes van a tomar los pesos) y 5 niveles para las piezas (5, 10, 20, 50 y 100 gr). En la casilla correspondiente al número de replicas se puso un total de 10 que son las deseadas por el experimentador : 147
  • 150. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas 3. Al oprimir el botón de ok en las anteriores ventanas se obtiene entonces el siguiente arreglo. Minitab despliega en la columna de piezas valores del 1 al 5, para efectos de visualización, se cambiaron los valores de manera que se vieran los pesos. El valor de 1 corresponde al peso más alto (100) y el de 5 al más bajo (5). Se tomaron las medidas de acuerdo a los arreglos y se obtuvieron las respuestas ingresadas bajo la columna de Medidas de la Balanza: StdOrder RunOrder PtType Blocks Piezas Personas Medidas de la Balanza 74 1 1 1 50 2 50.01 22 2 1 1 100 2 99.99 31 3 1 1 100 1 99.99 40 4 1 1 5 2 5.00 71 5 1 1 100 1 99.99 55 6 1 1 20 1 19.99 69 7 1 1 5 1 5.00 50 8 1 1 5 2 5.00 11 9 1 1 100 1 99.99 28 10 1 1 10 2 10.00 98 11 1 1 10 2 10.00 95 12 1 1 20 1 20.00 21 13 1 1 100 1 99.99 20 14 1 1 5 2 5.00 57 15 1 1 10 1 9.99 66 16 1 1 20 2 20.00 7 17 1 1 10 1 10.00 2 18 1 1 100 2 99.99 32 19 1 1 100 2 99.99 61 20 1 1 100 1 99.99 44 21 1 1 50 2 50.01 63 22 1 1 50 1 50.01 16 23 1 1 20 2 20.00 18 24 1 1 10 2 10.00 12 25 1 1 100 2 99.99 81 26 1 1 100 1 99.99 86 27 1 1 20 2 20.00 91 28 1 1 100 1 99.99 51 29 1 1 100 1 99.99 70 30 1 1 5 2 5.00 87 31 1 1 10 1 10.00 148
  • 151. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas 49 32 1 1 5 1 5.00 82 33 1 1 100 2 99.99 43 34 1 1 50 1 50.01 60 35 1 1 5 2 5.00 97 36 1 1 10 1 10.00 3 37 1 1 50 1 50.01 52 38 1 1 100 2 100.00 76 39 1 1 20 2 20.00 56 40 1 1 20 2 20.01 30 41 1 1 5 2 5.00 9 42 1 1 5 1 5.00 80 43 1 1 5 2 5.00 100 44 1 1 5 2 5.00 73 45 1 1 50 1 50.00 37 46 1 1 10 1 10.00 23 47 1 1 50 1 50.01 64 48 1 1 50 2 50.01 19 49 1 1 5 1 5.00 68 50 1 1 10 2 10.00 90 51 1 1 5 2 5.00 94 52 1 1 50 2 50.01 25 53 1 1 20 1 20.00 26 54 1 1 20 2 20.00 83 55 1 1 50 1 50.01 29 56 1 1 5 1 5.00 48 57 1 1 10 2 10.00 8 58 1 1 10 2 10.00 15 59 1 1 20 1 20.01 72 60 1 1 100 2 99.99 27 61 1 1 10 1 10.00 47 62 1 1 10 1 10.00 4 63 1 1 50 2 50.01 17 64 1 1 10 1 9.99 67 65 1 1 10 1 10.00 39 66 1 1 5 1 5.00 45 67 1 1 20 1 20.01 6 68 1 1 20 2 20.01 93 69 1 1 50 1 50.01 10 70 1 1 5 2 5.01 33 71 1 1 50 1 50.01 14 72 1 1 50 2 50.00 149
  • 152. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas 96 73 1 1 20 2 20.00 89 74 1 1 5 1 5.00 1 75 1 1 100 1 99.99 79 76 1 1 5 1 5.00 42 77 1 1 100 2 99.99 41 78 1 1 100 1 99.99 24 79 1 1 50 2 50.01 53 80 1 1 50 1 50.01 77 81 1 1 10 1 10.00 84 82 1 1 50 2 50.01 99 83 1 1 5 1 5.00 46 84 1 1 20 2 20.00 5 85 1 1 20 1 20.01 36 86 1 1 20 2 20.01 88 87 1 1 10 2 10.00 34 88 1 1 50 2 50.01 13 89 1 1 50 1 50.01 38 90 1 1 10 2 10.00 35 91 1 1 20 1 20.01 54 92 1 1 50 2 50.01 92 93 1 1 100 2 99.99 78 94 1 1 10 2 10.00 85 95 1 1 20 1 20.01 75 96 1 1 20 1 20.01 65 97 1 1 20 1 20.01 62 98 1 1 100 2 99.99 59 99 1 1 5 1 5.00 58 100 1 1 10 2 10.00 4. Luego para realizar el análisis de los datos se ingresa al menú de stat, quality tools, gauge study y luego se hace click en Gauge R & R study (crossed) como muestra la figura: 150
  • 153. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas 5. Al hacer click se despliega una pantalla donde en la primera casilla se ingresa la columna correspondiente a las piezas, en la segunda (operators) se ingresa la columna correspondiente a las personas que van a realizar el experimento, finalmente en la casilla de measurement data se ingresa la columna correspondiente a las respuestas (medidas de la balanza). Se hace click en la opción de anova para hacer el análisis de varianza. 6. Después de dar click en el botón de ok, se obtiene la siguiente respuesta: 151
  • 154. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas Gage R&R Study - ANOVA Method Two-Way ANOVA Table With Interaction Source DF SS MS F P Piezas 4 123578 30894.5 1669974646 0.000 Personas 1 0 0.0 0 0.828 Piezas * Personas 4 0 0.0 1 0.233 Repeatability 90 0 0.0 Total 99 123578 Gage R&R %Contribution Source VarComp (of VarComp) Total Gage R&R 0.00 0.00 Repeatability 0.00 0.00 Reproducibility 0.00 0.00 Personas 0.00 0.00 Personas*Piezas 0.00 0.00 Part-To-Part 1544.73 100.00 Total Variation 1544.73 100.00 Se observa un valor P de 0 para las piezas, 0.828 para los operarios y de 0.233 para la interacción pesos-operarios. Estos valores permiten concluir que la hipótesis nula para las piezas se rechaza, es decir, la variabilidad del experimento se debe a la diferencia entre las piezas y la balanza entonces, tiene la capacidad de diferenciar entre varios tipos de piezas, alcanzando así el propósito del experimento, es decir que la balanza puede ser utilizada para medir objetos en un rango de 5 a 100 gramos con precisión. Los valores de P para los operarios y la interacción entre pesos y operarios muestran que estos no aportan una variación significativa al experimento. En la figura se observa también la contribución de variación de cada uno de los componentes y se ratifica que la variación total se debe a las piezas. Lo anterior muestra que la balanza es precisa. El experimentador observó que la calibración de la misma se hace manualmente, la balanza tiene en una esquina un dispositivo con una burbuja de aire que debe ser puesta en la mitad del círculo para asegurar la calibración. 2. Reglas para obtener las medias cuadradas esperadas (EMS: Expected mean squares) 152
  • 155. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas 153
  • 156. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas 154
  • 157. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas 155
  • 158. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas 156
  • 159. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas 157
  • 160. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas Ejemplo 1 (Tomado del libro Design and analysis of Experiments, de Douglas C. Montgomery, 6 edición, página 523) Considere un experimento factorial con cuatro factores, donde el factor A tiene a niveles, el factor B tiene b niveles, el factor C tiene c niveles, el factor D tiene d niveles y hay n replicas. Escriba las sumas de cuadrados, los grados de libertad y las medias cuadradas esperadas para los siguientes casos: a) A, B, C, y D son factores fijos. b) A, B, C, y D son factores aleatorios. c) A es fijo y B, C, y D son aleatorios. La suma de cuadrados y los grados de libertad son iguales para las partes a, b y c 158
  • 161. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas Fuente de variación Suma de cuadrados Grados de libertad A SSA a-1 B SSB b-1 C SSC c-1 D SSD d-1 AB SSAB (a-1)(b-1) AC SSAC (a-1)(c-1) AD SSAD (a-1)(d-1) BC SSBC (b-1)(c-1) BD SSBD (b-1)(d-1) CD SSCD (c-1)(d-1) ABC SSABC (a-1)(b-1)(c-1) ABD SSABD (a-1)(b-1)(d-1) ACD SSACD (a-1)(c-1)(d-1) BCD SSBCD (b-1)(c-1)(d-1) ABCD SSABCD (a-1)(b-1)(c-1)(d-1) a) Para el caso donde A, B, C, y D son factores fijos : Componente de varianza para el factor fijo τi Factores F F F F R EMS a b c d e i j k l m τi 0 B c d n σ2 + [bcdn Σ τ2i] / (a-1) βj a 0 c d n σ2 + [acdn Σ β2j] / (b-1) γk a B 0 d n σ2 + [abdn Σ γ2k] / (c-1) δl a B c 0 n σ2 + [abcn Σ δ2l] / (d-1) (τβ)ij 0 0 c d n σ + [cdn ΣΣ (τβ)2ij] / (a-1) (b-1) 2 (τγ)ik 0 B 0 d n σ2 + [bdn ΣΣ (τγ)2ik] / (a-1) (c-1) (τδ)il 0 B c 0 n σ2 + [bcn ΣΣ (τδ)2il] / (a-1) (d-1) (βγ)jk a 0 0 d n σ2 + [adn ΣΣ (βγ)2jk] / (b-1) (c-1) (βδ)jl a 0 c 0 n σ2 + [acn ΣΣ (βδ)2jl] / (b-1) (d-1) (γδ)kl a B 0 0 n σ2 + [abn ΣΣ (γδ)2jl] / (c-1) (d-1) (τβγ)ijk 0 0 0 d n σ + [dn ΣΣΣ (τβγ)2 ijl] / (a-1) (b-1) (c-1) 2 (τβδ)ijl 0 0 c 0 n σ2 + [dn ΣΣΣ (τβδ)2 ijl] / (a-1) (b-1) (d-1) (τγδ)ikl 0 B 0 0 n σ2 + [dn ΣΣΣ (τγδ)2 ikl] / (a-1) (c-1) (d-1) (βγδ)jkl a 0 0 0 n σ2 + [dn ΣΣΣ (βγδ)2 jkl] / (b-1) (c-1) (d-1) (τβγδ)ijkl 0 0 0 0 n σ2 + [dn ΣΣΣΣ (τβγδ)2 ijkl] / (a-1) (b-1) (c-1) (d-1) ε(ijkl)m 1 1 1 1 1 σ2 b) Para el caso donde A, B, C, y D son factores aleatorios: 159
  • 162. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas Factores R R R R R EMS a b c d e i j k l m τi 1 b c D n σ2+nσ2τβγδ +bnσ2τ γδ +cnσ2τβδ +dnσ2τ βγ +bcnσ2 τ δ +bdnσ2 τ γ +cdnσ2τβ +bcdnσ2 τ βj a 1 c d n σ2+nσ2τβγδ +anσ2βγδ +cnσ2τβδ +dnσ2τ βγ +acnσ2 βδ +adnσ2βγ +cdnσ2τβ +acdnσ2β γk a b 1 d n σ2 + nσ2 τβγδ + anσ2 βγδ + dnσ2 τβγ + abnσ2 τδ + adnσ2 βγ + cnσ2 τγ + abdnσ2 δ δl a b c 1 n σ2 + nσ2 τβγδ + anσ2 βγδ + cnσ2 τβδ + abnσ2 τδ + acnσ2 βδ + bcnσ2 τδ + abcnσ2 δ (τβ)ij 1 1 c d n σ2 + nσ2 τβγδ + cnσ2 τβδ + dnσ2 τβγ + cdnσ2 τβ (τγ)ik 1 b 1 d n σ2 + nσ2 τβγδ + bnσ2 τγδ + dnσ2 τβγ + bcnσ2 τγ (τδ)il 1 b c 1 n σ2 + nσ2 τβγδ + bnσ2 τγδ + cnσ2 τβδ + bcnσ2 τδ (βγ)jk a 1 1 d n σ2 + nσ2 τβγδ + anσ2 βγδ + dnσ2 τβδ + adnσ2 βγ (βδ)jl a 1 c 1 n σ2 + nσ2 τβγδ + anσ2 βγδ + cnσ2 τβδ + acnσ2 βδ (γδ)kl a b 1 1 n σ2 + nσ2 τβγδ + anσ2 βγδ + abnσ2 γδ (τβγ)ijk 1 1 1 d n σ2 + nσ2 τβγδ + dnσ2 τβγ (τβδ)ijl 1 1 c 1 n σ2 + nσ2 τβγδ + cnσ2 τβδ (τγδ)ikl 1 b 1 1 n σ2 + nσ2 τβγδ + bnσ2 τγδ (βγδ)jkl a 1 1 1 n σ2 + nσ2 τβγδ + anσ2 βγδ (τβγδ)ijkl 1 1 1 1 n σ2 + nσ2 τβγδ ε(ijkl)m 1 1 1 1 1 σ2 c) Para el caso donde A es fijo y B, C, y D son aleatorios: Factores F R R R R EMS a b c d e i j k l m τi 0 b c d n σ2+nσ2τβγδ +bnσ2τ γδ +cnσ2τβδ +dnσ2τ βγ +bcnσ2 τ δ +bdnσ2 τ γ +cdnσ2τβ +(bcdnΣτ2i)/(a-1) βj a 1 c d n σ2 + anσ2 βγδ + acnσ2 βδ + adnσ2 βγ + abdnσ2 β γk a b 1 d n σ2 + anσ2 βγδ + abnσ2 δγ + adnσ2 βγ + abdnσ2 δ δl a b c 1 n σ2 + anσ2 βγδ + abnσ2 δγ + acnσ2 βδ + abcnσ2 δ (τβ)ij 0 1 c d n σ2 + nσ2 τβγδ + cnσ2 τβδ + dnσ2 τβγ + cdnσ2 τβ (τγ)ik 0 b 1 d n σ2 + nσ2 τβγδ + bnσ2 τγδ + dnσ2 τβγ + bdnσ2 τγ (τδ)il 0 b c 1 n σ2 + nσ2 τβγδ + bnσ2 τγδ + cnσ2 τβδ + bcnσ2 τδ (βγ)jk a 1 1 d n σ2 + anσ2 βγδ + adnσ2 βγ (βδ)jl a 1 c 1 n σ2 + anσ2 βγδ + acnσ2 βδ (γδ)kl a b 1 1 n σ2 + anσ2 βγδ + abnσ2 γδ (τβγ)ijk 0 1 1 d n σ2 + nσ2 τβγδ + dnσ2 τβγ (τβδ)ijl 0 1 c 1 n σ2 + nσ2 τβγδ + cnσ2 τβδ (τγδ)ikl 0 b 1 1 n σ2 + nσ2 τβγδ + bnσ2 τγδ (βγδ)jkl a 1 1 1 n σ2 + anσ2 βγδ 160
  • 163. Sección 8: Experimentos Gauge R&R y Medias Cuadradas Esperadas (τβγδ)ijkl 0 1 1 1 n σ2 + nσ2 τβγδ ε(ijkl)m 0 1 1 1 1 σ2 161
  • 164. Sección 9: Experimentos anidados y Anidados Factoriales 1. EXPERIMENTOS ANIDADOS O JERARQUICOS “NESTED” Existen ocasiones donde los niveles de un factor B son similares pero no idénticos para diferentes niveles del factor A. Es decir, diferentes niveles del factor A ven niveles del factor B que son similares para cada nivel del factor A pero por no ser idénticos, se encuentran anidados en el nivel al que correspondan para el factor A. Para ilustrar lo descrito, suponga que tiene una máquina de refrescos compuesta de 3 bombas y cada una de ellas suple a dos dispensadores como muestra la figura: dispens En la figura se observa entonces un experimento anidado de dos niveles, esto porque los dispensadores componen un nivel del “nested” que están anidados en las bombas (que componen un segundo nivel) y ellas a su vez anidadas en la máquina. Allí se observa la teoría descrita ya . que las bombas son componentes similares pero no iguales porque cada una de ellas tiene un funcionamiento independiente, y, de la misma manera, los dispensadores son un factor con independiente componentes similares pero no idénticos; por este motivo si lo que se desea es analizar una respuesta con respecto a los factores bomba y dispensador, se debe hacer entonces un experimento anidado o jerárquico. El modelo que describe estos experimentos es: 161
  • 165. Sección 9: Experimentos anidados y Anidados Factoriales Yijk = µ + M i + B j ( i ) + Dk (ij ) + ε ( ijk ) l Donde: µ = media _ general M i = Maquina B j ( i ) = Bomba Dk ( ij ) = Dispensador ε ( ijk ) l = error i: corresponde al suscrito para la máquina que en el ejemplo corresponde a 1, si tuviera mas m’aquinas correspondería a 1…a j(i): corresponde al suscrito de las bombas que en el ejemplo corresponde a j = 1, 2, 3 anidadas en i = 1 máquina. Si tuviera más bombas el suscrito seria j = 1…b k(ij): corresponde al suscrito de los dispensadores k = 1,2 anidados en las bombas j y las máquinas i. Si tuviera más dispensadores k = 1…c (ijk)l: corresponde al termino del error Para realizar el experimento descrito anteriormente como uno tipo factorial, tendrían que cambiarse los dispensadores para las bombas cada vez que se haga una corrida, de manera que los dispensadores fueran los mismos dos para las 3 bombas. Esto resulta inútil ya que este tipo de maquinas requieren un arreglo como el que se describió anteriormente. De esta manera por ser éste un experimento anidado, no hay interacciones presentes entre los factores. Suponiendo que adicional a la máquina presentada en la figura, se tiene otra más, la tabla de análisis de varianza para las dos maquinas, con 3 bombas cada una y cada bomba con dos dispensadores es: 162
  • 166. Sección 9: Experimentos anidados y Anidados Factoriales Análisis de Varianza para un experimento anidado en 3 niveles Fuente de variación Suma de cuadrados Grados de Medias cuadradas esperadas para A libertad y B fijos y C aleatorio A (máquinas) ∑(y − y.... ) 2 a-1 bcn τ 2 bcn i i ... σ 2 + nσ c 2 + ∑ i a −1 B (bombas dentro de cn ∑(y ij .. − y.... ) 2 a(b-1) cn∑∑ β 2 A) i σ + nσ c + 2 2 j (i ) a (b − 1) C (dispensadores n ∑(y ijk . − y.... ) 2 ab(c-1) σ + nσ c 2 2 dentro de B) i Error ∑∑∑∑ ( y ijkl − y ijk . ) 2 abc(n-1) σ2 i j k l Total ∑∑∑∑ ( y ijkl − y.... ) 2 abcn-1 i j k l Ejemplo Suponga que se está estudiando la dureza de la superficie de un material de acuerdo a 3 máquinas que se encuentran en 3 plantas de producción diferentes. Estas máquinas son operadas por 3 personas diferentes cada una que se escogieron de manera aleatoria. Cada persona que opera la máquina toma 3 medidas para la dureza del material. Se obtuvieron las siguientes respuestas: Máquina 1 Máquina 2 Máquina 3 Personas 1 2 3 1 2 3 1 2 3 78 96 47 93 86 74 88 52 43 61 76 58 100 80 66 75 55 54 75 65 55 90 90 80 67 50 63 A continuación se presenta el procedimiento en Minitab: 1. Se introducen los datos como muestra la grafica: 163
  • 167. Sección 9: Experimentos anidados y Anidados Factoriales 2. En el menú stat se hace click sobre la opción ANOVA y allí se hace click sobre la opción Balanced Anova como muestra la figura: 3. En la pantalla que se despliega se pone en la casilla responses la columna que contiene las respuestas, y, en la casilla Model, se pone la columna de máquina y la columna de personas. Nótese que después de la columna de personas se encuentra la columna de 164
  • 168. Sección 9: Experimentos anidados y Anidados Factoriales máquinas entre paréntesis, esto indica a Minitab que las personas están anidadas dentro de las máquinas. 4. Al hacer click en el botón de graphs se despliega un menú de graficas, se hace click sobre la opción four in one de manera que se muestren las 4 graficas de los residuales en una. Se da ok a todas las pantallas y se obtienen los resultados. 5. Los resultados se muestran a continuación: 165
  • 169. Sección 9: Experimentos anidados y Anidados Factoriales ANOVA: respuesta versus maquina, personas Factor Type Levels Values maquina fixed 3 1, 2, 3 personas(maquina) random 3 1, 2, 3 Analysis of Variance for respuesta Source DF SS MS F P maquina 2 2627.56 1313.78 2.77 0.141 personas(maquina) 6 2845.11 474.19 6.26 0.001 Error 18 1363.33 75.74 Total 26 6836.00 S = 8.70292 R-Sq = 80.06% R-Sq(adj) = 71.19% Se observa que no existe diferencia significativa en el factor máquinas a pesar de que las mismas se encuentran en diferentes plantas, sin embargo, se observa diferencia en las personas ya que su valor p es menor al nivel de significancia utilizado para la prueba (0.05). Debido a que hay diferencia entre las personas que operan las maquinas, el interés mayor es saber en qué máquina están difiriendo estas personas pero el análisis hecho con anterioridad no permite obtener esta información, ya que el mismo se realizó de manera global. Para obtener un análisis por cada máquina se realiza entonces un análisis para un solo factor aleatorio para cada una de las maquinas. El factor en consideración para cada análisis es las personas con 3 niveles. En la sección correspondiente a un solo factor aleatorio de este material se muestra el procedimiento para la realización del mismo en Minitab, de manera que se procede a mostrar aquí los resultados. 1. Análisis de un solo factor aleatorio para la máquina 1: One-way ANOVA: respuesta versus personas Source DF SS MS F P personas 2 1042 521 4.32 0.069 Error 6 723 121 Total 8 1765 S = 10.98 R-Sq = 59.02% R-Sq(adj) = 45.35% Individual 95% CIs For Mean Based on 166
  • 170. Sección 9: Experimentos anidados y Anidados Factoriales Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- 1 3 71.33 9.07 (----------*---------) 2 3 79.00 15.72 (----------*---------) 3 3 53.33 5.69 (----------*---------) -----+---------+---------+---------+---- 45 60 75 90 2. Análisis de un solo factor aleatorio para la máquina 2: One-way ANOVA: respuesta m2 versus personas m2 Source DF SS MS F P personas m2 2 666.0 333.0 9.89 0.013 Error 6 202.0 33.7 Total 8 868.0 S = 5.802 R-Sq = 76.73% R-Sq(adj) = 68.97% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev -----+---------+---------+---------+---- 1 3 94.33 5.13 (-------*--------) 2 3 85.33 5.03 (-------*--------) 3 3 73.33 7.02 (-------*--------) -----+---------+---------+---------+---- 70 80 90 100 Pooled StDev = 5.80 3. Análisis de un solo factor aleatorio para la máquina 3: One-way ANOVA: respuesta m3 versus Personas m3 Source DF SS MS F P Personas m3 2 1137.6 568.8 7.79 0.021 Error 6 438.0 73.0 Total 8 1575.6 S = 8.544 R-Sq = 72.20% R-Sq(adj) = 62.93% Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---+---------+---------+---------+------ 1 3 76.667 10.599 (-------*-------) 2 3 52.333 2.517 (-------*-------) 3 3 53.333 10.017 (-------*-------) ---+---------+---------+---------+------ 45 60 75 90 Pooled StDev = 8.544 167
  • 171. Sección 9: Experimentos anidados y Anidados Factoriales Se observa que al sumar la suma de cuadrados para el factor persona de cada una de las máquinas, se obtiene la suma de cuadrados total que se observa en el análisis global. Es decir: 1042+666+1137.6 = 2845.6. Con los análisis realizados para un solo factor aleatorio se puede observar que hay diferencia significativa entre las personas de las máquinas 2 y 3. Sin embargo se podría decir que en la máquina uno también puede haber una diferencia entre las personas ya que el valor p no está muy lejano del nivel de significancia de la prueba (0.05). 2. Experimentos anidados cruzados o anidados factoriales Hay ocasiones donde se tienen experimentos en que algunos factores están organizados de manera factorial y otros anidados dentro de alguno de estos factores factoriales. De manera entonces que en este tipo de experimentos hay interacción entre los factores factoriales. El modelo para estos experimentos esta descrito por: Yijkl = µ + τ i + B j ( i ) + yk ( j ) + τβij + τyik ( j ) + ε ( ijk ) l Donde: τ i : Es el efecto del factor factorial A β j : Es el efecto del factor factorial B y k ( j ) : Es el efecto del factor C anidado en B τβ ij : Es la interacción de los factores A y B τy ik ( j ) : Es la interacción entre el factor A y el factor C anidado en B ε ( ijk ) l : Es el error experimental 168
  • 172. Sección 9: Experimentos anidados y Anidados Factoriales Ejemplo Un profesor está estudiando la velocidad de ensamble de los alumnos al armar carritos con unos legos. El diseñó 3 formas de ensamblaje y dos estaciones de trabajo. Para la práctica selecciono 4 alumnos de manera aleatoria para asignarlos a la combinación entre forma de ensamble y estación de trabajo. Las estaciones de trabajo se ubicaron cada una en un salón de clase diferente, de manera que los cuatro alumnos seleccionados para cada trabajo son diferentes para cada estación. Para cada combinación se realizaron 2 replicas. Debido a que los alumnos son diferentes para cada estación de trabajo, estos se van a encontrar anidados dentro de las estaciones de trabajo, pero como las tres formas de ensamble son las mismas para las dos estaciones de trabajo, estos dos factores son factoriales y por tanto pueden interactuar. A continuación se presenta la tabla con las velocidades de ensamble para cada tratamiento: Estación de trabajo 1 Estación de trabajo 2 Alumno 1 2 3 4 1 2 3 4 Ensamble 22 23 28 25 26 27 28 24 1 24 24 29 23 28 25 25 23 Ensamble 30 29 30 27 29 30 24 28 2 27 28 32 25 28 27 23 30 Ensamble 25 24 27 26 27 26 24 28 3 21 22 25 23 25 24 27 27 Una vez se tienen las respuestas al experimento se procede a realizar el análisis mediante el programa Minitab: 1. En el menú stat, se hace click sobre la opción ANOVA, allí se puede escoger para este caso, la opción Balanced Anova o General linear model, cualquiera de los dos funciona porque se tiene un diseño balanceado. En este caso haga click sobre la opción Balanced Anova como muestra la figura: 169
  • 173. Sección 9: Experimentos anidados y Anidados Factoriales 2. En la pantalla que se despliega (mostrada en la figura) se introduce el modelo. En la casilla de response se hace click a la columna de respuestas, en la casilla de model, se introducen las columnas correspondientes al modelo como se muestra en la figura. Observe que cuando se introduce el factor alumno, se pone entre parentecis las estaciones de trabajo, esto se hace para darle a entender a Minitab que los alumnos se encuentran anidados dentro de las estaciones de trabajo. También observe que se ponen interacciones entre los tipos de ensamble y las estaciones de trabajo porque ambas estaciones ven todos los tipos de ensamble, igualmente los alumnos de cada estación ven los mismos tipos de ensamble, de manera que estos interactúan. Sin embargo no hay interaccion entre las estaciones de trabajo y los alumnos porque los mismos varian para cada estación de trabajo, es decir, se encuentran anidados dentro de las estaciones. En la casilla de Random factors se pone el factor alumnos porque el interés del experimentador es hacer inferencia en una población mayor de los mismos: 170
  • 174. Sección 9: Experimentos anidados y Anidados Factoriales 3. Al hacer click en el botón de graphs, se obtiene una pantalla donde se escoge la opción de four in one para que el programa muestre las 4 graficas para los residuales en una misma como muestra la figura. Una vez escogida la opción se da ok: 4. Al regresar a la pantalla principal, se hace click sobre el botón de options con el fin de que el programa despliegue la pantalla mostrada en la figura. En esta pantalla se de click sobre la casilla que dice Use the restricted form of the model para que entonces Minitab entienda que debe hacer el análisis considerando el modelo restringido. Esto quiere decir 171
  • 175. Sección 9: Experimentos anidados y Anidados Factoriales que los cálculos para la estadística F se hacen presumiendo que los estimados de varianza que sean negativos son iguales a cero. 5. Al dar ok en la pantalla de la figura anterior, se regresa al menú principal donde se da de nuevo ok para obtener los siguientes resultados: ANOVA: Respuesta versus Estacion de trabajo, Tipo de ensamble, Alumno Factor Type Levels Values Estacion de trabajo fixed 2 1, 2 Alumno(Estacion de trabajo) random 4 1, 2, 3, 4 Tipo de ensamble fixed 3 1, 2, 3 Analysis of Variance for Respuesta Source DF SS MS F P Estacion de trabajo 1 4.083 4.083 0.34 0.581 Alumno(Estacion de trabajo) 6 71.917 11.986 5.14 0.002 Tipo de ensamble 2 82.792 41.396 7.55 0.008 Estacion de trabajo*Tipo de ensamble 2 19.042 9.521 1.74 0.218 Tipo de ensamble*Alumno( 12 65.833 5.486 2.35 0.036 Estacion de trabajo) Error 24 56.000 2.333 Total 47 299.667 S = 1.52753 R-Sq = 81.31% R-Sq(adj) = 63.40% Variance Error Source component term 1 Estacion de trabajo 2 172
  • 176. Sección 9: Experimentos anidados y Anidados Factoriales 2 Alumno(Estacion de trabajo) 1.609 6 3 Tipo de ensamble 5 4 Estacion de trabajo*Tipo de ensamble 5 5 Tipo de ensamble*Alumno( 1.576 6 Estacion de trabajo) 6 Error 2.333 Expected Mean Square for Each Term (using Source restricted model) 1 Estacion de trabajo (6) + 6 (2) + 24 Q[1] 2 Alumno(Estacion de trabajo) (6) + 6 (2) 3 Tipo de ensamble (6) + 2 (5) + 16 Q[3] 4 Estacion de trabajo*Tipo de ensamble (6) + 2 (5) + 8 Q[4] 5 Tipo de ensamble*Alumno( (6) + 2 (5) Estacion de trabajo) 6 Error (6) Se observa entonces que no existe diferencia significativa en la respuesta cuando se cambia la estación de trabajo, sin embargo, los factores alumnos dentro de las estaciones y los tipos de ensamble afectan la respuesta significativamente al cambiar sus niveles. Una forma de observar cuando disminuye el tiempo de ensamble, seria con la grafica de los efectos de los factores principales. Para obtener esta grafica se hace click sobre el menú stat, luego en ANOVA y en el menú que se despliega se hace click sobre Main Effects Plot (grafico de los efectos principales) como muestra la figura: En la pantalla que se depliega, se pone la columna de respuestas en la casilla correspondiente a Responses y en la casilla de Factors se ponen los factores del modelo que son de tipo factorial. Una vez se hayan puesto los factores y la respuesta se da click en ok como muestra la figura: 173
  • 177. Sección 9: Experimentos anidados y Anidados Factoriales Al dar ok se obtiene la siguiente grafica: Main Effects Plot (data means) for Respuesta Estacion de trabajo Tipo de ensamble 28.0 27.5 Mean of Respuesta 27.0 26.5 26.0 25.5 25.0 1 2 1 2 3 Aunque la diferencia entre las estaciones de trabajo no es significativa, se observa que la respuesta puede ser un poco más pequeña al trabajar en la estación 1. En cuanto a los tipos de ensamble, se observa que entre el tipo de ensamble 1 y 3 la diferencia de tiempo no es significativa, sin embargo, el tipo de ensamble 2 hace que la respuesta aumente considerablemente; de manera que se recomienda entonces utilizar el tipo de ensamble 1 o 3 en la estación de trabajo 1, aunque si es más económico usar la estación de trabajo 2, también puede ser usada sin afectar la respuesta. En cuanto a los operadores, se tendría que realizar un análisis similar al mostrado en la sección de experimentos anidados, es decir que se haría un análisis considerando las estaciones de trabajo por aparte. 174
  • 178. Sección 10: Experimentos de Parcelas o Cuadrantes Partidas 1. Experimento Split-Plot (Parcelas o cuadrantes partidas/os): Este tipo de experimento se utiliza cuando no existe la posibilidad de aleatorizar por completo el orden de las corridas. Maneja tratamientos que ocurren de manera simultánea incluso con algunas restricciones en la aleatoriedad. El modelo que describe este tipo de experimento es: i = 1, 2,..., r  yijk = µ + τ i + β j + (τβ )ij + γ k + (τγ )ik + ( βγ ) jk + (τβγ )ijk + ε ijk  j = 1, 2,..., a k = 1, 2,..., b  Donde: τ i = Bloques o replicas β j = Factor involucrado en el plot principal (A) τβij = Error del plot principal γ k = Factor involucrado en el sub-plot (B) (τγ )ik = Replicas x factor (B) ( βγ )ij = Interacción entre los factores A y B (τβγ )ijk = Error del sub-plot Las hipótesis que se desean probar para este modelo son: H 0 : τ 1 = τ 2 = ...τ a Ho : µ1 = µ 2 = ...µ a Equivalente a H1 : τ 1 ≠ τ 2 ≠ ...τ a H 1 : µ1 ≠ µ 2 ≠ ...µ a Donde τ es el efecto del tratamiento a y µ es la media del tratamiento a. La hipótesis alterna (hipótesis del investigador) busca probar que existe una diferencia entre los niveles de los factores en consideración, de manera que al variar el nivel, la respuesta varíe. 175
  • 179. Sección 10: Experimentos de Parcelas o Cuadrantes Partidas Ejemplo 1 Se desea analizar el largo de vida (Y) de componentes electrónicos al variar la temperatura (T) y el tiempo de horneado (H). Se analizan 4 niveles de temperatura y 3 niveles de tiempo de horneado. El experimentador decide hacer 3 réplicas. La siguiente tabla muestra las respuestas obtenidas para cada uno de los arreglos: Temperatura (grados centígrados) Réplica Tiempo 580 600 620 640 (minutos) I 5 217 158 229 223 10 233 138 186 227 15 175 152 155 156 II 5 188 126 160 201 10 201 130 170 181 15 195 147 161 172 III 5 162 122 167 182 10 170 185 181 201 15 213 180 182 199 Análisis: Este experimento podría conducirse como un factorial. Si se hiciera de esa manera, entonces el experimentador tendría que haber seleccionado una combinación de las cuatro temperaturas y los 3 tiempos de manera aleatoria, colocar un componente en el horno por el tiempo seleccionado y proseguir de esta manera hasta que todos los tratamientos fueran realizados. Se piensa entonces que al establecer una temperatura y tomar por ejemplo el tiempo de 15, se hubiera podido aprovechar y sacar el componente en un tiempo de 5 y uno de 10, de manera que se obtengan 3 respuestas en 15 minutos. Hacer esto es algo que un experimento de tipo factorial no permite. Si se realizara el experimento como uno factorial, se estaría desperdiciando tiempo y saldría más costoso. 176
  • 180. Sección 10: Experimentos de Parcelas o Cuadrantes Partidas Para esta situación, se establece el experimento Split-Plot porque permite manejar tratamientos de manera simultánea aun con restricciones en la aleatoriedad; para este ejemplo se restringiría la aleatoriedad del factor tiempo. Una forma lógica de conducir este experimento, seria seleccionar una de las cuatro temperaturas de forma aleatoria y colocar tres componentes (diferentes unidades experimentales) para entonces analizarlos de acuerdo al tiempo asignado para cada componente; en otras palabras, a una temperatura dada (teniendo en cuenta que debe ser escogida de manera aleatoria) los 3 componentes son puestos en el horno por tres períodos de tiempo distintos. En este caso la temperatura actúa como cuadrante o parcela (Plot) y el tiempo es quien parte la parcela (Split). Luego la temperatura se ajusta a otro nivel y se repite éste procedimiento hasta que las cuatro temperaturas sean tomadas en consideración, a esto se le llama una replica del experimento (el ejemplo muestra 3). El modelo que describe el experimento esta dado por: yijk = µ + τ i + Tj + Tτ ij + TI k + τTI ik + TTI jk + τTTI ijk 1442443 14444244443 4 4 Parcela −completa Parcela − partida Donde τ i es el efecto de las réplicas, Tj es el efecto de las temperaturas y TIk es el efecto de los tiempos. Se podría pensar que el efecto de tiempo en este experimento se encuentra anidado dentro de las temperaturas, pero esto no es así ya que los mismos niveles de tiempo se efectúan en todas las temperaturas. Para realizar el análisis de los datos, se procede entonces a realizar un análisis de varianza en el programa Minitab: 1. En el menú de stat, en la opción de anova se encuentra la opción de general linear model como muestra la figura: 177
  • 181. Sección 10: Experimentos de Parcelas o Cuadrantes Partidas 2. Al dar click se muestra la pantalla donde se ingresan los datos; en la casilla de responses se ingresa la columna de respuestas, en la casilla de model se ingresa el modelo, en el caso del Split plot se tiene interacción entre todos los factores (replica| tiempo| temperatura) donde el símbolo | hace que el programa entienda que hay interacción entre todos los factores. En la casilla de random factors se ingresa la columna correspondiente a las replicas porque es el único factor aleatorio, los demás son considerados fijos. 3. En la opción de graphs se pueden obtener los gráficos correspondientes a los residuales del modelo, allí se oprime como preferencia four in one con el fin de 178
  • 182. Sección 10: Experimentos de Parcelas o Cuadrantes Partidas que se muestre un solo grafico que contenga los 4 graficos del análisis de residuales: 4. Finalmente al dar clik en ok se obtiene la siguiente respuesta: General Linear Model: respuesta versus replica, tiempo, temperatura Factor Type Levels Values replica random 3 1, 2, 3 tiempo fixed 3 5, 10, 15 temperatura fixed 4 580, 600, 620, 640 Analysis of Variance for respuesta, using Adjusted SS for Tests Source DF Seq SS Adj SS Adj MS F P replica 2 1962.72 1962.72 981.36 0.54 0.618 x tiempo 2 566.22 566.22 283.11 0.16 0.856 temperatura 3 12494.31 12494.31 4164.77 14.09 0.004 replica*tiempo 4 7021.28 7021.28 1755.32 7.23 0.003 replica*temperatura 6 1773.94 1773.94 295.66 1.22 0.362 tiempo*temperatura 6 2600.44 2600.44 433.41 1.79 0.185 replica*tiempo*temperatura 12 2912.06 2912.06 242.67 ** Error 0 * * * Total 35 29330.97 x Not an exact F-test. ** Denominator of F-test is zero. * NOTE * Could not graph the specified residual type because MSE = 0 or the degrees of freedom for error = 0. Teniendo en cuenta un nivel de significancia de 0.05 que es el que asume Minitab, se nota que el único factor que afecta la respuesta al cambiar sus niveles es el factor 179
  • 183. Sección 10: Experimentos de Parcelas o Cuadrantes Partidas temperatura, esto porque el valor p es menor al valor de significancia (0.004 < 0.005). El efecto que causan las replicas no es de interés ya que las mismas se hacen para reducir el error experimental. El resultado muestra también que no se realizaron gráficos para los residuales debido a que los estimados del error son 0. Ejemplo 2 Se desea saber bajo que condiciones se da mejor la deshidratación de setas Pleurotus pulmonarius. Para la experimentación se utilizó una caja de cartón con una parrilla donde se ubicaron las setas. Se realizó la experimentación teniendo en cuenta 3 variables de entrada o factores: 1. Focos: Se realizaron pruebas con 2 tipos de focos, uno de 40 vatios y otro de 60 vatios. 2. Diedrita: Esta es una piedra que absorbe la humedad. Se localizó en la entrada de aire de la caja y se hizo la experimentación con y sin diedrita. 3. Ventilación: Se tuvo en cuenta aire inducido por un ventilador y sin el mismo. Se desea saber como cambia el peso de las setas teniendo en cuenta tiempos de intervalos de 5 horas, comenzando en 5 y terminando en 30. Para el mismo se estableció la realización de 2 replicas. Por lo anterior, el experimento fue conducido como un Split-Plot. En este caso en particular se tienen 3 factores en el Plot (focos, diedrita y ventilación), cada uno con dos niveles (40 y 60 vatios, con diedrita y sin diedrita, con ventilación y sin ventilación). Se realizó una asignación aleatoria para los factores del Plot mediante el programa Minitab. El tiempo fue tomado como el factor Split el cual no fue asignado aleatoriamente ya que la intención es no perder información. Se presenta las siguientes tablas con el fin de ilustrar el experimento y proveer información sobre las respuestas obtenidas después de haber realizado la experimentación. La primera tabla se da para visualización del modelo; la segunda tabla ilustra la entrada de los datos en el programa Minitab. 180
  • 184. Sección 10: Experimentos de Parcelas o Cuadrantes Partidas Plot o parcela con 3 factores Con ventilación Sin ventilación Split Con diedrita Sin diedrita Con diedrita Sin diedrita Tiempo 40 60 40 60 40 60 40 60 en voltios voltios voltios voltios voltios voltios voltios voltios horas 5 Replica 1 10 15 20 25 30 5 Replica 2 10 15 20 25 30 181
  • 185. Sección 10: Experimentos de Parcelas o Cuadrantes Partidas Datos ingresados al programa Minitab StdOrder RunOrder CenterPt Réplica Tiempo Ventilación Diedrita Focos Peso 14 1 1 1 5 1 -1 1 6.07 14 1 1 1 10 1 -1 1 3.55 14 1 1 1 15 1 -1 1 3.97 14 1 1 1 20 1 -1 1 3.88 14 1 1 1 25 1 -1 1 3.65 14 1 1 1 30 1 -1 1 3.71 2 2 1 1 5 1 -1 -1 16.14 2 2 1 1 10 1 -1 -1 7.43 2 2 1 1 15 1 -1 -1 4.32 2 2 1 1 20 1 -1 -1 4.46 2 2 1 1 25 1 -1 -1 3.97 2 2 1 1 30 1 -1 -1 4.62 12 3 1 1 5 1 1 -1 15.53 12 3 1 1 10 1 1 -1 4.33 12 3 1 1 15 1 1 -1 4.75 12 3 1 1 20 1 1 -1 4.36 12 3 1 1 25 1 1 -1 4.26 12 3 1 1 30 1 1 -1 4.26 8 4 1 1 5 1 1 1 12.31 8 4 1 1 10 1 1 1 6.5 8 4 1 1 15 1 1 1 5.38 8 4 1 1 20 1 1 1 5.16 8 4 1 1 25 1 1 1 4.45 8 4 1 1 30 1 1 1 5.08 10 5 1 2 5 1 -1 -1 11.61 10 5 1 2 10 1 -1 -1 4.14 10 5 1 2 15 1 -1 -1 3.5 10 5 1 2 20 1 -1 -1 3.11 10 5 1 2 25 1 -1 -1 2.98 10 5 1 2 30 1 -1 -1 3.09 9 6 1 1 5 -1 -1 -1 11.74 9 6 1 1 10 -1 -1 -1 3.76 9 6 1 1 15 -1 -1 -1 4.4 9 6 1 1 20 -1 -1 -1 4.09 9 6 1 1 25 -1 -1 -1 4.23 9 6 1 1 30 -1 -1 -1 4.52 4 7 1 2 5 1 1 -1 12.5 4 7 1 2 10 1 1 -1 4.88 4 7 1 2 15 1 1 -1 4.93 4 7 1 2 20 1 1 -1 4.21 4 7 1 2 25 1 1 -1 5.2 4 7 1 2 30 1 1 -1 4.67 1 8 1 2 5 -1 -1 -1 13.19 1 8 1 2 10 -1 -1 -1 5.73 1 8 1 2 15 -1 -1 -1 5.73 1 8 1 2 20 -1 -1 -1 5.64 182
  • 186. Sección 10: Experimentos de Parcelas o Cuadrantes Partidas 1 8 1 2 25 -1 -1 -1 5.29 1 8 1 2 30 -1 -1 -1 4.66 11 9 1 1 5 -1 1 -1 14.59 11 9 1 1 10 -1 1 -1 5.5 11 9 1 1 15 -1 1 -1 4.68 11 9 1 1 20 -1 1 -1 4.4 11 9 1 1 25 -1 1 -1 4.07 11 9 1 1 30 -1 1 -1 4.51 6 10 1 2 5 1 -1 1 6.09 6 10 1 2 10 1 -1 1 3.95 6 10 1 2 15 1 -1 1 3.73 6 10 1 2 20 1 -1 1 3.8 6 10 1 2 25 1 -1 1 3.69 6 10 1 2 30 1 -1 1 3.71 3 11 1 2 5 -1 1 -1 14.56 3 11 1 2 10 -1 1 -1 4.38 3 11 1 2 15 -1 1 -1 3.89 3 11 1 2 20 -1 1 -1 3.77 3 11 1 2 25 -1 1 -1 3.65 3 11 1 2 30 -1 1 -1 3.9 13 12 1 1 5 -1 -1 1 9.53 13 12 1 1 10 -1 -1 1 4.52 13 12 1 1 15 -1 -1 1 4.54 13 12 1 1 20 -1 -1 1 4.08 13 12 1 1 25 -1 -1 1 4.19 13 12 1 1 30 -1 -1 1 4.21 15 13 1 1 5 -1 1 1 11.09 15 13 1 1 10 -1 1 1 5.13 15 13 1 1 15 -1 1 1 5.49 15 13 1 1 20 -1 1 1 5.05 15 13 1 1 25 -1 1 1 5.05 15 13 1 1 30 -1 1 1 4.38 7 14 1 2 5 -1 1 1 10.47 7 14 1 2 10 -1 1 1 4.44 7 14 1 2 15 -1 1 1 4.59 7 14 1 2 20 -1 1 1 4.77 7 14 1 2 25 -1 1 1 4.64 7 14 1 2 30 -1 1 1 4.38 16 15 1 2 5 1 1 1 12.65 16 15 1 2 10 1 1 1 4.82 16 15 1 2 15 1 1 1 4.83 16 15 1 2 20 1 1 1 4.83 16 15 1 2 25 1 1 1 5.01 16 15 1 2 30 1 1 1 4.89 5 16 1 2 5 -1 -1 1 9.37 5 16 1 2 10 -1 -1 1 4.43 5 16 1 2 15 -1 -1 1 4.68 5 16 1 2 20 -1 -1 1 4.64 183
  • 187. Sección 10: Experimentos de Parcelas o Cuadrantes Partidas 5 16 1 2 25 -1 -1 1 4.73 5 16 1 2 30 -1 -1 1 4.66 Los valores de -1 y 1 indican los niveles del factor, donde: la ventilación es -1 cuando no se induce y 1 cuando se usa un abanico; la diedrita es -1 cuando no se usa y 1 cuando se pone en la entrada de aire y los focos son -1 cuando es de 40 vatios y 1 cuando es de 60. El tiempo se considera de acuerdo a las horas en que se saco cada muestra. En la misma caja fueron puestas 6 muestras de setas y se saco 1 muestra cada 5 horas para tomar su peso (en gramos), siendo el peso la variable respuesta. A continuación se presenta el procedimiento de análisis del experimento en Minitab: 1. En la barra de herramientas, se entra al menú stat y se escoge la opción ANOVA, ésta despliega un menú donde se escoge la opción general linear model como muestra la figura: 184
  • 188. Sección 10: Experimentos de Parcelas o Cuadrantes Partidas 2. Luego en la ventana que se abre se ingresa el modelo. Se tiene en cuenta que en un experimento de este tipo hay interacción de todos los factores entre ellos y con las réplicas, para lo cual se utiliza el símbolo | teniendo en cuenta que éste hace que todos los factores interactúen. En la casilla de responses se ingresa la celda peso haciendo doble clic sobre la palabra peso que aparece en la ventana del lado izquierdo, en esa ventana aparecen todas las celdas que están en la hoja de trabajo. Luego en la casilla model se ingresan los factores del modelo teniendo en cuenta que interactúan. En la casilla de random factors se ingresó solo las réplicas porque fue el único factor considerado aleatorio para este experimento. 3. Se hace clic sobre el botón de Factor Plots para ingresar los factores principales y observar el cambio de la respuesta en promedio con respecto al cambio de nivel de cada factor. Esta opción permite ver gráficamente el cambio en la respuesta, en la casilla de factors se ingresan los factores principales, finalmente se oprime ok para esta ventana y la ventana subsiguiente con el fin de obtener resultados. 185
  • 189. Sección 10: Experimentos de Parcelas o Cuadrantes Partidas 4. Los resultados obtenidos se muestran en la hoja de session de Minitab. General Linear Model: Peso versus Rep, Tiempo, ... Factor Type Levels Values Rep random 2 1, 2 Tiempo fixed 6 5, 10, 15, 20, 25, 30 Ventilación fixed 2 -1, 1 Diedrita fixed 2 -1, 1 Focos fixed 2 -1, 1 Analysis of Variance for Peso, using Adjusted SS for Tests Source DF Seq SS Adj SS Adj MS F Rep 1 1.7281 1.7281 1.7281 ** Tiempo 5 698.5910 698.5910 139.7182 296.29 Ventilación 1 0.8400 0.8400 0.8400 0.26 Diedrita 1 13.0833 13.0833 13.0833 34.66 Focos 1 8.9793 8.9793 8.9793 20.15 Rep*Tiempo 5 2.3578 2.3578 0.4716 1.32 Rep*Ventilación 1 3.2856 3.2856 3.2856 0.62 Rep*Diedrita 1 0.3775 0.3775 0.3775 0.13 Rep*Focos 1 0.4455 0.4455 0.4455 ** Tiempo*Ventilación 5 0.8865 0.8865 0.1773 0.37 186
  • 190. Sección 10: Experimentos de Parcelas o Cuadrantes Partidas Tiempo*Diedrita 5 14.8796 14.8796 2.9759 28.38 Tiempo*Focos 5 57.2298 57.2298 11.4460 29.19 Ventilación*Diedrita 1 6.9338 6.9338 6.9338 1.08 Ventilación*Focos 1 0.3408 0.3408 0.3408 0.11 Diedrita*Focos 1 8.5085 8.5085 8.5085 18.53 Rep*Tiempo*Ventilación 5 2.4045 2.4045 0.4809 0.94 Rep*Tiempo*Diedrita 5 0.5242 0.5242 0.1048 ** Rep*Tiempo*Focos 5 1.9604 1.9604 0.3921 0.69 Rep*Ventilación*Diedrita 1 6.4377 6.4377 6.4377 1.65 Rep*Ventilación*Focos 1 3.1032 3.1032 3.1032 0.66 Rep*Diedrita*Focos 1 0.4593 0.4593 0.4593 0.12 Tiempo*Ventilación*Diedrita 5 1.3299 1.3299 0.2660 5.40 Tiempo*Ventilación*Focos 5 1.4671 1.4671 0.2934 0.35 Tiempo*Diedrita*Focos 5 3.6857 3.6857 0.7371 6.83 Ventilación*Diedrita*Focos 1 2.2265 2.2265 2.2265 0.53 Rep*Tiempo*Ventilación*Diedrita 5 0.2461 0.2461 0.0492 0.13 Rep*Tiempo*Ventilación*Focos 5 4.2483 4.2483 0.8497 2.19 Rep*Tiempo*Diedrita*Focos 5 0.5394 0.5394 0.1079 0.28 Rep*Ventilación*Diedrita*Focos 1 4.2336 4.2336 4.2336 10.93 Tiempo*Ventilación*Diedrita*Focos 5 13.2619 13.2619 2.6524 6.85 Rep*Tiempo*Ventilación*Diedrita* 5 1.9372 1.9372 0.3874 ** Focos Error 0 * * * Total 95 866.5321 Source P Rep Tiempo 0.000 Ventilación 0.702 Diedrita 0.107 Focos 0.140 Rep*Tiempo 0.673 x Rep*Ventilación 0.686 x Rep*Diedrita 0.890 x Rep*Focos Tiempo*Ventilación 0.851 Tiempo*Diedrita 0.001 Tiempo*Focos 0.001 Ventilación*Diedrita 0.488 Ventilación*Focos 0.796 Diedrita*Focos 0.145 Rep*Tiempo*Ventilación 0.612 x Rep*Tiempo*Diedrita Rep*Tiempo*Focos 0.686 x Rep*Ventilación*Diedrita 0.449 x Rep*Ventilación*Focos 0.545 x Rep*Diedrita*Focos 0.797 x Tiempo*Ventilación*Diedrita 0.044 Tiempo*Ventilación*Focos 0.866 Tiempo*Diedrita*Focos 0.027 Ventilación*Diedrita*Focos 0.601 Rep*Tiempo*Ventilación*Diedrita 0.980 Rep*Tiempo*Ventilación*Focos 0.205 Rep*Tiempo*Diedrita*Focos 0.907 Rep*Ventilación*Diedrita*Focos 0.021 Tiempo*Ventilación*Diedrita*Focos 0.027 Rep*Tiempo*Ventilación*Diedrita* Focos Error Total 187
  • 191. Sección 10: Experimentos de Parcelas o Cuadrantes Partidas El nivel de significancia utilizado en el modelo fue de 0.05 (nivel de significancia tomado por defecto en Minitab) de manera que la hipótesis nula se rechaza cuando el valor P sea menor al nivel de significancia. Según los resultados, los factores en los cuales el cambiar el nivel altera las condiciones del horno son: tiempo, diedrita y foco; aunque el valor P para los factores diedrita y foco indica que variar los niveles para estos factores no es significativo, las interacciones de dos factores para tiempo*diedrita y tiempo*foco indican que si hay diferencia al variar estos factores. Las interacciones de 3 y 4 factores no aportan mayor información pero al observar el valor P para las mismas, se encuentra que la interacción entre tiempo*diedrita*foco resulta ser significativa. Por los resultados del ANOVA se puede concluir que la respuesta cambia al cambiar los niveles de los factores tiempo, diedrita y foco. Con el fin de evaluar que bajo que niveles se da una mayor perdida de peso, se utilizó el gráfico para los factores principales donde se observa que la mayor perdida de peso se da cuando no hay diedrita y cuando se utiliza un foco de 60 vatios. En cuanto al tiempo se nota una estabilidad aproximada después de las 10 horas de proceso. 188
  • 192. Sección 11: Metodología de Respuesta 1. Metodología de respuesta En las secciones anteriores se ha estudiado el comportamiento de la variable respuesta cuando se ve afectada por diferentes factores, sin embargo no se ha tocado el tema a cerca de llegar a la combinación optima de factores y sus niveles de manera que se logre optimizar la respuesta. Las metodologías de superficie de respuesta son usadas para analizar una respuesta de interés que se ve afectada por unas variables y para la cual se necesita llegar a un óptimo. Suponga que un ingeniero quiere encontrar los niveles de ventilación (a) y humedad (b) que maximizan la respuesta (y) de un proceso. De esta manera la respuesta se ve como una función de las variables a y b: y = f (a,b) + e Donde a y b son las variables independientes o factores y e se refiere al error o ruido observado en la respuesta. La figura muestra la superficie de respuesta para la variable y en diferentes niveles de las variables independientes a y b. La metodología de respuesta busca llegar al punto óptimo, representado por el punto azul, donde se encuentra la mejor combinación de los factores a y b para la respuesta optima de y. Yo = Valor optimo y para la respuesta b a En ocasiones con un modelo de primer orden se llega a un lugar donde se puede encontrar una respuesta factible, mas no optima. Las respuestas optima generalmente se encuentran en un lugar 189
  • 193. Sección 11: Metodología de Respuesta cóncavo ( ∪) o convexo ( ∩) y por lo tanto se encuentra curvatura, de manera que un modelo de primer orden no es suficiente para llegar al óptimo. La metodología simplex es una manera de llegar a un punto óptimo, sin embargo no me permite saber el factor que conduce a ésta respuesta. A continuación se presenta un modelo con el cual se llega a un valor óptimo para la respuesta y se logra identificar el factor que lo condujo allí. Método de máxima pendiente de ascenso (Steepest Ascent) Este modelo permite moverse de manera secuencial hacia la respuesta óptima. Si se desea una maximización en la respuesta entonces el modelo se llama máxima pendiente de ascenso porque se mueve en dirección ascendente hasta encontrar el incremento máximo de la respuesta. Si se desea una minimización en la respuesta, el modelo se llamaría máxima pendiente de descenso de manera que se pueda llegar al máximo decremento en la respuesta. Esta metodología consta de los siguientes pasos: 1. Al tener el experimento que se desea hacer, construya un modelo de primer orden como por ejemplo un modelo factorial 2k y, en lo posible, agregue puntos centrales para observar si existe curvatura. 2. Coteje si existe curvatura. Si no existe, un modelo de primer orden es suficiente, y, a partir de este, se debe buscar el paso que conduzca a la mejora, se debe permanecer en él hasta que no haya evidencia de que se sigue dando la mejora. Si existe curvatura, se debe hacer un modelo de segundo orden con el fin de llegar al óptimo. Para los modelos de segundo orden se tiene la opción de hacer experimentos tipo 3k sin embargo no son eficientes debido al número de tratamientos que se requieren, además que la precisión del modelo no es igual en todas las direcciones. De esta manera, cuando se requiera un modelo de segundo orden, se recomienda hacer un experimento central compuesto. 3. Una vez se tiene el modelo a seguir se debe determinar el paso de máxima pendiente de ascenso o descenso dependiendo de si se desea maximizar o minimizar la respuesta. 4. En el paso determinado se deben conducir experimentos para observar el cambio en la variable respuesta. Se debe continuar hasta que la variable respuesta no muestre más mejoras, lo cual indicaría entonces que el modelo aplicado ya no tiene buen carácter predictivo. 190
  • 194. Sección 11: Metodología de Respuesta 5. Al llegar al punto donde no hay mas mejoras, se debe construir un modelo de primer orden de nuevo pero con puntos centrales en espera de que los mismos determinen la necesidad de curvatura y entonces se procede a la localización del óptimo. En caso de que la prueba de carencia de ajuste no sea significativa, se hace una búsqueda desde el paso 3. Cuando no mejora más, se intenta entonces un modelo de orden mayor. Para ilustrar mejor lo descrito anteriormente se realizo el siguiente ejemplo: Ejemplo Un ingeniero industrial está interesado en encontrar las condiciones que maximizan la producción de una línea. El proceso de producción está influenciado por dos variables independientes o factores: Tiempo y temperatura del vapor de agua. Las condiciones actuales muestran que hay una producción de aproximadamente 35% al operar con un tiempo de 35 minutos y una temperatura de 100 grados centígrados. El ingeniero considera que se puede aumentar la producción y desea encontrar los niveles de los factores a los cuales se obtiene un porcentaje óptimo de producción. Para la solución del problema se siguen los siguientes pasos: 1. Se establecen los niveles de experimentación de las variables independientes y se realiza la experimentación con un modelo de primer orden con puntos centrales para verificar curvatura. Para este caso particular se ajusta un modelo 22 con 5 puntos centrales. Los niveles de experimentación para las variables independientes son: Tiempo Temperatura de vapor Niveles (A) (B) Bajo 30 90 Alto 40 110 Puntos centrales 35 100 2. A continuación se muestra la tabla donde se observan los tratamientos y la respuesta correspondiente para los mismos: 191
  • 195. Sección 11: Metodología de Respuesta Variables naturales Variables codificadas Respuesta A B X1 X2 Y 30 90 -1 -1 34.3 30 110 -1 1 35 40 90 1 -1 35.9 40 110 1 1 36.4 35 100 0 0 35.6 35 100 0 0 35.3 35 100 0 0 35.2 35 100 0 0 35.7 35 100 0 0 35.5 3. El análisis para el experimento se hizo en Minitab. El procedimiento es el mismo que se mostró para experimentos 2k. Al realizarlo se obtuvo la siguiente respuestas: Factorial Fit: Respuesta versus A, B Estimated Effects and Coefficients for Respuesta (coded units) Term Effect Coef SE Coef T P Constant 35.4000 0.1037 341.43 0.000 A 1.5000 0.7500 0.1037 7.23 0.002 B 0.6000 0.3000 0.1037 2.89 0.044 A*B -0.1000 -0.0500 0.1037 -0.48 0.655 Ct Pt 0.0600 0.1391 0.43 0.688 S = 0.207364 R-Sq = 93.86% R-Sq(adj) = 87.71% Analysis of Variance for Respuesta (coded units) Source DF Seq SS Adj SS Adj MS F P Main Effects 2 2.61000 2.61000 1.30500 30.35 0.004 2-Way Interactions 1 0.01000 0.01000 0.01000 0.23 0.655 Curvature 1 0.00800 0.00800 0.00800 0.19 0.688 Residual Error 4 0.17200 0.17200 0.04300 Pure Error 4 0.17200 0.17200 0.04300 Total 8 2.80000 Se observa que los factores principales A y B (Tiempo y temperatura de vapor) resultan ser significativos, sin embargo la interacción y la curvatura no. Debido a que no hay significancia en la curvatura se concluye que un modelo de primer orden es suficiente para encontrar el paso de ascenso con el cual se espera llegar a la respuesta óptima. La tabla muestra los coeficientes regresores para cada factor, de esta manera la ecuación que describe el modelo es: 192
  • 196. Sección 11: Metodología de Respuesta Y = 35.4 + 0.75X1 + 0.30X2 En el modelo se observa que al moverse en X1 se da un mayor incremento en la respuesta que es el objetivo del experimento, (buscar los niveles óptimos de los factores para lograr una maximización en la respuesta). De esta manera se propone entonces incrementar en un paso de 1 en términos de X1 y en un paso de una fracción en términos de X2. La fracción se determina de la siguiente manera: ∧ bi 0.30 ∆X i = ∧ = = 0.4 0.75 bj De esta manera los incrementos serian: ∆X 1 = 1 y ∆X 2 = 0.4 . Teniendo estos incrementos se procede entonces a verificar como quedarían los niveles de los factores al realizar los incrementos porque los mismos están codificados. Al pasarlo a variables naturales se obtiene:  10  A =   * 1 + 35 = 40 2  20  B =   * 0.4 + 100 = 104  2  4. Sabiendo entonces el procedimiento para calcular los incrementos en los niveles de las variables o factores, tiempo y temperatura de vapor, se procede a realizar incrementos hasta encontrar que la variable respuesta deje de mostrar mejoras. Esto quiere decir entonces que se deben hacer experimentos en diferentes niveles de las variables de entrada y tomar datos de la respuesta hasta encontrar que la misma deje de incrementar. La siguiente tabla muestra un resumen para las respuestas obtenidas en diferentes niveles de los factores A y B. 193
  • 197. Sección 11: Metodología de Respuesta Variables naturales Variables codificadas Respuesta Pasos de ascenso A B X1 X2 Y Origen 35 100 0 0 35.46 Magnitud de incremento 5 4 1 0.4 Paso 1 40 104 2 0.8 36.5 Paso 2 45 108 3 1.2 38.4 Paso 3 50 112 4 1.6 42.6 Paso 4 55 116 5 2.0 45.2 Paso 5 60 120 6 2.4 49.3 Paso 6 65 124 7 2.8 55.4 Paso 7 70 128 8 3.2 60.3 Paso 8 75 132 9 3.6 65.7 Paso 9 80 136 10 4.0 72.9 Paso 10 85 140 11 4.4 75.1 Paso 11 90 144 12 4.8 71.3 Paso 12 95 148 13 5.2 70.4 La siguiente figura muestra gráficamente la reducción en la respuesta después del paso 10: 80 70 60 Porcentaje 50 40 30 Porcentaje de 20 produccion (Y) 10 0 2 4 6 8 10 12 Pasos dados en busca de mejora Se encuentra entonces que en el paso 10 donde la respuesta es de 75.1 se llega a un valor máximo de la misma. Debido a que se alcanza este valor máximo y no se ve mejora en los pasos siguientes, se determina entonces hacer un nuevo modelo de primer orden para verificar si se debe cambiar el paso o si se ha llegado a un punto donde hay curvatura y se deba ajustar un modelo de segundo orden. 194
  • 198. Sección 11: Metodología de Respuesta 5. Se procede a hacer un nuevo experimento 22 teniendo como puntos centrales los valores que maximizan la respuesta en el procedimiento hecho anteriormente. De manera que se establece la temperatura de vapor en 140 grados centígrados y el tiempo en 35 minutos, siendo estos los niveles que se establecen para los puntos centrales. La siguiente tabla muestra el nuevo experimento realizado: Variables naturales Variables codificadas Respuesta A B X1 X2 Y 80 130 -1 -1 71.3 80 150 -1 1 73.2 90 130 1 -1 74.1 90 150 1 1 74.5 85 140 0 0 75.1 85 140 0 0 75.8 85 140 0 0 74.9 85 140 0 0 75.2 85 140 0 0 75.6 Teniendo las respuestas se procedió a realizar un análisis en Minitab para observar si se encuentra curvatura. La siguiente tabla muestra los resultados: Factorial Fit: Respuesta versus A, B Estimated Effects and Coefficients for Respuesta (coded units) Term Effect Coef SE Coef T P Constant 73.2750 0.1851 395.94 0.000 A 2.0500 1.0250 0.1851 5.54 0.005 B 1.1500 0.5750 0.1851 3.11 0.036 A*B -0.7500 -0.3750 0.1851 -2.03 0.113 Ct Pt 2.0450 0.2483 8.24 0.001 S = 0.370135 R-Sq = 96.56% R-Sq(adj) = 93.12% Analysis of Variance for Respuesta (coded units) Source DF Seq SS Adj SS Adj MS F P Main Effects 2 5.5250 5.52500 2.7625 20.16 0.008 2-Way Interactions 1 0.5625 0.56250 0.5625 4.11 0.113 Curvature 1 9.2934 9.29339 9.2934 67.83 0.001 Residual Error 4 0.5480 0.54800 0.1370 Pure Error 4 0.5480 0.54800 0.1370 Total 8 15.9289 195
  • 199. Sección 11: Metodología de Respuesta Los resultados muestran un p value de 0.001 para la curvatura, esto nos dice entonces que un modelo de primer orden no es suficiente para llegar al punto optimo, de manera que se concluye que después de analizar los datos con el primer modelo de primer orden hecho, se debe pasar a uno de segundo orden con el fin de llegar a la configuración de factores que dan la respuesta optima para el problema. 6. Se procede entonces a hacer un modelo considerando puntos axiales. El modelo que se usa en este caso para ajustar uno de segundo orden tiene el nombre de diseño central compuesto. El número de puntos axiales que debe existir en el modelo se obtiene multiplicando 2*k, siendo k el numero de factores. De esta manera para este modelo donde se tienen 2 factores, el número de puntos axiales corresponde a 2*2 = 4 puntos. Ahora para encontrar la distancia en valores codificados a los cuales deben ponerse esos puntos se tiene en cuenta lo siguiente: α = ( 2 k )1 / 4 Donde k corresponde al número de factores. Por lo tanto para este ejemplo particular, la distancia a la que deben estar los puntos axiales es: (0, 1.41) (-1, 1) (1, 1) (-1.41, 0) (1.41, 0) Todos los puntos (-1, - 1) (1,- 1) marcados con la raya verde son los puntos axiales, note que están fuera de los niveles a los (0, -1.41) 196
  • 200. Sección 11: Metodología de Respuesta Teniendo entonces los puntos axiales, se procede a realizar el experimento en esos niveles para obtener datos de la respuesta. La siguiente tabla muestra las respuestas obtenidas, donde se incluyen las respuestas obtenidas en el experimento anterior y las respuestas obtenidas en los niveles de los puntos axiales: Variables codificadas Respuesta X1 X2 Y -1 -1 71.3 -1 1 73.2 1 -1 74.1 1 1 74.5 0 0 75.1 0 0 75.8 0 0 74.9 0 0 75.2 0 0 75.6 -1.41 0 72.3 1.41 0 74.8 0 -1.41 73.5 0 1.41 75.1 7. Teniendo las respuestas, se ingresan los datos a Minitab de la siguiente manera: • En el menú de stat, se hace clik sobre el menú de DOE, luego se hace click sobre la opción de Response Surface, allí se hace click sobre la opción de create a response surface design. La siguiente figura ilustra lo anterior: 197
  • 201. Sección 11: Metodología de Respuesta • La siguiente figura, muestra las opciones para realizar el análisis. Para este caso se toma la opción de central composite y se definen los dos factores que se involucraron en el ejemplo: • Luego se hace click sobre la opción Designs, para definir el tipo de diseño que se desea. La siguiente figura ilustra lo descrito: 198
  • 202. Sección 11: Metodología de Respuesta • Al dar click sobre el botón de ok se obtienen los siguientes resultados (se anadio la columna correspondiente a las respuestas): 199
  • 203. Sección 11: Metodología de Respuesta • Teniendo el diseño, se procede a analizar las respuestas. Para el análisis, en el menú de response surface se hace click sobre la opción analyze response surface design, como muestra la siguiente figura: • Se despliega la siguiente ventana donde se procede a especificar la columna de respuestas y si las variables están en su forma codificada como es el caso de este ejemplo: 200
  • 204. Sección 11: Metodología de Respuesta • En el menú de terms, se procede a especificar los términos que están incluidos dentro del modelo como muestra la figura: • Al dar clik en el botón de ok, se obtienen los siguientes resultados: Response Surface Regression: Respuesta_1 versus A, B The analysis was done using coded units. Estimated Regression Coefficients for Respuesta_1 Term Coef SE Coef T P Constant 75.3215 0.2003 375.959 0.000 A 0.9560 0.1586 6.027 0.001 B 0.5712 0.1586 3.601 0.009 A*A -1.0524 0.1706 -6.170 0.000 B*B -0.6752 0.1706 -3.958 0.005 A*B -0.3750 0.2240 -1.674 0.138 S = 0.4480 R-Sq = 93.5% R-Sq(adj) = 88.8% Analysis of Variance for Respuesta_1 Source DF Seq SS Adj SS Adj MS F P Regression 5 20.1459 20.1459 4.0292 20.08 0.001 Linear 2 9.8916 9.8916 4.9458 24.64 0.001 Square 2 9.6918 9.6918 4.8459 24.15 0.001 Interaction 1 0.5625 0.5625 0.5625 2.80 0.138 Residual Error 7 1.4049 1.4049 0.2007 Lack-of-Fit 3 0.8569 0.8569 0.2856 2.08 0.245 Pure Error 4 0.5480 0.5480 0.1370 Total 12 21.5508 201
  • 205. Sección 11: Metodología de Respuesta Se puede ver como los componentes cuadráticos de los factores resultan ser significativos, de manera que un modelo lineal no hubiese podido describir adecuadamente lo que sucede a la respuesta al variar los niveles de los factores. Ademas de esto se observa un componente adicional en el Anova: Lack of fit. Este componente muestra no ser significativo, sin embargo, si lo hubiese sido, implicaría entonces que es necesario aplicar un modelo de mayor orden para describir lo que sucede a la respuesta al variar los niveles de los factores. • Para observar lo que sucede a la respuesta cuando se varían los niveles de los factores se realiza entonces el grafico de superficie. En Minitab en el menú de graph se escoge la opción 3D surface plot como muestra la siguiente figura: • Luego se escoge el tipo de grafico que se desea como muestra la figura: • En la siguiente ventana se introducen las columnas correspondientes a la respuesta y los factores: 202
  • 206. Sección 11: Metodología de Respuesta • Se da click en el botón de ok y se obtiene el siguiente grafico: Surface Plot of Respuesta_1 vs A, B 76 74 Respuesta_1 72 1 0 A -1 -1 0 B 1 Se observa entonces que la respuesta aumenta cuando A esta en su nivel alto y B esta en niveles entre 0 y 1. De manera que el ingeniero debe usar una combinación de estos dos niveles para lograr un incremento en el porcentaje de producción. 203