Tema 2
Estimación por intervalos de
confianza y contrastes de hipótesis
Estadística Avanzada
Ana D. Maldonado
Departamento de Matemáticas, Universidad de Almería
Índice
1 Planteamiento general de un intervalo de confianza
2 Metodología general de contrucción de un intervalo de confianza
3 Planteamiento general de un contraste de hipótesis paramétrico
4 Método de construcción de contrastes de hipótesis
5 Intervalos de confianza y contrastes de hipótesis de uso frecuente
© Ana D. Maldonado 2
PLANTEAMIENTO GENERAL DE UN INTERVALO DE
CONFIANZA
© Ana D. Maldonado 3
Planteamiento General de un Intervalo de Confianza
En el tema anterior aprendimos que los estimadores son funciones de las observaciones
muestrales, y cuando se calcula el valor del estimador θ̂ para una muestra concreta entonces
se tiene la estimación puntual.
Ejemplo 10 del Tema 1
Para estimar el tiempo medio, µ, en atender a un cliente se obtiene una muestra de 10 clientes
seleccionados al azar y se mide el tiempo, en segundos, en ser atendidos en una ventanilla, obteniendo:
115, 78, 194, 91, 110, 50, 61, 176, 163, 156
La estimación puntual del tiempo medio en atender a un cliente fue de µ̂ = X̂n = 119.4
© Ana D. Maldonado 4
Planteamiento General de un Intervalo de Confianza
Sabemos que el valor proporcionado por la estimación puntual generalmente difiere del
verdadero valor del parámetro θ. La pregunta que nos hacemos ahora es ¿cuánto difiere? Es
deseable proporcionar, junto a la estimación puntual, un intervalo que medida del posible
error asociado a la estimación del parámetro.
Ejemplo 10 del Tema 1 (continuación)
Sabemos que el verdadero valor de µ no es exactamente 119.4.
En este tema, aprenderemos a construir un intervalo [θ̂1, θ̂2] dentro del cual esperaríamos
encontrar el valor del parámetro θ. Este intervalo se conoce como intervalo de confianza.
© Ana D. Maldonado 5
Planteamiento General de un Intervalo de Confianza
• Toda aproximación debe ir acompañada de una acotación de error cometido.
• En el Tema 1 se definió un error cuadrático medio, pero sólo como criterio de elección
entre estimadores, no como una medida del error de una estimación.
Para tratar de dar una aproximación más adecuada del parámetro que estemos estudiando,
usaremos los intervalos de confianza.
Intervalo de confianza
A partir de una muestra, construiremos dos cantidades numéricas, θ̂1 y θ̂2, de tal manera que el
intervalo [θ̂1, θ̂2] ofrezca unas garantías determinadas de contener al valor desconocido de θ. Además
lo que pretendemos es que el intervalo obtenido sea de amplitud mínima.
© Ana D. Maldonado 6
Planteamiento General de un Intervalo de Confianza
Considérese una población representada por X → f(x; θ), con θ desconocida.
Dada una muestra aleatoria simple de X, X1, . . . , Xn, determinamos dos funciones a partir de
los valores muestrales, θ̂1(X1, . . . , Xn), θ̂2(X1, . . . , Xn), denotados por θ̂1(X) y θ̂2(X).
• Antes de particularizar su valor para la muestra, θ̂1(X) y θ̂2(X) son funciones que
dependen de la muestra; por lo tanto, son variables aleatorias.
• A partir del resultado de una muestra, θ̂1 y θ̂2, se convierten en valores fijos.
© Ana D. Maldonado 7
Planteamiento General de un Intervalo de Confianza
Estimación por intervalo del parámetro θ
Dado que el objetivo es construir un intervalo cuya probabilidad de contener al verdadero valor del
parámetro, θ, sea muy alta, tenemos que determinar dos funciones, θ̂1(X) y θ̂2(X), que nos darán los
valores extremos del intervalo, tales que
P[θ̂1(X) ≤ θ ≤ θ̂2(X)] = 1 − α (1)
donde
• 0 < α < 1, normalmente pequeño. Valores típicos de α son 0.05, 0.1 y 0.01.
• 1 − α recibe el nombre de nivel de confianza.
© Ana D. Maldonado 8
Planteamiento General de un Intervalo de Confianza
Interpretación del intervalo de confianza
Observando el intervalo dado en la expresión (1) se pone de manifiesto:
• Que se trata de un intervalo aleatorio, pues los extremos dependen de la muestra seleccionada y,
por tanto, las funciones θ̂1(X) y θ̂2(X) son variables aleatorias.
• Que el parámetro desconocido θ se considera un valor fijo, no una variable aleatoria.
• En consecuencia, en incorrecto interpretar que 1 − α es la probabilidad de que θ esté entre θ̂1 y θ̂2
Por lo tanto, la interpretación correcta de la expresión (1) es que 1 − α es la probabilidad de que el
intervalo aleatorio [θ̂1(X), θ̂2(X)] incluya al verdadero valor del parámetro.
Interpretación de un IC dada una muestra
Una vez seleccionada la muestra, la probabilidad de que el verdadero valor del parámetro esté en el
intervalo [θ̂1, θ̂2] es 1 si de verdad está o 0 si no está entre los dos números en los que se convierten θ̂1 y
θ̂2 al particularizarlos para la muestra X1, . . . , Xn concreta.
© Ana D. Maldonado 9
Planteamiento General de un Intervalo de Confianza
Interpretación del concepto de confianza
Si se repitiera el experimento muestral X1, . . . , Xn un número suficiente de veces, es decir, se obtuviese
muchas muestras distintas, el 100(1 − α)% de casos se confiaría en que el verdadero valor del
parámetro θ pertenezca al intervalo [θ̂1(X), θ̂2(X)].
Por ejemplo, para un nivel de confianza del
95%, si tomamos 100 muestras aleatorias
de tamaño n de la misma población,
esperamos que aprox. el 95% de ellos
contendrán el verdadero valor del
parámetro y el 5% restante no. Pero como
en la práctica solo tomamos una muestra
aleatoria, no conocemos si nuestro
intervalo es uno del 95% o del 5% y por eso
hablamos de que tenemos un nivel de
confianza del 95%.
© Ana D. Maldonado 10
METODOLOGÍA GENERAL DE CONTRUCCIÓN DE UN
INTERVALO DE CONFIANZA
© Ana D. Maldonado 11
Metodología general de construcción de un IC
Método pivote
Este método consiste básicamente en la obtención de un estadístico llamado pivote T(X1, . . . , Xn, θ)
que verifique las siguientes condiciones:
1. El pivote T(X1, . . . , Xn, θ) es una función de las observaciones muestrales y del parámetro θ, de tal
manera que para cada muestra solo dependerá de θ.
2. La distribución muestral del pivote T(X1, . . . , Xn, θ) es conocida y no depende del parámetro θ.
© Ana D. Maldonado 12
Método Pivote
Al conocer la distribución muestral del pivote y no depender del parámetro θ, dado un nivel
de confianza 1 − α, podemos calcular de forma sencilla dos valores λ1 y λ2 que cumplan
P[λ1 ≤ T(X1, . . . , Xn, θ) ≤ λ2] = 1 − α (2)
Este par λ1 y λ2 no son únicos. ¿Cómo escogemos los valores λ1 y λ2, al no ser únicos?
Selección de λ1 y λ2
Escogeremos λ1 y λ2 de forma que se reparta la probabilidad sobrante α en dos mitades (suele
coincidir con el IC de amplitud mínima.)
© Ana D. Maldonado 13
Método Pivote
Una vez tengamos λ1 y λ2, despejamos θ de T(X1, . . . , Xn, θ) y obtendremos
P[ ˆ
θ1(X1, . . . , Xn, λ1) ≤ θ ≤ ˆ
θ2(X1, . . . , Xn, λ2)] = 1 − α
que es lo que buscábamos.
Condiciones Método Pivote
1. La existencia de T(X1, . . . , Xn, θ), cuya distribución esté totalmente determinada y que no dependa
de θ.
2. La posibilidad de despejar θ en la doble desigualdad del interior de los corchetes de la expresión
(2).
© Ana D. Maldonado 14
Método Pivote
Ejemplo 1
Sea X1, . . . , Xn una muestra aleatoria procedente de una población N(µ, σ), con σ conocida. Deseamos
obtener el intervalo de confianza al nivel del 95% para el parámetro poblacional µ.
© Ana D. Maldonado 15
Método Pivote
Ejemplo 1 (Solución)
© Ana D. Maldonado 16
Método Pivote
Ejemplo 1 (Solución)
© Ana D. Maldonado 17
Método Pivote
Ejemplo 1 (Solución)
© Ana D. Maldonado 18
PLANTEAMIENTO GENERAL DE UN CONTRASTE DE
HIPÓTESIS PARAMÉTRICO
© Ana D. Maldonado 19
Planteamiento General de un Contraste de Hipótesis
Mientras que los intervalos de confianza se utilizan para estimar parámetros, los contrastes
o test de hipótesis sirven para tomar decisiones acerca de las características poblacionales.
Ambos métodos de inferencia estás estrechamente ligados ya que se basan en las mismas
distribuciones muestrales.
Contrastes de hipótesis
Un contraste de hipótesis tiene como objetivo decidir si una determinada hipótesis sobre la
distribución en estudio es confirmada o invalidada a partir de las observaciones de una muestra.
Ejemplos de hipótesis
• Una compañía recibe un gran cargamento de piezas. Sólo acepta el envío si no hay más de un 5%
de piezas defectuosas. ¿Cómo tomar una decisión sin verificar todas las piezas?
• Un investigador quiere saber si una propuesta de reforma fiscal es acogida de igual forma por
hombres y mujeres. ¿Cómo puede comprobar esa conjetura?
© Ana D. Maldonado 20
Conceptos básicos
Hipótesis estadística
Una hipótesis estadística es cualquier afirmación sobre alguna característica desconocida de la
población.
• Si la hipótesis se refiere al valor de un parámetro desconocido θ de la población, diremos que se
trata de un contraste paramétrico.
• Si la hipótesis se refiere al modelo probabilístico de la población, hablaremos de contrastes no
paramétricos (Tema 3).
En cualquier caso, el primer paso para contrastar hipótesis es definir dos alternativas que
cubran todos los resultados posibles; esto es lo que llamaremos hipótesis nula e hipótesis
alternativa.
© Ana D. Maldonado 21
Conceptos básicos
Llamaremos hipótesis nula, H0, a la hipótesis que se contrasta. El nombre de "nula" proviene
de que H0 representa la hipótesis que mantendremos a no ser que los datos indiquen su
falsedad, y debe entenderse, por tanto, en el sentido de "neutra". La hipótesis H0 nunca se
considera probada, aunque puede ser rechazada por los datos.
Observaciones sobre la hipótesis nula
• La hipótesis nula es la que se quiere contrastar.
• Se denota por H0.
• Viene dada por una igualdad o afirmación positiva.
• El contraste de hipótesis NO sirve para demostrar H0.
• A partir de los datos de la muestra, la conclusión del contraste será:
• Rechazar H0, si hay una fuerte evidencia en su contra.
• No rechazar H0, si NO hay suficiente evidencia de que sea falsa (es decir, dada la muestra
observada, es aceptable suponer que H0 es cierta).
© Ana D. Maldonado 22
Conceptos básicos
Si rechazamos H0 estamos implícitamente aceptando una hipótesis alternativa, H1.
Aceptamos H1 si los datos de la muestra indican claramente que H0 no es cierta, y por tanto,
su contrario, H1, debe ser cierto.
Observaciones sobre la hipótesis alternativa
• La hipótesis alternativa es la negación de H0.
• Se denota por H1.
• H1 nunca contiene los signos ‘=’, ‘≤’, ‘≥’.
• H1 puede aceptarse o no aceptarse.
• El contraste de hipótesis sirve para demostrar H1, ya que requiere una fuerte evidencia (en contra
de H0) para ser aceptada. Por lo tanto, H1 es la hipótesis que se desea probar fuera de toda duda
(salvo error α).
© Ana D. Maldonado 23
Tipos de error
DECISIÓN
No rechazar H0 Rechazar H0
H0 cierta
correcta errónea
H0 falsa
errónea correcta
© Ana D. Maldonado 24
Tipos de error
DECISIÓN
No rechazar H0 Rechazar H0
H0 cierta
correcta
Nivel de confianza:
1-α
errónea
Error de tipo I (Nivel de
significación: α)
H0 falsa
errónea
Error de tipo II (β)
correcta
Potencia: 1 − β
© Ana D. Maldonado 24
Tipos de error
Tipos de error en un contraste de hipótesis
• Error de Tipo I: Rechazar H0 cuando es cierta.
• Error de Tipo II: Aceptar H0 cuando es falsa.
© Ana D. Maldonado 25
Tipos de error
El test de hipótesis se debería diseñar de forma que los errores tipo I y tipo II no se
cometieran de forma frecuente, es decir, que tengan una baja probabilidad.
Probabilidad del error tipo I y tipo II
α = P(Error tipo I) ; β = P(Error tipo II)
• α recibe el nombre de nivel de significación del test.
• 1 − β recibe el nombre de potencia del test. Nótese que
1 − β = P(Rechazar H0 cuando es falsa)
© Ana D. Maldonado 26
Tipos de error
α: probabilidad de rechazar H0 cuando es cierta (error tipo I)
β: probabilidad de no rechazar H0 cuando es falsa (error tipo II)
potencia: probabilidad de rechazar H0 cuando es falsa
© Ana D. Maldonado 27
Ejemplo
Ejemplo 2
Una empresa sabe que el tiempo necesario para atender la queja de un cliente es una variable aleatoria
X → N(µ, 4), e intenta determinar, para mejorar su servicio, si el tiempo medio necesario para atender
la queja de un cliente ha aumentado a 7 minutos o sigue siendo de 4 minutos. Para ello, se selecciona
una muestra aleatoria de 16 clientes y se mide el tiempo necesario para atender sus quejas, y si la
media muestral es mayor que 5.6, se rechaza que µ = 4, y por lo tanto se acepta que µ = 7.
1. Determinar la probabilidad de los errores Tipo I y Tipo II. (Sol: 0.0548; 0.0808)
2. Determinar la potencia del test. (Sol: 0.9192)
3. Si deseamos una probabilidad de cometer un error de Tipo I igual al 2%, determinar la región
crítica y la probabilidad de cometer un error de Tipo II. (Sol: C = (6.0537, + ∞); 0.172)
© Ana D. Maldonado 28
Ejemplo
Ejemplo 2 (Solución)
© Ana D. Maldonado 29
Ejemplo
Ejemplo 2 (Solución)
© Ana D. Maldonado 30
Ejemplo
Ejemplo 2 (Solución)
© Ana D. Maldonado 31
Ejemplo
Ejemplo 2 (Solución)
© Ana D. Maldonado 32
Ejemplo
Ejemplo 2 (Solución)
© Ana D. Maldonado 33
Ejemplo
Ejemplo 2 (Solución)
© Ana D. Maldonado 34
Ejemplo
Ejemplo 2 (Solución)
© Ana D. Maldonado 35
Tipos de error
Observación
Hemos visto que al disminuir α (ha pasado de 0.0548 a 0.02), aumenta β (ha pasado de 0.0808 a
0.172). Lo ideal es minimizar la probabilidad de cometer ambos errores, α y β, pero esto no se puede
lograr simultáneamente, ya que al disminuir uno, aumenta el otro. La única forma de lograrlo es
incrementar el tamaño de la muestra.
© Ana D. Maldonado 36
MÉTODO DE CONSTRUCCIÓN DE CONTRASTES DE
HIPÓTESIS
© Ana D. Maldonado 37
Método de construcción de un Contraste de Hipótesis
Etapas del contraste de hipótesis
1. Definir la hipótesis nula a contrastar, H0 , y la alternativa, H1.

H0 : θ = θ0
H1 : θ 6= θ0

H0 : θ ≤ θ0
H1 : θ  θ0

H0 : θ ≥ θ0
H1 : θ  θ0
Test bilateral Test unilateral Test unilateral
© Ana D. Maldonado 38
Método de construcción de un Contraste de Hipótesis
Etapas del contraste de hipótesis (continuación)
2. Definir una medida de discrepancia, T = d(θ̂, θ0), entre los datos muestrales, X1, . . . , Xn, y H0.
Llamaremos a esta medida estadístico del contraste. Para contrastes paramétricos:
• La discrepancia puede expresarse como una función del valor del parámetro especificado
por H0 y el valor estimado en la muestra, θ̂.
• La medida de discrepancia debe tener una distribución conocida bajo el supuesto de que H0
es cierta.
3. Decidir qué discrepancias consideramos inadmisibles con H0, es decir, a partir de qué valor de
diferencia entre θ̂ y θ0 es demasiado grande para poder atribuir al azar. Esto lo hacemos fijando un
valor para α.
4. Tomar la muestra, calcular el valor del estimador θ̂ y de la discrepancia observada d(θ̂, θ0), que
usualmente se llama t0. Si ésta es pequeña, aceptar H0; si es demasiado grande, rechazar H0 y
aceptar H1.
© Ana D. Maldonado 39
Método de construcción de un Contraste de Hipótesis
Región de rechazo
El método tradicional de realizar un contraste es
1. Dividir el rango de discrepancias que puede observarse cuando H0 es cierta en dos regiones: una
región de aceptación de H0 y otra de rechazo, llamada región crítica o de rechazo.
2. Fijado α, la región de rechazo se determina a partir de la distribución de T = d(θ̂, θ0), suponiendo
que H0 es cierta.
3. Cuando la discrepancia observada (t0) en la muestra pertenece a la región de rechazo, se dice que
se ha producido una diferencia (estadísticamente) significativa, y se rechaza la hipótesis H0. Es
decir, rechazaremos H0 cuando el estadístico de contraste tome valores muy extremos.
© Ana D. Maldonado 40
Método de construcción de un Contraste de Hipótesis
p-valor
En lugar de contrastar hipótesis a niveles de significación α preasignados, también se puede hallar el
nivel de significación más bajo al que se puede rechazar H0, dada la muestra concreta. Es lo que se
denomina p-valor o nivel crítico de un contraste.
Por lo tanto, se puede interpretar el p-valor como la probabilidad de obtener un valor del estadístico del
contraste igual de extremo o más que el valor obtenido para la muestra en cuestión cuando la hipótesis
nula es verdadera.
Cuando calculamos el p-valor, podemos contrastar H0 utilizando la siguiente regla:
• No rechazar H0 si p ≥ α
• Rechazar H0 si p  α
© Ana D. Maldonado 41
Método de construcción de un Contraste de Hipótesis
Cálculo del p-valor
• Contraste bilateral (H1 : θ 6= θ0): 2 · min{P(T  t0|H0 cierta), P(T  t0|H0 cierta)}
• Contraste unilateral por la derecha (H1 : θ  θ0): P(T  t0|H0 cierta)
• Contraste unilateral por la izquierda (H1 : θ  θ0): P(T  t0|H0 cierta)
© Ana D. Maldonado 42
Método de construcción de un Contraste de Hipótesis
p-valor o región crítica
• Las conclusiones son las mismas, ambas reglas de decisión son equivalentes. Si aceptamos H0
basándonos en p-valor, también la aceptaremos basándonos en la región crítica, y viceversa.
• En SPSS solo se muestran p-valores, no regiones críticas, al resolver contrastes de hipótesis.
© Ana D. Maldonado 43
INTERVALOS DE CONFIANZA Y CONTRASTES DE
HIPÓTESIS DE USO FRECUENTE
© Ana D. Maldonado 44
IC y CH de uso frecuente
Vamos a estudiar los siguientes Intervalos de Confianza (IC) y Contrastes de Hipótesis (CH)
para poblaciones normales y proporciones:
• IC y CH para poblaciones normales
• Para la media de una distribución. diapositiva 47
• Igualdad de varianzas de dos muestras independientes. diapositiva 56
• Igualdad de medias de dos muestras independientes
• con varianzas desconocidas, pero iguales. diapositiva 65
• con varianzas desconocidas, no necesariamente iguales. diapositiva 67
• Igualdad de medias de dos muestras emparejadas. diapositiva 76
• IC y CH para proporciones
• Una muestra. diapositiva 84
• Dos muestras. diapositiva 90
© Ana D. Maldonado 45
Muestras independientes y relacionadas
Muestras independientes
En las muestras independientes, los elementos
de una muestra no están relacionados con los
elementos de la otra muestra. Por tanto, las
muestras independientes son mediciones
realizadas en 2 conjuntos de elementos
diferentes.
Muestras relacionadas
En las muestras relacionadas (emparejadas o
pareadas), cada elemento de una muestra está
relacionado con un elemento de la otra muestra.
Por ejemplo, mediciones realizadas sobre el
mismo conjunto de elementos antes y después
de un evento.
© Ana D. Maldonado 46
IC y CH para la media de una Población Normal
Una muestra
Si consideramos una población en donde existe una variable X → N(µ, σ), cuya media µ es
desconocida y disponemos de una muestra X1, . . . , Xn podemos obtener:
• Intervalo de confianza para µ con el estadístico pivote:
X̄ − µ
S/
√
n
→ t(n − 1)
• Contrastes bilaterales y unilaterales para µ, mediante el estadístico de contraste:
T =
X̄ − µ0
S/
√
n
→ t(n − 1)
donde X̄ es la media muestral y S2
es la varianza muestral.
i
© Ana D. Maldonado 47
IC y CH para la media de una Población Normal
Contrastes de Hipótesis para µ: prueba t de Student
Contraste Estadístico Contraste Región Crítica P-valor
H0 : µ = µ0
H1 : µ 6= µ0

[T  tn−1, α
2
] ∪ [T  tn−1,1− α
2
] 2 · min
n
P[T  t0], P[T  t0]
o
H0 : µ ≤ µ0
H1 : µ  µ0

T =
X̄ − µ0
S/
√
n
→ t(n − 1) [T  tn−1,1−α] P[T  t0]
H0 : µ ≥ µ0
H1 : µ  µ0

[T  tn−1,α] P[T  t0]
© Ana D. Maldonado 48
IC y CH para la media de una Población Normal
Ejemplo 3
Se supone que el peso en gramos de los huevos procedentes de una granja sigue una distribución
normal. Seleccionada aleatoriamente una muestra de 8 huevos, se obtuvieron los siguientes pesos
70, 70, 68, 68, 69, 71, 67, 70
Se pide el intervalo de confianza y contrastar la hipótesis de que el peso medio de los huevos
procedentes de dicha granja es igual a 70 gramos, utilizando en ambos casos un nivel de confianza del
95%. (Sol: [67.99, 70.26]; p-valor = 0.1107)
© Ana D. Maldonado 49
IC y CH para la media de una Población Normal
Ejemplo 3 (Solución Intervalo de confianza)
© Ana D. Maldonado 50
IC y CH para la media de una Población Normal
Ejemplo 3 (Solución Intervalo de confianza)
© Ana D. Maldonado 51
IC y CH para la media de una Población Normal
Ejemplo 3 (Solución Intervalo de confianza)
© Ana D. Maldonado 52
IC y CH para la media de una Población Normal
Ejemplo 3 (Solución Contraste de hipótesis)
© Ana D. Maldonado 53
IC y CH para la media de una Población Normal
Ejemplo 3 (Solución Contraste de hipótesis)
© Ana D. Maldonado 54
IC y CH para la media de una Población Normal
Ejemplo 3 (Solución Contraste de hipótesis)
© Ana D. Maldonado 55
CH para dos Poblaciones Normales: varianzas
Los contrastes de hipótesis relativos a la varianza son cada vez más importantes. Por
ejemplo:
• Las empresas tratan de reducir la variabilidad de los procesos con el fin de garantizar
que todas las unidades producidas sean de alta calidad.
• En los estudios de control de calidad, a menudo se trata de saber qué proceso tiene la
menor varianza.
• En investigación financiera, la varianza se puede utilizar como una medida del riesgo de
una acción en el mercado de valores. Cuanto mayor sea la varianza, mayor será el
riesgo.
i
© Ana D. Maldonado 56
CH para dos Poblaciones Normales: varianzas
Dos muestras independientes
Si consideramos una población en donde existen dos variables independientes:
X → N(µx, σx), Y → N(µy, σy)
cuyas medias y varianzas son desconocidas, podemos considerar el siguiente contraste de hipótesis
bilateral sobre las varianzas:

H0 : σ2
x = σ2
y
H1 : σ2
x 6= σ2
y
Para ello, es fundamental disponer de dos muestras independientes.
© Ana D. Maldonado 57
CH para dos Poblaciones Normales: varianzas
Dos muestras independientes
El test de Levene se utiliza para contrastar la igualdad de varianzas en dos (o más) muestras
independientes. El estadístico de contraste para la realización del test es:
F =
n(D̄1 − D̄)2
+ m(D̄2 − D̄)2
n
X
i=1
(D1i − D̄1)2
+
m
X
i=1
(D2i − D̄2)2
n+m−2
→ F(1, n + m − 2)
donde
• n y m son el tamaño muestral de X e Y, respectivamente
• D1i = |xi − x̄| y D2i = |yi − ȳ|
• D̄1 =
Pn
i=1 D1i
n y D̄2 =
Pm
i=1 D2i
m
• D̄ =
Pn
i=1 D1i+
Pm
i=1 D2i
n+m
© Ana D. Maldonado 58
CH para dos Poblaciones Normales: varianzas
Contrastes de Hipótesis para Igualdad de Varianzas: prueba de Levene
Contraste Estadístico Contraste P-valor
H0 : σ2
x = σ2
y
H1 : σ2
x 6= σ2
y

F =
n(D̄1 − D̄)2
+ m(D̄2 − D̄)2
n
X
i=1
(D1i − D̄1)2
+
m
X
i=1
(D2i − D̄2)2
n+m−2
→ F(1, n + m − 2) P[F  f0]
© Ana D. Maldonado 59
CH para dos Poblaciones Normales: varianzas
Ejemplo 4
En un estudio sobre los préstamos realizados por dos entidades financieras a sus clientes se toma una
muestra aleatoria de 6 préstamos de la primera entidad, obteniendo como resultado la siguiente
muestra:
7000, 8500, 9900, 10000, 6900, 7100
Una muestra aleatoria, independiente de la anterior, de 9 préstamos de la segunda entidad ofreció
como resultado la siguiente muestra
2000, 3600, 5000, 3000, 2500, 6100, 4000, 3300, 2200
Admitiendo que las dos distribuciones poblacionales son normales, contrastar a nivel de significación
del 5% si podemos aceptar la igualdad de varianzas de ambas poblaciones. (Sol: p-valor = 0.584)
© Ana D. Maldonado 60
CH para dos Poblaciones Normales: varianzas
Ejemplo 4 (Solución)
© Ana D. Maldonado 61
CH para dos Poblaciones Normales: varianzas
Ejemplo 4 (Solución)
© Ana D. Maldonado 62
CH para dos Poblaciones Normales: varianzas
Ejemplo 4 (Solución)
© Ana D. Maldonado 63
IC y CH para dos Poblaciones Normales: medias
Dos muestras independientes
Si consideramos una población en donde existen dos variables independientes:
X → N(µx, σx), Y → N(µy, σy)
cuyas medias µx y µy son desconocidas, podemos obtener:
• Intervalo de confianza para la diferencia de medias, µx − µy.
• Contrastes de hipótesis bilaterales y unilaterales para la diferencia de medias, µx − µy.
Para ello, es fundamental disponer de dos muestras independientes, X e Y, de tamaños n y m,
respectivamente.
Además, tanto el pivote como el estadístico del contraste para la diferencia de medias dependen de si
las varianzas son iguales σ2
x = σ2
y o si son distintas σ2
x 6= σ2
y , cuestión que podemos determinar con el
contraste anteriormente estudiado para varianzas.
i
© Ana D. Maldonado 64
IC y CH para dos Poblaciones Normales: medias
Caso 1: varianzas poblacionales desconocidas pero iguales, σ2
x = σ2
y
• Intervalos de Confianza. Si σ2
x = σ2
y , el estadístico pivote viene dado por:
X̄ − Ȳ − (µx − µy)
Sp
p
(1/n) + (1/m)
→ t(n + m − 2)
• Contrastes de Hipótesis. Si σ2
x = σ2
y , el estadístico de contraste viene dado por:
T =
X̄ − Ȳ − ∆0
Sp
p
(1/n) + (1/m)
→ t(n + m − 2)
donde
S2
p =
(n − 1)S2
x + (m − 1)S2
y
n + m − 2
y X̄ e Ȳ son las respectivas medias muestrales y S2
x y S2
y son las respectivas varianzas muestrales. i
© Ana D. Maldonado 65
IC y CH para dos Poblaciones Normales: medias
Contrastes de Hipótesis para µx − µy. Caso σ2
x = σ2
y
Contraste Estadístico Contraste P-valor
H0 : µx − µy = ∆0
H1 : µx − µy 6= ∆0

2 · min
n
P[T  t0], P[T  t0]
o
H0 : µx − µy ≤ ∆0
H1 : µx − µy  ∆0

T =
X̄ − Ȳ − ∆0
Sp
p
(1/n) + (1/m)
→ t(n + m − 2) P[T  t0]
H0 : µx − µy ≥ ∆0
H1 : µx − µy  ∆0

S2
p =
(n − 1)S2
x + (m − 1)S2
y
n + m − 2
P[T  t0]
© Ana D. Maldonado 66
IC y CH para dos Poblaciones Normales: medias
Caso 2: varianzas poblacionales desconocidas y distintas, σ2
x 6= σ2
y
• Intervalos de Confianza. Si σ2
x 6= σ2
y , el estadístico pivote viene dado por:
X̄ − Ȳ − (µx − µy)
q
(S2
x /n) + (S2
y /m)
→ t([ν])
• Contrastes de Hipótesis. Si σ2
x 6= σ2
y , el estadístico de contraste viene dado por:
T =
X̄ − Ȳ − ∆0
q
(S2
x /n) + (S2
y /m)
→ t([ν])
donde
ν =
(S2
x /n + S2
y /m)2
(S2
x /n)2/(n − 1) + (S2
y /m)2/(m − 1)
y X̄ e Ȳ son las respectivas medias muestrales y S2
x y S2
y son las respectivas varianzas muestrales. i
© Ana D. Maldonado 67
IC y CH para dos Poblaciones Normales: medias
Contrastes de Hipótesis para µx − µy. Caso σ2
x 6= σ2
y
Contraste Estadístico Contraste P-valor
H0 : µx − µy = ∆0
H1 : µx − µy 6= ∆0

2 · min
n
P[T  t0], P[T  t0]
o
H0 : µx − µy ≤ ∆0
H1 : µx − µy  ∆0

T =
X̄ − Ȳ − ∆0
q
(S2
x /n) + (S2
y /m)
→ t([ν]) P[T  t0]
H0 : µx − µy ≥ ∆0
H1 : µx − µy  ∆0

ν =
(S2
x /n + S2
y /m)2
(S2
x /n)2/(n − 1) + (S2
y /m)2/(m − 1)
P[T  t0]
© Ana D. Maldonado 68
IC y CH para dos Poblaciones Normales: medias
Ejemplo 5
En un estudio sobre los préstamos realizados por dos entidades financieras a sus clientes se toma una
muestra aleatoria de 6 préstamos de la primera entidad, obteniendo como resultado la siguiente
muestra:
7000, 8500, 9900, 10000, 6900, 7100
Una muestra aleatoria, independiente de la anterior, de 9 préstamos de la segunda entidad ofreció
como resultado la siguiente muestra
2000, 3600, 5000, 3000, 2500, 6100, 4000, 3300, 2200
Admitiendo que las dos distribuciones poblacionales son normales, obtener al nivel del 95% un
intervalo de confianza para la diferencia entre sus medias poblacionales. (Sol: [3130.863, 6291.359])
© Ana D. Maldonado 69
IC y CH para dos Poblaciones Normales: medias
Ejemplo 5 (Solución)
© Ana D. Maldonado 70
IC y CH para dos Poblaciones Normales: medias
Ejemplo 5 (Solución)
© Ana D. Maldonado 71
IC y CH para dos Poblaciones Normales: medias
Ejemplo 5 (Solución)
© Ana D. Maldonado 72
IC y CH para dos Poblaciones Normales: medias
Ejemplo 6
En un estudio sobre los préstamos realizados por dos entidades financieras a sus clientes se toma una
muestra aleatoria de 6 préstamos de la primera entidad, obteniendo como resultado la siguiente
muestra:
7000, 8500, 9900, 10000, 6900, 7100
Una muestra aleatoria, independiente de la anterior, de 9 préstamos de la segunda entidad ofreció
como resultado la siguiente muestra
2000, 3600, 5000, 3000, 2500, 6100, 4000, 3300, 2200
Admitiendo que las dos distribuciones poblacionales son normales, ¿podemos considerar que los
importes medios de los préstamos de las dos entidades financieras son iguales? (Sol: p-valor = 2.2e-5)
© Ana D. Maldonado 73
IC y CH para dos Poblaciones Normales: medias
Ejemplo 6 (Solución)
© Ana D. Maldonado 74
IC y CH para dos Poblaciones Normales: medias
Ejemplo 6 (Solución)
© Ana D. Maldonado 75
IC y CH para dos Poblaciones Normales: medias
Dos muestras apareadas
Si al igual que el caso anterior, consideramos una población en donde existen dos variables:
X → N(µx, σx), Y → N(µy, σy)
pero suponemos que ambas variables son dependientes, sus correspondientes muestras deben ser de
igual tamaño n
Muestra para X: X1, . . . , Xn
Muestra para Y: Y1, . . . , Yn
y ambas muestras estarán apareadas.
i
© Ana D. Maldonado 76
IC y CH para dos Poblaciones Normales: medias
Muestras apareadas
Si desconocemos las medias poblacionales µx y µy, en el caso de muestras apareadas podemos
obtener intervalos de confianza y contrastes de hipótesis para la diferencia de medias µx − µy. Para
ello, debemos considerar la v.a D = X − Y. Con ello:
• Intervalo de Confianza para µD con el estadístico pivote:
D̄ − µD
SD/
√
n
→ t(n − 1)
• Contraste de Hipótesis para µD, mediante el estadístico de contraste:
T =
D̄ − D0
SD/
√
n
→ t(n − 1)
donde D̄ y S2
D son respectivamente la media muestral y la varianza muestral de la muestra
correspondiente a la v.a D.
© Ana D. Maldonado 77
IC y CH para dos Poblaciones Normales: medias
Contrastes de Hipótesis para µx − µy. Muestras apareadas.
Contraste Estadístico Contraste P-valor
H0 : µx − µy = ∆0
H1 : µx − µy 6= ∆0

2 · min
n
P[T  t0], P[T  t0]
o
H0 : µx − µy ≤ ∆0
H1 : µx − µy  ∆0

T =
D̄ − D0
SD/
√
n
→ t(n − 1) P[T  t0]
H0 : µx − µy ≥ ∆0
H1 : µx − µy  ∆0

D = X − Y P[T  t0]
© Ana D. Maldonado 78
IC y CH para dos Poblaciones Normales: medias
Ejemplo 7
Una empresa de marketing ofrece a una conocida editorial preparar a sus representantes mediante un
curso acelerado que, según afirma, supondrá un incremento de las ventas realizadas por éstos. Para
comprobar el resultado del curso, se seleccionó una muestra aleatoria de 6 representantes y se
contabilizó su volumen de ventas durante la semana anterior y posterior al curso. Los resultados, en
miles de euros, fueron los siguientes:
Representante 1 2 3 4 5 6
Ventas antes 130.2 180.7 149.6 153.2 162.6 160.1
Ventas después 136.9 201.5 167.3 150.1 173.3 170.4
Suponiendo que la distribución del volumen semanal de ventas es normal, construir un intervalo de
confianza al 90% para la diferencia entre las ventas medias semanales antes y después del curso. (Sol:
[-17.47, -3.57])
© Ana D. Maldonado 79
IC y CH para dos Poblaciones Normales: medias
Ejemplo 7 (Solución)
© Ana D. Maldonado 80
IC y CH para dos Poblaciones Normales: medias
Ejemplo 7 (Solución)
© Ana D. Maldonado 81
IC y CH para dos Poblaciones Normales: medias
Ejemplo 7 (Solución)
© Ana D. Maldonado 82
IC y CH para dos Poblaciones Normales: medias
Ejemplo 7 (Solución)
© Ana D. Maldonado 83
Intervalos de Confianza sobre una proporción
Una muestra
Si consideramos una población de la que queremos estudiar la proporción de éxitos, siendo todo lo
demás desconocido, el intervalo de confianza se obtiene con el siguiente estadístico pivote:
T =
p̂ − p
r
p(1 − p)
n
→ N(0, 1)
Como p es desconocido, el denominador del estadístico pivote debe ser estimado mediante:
p̂(1 − p̂)
n
El intervalo de confianza es asintótico, es decir, es fiable en el límite (cuando n es grande), dado que
utiliza el Teorema Central del Límite para definir la distribución del estadístico. Por tanto podemos
obtener el intervalo si n ≥ 25.
i
© Ana D. Maldonado 84
Contrastes de Hipótesis sobre una proporción
Una muestra.
El contraste de hipótesis acerca de una proporción es un contraste asintótico, es decir, es fiable en el
límite (cuando n es grande), dado que utiliza el Teorema Central del Límite para definir la distribución
del estadístico. Si la hipótesis nula es simple y establece H0 : p = p0, entonces, si es cierta, el
estadístico:
T =
p̂ − p0
r
p0(1 − p0)
n
→ N(0, 1)
nos permite llevar a cabo el contraste (n ≥ 25).
© Ana D. Maldonado 85
Contrastes de Hipótesis sobre una proporción
Contrastes de Hipótesis para p.
Contraste Estadístico Contraste P-valor
H0 : p = p0
H1 : p 6= p0

2 · min
n
P[T  t0], P[T  t0]
o
H0 : p ≤ p0
H1 : p  p0

T =
p̂ − p0
r
p0(1 − p0)
n
→ N(0, 1) P[T  t0]
H0 : p ≥ p0
H1 : p  p0

P[T  t0]
© Ana D. Maldonado 86
Contrastes de Hipótesis sobre una proporción
Ejemplo 8
Se está intentando probar que la proporción de familias con vivienda en propiedad totalmente pagada
en una ciudad es del 20%. Para ello se toma una muestra de 800 familias y se observa que la
proporción de familias con vivienda en propiedad totalmente pagada es del 18%. ¿Es consistente la
hipótesis a probar con el resultado obtenido de la muestra con un nivel de confianza del 95%? (Sol:
p-valor = 0.1573)
© Ana D. Maldonado 87
Contrastes de Hipótesis sobre una proporción
Ejemplo 8 (Solución)
© Ana D. Maldonado 88
Contrastes de Hipótesis sobre una proporción
Ejemplo 8 (Solución)
© Ana D. Maldonado 89
Intervalos de Confianza sobre dos proporciones
Dos muestras independientes
Si consideramos una población de la que queremos estudiar si dos probabilidades de éxito (px y py)
son diferentes o no (diferencia de proporciones), siendo todo lo demás desconocido debemos
disponer de dos muestras independientes:
Muestra de tamaño n para la proporción (px): X1, . . . , Xn
Muestra de tamaño m para la proporción (py): Y1, . . . , Ym
El intervalo se obtiene con el siguiente estadístico pivote:
T =
p̂x − p̂y − (px − py)
q
p̂x(1−p̂x)
n
+
p̂y(1−p̂y)
m
→ N(0, 1)
El intervalo de confianza es asintótico, es decir, es fiable en el límite (cuando n y m son grandes y por
tanto mayores o iguales a 25).
i
© Ana D. Maldonado 90
Contrastes de Hipótesis sobre dos proporciones
Dos muestras independientes
Si consideramos una población de la que queremos estudiar si dos probabilidades de éxito (px y py)
son diferentes o no (diferencia de proporciones), siendo todo lo demás desconocido, podemos
contrastar hipótesis bilaterales y unilaterales sobre la diferencia de dichas proporciones. Para ello,
debemos disponer de dos muestras independientes.
El contraste de hipótesis para la diferencia de proporciones es asintótico y por tanto fiable en el límite
(cuando n y m mayores o iguales a 25). Si la hipótesis nula es simple y establece H0 : px = py,
entonces, si es cierta, el estadístico:
T =
p̂x − p̂y
q
n+m
nm
p̂(1 − p̂)
→ N(0, 1)
nos permite llevar a cabo el contraste, dónde p̂ =
np̂x + mp̂y
n + m
(para n y m ≥ 25).
© Ana D. Maldonado 91
Contrastes de Hipótesis sobre dos proporciones
Contrastes de Hipótesis para px − py.
Contraste Estadístico Contraste P-valor
H0 : px − py = 0
H1 : px − py 6= 0

2 · min
n
P[T  t0], P[T  t0]
o
H0 : px − py ≤ 0
H1 : px − py  0

T =
p̂x − p̂y
q
n+m
nm
p̂(1 − p̂)
→ N(0, 1) P[T  t0]
H0 : px − py ≥ 0
H1 : px − py  0

P[T  t0]
© Ana D. Maldonado 92
Contrastes de Hipótesis sobre dos proporciones
Ejemplo 9
Se desea comparar dos comunidades respecto a la proporción de personas seguidoras de un partido
político. En la comunidad A se encuestaron 500 personas de las cuales 300 se declararon seguidoras
de este partido. En la comunidad B fueron encuestadas 1000 personas de las cuales 680 se declararon
seguidoras de dicho partido. ¿Hay suficiente evidencia estadística para concluir, con un nivel de
significación del 5%, que es igual la proporción de seguidores en la comunidad A que en la B? (Sol:
p-valor = 0.0022)
© Ana D. Maldonado 93
Contrastes de Hipótesis sobre dos proporciones
Ejemplo 9 (Solución)
© Ana D. Maldonado 94
Contrastes de Hipótesis sobre dos proporciones
Ejemplo 9 (Solución)
© Ana D. Maldonado 95

Más contenido relacionado

PPT
INFERENCIA ESTADISTICA 2018.ppt
PPTX
Estadística inferencial teoria2
PDF
TEMA 5 Ingeniería de la asignatura de estadística 2024.pdf
PDF
Taller Estadistica Aplicada con Estudios para la Investigación Biométrica
PDF
Capitulo5 estimacion por_intervalo_es_de_confianza (2)
DOC
Prueba de hipótesis dc
PPTX
Intervalo de confianza para bioestadística
DOC
estadistica no parametrica
INFERENCIA ESTADISTICA 2018.ppt
Estadística inferencial teoria2
TEMA 5 Ingeniería de la asignatura de estadística 2024.pdf
Taller Estadistica Aplicada con Estudios para la Investigación Biométrica
Capitulo5 estimacion por_intervalo_es_de_confianza (2)
Prueba de hipótesis dc
Intervalo de confianza para bioestadística
estadistica no parametrica

Similar a Tema2.pdfllllllllllllllllllllllllllllllllllll (20)

DOCX
Intervalos de confianza
PPTX
PPTX
Trabajo de la unidad 3
DOCX
Unidad5 angel wha
PPTX
Presentación1
PDF
Unidad5
PDF
ESTIMACIÓN-estatica- ingenieria civil unp .pdf
DOC
Prueba de hipótesis dc
PPTX
Presentación Estadística descriptiva.pptx
DOCX
Trabajo de la unidad 3
PPTX
Inferencia Estadística con muestras grandes
PPTX
Unidad tres
DOCX
Prueba de hipótesis
DOCX
Intervalos de confianz adocx
DOCX
Intervalos de confianz adocx
PPTX
Expo extadistica1
PPTX
Intervalos de confianza
PDF
Estimacion de Parámetro.pdf
PDF
clase teorica INFERENCIA ESTADISTICA INTERVALOS DE CONFIANZA 1era parte.pdf
Intervalos de confianza
Trabajo de la unidad 3
Unidad5 angel wha
Presentación1
Unidad5
ESTIMACIÓN-estatica- ingenieria civil unp .pdf
Prueba de hipótesis dc
Presentación Estadística descriptiva.pptx
Trabajo de la unidad 3
Inferencia Estadística con muestras grandes
Unidad tres
Prueba de hipótesis
Intervalos de confianz adocx
Intervalos de confianz adocx
Expo extadistica1
Intervalos de confianza
Estimacion de Parámetro.pdf
clase teorica INFERENCIA ESTADISTICA INTERVALOS DE CONFIANZA 1era parte.pdf
Publicidad

Último (20)

PDF
PRESENTACION DE ENF. GINECO OBSTETRICAS MAS COMUNES
PPTX
Introducción a la Prótesis Parcial Removible
PDF
DIAPOSITIVAS SEMINARIO HISTORIA CLINICA.pdf
PDF
intervencio y violencia, ppt del manual
PPTX
RECIEN NACIDO PREMATURO CARACTERISTICASS
PDF
Transtorno de la personalidad grupo B.pdf
PDF
4.1.7 insuficiencia hepática aguda abordaje completo
PDF
HidradenitisSupurativa(2025-08-01).HIDROSADENITIS.doc.pdf
PDF
Ginecología tips para estudiantes de medicina
PPTX
Puerperio fisiológico y PATOLÓGICO GYO PPT
PPTX
2025 ACS Clinical Update Slide Set (1) (1).pptx
PPTX
código mater y equipo de respuesta inmediata.pptx
PPTX
PATOLOGIAS PREVALENTES DE LA REGION.pptx
PPTX
RECIEN NACIDO PATOLOGICO con síndrome re
PPT
uso mas frecuente de algunas drogas vasoactivas
PDF
Anatomía del Sistema Nervioso Clase 6.pdf
PPTX
SHOCK EN LA EMERGENCIA PEDIATRICA 2025.pptx
PDF
HISTOPLASMOSIS EN PACENTES INMUNODEPRIMIDOS
PDF
Cambios asociados a la gestación y sus cuidados
PPTX
Anatomia y Fisiología Instituto San Pablo
PRESENTACION DE ENF. GINECO OBSTETRICAS MAS COMUNES
Introducción a la Prótesis Parcial Removible
DIAPOSITIVAS SEMINARIO HISTORIA CLINICA.pdf
intervencio y violencia, ppt del manual
RECIEN NACIDO PREMATURO CARACTERISTICASS
Transtorno de la personalidad grupo B.pdf
4.1.7 insuficiencia hepática aguda abordaje completo
HidradenitisSupurativa(2025-08-01).HIDROSADENITIS.doc.pdf
Ginecología tips para estudiantes de medicina
Puerperio fisiológico y PATOLÓGICO GYO PPT
2025 ACS Clinical Update Slide Set (1) (1).pptx
código mater y equipo de respuesta inmediata.pptx
PATOLOGIAS PREVALENTES DE LA REGION.pptx
RECIEN NACIDO PATOLOGICO con síndrome re
uso mas frecuente de algunas drogas vasoactivas
Anatomía del Sistema Nervioso Clase 6.pdf
SHOCK EN LA EMERGENCIA PEDIATRICA 2025.pptx
HISTOPLASMOSIS EN PACENTES INMUNODEPRIMIDOS
Cambios asociados a la gestación y sus cuidados
Anatomia y Fisiología Instituto San Pablo
Publicidad

Tema2.pdfllllllllllllllllllllllllllllllllllll

  • 1. Tema 2 Estimación por intervalos de confianza y contrastes de hipótesis Estadística Avanzada Ana D. Maldonado Departamento de Matemáticas, Universidad de Almería
  • 2. Índice 1 Planteamiento general de un intervalo de confianza 2 Metodología general de contrucción de un intervalo de confianza 3 Planteamiento general de un contraste de hipótesis paramétrico 4 Método de construcción de contrastes de hipótesis 5 Intervalos de confianza y contrastes de hipótesis de uso frecuente © Ana D. Maldonado 2
  • 3. PLANTEAMIENTO GENERAL DE UN INTERVALO DE CONFIANZA © Ana D. Maldonado 3
  • 4. Planteamiento General de un Intervalo de Confianza En el tema anterior aprendimos que los estimadores son funciones de las observaciones muestrales, y cuando se calcula el valor del estimador θ̂ para una muestra concreta entonces se tiene la estimación puntual. Ejemplo 10 del Tema 1 Para estimar el tiempo medio, µ, en atender a un cliente se obtiene una muestra de 10 clientes seleccionados al azar y se mide el tiempo, en segundos, en ser atendidos en una ventanilla, obteniendo: 115, 78, 194, 91, 110, 50, 61, 176, 163, 156 La estimación puntual del tiempo medio en atender a un cliente fue de µ̂ = X̂n = 119.4 © Ana D. Maldonado 4
  • 5. Planteamiento General de un Intervalo de Confianza Sabemos que el valor proporcionado por la estimación puntual generalmente difiere del verdadero valor del parámetro θ. La pregunta que nos hacemos ahora es ¿cuánto difiere? Es deseable proporcionar, junto a la estimación puntual, un intervalo que medida del posible error asociado a la estimación del parámetro. Ejemplo 10 del Tema 1 (continuación) Sabemos que el verdadero valor de µ no es exactamente 119.4. En este tema, aprenderemos a construir un intervalo [θ̂1, θ̂2] dentro del cual esperaríamos encontrar el valor del parámetro θ. Este intervalo se conoce como intervalo de confianza. © Ana D. Maldonado 5
  • 6. Planteamiento General de un Intervalo de Confianza • Toda aproximación debe ir acompañada de una acotación de error cometido. • En el Tema 1 se definió un error cuadrático medio, pero sólo como criterio de elección entre estimadores, no como una medida del error de una estimación. Para tratar de dar una aproximación más adecuada del parámetro que estemos estudiando, usaremos los intervalos de confianza. Intervalo de confianza A partir de una muestra, construiremos dos cantidades numéricas, θ̂1 y θ̂2, de tal manera que el intervalo [θ̂1, θ̂2] ofrezca unas garantías determinadas de contener al valor desconocido de θ. Además lo que pretendemos es que el intervalo obtenido sea de amplitud mínima. © Ana D. Maldonado 6
  • 7. Planteamiento General de un Intervalo de Confianza Considérese una población representada por X → f(x; θ), con θ desconocida. Dada una muestra aleatoria simple de X, X1, . . . , Xn, determinamos dos funciones a partir de los valores muestrales, θ̂1(X1, . . . , Xn), θ̂2(X1, . . . , Xn), denotados por θ̂1(X) y θ̂2(X). • Antes de particularizar su valor para la muestra, θ̂1(X) y θ̂2(X) son funciones que dependen de la muestra; por lo tanto, son variables aleatorias. • A partir del resultado de una muestra, θ̂1 y θ̂2, se convierten en valores fijos. © Ana D. Maldonado 7
  • 8. Planteamiento General de un Intervalo de Confianza Estimación por intervalo del parámetro θ Dado que el objetivo es construir un intervalo cuya probabilidad de contener al verdadero valor del parámetro, θ, sea muy alta, tenemos que determinar dos funciones, θ̂1(X) y θ̂2(X), que nos darán los valores extremos del intervalo, tales que P[θ̂1(X) ≤ θ ≤ θ̂2(X)] = 1 − α (1) donde • 0 < α < 1, normalmente pequeño. Valores típicos de α son 0.05, 0.1 y 0.01. • 1 − α recibe el nombre de nivel de confianza. © Ana D. Maldonado 8
  • 9. Planteamiento General de un Intervalo de Confianza Interpretación del intervalo de confianza Observando el intervalo dado en la expresión (1) se pone de manifiesto: • Que se trata de un intervalo aleatorio, pues los extremos dependen de la muestra seleccionada y, por tanto, las funciones θ̂1(X) y θ̂2(X) son variables aleatorias. • Que el parámetro desconocido θ se considera un valor fijo, no una variable aleatoria. • En consecuencia, en incorrecto interpretar que 1 − α es la probabilidad de que θ esté entre θ̂1 y θ̂2 Por lo tanto, la interpretación correcta de la expresión (1) es que 1 − α es la probabilidad de que el intervalo aleatorio [θ̂1(X), θ̂2(X)] incluya al verdadero valor del parámetro. Interpretación de un IC dada una muestra Una vez seleccionada la muestra, la probabilidad de que el verdadero valor del parámetro esté en el intervalo [θ̂1, θ̂2] es 1 si de verdad está o 0 si no está entre los dos números en los que se convierten θ̂1 y θ̂2 al particularizarlos para la muestra X1, . . . , Xn concreta. © Ana D. Maldonado 9
  • 10. Planteamiento General de un Intervalo de Confianza Interpretación del concepto de confianza Si se repitiera el experimento muestral X1, . . . , Xn un número suficiente de veces, es decir, se obtuviese muchas muestras distintas, el 100(1 − α)% de casos se confiaría en que el verdadero valor del parámetro θ pertenezca al intervalo [θ̂1(X), θ̂2(X)]. Por ejemplo, para un nivel de confianza del 95%, si tomamos 100 muestras aleatorias de tamaño n de la misma población, esperamos que aprox. el 95% de ellos contendrán el verdadero valor del parámetro y el 5% restante no. Pero como en la práctica solo tomamos una muestra aleatoria, no conocemos si nuestro intervalo es uno del 95% o del 5% y por eso hablamos de que tenemos un nivel de confianza del 95%. © Ana D. Maldonado 10
  • 11. METODOLOGÍA GENERAL DE CONTRUCCIÓN DE UN INTERVALO DE CONFIANZA © Ana D. Maldonado 11
  • 12. Metodología general de construcción de un IC Método pivote Este método consiste básicamente en la obtención de un estadístico llamado pivote T(X1, . . . , Xn, θ) que verifique las siguientes condiciones: 1. El pivote T(X1, . . . , Xn, θ) es una función de las observaciones muestrales y del parámetro θ, de tal manera que para cada muestra solo dependerá de θ. 2. La distribución muestral del pivote T(X1, . . . , Xn, θ) es conocida y no depende del parámetro θ. © Ana D. Maldonado 12
  • 13. Método Pivote Al conocer la distribución muestral del pivote y no depender del parámetro θ, dado un nivel de confianza 1 − α, podemos calcular de forma sencilla dos valores λ1 y λ2 que cumplan P[λ1 ≤ T(X1, . . . , Xn, θ) ≤ λ2] = 1 − α (2) Este par λ1 y λ2 no son únicos. ¿Cómo escogemos los valores λ1 y λ2, al no ser únicos? Selección de λ1 y λ2 Escogeremos λ1 y λ2 de forma que se reparta la probabilidad sobrante α en dos mitades (suele coincidir con el IC de amplitud mínima.) © Ana D. Maldonado 13
  • 14. Método Pivote Una vez tengamos λ1 y λ2, despejamos θ de T(X1, . . . , Xn, θ) y obtendremos P[ ˆ θ1(X1, . . . , Xn, λ1) ≤ θ ≤ ˆ θ2(X1, . . . , Xn, λ2)] = 1 − α que es lo que buscábamos. Condiciones Método Pivote 1. La existencia de T(X1, . . . , Xn, θ), cuya distribución esté totalmente determinada y que no dependa de θ. 2. La posibilidad de despejar θ en la doble desigualdad del interior de los corchetes de la expresión (2). © Ana D. Maldonado 14
  • 15. Método Pivote Ejemplo 1 Sea X1, . . . , Xn una muestra aleatoria procedente de una población N(µ, σ), con σ conocida. Deseamos obtener el intervalo de confianza al nivel del 95% para el parámetro poblacional µ. © Ana D. Maldonado 15
  • 16. Método Pivote Ejemplo 1 (Solución) © Ana D. Maldonado 16
  • 17. Método Pivote Ejemplo 1 (Solución) © Ana D. Maldonado 17
  • 18. Método Pivote Ejemplo 1 (Solución) © Ana D. Maldonado 18
  • 19. PLANTEAMIENTO GENERAL DE UN CONTRASTE DE HIPÓTESIS PARAMÉTRICO © Ana D. Maldonado 19
  • 20. Planteamiento General de un Contraste de Hipótesis Mientras que los intervalos de confianza se utilizan para estimar parámetros, los contrastes o test de hipótesis sirven para tomar decisiones acerca de las características poblacionales. Ambos métodos de inferencia estás estrechamente ligados ya que se basan en las mismas distribuciones muestrales. Contrastes de hipótesis Un contraste de hipótesis tiene como objetivo decidir si una determinada hipótesis sobre la distribución en estudio es confirmada o invalidada a partir de las observaciones de una muestra. Ejemplos de hipótesis • Una compañía recibe un gran cargamento de piezas. Sólo acepta el envío si no hay más de un 5% de piezas defectuosas. ¿Cómo tomar una decisión sin verificar todas las piezas? • Un investigador quiere saber si una propuesta de reforma fiscal es acogida de igual forma por hombres y mujeres. ¿Cómo puede comprobar esa conjetura? © Ana D. Maldonado 20
  • 21. Conceptos básicos Hipótesis estadística Una hipótesis estadística es cualquier afirmación sobre alguna característica desconocida de la población. • Si la hipótesis se refiere al valor de un parámetro desconocido θ de la población, diremos que se trata de un contraste paramétrico. • Si la hipótesis se refiere al modelo probabilístico de la población, hablaremos de contrastes no paramétricos (Tema 3). En cualquier caso, el primer paso para contrastar hipótesis es definir dos alternativas que cubran todos los resultados posibles; esto es lo que llamaremos hipótesis nula e hipótesis alternativa. © Ana D. Maldonado 21
  • 22. Conceptos básicos Llamaremos hipótesis nula, H0, a la hipótesis que se contrasta. El nombre de "nula" proviene de que H0 representa la hipótesis que mantendremos a no ser que los datos indiquen su falsedad, y debe entenderse, por tanto, en el sentido de "neutra". La hipótesis H0 nunca se considera probada, aunque puede ser rechazada por los datos. Observaciones sobre la hipótesis nula • La hipótesis nula es la que se quiere contrastar. • Se denota por H0. • Viene dada por una igualdad o afirmación positiva. • El contraste de hipótesis NO sirve para demostrar H0. • A partir de los datos de la muestra, la conclusión del contraste será: • Rechazar H0, si hay una fuerte evidencia en su contra. • No rechazar H0, si NO hay suficiente evidencia de que sea falsa (es decir, dada la muestra observada, es aceptable suponer que H0 es cierta). © Ana D. Maldonado 22
  • 23. Conceptos básicos Si rechazamos H0 estamos implícitamente aceptando una hipótesis alternativa, H1. Aceptamos H1 si los datos de la muestra indican claramente que H0 no es cierta, y por tanto, su contrario, H1, debe ser cierto. Observaciones sobre la hipótesis alternativa • La hipótesis alternativa es la negación de H0. • Se denota por H1. • H1 nunca contiene los signos ‘=’, ‘≤’, ‘≥’. • H1 puede aceptarse o no aceptarse. • El contraste de hipótesis sirve para demostrar H1, ya que requiere una fuerte evidencia (en contra de H0) para ser aceptada. Por lo tanto, H1 es la hipótesis que se desea probar fuera de toda duda (salvo error α). © Ana D. Maldonado 23
  • 24. Tipos de error DECISIÓN No rechazar H0 Rechazar H0 H0 cierta correcta errónea H0 falsa errónea correcta © Ana D. Maldonado 24
  • 25. Tipos de error DECISIÓN No rechazar H0 Rechazar H0 H0 cierta correcta Nivel de confianza: 1-α errónea Error de tipo I (Nivel de significación: α) H0 falsa errónea Error de tipo II (β) correcta Potencia: 1 − β © Ana D. Maldonado 24
  • 26. Tipos de error Tipos de error en un contraste de hipótesis • Error de Tipo I: Rechazar H0 cuando es cierta. • Error de Tipo II: Aceptar H0 cuando es falsa. © Ana D. Maldonado 25
  • 27. Tipos de error El test de hipótesis se debería diseñar de forma que los errores tipo I y tipo II no se cometieran de forma frecuente, es decir, que tengan una baja probabilidad. Probabilidad del error tipo I y tipo II α = P(Error tipo I) ; β = P(Error tipo II) • α recibe el nombre de nivel de significación del test. • 1 − β recibe el nombre de potencia del test. Nótese que 1 − β = P(Rechazar H0 cuando es falsa) © Ana D. Maldonado 26
  • 28. Tipos de error α: probabilidad de rechazar H0 cuando es cierta (error tipo I) β: probabilidad de no rechazar H0 cuando es falsa (error tipo II) potencia: probabilidad de rechazar H0 cuando es falsa © Ana D. Maldonado 27
  • 29. Ejemplo Ejemplo 2 Una empresa sabe que el tiempo necesario para atender la queja de un cliente es una variable aleatoria X → N(µ, 4), e intenta determinar, para mejorar su servicio, si el tiempo medio necesario para atender la queja de un cliente ha aumentado a 7 minutos o sigue siendo de 4 minutos. Para ello, se selecciona una muestra aleatoria de 16 clientes y se mide el tiempo necesario para atender sus quejas, y si la media muestral es mayor que 5.6, se rechaza que µ = 4, y por lo tanto se acepta que µ = 7. 1. Determinar la probabilidad de los errores Tipo I y Tipo II. (Sol: 0.0548; 0.0808) 2. Determinar la potencia del test. (Sol: 0.9192) 3. Si deseamos una probabilidad de cometer un error de Tipo I igual al 2%, determinar la región crítica y la probabilidad de cometer un error de Tipo II. (Sol: C = (6.0537, + ∞); 0.172) © Ana D. Maldonado 28
  • 30. Ejemplo Ejemplo 2 (Solución) © Ana D. Maldonado 29
  • 31. Ejemplo Ejemplo 2 (Solución) © Ana D. Maldonado 30
  • 32. Ejemplo Ejemplo 2 (Solución) © Ana D. Maldonado 31
  • 33. Ejemplo Ejemplo 2 (Solución) © Ana D. Maldonado 32
  • 34. Ejemplo Ejemplo 2 (Solución) © Ana D. Maldonado 33
  • 35. Ejemplo Ejemplo 2 (Solución) © Ana D. Maldonado 34
  • 36. Ejemplo Ejemplo 2 (Solución) © Ana D. Maldonado 35
  • 37. Tipos de error Observación Hemos visto que al disminuir α (ha pasado de 0.0548 a 0.02), aumenta β (ha pasado de 0.0808 a 0.172). Lo ideal es minimizar la probabilidad de cometer ambos errores, α y β, pero esto no se puede lograr simultáneamente, ya que al disminuir uno, aumenta el otro. La única forma de lograrlo es incrementar el tamaño de la muestra. © Ana D. Maldonado 36
  • 38. MÉTODO DE CONSTRUCCIÓN DE CONTRASTES DE HIPÓTESIS © Ana D. Maldonado 37
  • 39. Método de construcción de un Contraste de Hipótesis Etapas del contraste de hipótesis 1. Definir la hipótesis nula a contrastar, H0 , y la alternativa, H1. H0 : θ = θ0 H1 : θ 6= θ0 H0 : θ ≤ θ0 H1 : θ θ0 H0 : θ ≥ θ0 H1 : θ θ0 Test bilateral Test unilateral Test unilateral © Ana D. Maldonado 38
  • 40. Método de construcción de un Contraste de Hipótesis Etapas del contraste de hipótesis (continuación) 2. Definir una medida de discrepancia, T = d(θ̂, θ0), entre los datos muestrales, X1, . . . , Xn, y H0. Llamaremos a esta medida estadístico del contraste. Para contrastes paramétricos: • La discrepancia puede expresarse como una función del valor del parámetro especificado por H0 y el valor estimado en la muestra, θ̂. • La medida de discrepancia debe tener una distribución conocida bajo el supuesto de que H0 es cierta. 3. Decidir qué discrepancias consideramos inadmisibles con H0, es decir, a partir de qué valor de diferencia entre θ̂ y θ0 es demasiado grande para poder atribuir al azar. Esto lo hacemos fijando un valor para α. 4. Tomar la muestra, calcular el valor del estimador θ̂ y de la discrepancia observada d(θ̂, θ0), que usualmente se llama t0. Si ésta es pequeña, aceptar H0; si es demasiado grande, rechazar H0 y aceptar H1. © Ana D. Maldonado 39
  • 41. Método de construcción de un Contraste de Hipótesis Región de rechazo El método tradicional de realizar un contraste es 1. Dividir el rango de discrepancias que puede observarse cuando H0 es cierta en dos regiones: una región de aceptación de H0 y otra de rechazo, llamada región crítica o de rechazo. 2. Fijado α, la región de rechazo se determina a partir de la distribución de T = d(θ̂, θ0), suponiendo que H0 es cierta. 3. Cuando la discrepancia observada (t0) en la muestra pertenece a la región de rechazo, se dice que se ha producido una diferencia (estadísticamente) significativa, y se rechaza la hipótesis H0. Es decir, rechazaremos H0 cuando el estadístico de contraste tome valores muy extremos. © Ana D. Maldonado 40
  • 42. Método de construcción de un Contraste de Hipótesis p-valor En lugar de contrastar hipótesis a niveles de significación α preasignados, también se puede hallar el nivel de significación más bajo al que se puede rechazar H0, dada la muestra concreta. Es lo que se denomina p-valor o nivel crítico de un contraste. Por lo tanto, se puede interpretar el p-valor como la probabilidad de obtener un valor del estadístico del contraste igual de extremo o más que el valor obtenido para la muestra en cuestión cuando la hipótesis nula es verdadera. Cuando calculamos el p-valor, podemos contrastar H0 utilizando la siguiente regla: • No rechazar H0 si p ≥ α • Rechazar H0 si p α © Ana D. Maldonado 41
  • 43. Método de construcción de un Contraste de Hipótesis Cálculo del p-valor • Contraste bilateral (H1 : θ 6= θ0): 2 · min{P(T t0|H0 cierta), P(T t0|H0 cierta)} • Contraste unilateral por la derecha (H1 : θ θ0): P(T t0|H0 cierta) • Contraste unilateral por la izquierda (H1 : θ θ0): P(T t0|H0 cierta) © Ana D. Maldonado 42
  • 44. Método de construcción de un Contraste de Hipótesis p-valor o región crítica • Las conclusiones son las mismas, ambas reglas de decisión son equivalentes. Si aceptamos H0 basándonos en p-valor, también la aceptaremos basándonos en la región crítica, y viceversa. • En SPSS solo se muestran p-valores, no regiones críticas, al resolver contrastes de hipótesis. © Ana D. Maldonado 43
  • 45. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPÓTESIS DE USO FRECUENTE © Ana D. Maldonado 44
  • 46. IC y CH de uso frecuente Vamos a estudiar los siguientes Intervalos de Confianza (IC) y Contrastes de Hipótesis (CH) para poblaciones normales y proporciones: • IC y CH para poblaciones normales • Para la media de una distribución. diapositiva 47 • Igualdad de varianzas de dos muestras independientes. diapositiva 56 • Igualdad de medias de dos muestras independientes • con varianzas desconocidas, pero iguales. diapositiva 65 • con varianzas desconocidas, no necesariamente iguales. diapositiva 67 • Igualdad de medias de dos muestras emparejadas. diapositiva 76 • IC y CH para proporciones • Una muestra. diapositiva 84 • Dos muestras. diapositiva 90 © Ana D. Maldonado 45
  • 47. Muestras independientes y relacionadas Muestras independientes En las muestras independientes, los elementos de una muestra no están relacionados con los elementos de la otra muestra. Por tanto, las muestras independientes son mediciones realizadas en 2 conjuntos de elementos diferentes. Muestras relacionadas En las muestras relacionadas (emparejadas o pareadas), cada elemento de una muestra está relacionado con un elemento de la otra muestra. Por ejemplo, mediciones realizadas sobre el mismo conjunto de elementos antes y después de un evento. © Ana D. Maldonado 46
  • 48. IC y CH para la media de una Población Normal Una muestra Si consideramos una población en donde existe una variable X → N(µ, σ), cuya media µ es desconocida y disponemos de una muestra X1, . . . , Xn podemos obtener: • Intervalo de confianza para µ con el estadístico pivote: X̄ − µ S/ √ n → t(n − 1) • Contrastes bilaterales y unilaterales para µ, mediante el estadístico de contraste: T = X̄ − µ0 S/ √ n → t(n − 1) donde X̄ es la media muestral y S2 es la varianza muestral. i © Ana D. Maldonado 47
  • 49. IC y CH para la media de una Población Normal Contrastes de Hipótesis para µ: prueba t de Student Contraste Estadístico Contraste Región Crítica P-valor H0 : µ = µ0 H1 : µ 6= µ0 [T tn−1, α 2 ] ∪ [T tn−1,1− α 2 ] 2 · min n P[T t0], P[T t0] o H0 : µ ≤ µ0 H1 : µ µ0 T = X̄ − µ0 S/ √ n → t(n − 1) [T tn−1,1−α] P[T t0] H0 : µ ≥ µ0 H1 : µ µ0 [T tn−1,α] P[T t0] © Ana D. Maldonado 48
  • 50. IC y CH para la media de una Población Normal Ejemplo 3 Se supone que el peso en gramos de los huevos procedentes de una granja sigue una distribución normal. Seleccionada aleatoriamente una muestra de 8 huevos, se obtuvieron los siguientes pesos 70, 70, 68, 68, 69, 71, 67, 70 Se pide el intervalo de confianza y contrastar la hipótesis de que el peso medio de los huevos procedentes de dicha granja es igual a 70 gramos, utilizando en ambos casos un nivel de confianza del 95%. (Sol: [67.99, 70.26]; p-valor = 0.1107) © Ana D. Maldonado 49
  • 51. IC y CH para la media de una Población Normal Ejemplo 3 (Solución Intervalo de confianza) © Ana D. Maldonado 50
  • 52. IC y CH para la media de una Población Normal Ejemplo 3 (Solución Intervalo de confianza) © Ana D. Maldonado 51
  • 53. IC y CH para la media de una Población Normal Ejemplo 3 (Solución Intervalo de confianza) © Ana D. Maldonado 52
  • 54. IC y CH para la media de una Población Normal Ejemplo 3 (Solución Contraste de hipótesis) © Ana D. Maldonado 53
  • 55. IC y CH para la media de una Población Normal Ejemplo 3 (Solución Contraste de hipótesis) © Ana D. Maldonado 54
  • 56. IC y CH para la media de una Población Normal Ejemplo 3 (Solución Contraste de hipótesis) © Ana D. Maldonado 55
  • 57. CH para dos Poblaciones Normales: varianzas Los contrastes de hipótesis relativos a la varianza son cada vez más importantes. Por ejemplo: • Las empresas tratan de reducir la variabilidad de los procesos con el fin de garantizar que todas las unidades producidas sean de alta calidad. • En los estudios de control de calidad, a menudo se trata de saber qué proceso tiene la menor varianza. • En investigación financiera, la varianza se puede utilizar como una medida del riesgo de una acción en el mercado de valores. Cuanto mayor sea la varianza, mayor será el riesgo. i © Ana D. Maldonado 56
  • 58. CH para dos Poblaciones Normales: varianzas Dos muestras independientes Si consideramos una población en donde existen dos variables independientes: X → N(µx, σx), Y → N(µy, σy) cuyas medias y varianzas son desconocidas, podemos considerar el siguiente contraste de hipótesis bilateral sobre las varianzas: H0 : σ2 x = σ2 y H1 : σ2 x 6= σ2 y Para ello, es fundamental disponer de dos muestras independientes. © Ana D. Maldonado 57
  • 59. CH para dos Poblaciones Normales: varianzas Dos muestras independientes El test de Levene se utiliza para contrastar la igualdad de varianzas en dos (o más) muestras independientes. El estadístico de contraste para la realización del test es: F = n(D̄1 − D̄)2 + m(D̄2 − D̄)2 n X i=1 (D1i − D̄1)2 + m X i=1 (D2i − D̄2)2 n+m−2 → F(1, n + m − 2) donde • n y m son el tamaño muestral de X e Y, respectivamente • D1i = |xi − x̄| y D2i = |yi − ȳ| • D̄1 = Pn i=1 D1i n y D̄2 = Pm i=1 D2i m • D̄ = Pn i=1 D1i+ Pm i=1 D2i n+m © Ana D. Maldonado 58
  • 60. CH para dos Poblaciones Normales: varianzas Contrastes de Hipótesis para Igualdad de Varianzas: prueba de Levene Contraste Estadístico Contraste P-valor H0 : σ2 x = σ2 y H1 : σ2 x 6= σ2 y F = n(D̄1 − D̄)2 + m(D̄2 − D̄)2 n X i=1 (D1i − D̄1)2 + m X i=1 (D2i − D̄2)2 n+m−2 → F(1, n + m − 2) P[F f0] © Ana D. Maldonado 59
  • 61. CH para dos Poblaciones Normales: varianzas Ejemplo 4 En un estudio sobre los préstamos realizados por dos entidades financieras a sus clientes se toma una muestra aleatoria de 6 préstamos de la primera entidad, obteniendo como resultado la siguiente muestra: 7000, 8500, 9900, 10000, 6900, 7100 Una muestra aleatoria, independiente de la anterior, de 9 préstamos de la segunda entidad ofreció como resultado la siguiente muestra 2000, 3600, 5000, 3000, 2500, 6100, 4000, 3300, 2200 Admitiendo que las dos distribuciones poblacionales son normales, contrastar a nivel de significación del 5% si podemos aceptar la igualdad de varianzas de ambas poblaciones. (Sol: p-valor = 0.584) © Ana D. Maldonado 60
  • 62. CH para dos Poblaciones Normales: varianzas Ejemplo 4 (Solución) © Ana D. Maldonado 61
  • 63. CH para dos Poblaciones Normales: varianzas Ejemplo 4 (Solución) © Ana D. Maldonado 62
  • 64. CH para dos Poblaciones Normales: varianzas Ejemplo 4 (Solución) © Ana D. Maldonado 63
  • 65. IC y CH para dos Poblaciones Normales: medias Dos muestras independientes Si consideramos una población en donde existen dos variables independientes: X → N(µx, σx), Y → N(µy, σy) cuyas medias µx y µy son desconocidas, podemos obtener: • Intervalo de confianza para la diferencia de medias, µx − µy. • Contrastes de hipótesis bilaterales y unilaterales para la diferencia de medias, µx − µy. Para ello, es fundamental disponer de dos muestras independientes, X e Y, de tamaños n y m, respectivamente. Además, tanto el pivote como el estadístico del contraste para la diferencia de medias dependen de si las varianzas son iguales σ2 x = σ2 y o si son distintas σ2 x 6= σ2 y , cuestión que podemos determinar con el contraste anteriormente estudiado para varianzas. i © Ana D. Maldonado 64
  • 66. IC y CH para dos Poblaciones Normales: medias Caso 1: varianzas poblacionales desconocidas pero iguales, σ2 x = σ2 y • Intervalos de Confianza. Si σ2 x = σ2 y , el estadístico pivote viene dado por: X̄ − Ȳ − (µx − µy) Sp p (1/n) + (1/m) → t(n + m − 2) • Contrastes de Hipótesis. Si σ2 x = σ2 y , el estadístico de contraste viene dado por: T = X̄ − Ȳ − ∆0 Sp p (1/n) + (1/m) → t(n + m − 2) donde S2 p = (n − 1)S2 x + (m − 1)S2 y n + m − 2 y X̄ e Ȳ son las respectivas medias muestrales y S2 x y S2 y son las respectivas varianzas muestrales. i © Ana D. Maldonado 65
  • 67. IC y CH para dos Poblaciones Normales: medias Contrastes de Hipótesis para µx − µy. Caso σ2 x = σ2 y Contraste Estadístico Contraste P-valor H0 : µx − µy = ∆0 H1 : µx − µy 6= ∆0 2 · min n P[T t0], P[T t0] o H0 : µx − µy ≤ ∆0 H1 : µx − µy ∆0 T = X̄ − Ȳ − ∆0 Sp p (1/n) + (1/m) → t(n + m − 2) P[T t0] H0 : µx − µy ≥ ∆0 H1 : µx − µy ∆0 S2 p = (n − 1)S2 x + (m − 1)S2 y n + m − 2 P[T t0] © Ana D. Maldonado 66
  • 68. IC y CH para dos Poblaciones Normales: medias Caso 2: varianzas poblacionales desconocidas y distintas, σ2 x 6= σ2 y • Intervalos de Confianza. Si σ2 x 6= σ2 y , el estadístico pivote viene dado por: X̄ − Ȳ − (µx − µy) q (S2 x /n) + (S2 y /m) → t([ν]) • Contrastes de Hipótesis. Si σ2 x 6= σ2 y , el estadístico de contraste viene dado por: T = X̄ − Ȳ − ∆0 q (S2 x /n) + (S2 y /m) → t([ν]) donde ν = (S2 x /n + S2 y /m)2 (S2 x /n)2/(n − 1) + (S2 y /m)2/(m − 1) y X̄ e Ȳ son las respectivas medias muestrales y S2 x y S2 y son las respectivas varianzas muestrales. i © Ana D. Maldonado 67
  • 69. IC y CH para dos Poblaciones Normales: medias Contrastes de Hipótesis para µx − µy. Caso σ2 x 6= σ2 y Contraste Estadístico Contraste P-valor H0 : µx − µy = ∆0 H1 : µx − µy 6= ∆0 2 · min n P[T t0], P[T t0] o H0 : µx − µy ≤ ∆0 H1 : µx − µy ∆0 T = X̄ − Ȳ − ∆0 q (S2 x /n) + (S2 y /m) → t([ν]) P[T t0] H0 : µx − µy ≥ ∆0 H1 : µx − µy ∆0 ν = (S2 x /n + S2 y /m)2 (S2 x /n)2/(n − 1) + (S2 y /m)2/(m − 1) P[T t0] © Ana D. Maldonado 68
  • 70. IC y CH para dos Poblaciones Normales: medias Ejemplo 5 En un estudio sobre los préstamos realizados por dos entidades financieras a sus clientes se toma una muestra aleatoria de 6 préstamos de la primera entidad, obteniendo como resultado la siguiente muestra: 7000, 8500, 9900, 10000, 6900, 7100 Una muestra aleatoria, independiente de la anterior, de 9 préstamos de la segunda entidad ofreció como resultado la siguiente muestra 2000, 3600, 5000, 3000, 2500, 6100, 4000, 3300, 2200 Admitiendo que las dos distribuciones poblacionales son normales, obtener al nivel del 95% un intervalo de confianza para la diferencia entre sus medias poblacionales. (Sol: [3130.863, 6291.359]) © Ana D. Maldonado 69
  • 71. IC y CH para dos Poblaciones Normales: medias Ejemplo 5 (Solución) © Ana D. Maldonado 70
  • 72. IC y CH para dos Poblaciones Normales: medias Ejemplo 5 (Solución) © Ana D. Maldonado 71
  • 73. IC y CH para dos Poblaciones Normales: medias Ejemplo 5 (Solución) © Ana D. Maldonado 72
  • 74. IC y CH para dos Poblaciones Normales: medias Ejemplo 6 En un estudio sobre los préstamos realizados por dos entidades financieras a sus clientes se toma una muestra aleatoria de 6 préstamos de la primera entidad, obteniendo como resultado la siguiente muestra: 7000, 8500, 9900, 10000, 6900, 7100 Una muestra aleatoria, independiente de la anterior, de 9 préstamos de la segunda entidad ofreció como resultado la siguiente muestra 2000, 3600, 5000, 3000, 2500, 6100, 4000, 3300, 2200 Admitiendo que las dos distribuciones poblacionales son normales, ¿podemos considerar que los importes medios de los préstamos de las dos entidades financieras son iguales? (Sol: p-valor = 2.2e-5) © Ana D. Maldonado 73
  • 75. IC y CH para dos Poblaciones Normales: medias Ejemplo 6 (Solución) © Ana D. Maldonado 74
  • 76. IC y CH para dos Poblaciones Normales: medias Ejemplo 6 (Solución) © Ana D. Maldonado 75
  • 77. IC y CH para dos Poblaciones Normales: medias Dos muestras apareadas Si al igual que el caso anterior, consideramos una población en donde existen dos variables: X → N(µx, σx), Y → N(µy, σy) pero suponemos que ambas variables son dependientes, sus correspondientes muestras deben ser de igual tamaño n Muestra para X: X1, . . . , Xn Muestra para Y: Y1, . . . , Yn y ambas muestras estarán apareadas. i © Ana D. Maldonado 76
  • 78. IC y CH para dos Poblaciones Normales: medias Muestras apareadas Si desconocemos las medias poblacionales µx y µy, en el caso de muestras apareadas podemos obtener intervalos de confianza y contrastes de hipótesis para la diferencia de medias µx − µy. Para ello, debemos considerar la v.a D = X − Y. Con ello: • Intervalo de Confianza para µD con el estadístico pivote: D̄ − µD SD/ √ n → t(n − 1) • Contraste de Hipótesis para µD, mediante el estadístico de contraste: T = D̄ − D0 SD/ √ n → t(n − 1) donde D̄ y S2 D son respectivamente la media muestral y la varianza muestral de la muestra correspondiente a la v.a D. © Ana D. Maldonado 77
  • 79. IC y CH para dos Poblaciones Normales: medias Contrastes de Hipótesis para µx − µy. Muestras apareadas. Contraste Estadístico Contraste P-valor H0 : µx − µy = ∆0 H1 : µx − µy 6= ∆0 2 · min n P[T t0], P[T t0] o H0 : µx − µy ≤ ∆0 H1 : µx − µy ∆0 T = D̄ − D0 SD/ √ n → t(n − 1) P[T t0] H0 : µx − µy ≥ ∆0 H1 : µx − µy ∆0 D = X − Y P[T t0] © Ana D. Maldonado 78
  • 80. IC y CH para dos Poblaciones Normales: medias Ejemplo 7 Una empresa de marketing ofrece a una conocida editorial preparar a sus representantes mediante un curso acelerado que, según afirma, supondrá un incremento de las ventas realizadas por éstos. Para comprobar el resultado del curso, se seleccionó una muestra aleatoria de 6 representantes y se contabilizó su volumen de ventas durante la semana anterior y posterior al curso. Los resultados, en miles de euros, fueron los siguientes: Representante 1 2 3 4 5 6 Ventas antes 130.2 180.7 149.6 153.2 162.6 160.1 Ventas después 136.9 201.5 167.3 150.1 173.3 170.4 Suponiendo que la distribución del volumen semanal de ventas es normal, construir un intervalo de confianza al 90% para la diferencia entre las ventas medias semanales antes y después del curso. (Sol: [-17.47, -3.57]) © Ana D. Maldonado 79
  • 81. IC y CH para dos Poblaciones Normales: medias Ejemplo 7 (Solución) © Ana D. Maldonado 80
  • 82. IC y CH para dos Poblaciones Normales: medias Ejemplo 7 (Solución) © Ana D. Maldonado 81
  • 83. IC y CH para dos Poblaciones Normales: medias Ejemplo 7 (Solución) © Ana D. Maldonado 82
  • 84. IC y CH para dos Poblaciones Normales: medias Ejemplo 7 (Solución) © Ana D. Maldonado 83
  • 85. Intervalos de Confianza sobre una proporción Una muestra Si consideramos una población de la que queremos estudiar la proporción de éxitos, siendo todo lo demás desconocido, el intervalo de confianza se obtiene con el siguiente estadístico pivote: T = p̂ − p r p(1 − p) n → N(0, 1) Como p es desconocido, el denominador del estadístico pivote debe ser estimado mediante: p̂(1 − p̂) n El intervalo de confianza es asintótico, es decir, es fiable en el límite (cuando n es grande), dado que utiliza el Teorema Central del Límite para definir la distribución del estadístico. Por tanto podemos obtener el intervalo si n ≥ 25. i © Ana D. Maldonado 84
  • 86. Contrastes de Hipótesis sobre una proporción Una muestra. El contraste de hipótesis acerca de una proporción es un contraste asintótico, es decir, es fiable en el límite (cuando n es grande), dado que utiliza el Teorema Central del Límite para definir la distribución del estadístico. Si la hipótesis nula es simple y establece H0 : p = p0, entonces, si es cierta, el estadístico: T = p̂ − p0 r p0(1 − p0) n → N(0, 1) nos permite llevar a cabo el contraste (n ≥ 25). © Ana D. Maldonado 85
  • 87. Contrastes de Hipótesis sobre una proporción Contrastes de Hipótesis para p. Contraste Estadístico Contraste P-valor H0 : p = p0 H1 : p 6= p0 2 · min n P[T t0], P[T t0] o H0 : p ≤ p0 H1 : p p0 T = p̂ − p0 r p0(1 − p0) n → N(0, 1) P[T t0] H0 : p ≥ p0 H1 : p p0 P[T t0] © Ana D. Maldonado 86
  • 88. Contrastes de Hipótesis sobre una proporción Ejemplo 8 Se está intentando probar que la proporción de familias con vivienda en propiedad totalmente pagada en una ciudad es del 20%. Para ello se toma una muestra de 800 familias y se observa que la proporción de familias con vivienda en propiedad totalmente pagada es del 18%. ¿Es consistente la hipótesis a probar con el resultado obtenido de la muestra con un nivel de confianza del 95%? (Sol: p-valor = 0.1573) © Ana D. Maldonado 87
  • 89. Contrastes de Hipótesis sobre una proporción Ejemplo 8 (Solución) © Ana D. Maldonado 88
  • 90. Contrastes de Hipótesis sobre una proporción Ejemplo 8 (Solución) © Ana D. Maldonado 89
  • 91. Intervalos de Confianza sobre dos proporciones Dos muestras independientes Si consideramos una población de la que queremos estudiar si dos probabilidades de éxito (px y py) son diferentes o no (diferencia de proporciones), siendo todo lo demás desconocido debemos disponer de dos muestras independientes: Muestra de tamaño n para la proporción (px): X1, . . . , Xn Muestra de tamaño m para la proporción (py): Y1, . . . , Ym El intervalo se obtiene con el siguiente estadístico pivote: T = p̂x − p̂y − (px − py) q p̂x(1−p̂x) n + p̂y(1−p̂y) m → N(0, 1) El intervalo de confianza es asintótico, es decir, es fiable en el límite (cuando n y m son grandes y por tanto mayores o iguales a 25). i © Ana D. Maldonado 90
  • 92. Contrastes de Hipótesis sobre dos proporciones Dos muestras independientes Si consideramos una población de la que queremos estudiar si dos probabilidades de éxito (px y py) son diferentes o no (diferencia de proporciones), siendo todo lo demás desconocido, podemos contrastar hipótesis bilaterales y unilaterales sobre la diferencia de dichas proporciones. Para ello, debemos disponer de dos muestras independientes. El contraste de hipótesis para la diferencia de proporciones es asintótico y por tanto fiable en el límite (cuando n y m mayores o iguales a 25). Si la hipótesis nula es simple y establece H0 : px = py, entonces, si es cierta, el estadístico: T = p̂x − p̂y q n+m nm p̂(1 − p̂) → N(0, 1) nos permite llevar a cabo el contraste, dónde p̂ = np̂x + mp̂y n + m (para n y m ≥ 25). © Ana D. Maldonado 91
  • 93. Contrastes de Hipótesis sobre dos proporciones Contrastes de Hipótesis para px − py. Contraste Estadístico Contraste P-valor H0 : px − py = 0 H1 : px − py 6= 0 2 · min n P[T t0], P[T t0] o H0 : px − py ≤ 0 H1 : px − py 0 T = p̂x − p̂y q n+m nm p̂(1 − p̂) → N(0, 1) P[T t0] H0 : px − py ≥ 0 H1 : px − py 0 P[T t0] © Ana D. Maldonado 92
  • 94. Contrastes de Hipótesis sobre dos proporciones Ejemplo 9 Se desea comparar dos comunidades respecto a la proporción de personas seguidoras de un partido político. En la comunidad A se encuestaron 500 personas de las cuales 300 se declararon seguidoras de este partido. En la comunidad B fueron encuestadas 1000 personas de las cuales 680 se declararon seguidoras de dicho partido. ¿Hay suficiente evidencia estadística para concluir, con un nivel de significación del 5%, que es igual la proporción de seguidores en la comunidad A que en la B? (Sol: p-valor = 0.0022) © Ana D. Maldonado 93
  • 95. Contrastes de Hipótesis sobre dos proporciones Ejemplo 9 (Solución) © Ana D. Maldonado 94
  • 96. Contrastes de Hipótesis sobre dos proporciones Ejemplo 9 (Solución) © Ana D. Maldonado 95