Sesión 4
Distribuciones muestral
de la media
Estadística en las organizaciones
AD4001
Dr. Jorge Ramírez Medina
Para la sesión de hoy
Problema de “El tuercas”
El
tuercas
5w-20
Motor Oil
Dr Jorge Ramírez Medina
EGADE Business School
De la clase anterior
Uso y abuso de la estadística
• Cuidado con lo que asume.
• Sea claro acerca quiere descubrir.
• No tome la causalidad por sentado.
• Con estadística no se puede probar cosas con el
100% de certeza
• Un resultado que es numéricamente significativo
puede ser inútil.
Tomado de The Use and Misuse of statistics HBP.
Dr Jorge Ramírez Medina
EGADE Business School
Dr Jorge Ramírez Medina
EGADE Business School
s
m
x
Distribución Normal
𝑓(𝑥) =
1
𝜎 2𝜋
𝑒
−(𝑥−𝜇)2
2
Dr Jorge Ramírez Medina
EGADE Business School
Valores Z
Se interpreta como la cantidad de desviaciones
estándar que dista xi del promedio.
s
xx
z i
i


Dr Jorge Ramírez Medina
EGADE Business School
Z-scores
¿cómo
comparar
peras con
manzanas?
Dr Jorge Ramírez Medina
EGADE Business School
Un ejemplo
60 en estadística 60 en ética
Para entender;
Grafiquémoslo
• Tipo de datos
– Numéricos
– Medidas de tendencia central (media)
– Medidas de variabilidad (desviación estándar)
Dr Jorge Ramírez Medina
EGADE Business School
Primera idea
Dr Jorge Ramírez Medina
EGADE Business School
Nada es verdad, nada es mentira
Todo es según el cristal en que se mira
(Popular)
Segunda idea
Dr Jorge Ramírez Medina
EGADE Business School
X X
z
SD


Tercera idea
Dr Jorge Ramírez Medina
EGADE Business School
Cuarta idea
Dr Jorge Ramírez Medina
EGADE Business School
Z = (Score - Mean)/SD
Z = (60 - 50) / 10
Z = 1
Z = (Score - Mean)/SD
Z = (84 - 50) / 10
Z = 3.4
Z = (60 - 70) / 10
Z = -1.0
Z-scores
• Z-score puede ser positivo o negativo
– Positivo es arriba de la media
– Negativo es abajo de la media
• La media de un Z-score es siempre cero
• Si se tiene el promedio, el Z-score =0
• La desviación estándar de una distribución Z =1
Dr Jorge Ramírez Medina
EGADE Business School
Dr Jorge Ramírez Medina
EGADE Business School
425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
Para el ejemplo
de la sesión 1
= .865
Dr Jorge Ramírez Medina
EGADE Business School
Valores z
• z-Score del valor más pequeño (425)
-1.20 -1.11 -1.11 -1.02 -1.02 -1.02 -1.02 -1.02 -0.93 -0.93
-0.93 -0.93 -0.93 -0.84 -0.84 -0.84 -0.84 -0.84 -0.75 -0.75
-0.75 -0.75 -0.75 -0.75 -0.75 -0.56 -0.56 -0.56 -0.47 -0.47
-0.47 -0.38 -0.38 -0.34 -0.29 -0.29 -0.29 -0.20 -0.20 -0.20
-0.20 -0.11 -0.01 -0.01 -0.01 0.17 0.17 0.17 0.17 0.35
0.35 0.44 0.62 0.62 0.62 0.81 1.06 1.08 1.45 1.45
1.54 1.54 1.63 1.81 1.99 1.99 1.99 1.99 2.27 2.27
Valores estandarizados
20.1
73.54
8.490425





s
xx
z i
i
Dr Jorge Ramírez Medina
EGADE Business School
s  1
0
z
La letra z es utilizada para designar a la variable
normal aleatoria estandarizada.
Distribución de probabilidad
Normal estandarizada
s
m

x
z
Distribución de probabilidad
Normal estandarizada
Función de densidad normal estándar
donde:
z = (x – m)/s
 = 3.14159
e = 2.71828
Dr Jorge Ramírez Medina
EGADE Business School
2
2
2
1
)(
z
exf


s
Dr Jorge Ramírez Medina
ITESM EGADE Zona Centro
Un uso de esto?
Teorema de Chebychev
Cuando menos (1 - 1/z2) de los elementos
en cualquier conjunto de datos debe estar
a menos de z desviaciones estándar
de separación respecto a la media,
siendo z cualquier valor mayor que 1.
Dr Jorge Ramírez Medina
ITESM EGADE Zona Centro
Teorema de Chebyshev
Cuando menos (1 - 1/z2) de los elementos
en cualquier conjunto de datos debe estar
a menos de z desviaciones estándar
de separación respecto a la media,
siendo z cualquier valor mayor que 1.
Dr Jorge Ramírez Medina
ITESM EGADE Zona Centro
Ejemplo
Tome z = 1.5 con = 490.80 and s = 54.74x
Al menos (1 - 1/(1.5)2) = 1 - 0.44 = 0.56 or 56%
de los valores deben estar entre
xx - z(s) = 490.80 - 1.5(54.74) = 409
y
x + z(s) = 490.80 + 1.5(54.74) = 573
(de hecho, 86% de los valores
están entre 409 y 573.)
Dr Jorge Ramírez Medina
ITESM EGADE Zona Centro
x
m – 3s m – 1s
m – 2s
m + 1s
m + 2s
m + 3sm
68.26%
95.44%
99.72%
Regla Empírica
Valores atípicos
(outlier)
Dr Jorge Ramírez Medina
ITESM EGADE Zona Centro
Distribución de probabilidad
Normal estandarizada
Ejemplo: “El tuercas”
• Punto de reorden 20 litros
• La demanda durante el tiempo de resurtido esta
distribuida normalmente
• Media 15 lts, desv. est. 6 lts
El
tuercas
5w-20
Motor Oil
Dr Jorge Ramírez Medina
EGADE Business School
z = (x - m)/s
= (20 - 15)/6
= .83
Paso 1: Convierta x a la distribución normal estándar
El
Tuercas
5w-20
Motor Oil
Paso 2: encuentre el área bajo la curva normal
estandarizada a la izquierda de z = .83.
Distribución de probabilidad
Normal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
Tabla de probabilidad acumulada para la distribución
normal estandarizada
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
. . . . . . . . . . .
.5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
.6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
.7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
.8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
.9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
. . . . . . . . . . .
P(z < .83)
Distribución de probabilidad
Normal estandarizada
El
Tuercas
5w-20
Motor Oil
http://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.htm
Dr Jorge Ramírez Medina
EGADE Business School
P(z > .83) = 1 – P(z < .83)
= 1- .7967
= .2033
Step 3: Calcule el área bajo la curva normal estandar
a la derecha de z = .83.
Probabilidad de
faltantes P(x > 20)
El
Tuercas
5w-20
Motor Oil
Distribución de probabilidad
Normal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
0 .83
Area = .7967
Area = 1 - .7967
= .2033
z
El
Tuercas
5w-20
Motor Oil
Distribución de probabilidad
Normal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
Si se desea que la probabilidad de faltantes
no sea más de 0.05, cuál deberá ser el
punto de reorden?
El
Tuercas
5w-20
Motor Oil
Distribución de probabilidad
Normal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
0
Area = .9500
Area = .0500
z
z.05
El
Tuercas
5w-20
Motor Oil
Distribución de probabilidad
Normal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
Paso 1: encuentre el valor de z que corta un área de .05
en la cola derecha de la distribución normal
estándar.
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
. . . . . . . . . . .
1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
. . . . . . . . . . .
Buscamos el complemento de el
área en la cola (1 - .05 = .95) El
Tuercas
5w-20
Motor Oil
Distribución de probabilidad
Normal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
paso 2: Convierta z.05 al correspondiente valor de x.
x = m + z.05s
= 15 + 1.645(6)
= 24.87 o 25
Un punto de reorden de 25 litros llevará la probabilidad
de faltantes durante el reabasto (poco menos de) .05.
El
Tuercas
5w-20
Motor Oil
Distribución de probabilidad
Normal estandarizada
Dr Jorge Ramírez Medina
EGADE Business School
Distribución de muestreo de
la media muestral
• Es la distribución de probabilidad de la
población de todas las posibles medias
muestrales que pueden ser obtenidas de
todas las posibles muestras del mismo
tamaño.
Dr. Jorge Ramírez Medina
EGADE Business School
Forma de distribución
muestral de x
Dr Jorge Ramírez Medina
EGADE Business School
Si se usa una muestra aleatoria simple grande
(n > 30) el teorema del límite central nos permite
concluir que la distribución de puede ser
aproximada como una distribución normal.
Cuando la muestra aleatoria simple es pequeña
(n < 30), la distribución de muestreo de puede ser
considerada normal sólo si asumimos que la
población tiene una distribución normal.
Forma de distribución
muestral de x
Dr Jorge Ramírez Medina
EGADE Business School
x
x
Una estimación del intervalo se puede calcular
por sumar y restar un margen de error del estimador
puntual:
Estimador puntual +/- Margen de Error
Margen de Error y
estimación de intervalos
Por ejemplo la forma general de una estimación del
intervalo para una media poblacional es:
Margen de Error
Dr Jorge Ramírez Medina
EGADE Business School
x
Estimación de intervalo de la
media de una Población : s
conocida
 El margen de error puede ser calculado con:
– La desviación estándar de la población s , o
– La desviación estándar de la muestra s
 s raramente se conoce con exactitud, se
pueden obtener estimados de datos
históricos.
Dr Jorge Ramírez Medina
EGADE Business School
m
/2 /2
Estimación de intervalo de la
media de una Población : s
conocida
x
Dr Jorge Ramírez Medina
EGADE Business School
Distribución de
Muestreo de
1 -  de
todos los valores
de x
xz s 2/ xz s 2/
intervalo
incluye m
intervalo
no
incluye m
http://onlinestatbook.com/stat_sim/conf_interval/index.html
• Estimación de intervalo de m
donde: es la media muestral
1 - es el coeficiente de confidencia
z/2 es el valor z que provee un área de
/2 en la cola superior de la distribución
de probabilidad normal estandarizada
s es la desviación estándar de la población
n es el tamaño de la muestra
Estimación de intervalo de la
media de una Población : s
conocida
x
Dr Jorge Ramírez Medina
EGADE Business School
n
zx
s
 2/
• Selección del tamaño de la muestra
en la mayoría de las aplicaciones, un tamaño de
muestra de n = 30 es adecuado.
Si la distribución de la población es de un alto sesgo
o contiene outliers, se recomienda un tamaño de
muestra de 50 ó más.
Estimación de intervalo de la
media de una Población : s
conocida
Dr Jorge Ramírez Medina
EGADE Business School
• Selección del tamaño de la muestra
si la población no está normalmente distribuida pero
es simétrica (+/-) un tamaño de muestra pequeño
de 15 es suficiente.
Si se cree que la distribución de la población es
aproximadamente normal, se puede utilizar un
tamaño de muestra de menos de 15.
Estimación de intervalo de la
media de una Población : s
conocida
Dr Jorge Ramírez Medina
EGADE Business School
• Ejemplo: DiscoSuena
Estimación de intervalo de la
media de una Población : s
conocida
n=36
U= $31,100
S= $4,500
Intervalo de confianza del 95%
x
s
Dr Jorge Ramírez Medina
EGADE Business School
95% de las medias muestrales, están dentro de
un + 1.96 de la media poblacional m.sx
El margen de error es:
Estimación de intervalo de la
media de una Población : s
conocida
La estimación del intervalo para m es:
$31,100 + $1,470
o
$29,630 to $32,570
470,1
36
500,4
96.12/ 






n
z
s

Dr Jorge Ramírez Medina
EGADE Business School
Para el ejemplo de los autos
Dr. Jorge Ramírez Medina
EGADE Business School
• Si no se puede tener un estimado de la
desviación estándar de la población s se utiliza la
desviación estándar s de la muestra para estimar s .
• En este caso, la estimación del intervalo para m está
basada en la distribución t.
Estimación de intervalo de la
media de una Población : s
desconocida
Dr Jorge Ramírez Medina
EGADE Business School
La distribución t es una familia de distribuciones de
probabilidad similares.
Una distribución t específica depende de un
parámetro conocido como grados de libertad.
Los grados de libertad se refieren a el número de
piezas independientes de información que se usan
en el cálculo de s.
Distribución t
Dr Jorge Ramírez Medina
EGADE Business School
Conforme la distribución t tiene más grados de
libertad, ésta tiene menos dispersión.
Conforme se incrementan los grados de libertad,
la diferencia entre la distribución t y la distribución
de probabilidad normal estandarizada se hace más
pequeña.
Distribución t
William Sealy Gosset
Dr Jorge Ramírez Medina
EGADE Business School
Distribución t
distribución
normal
estándar
Distribución t
(20 grados
de libertad)
Distribución t
(10 grados
de libertad)
0
z, t
Dr Jorge Ramírez Medina
EGADE Business School
Para más de 100 grados de libertad, el valor de z
normal estandarizado, da una buena aproximación
del valor t.
Los valores z normal estandarizados, se pueden
encontrar en la tabla t, con infinito grados de libertad.
Distribución t
Dr Jorge Ramírez Medina
EGADE Business School
Degrees Area in Upper Tail
of Freedom .20 .10 .05 .025 .01 .005
. . . . . . .
50 .849 1.299 1.676 2.009 2.403 2.678
60 .848 1.296 1.671 2.000 2.390 2.660
80 .846 1.292 1.664 1.990 2.374 2.639
100 .845 1.290 1.660 1.984 2.364 2.626
.842 1.282 1.645 1.960 2.326 2.576
Valores z
normal estandarizados
Distribución t
Dr Jorge Ramírez Medina
EGADE Business School
Asignación para
la siguiente sesión
Dr. Jorge Ramírez Medina
EGADE Business School
Fin Sesión Cuatro

Más contenido relacionado

PPT
S03 ad4001 v2_ss
PPT
S04 ad4001 ss
PPT
S01 ad4001 ss
PPTX
Sesión 02
S03 ad4001 v2_ss
S04 ad4001 ss
S01 ad4001 ss
Sesión 02

La actualidad más candente (20)

PPT
S03 AD4001
PPT
S03 ad4001 slide_share
PPTX
S02 ad4001
DOCX
Ejercicios estadistica
PDF
DOCX
Estimación de la varianza poblacional
PDF
Guia distnormal
PPTX
Tipos de Ditribuciones
PPT
S01 ad4001 ss
DOC
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
DOCX
Trabajo de prueba de hipótesis
PPS
Tema 3 estimación
PDF
Ejercicios Distribución normal
PDF
Trabajos resueltos de inferencia 2015
DOCX
Ejercicios de probabilidad y estadistica uni 1
DOC
Taller estadistica tercer_corte[1]
S03 AD4001
S03 ad4001 slide_share
S02 ad4001
Ejercicios estadistica
Estimación de la varianza poblacional
Guia distnormal
Tipos de Ditribuciones
S01 ad4001 ss
Solucionario libro: Probabilidad y estadística para ingenieros 6 ed - walpole
Trabajo de prueba de hipótesis
Tema 3 estimación
Ejercicios Distribución normal
Trabajos resueltos de inferencia 2015
Ejercicios de probabilidad y estadistica uni 1
Taller estadistica tercer_corte[1]
Publicidad

Similar a S04 AD4001 (20)

PPT
S02 ad4001 ss
PPTX
Sesión 01
PDF
Se_9_UPN_Modificado año 2016 clases presenciales
PDF
Clase 1 (2016) sección s1
PPT
Clase 9 estadística
PPT
Diseño muestral...teoria
PPT
S06 AD4001
PPTX
15.-Distribucion Normal Herramienta de control de calidad.pptx
PPTX
716121166-TEMA-6-MEDIDAS-DE-DISPERSION-PARA-DATOS-NO-AGRUPADOS-Y-AGRUPADOS.pptx
PDF
Sesión 05
PDF
Estadística distribución normal aplicaciones
PPTX
+Reuniónago172014 03
PPTX
Tipos de distribuciones
PDF
4_Regresion_Logistica_2023_2 total lic4.pdf
PPT
14445595
PPT
Cap 1 teoria analisis exploratorio y descriptivo
PPTX
S06 ad4001 alumnos
PPTX
PPTX
U4_Semana15_sesión 15_distribución normal_EG_2024_1.pptx
S02 ad4001 ss
Sesión 01
Se_9_UPN_Modificado año 2016 clases presenciales
Clase 1 (2016) sección s1
Clase 9 estadística
Diseño muestral...teoria
S06 AD4001
15.-Distribucion Normal Herramienta de control de calidad.pptx
716121166-TEMA-6-MEDIDAS-DE-DISPERSION-PARA-DATOS-NO-AGRUPADOS-Y-AGRUPADOS.pptx
Sesión 05
Estadística distribución normal aplicaciones
+Reuniónago172014 03
Tipos de distribuciones
4_Regresion_Logistica_2023_2 total lic4.pdf
14445595
Cap 1 teoria analisis exploratorio y descriptivo
S06 ad4001 alumnos
U4_Semana15_sesión 15_distribución normal_EG_2024_1.pptx
Publicidad

Más de Jorge Ramírez (20)

PPTX
AD4026 BI Sesión 04
PPTX
Session 03 Business Intelligence
PDF
Business Intelligence S02
PPTX
AD4026 BI Sesión 01
PDF
Sesión 01 FZ4013
PDF
Sesión 01 FZ4013
PPTX
S11 ad5015
PPTX
Sesión 10 AD5015
PPT
Apoyo ejercicio busqueda de-patentes
PPT
Introduccion innovacion 2013-ott-cem
PPTX
Sesión 06
PPTX
S04 ad4024 v2
PPTX
Diapositivas de la sesión 04 AD5015
PPTX
sesión 03 AD5015
PPTX
Sesión 02 AD5010
PPTX
S01 AD5010
AD4026 BI Sesión 04
Session 03 Business Intelligence
Business Intelligence S02
AD4026 BI Sesión 01
Sesión 01 FZ4013
Sesión 01 FZ4013
S11 ad5015
Sesión 10 AD5015
Apoyo ejercicio busqueda de-patentes
Introduccion innovacion 2013-ott-cem
Sesión 06
S04 ad4024 v2
Diapositivas de la sesión 04 AD5015
sesión 03 AD5015
Sesión 02 AD5010
S01 AD5010

Último (20)

PDF
TALLER DE ESTADISTICA BASICA para principiantes y no tan basicos
PDF
Aqui No Hay Reglas Hastings-Meyer Ccesa007.pdf
DOC
4°_GRADO_-_SESIONES_DEL_11_AL_15_DE_AGOSTO.doc
DOCX
PLAN DE AREA DE CIENCIAS SOCIALES TODOS LOS GRUPOS
PDF
Esc. Sab. Lección 7. El pan y el agua de vida.pdf
PDF
Texto Digital Los Miserables - Victor Hugo Ccesa007.pdf
PDF
RM2025 - FUNDAMENTOS TEÓRICOS - PEDIATRÍA.pdf
PDF
E1 Guía_Matemática_5°_grado.pdf paraguay
PDF
Iniciación Al Aprendizaje Basado En Proyectos ABP Ccesa007.pdf
PDF
MODULO I ENFERMERIA BASICA.pdf HIstoria en enfermeria
DOC
Manual de Convivencia 2025 actualizado a las normas vigentes
PDF
Manual del Gobierno Escolar -MINEDUC.pdf
PDF
Aumente su Autoestima - Lair Ribeiro Ccesa007.pdf
DOCX
TEXTO DE TRABAJO DE EDUCACION RELIGIOSA - CUARTO GRADO.docx
PPTX
4. Qué es un computador PARA GRADO CUARTO.pptx
PPTX
Historia-Clinica-de-Emergencia-Obstetrica 1.10.pptx
PDF
Ernst Cassirer - Antropologia Filosofica.pdf
PDF
Teologia-Sistematica-Por-Lewis-Sperry-Chafer_060044.pdf
PPTX
Clase 3 del silabo-gestion y control financiero
PDF
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE.pdf
TALLER DE ESTADISTICA BASICA para principiantes y no tan basicos
Aqui No Hay Reglas Hastings-Meyer Ccesa007.pdf
4°_GRADO_-_SESIONES_DEL_11_AL_15_DE_AGOSTO.doc
PLAN DE AREA DE CIENCIAS SOCIALES TODOS LOS GRUPOS
Esc. Sab. Lección 7. El pan y el agua de vida.pdf
Texto Digital Los Miserables - Victor Hugo Ccesa007.pdf
RM2025 - FUNDAMENTOS TEÓRICOS - PEDIATRÍA.pdf
E1 Guía_Matemática_5°_grado.pdf paraguay
Iniciación Al Aprendizaje Basado En Proyectos ABP Ccesa007.pdf
MODULO I ENFERMERIA BASICA.pdf HIstoria en enfermeria
Manual de Convivencia 2025 actualizado a las normas vigentes
Manual del Gobierno Escolar -MINEDUC.pdf
Aumente su Autoestima - Lair Ribeiro Ccesa007.pdf
TEXTO DE TRABAJO DE EDUCACION RELIGIOSA - CUARTO GRADO.docx
4. Qué es un computador PARA GRADO CUARTO.pptx
Historia-Clinica-de-Emergencia-Obstetrica 1.10.pptx
Ernst Cassirer - Antropologia Filosofica.pdf
Teologia-Sistematica-Por-Lewis-Sperry-Chafer_060044.pdf
Clase 3 del silabo-gestion y control financiero
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE.pdf

S04 AD4001

  • 1. Sesión 4 Distribuciones muestral de la media Estadística en las organizaciones AD4001 Dr. Jorge Ramírez Medina
  • 2. Para la sesión de hoy Problema de “El tuercas” El tuercas 5w-20 Motor Oil Dr Jorge Ramírez Medina EGADE Business School
  • 3. De la clase anterior Uso y abuso de la estadística • Cuidado con lo que asume. • Sea claro acerca quiere descubrir. • No tome la causalidad por sentado. • Con estadística no se puede probar cosas con el 100% de certeza • Un resultado que es numéricamente significativo puede ser inútil. Tomado de The Use and Misuse of statistics HBP. Dr Jorge Ramírez Medina EGADE Business School
  • 4. Dr Jorge Ramírez Medina EGADE Business School s m x Distribución Normal 𝑓(𝑥) = 1 𝜎 2𝜋 𝑒 −(𝑥−𝜇)2 2
  • 5. Dr Jorge Ramírez Medina EGADE Business School Valores Z Se interpreta como la cantidad de desviaciones estándar que dista xi del promedio. s xx z i i  
  • 6. Dr Jorge Ramírez Medina EGADE Business School Z-scores ¿cómo comparar peras con manzanas?
  • 7. Dr Jorge Ramírez Medina EGADE Business School Un ejemplo 60 en estadística 60 en ética
  • 8. Para entender; Grafiquémoslo • Tipo de datos – Numéricos – Medidas de tendencia central (media) – Medidas de variabilidad (desviación estándar) Dr Jorge Ramírez Medina EGADE Business School
  • 9. Primera idea Dr Jorge Ramírez Medina EGADE Business School Nada es verdad, nada es mentira Todo es según el cristal en que se mira (Popular)
  • 10. Segunda idea Dr Jorge Ramírez Medina EGADE Business School X X z SD  
  • 11. Tercera idea Dr Jorge Ramírez Medina EGADE Business School
  • 12. Cuarta idea Dr Jorge Ramírez Medina EGADE Business School Z = (Score - Mean)/SD Z = (60 - 50) / 10 Z = 1 Z = (Score - Mean)/SD Z = (84 - 50) / 10 Z = 3.4 Z = (60 - 70) / 10 Z = -1.0
  • 13. Z-scores • Z-score puede ser positivo o negativo – Positivo es arriba de la media – Negativo es abajo de la media • La media de un Z-score es siempre cero • Si se tiene el promedio, el Z-score =0 • La desviación estándar de una distribución Z =1 Dr Jorge Ramírez Medina EGADE Business School
  • 14. Dr Jorge Ramírez Medina EGADE Business School 425 430 430 435 435 435 435 435 440 440 440 440 440 445 445 445 445 445 450 450 450 450 450 450 450 460 460 460 465 465 465 470 470 472 475 475 475 480 480 480 480 485 490 490 490 500 500 500 500 510 510 515 525 525 525 535 549 550 570 570 575 575 580 590 600 600 600 600 615 615 Para el ejemplo de la sesión 1 = .865
  • 15. Dr Jorge Ramírez Medina EGADE Business School Valores z • z-Score del valor más pequeño (425) -1.20 -1.11 -1.11 -1.02 -1.02 -1.02 -1.02 -1.02 -0.93 -0.93 -0.93 -0.93 -0.93 -0.84 -0.84 -0.84 -0.84 -0.84 -0.75 -0.75 -0.75 -0.75 -0.75 -0.75 -0.75 -0.56 -0.56 -0.56 -0.47 -0.47 -0.47 -0.38 -0.38 -0.34 -0.29 -0.29 -0.29 -0.20 -0.20 -0.20 -0.20 -0.11 -0.01 -0.01 -0.01 0.17 0.17 0.17 0.17 0.35 0.35 0.44 0.62 0.62 0.62 0.81 1.06 1.08 1.45 1.45 1.54 1.54 1.63 1.81 1.99 1.99 1.99 1.99 2.27 2.27 Valores estandarizados 20.1 73.54 8.490425      s xx z i i
  • 16. Dr Jorge Ramírez Medina EGADE Business School s  1 0 z La letra z es utilizada para designar a la variable normal aleatoria estandarizada. Distribución de probabilidad Normal estandarizada s m  x z
  • 17. Distribución de probabilidad Normal estandarizada Función de densidad normal estándar donde: z = (x – m)/s  = 3.14159 e = 2.71828 Dr Jorge Ramírez Medina EGADE Business School 2 2 2 1 )( z exf   s
  • 18. Dr Jorge Ramírez Medina ITESM EGADE Zona Centro Un uso de esto? Teorema de Chebychev Cuando menos (1 - 1/z2) de los elementos en cualquier conjunto de datos debe estar a menos de z desviaciones estándar de separación respecto a la media, siendo z cualquier valor mayor que 1.
  • 19. Dr Jorge Ramírez Medina ITESM EGADE Zona Centro Teorema de Chebyshev Cuando menos (1 - 1/z2) de los elementos en cualquier conjunto de datos debe estar a menos de z desviaciones estándar de separación respecto a la media, siendo z cualquier valor mayor que 1.
  • 20. Dr Jorge Ramírez Medina ITESM EGADE Zona Centro Ejemplo Tome z = 1.5 con = 490.80 and s = 54.74x Al menos (1 - 1/(1.5)2) = 1 - 0.44 = 0.56 or 56% de los valores deben estar entre xx - z(s) = 490.80 - 1.5(54.74) = 409 y x + z(s) = 490.80 + 1.5(54.74) = 573 (de hecho, 86% de los valores están entre 409 y 573.)
  • 21. Dr Jorge Ramírez Medina ITESM EGADE Zona Centro x m – 3s m – 1s m – 2s m + 1s m + 2s m + 3sm 68.26% 95.44% 99.72% Regla Empírica
  • 22. Valores atípicos (outlier) Dr Jorge Ramírez Medina ITESM EGADE Zona Centro
  • 23. Distribución de probabilidad Normal estandarizada Ejemplo: “El tuercas” • Punto de reorden 20 litros • La demanda durante el tiempo de resurtido esta distribuida normalmente • Media 15 lts, desv. est. 6 lts El tuercas 5w-20 Motor Oil Dr Jorge Ramírez Medina EGADE Business School
  • 24. z = (x - m)/s = (20 - 15)/6 = .83 Paso 1: Convierta x a la distribución normal estándar El Tuercas 5w-20 Motor Oil Paso 2: encuentre el área bajo la curva normal estandarizada a la izquierda de z = .83. Distribución de probabilidad Normal estandarizada Dr Jorge Ramírez Medina EGADE Business School
  • 25. Tabla de probabilidad acumulada para la distribución normal estandarizada z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 . . . . . . . . . . . .5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224 .6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549 .7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852 .8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133 .9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389 . . . . . . . . . . . P(z < .83) Distribución de probabilidad Normal estandarizada El Tuercas 5w-20 Motor Oil http://www.fisterra.com/mbe/investiga/distr_normal/distr_normal.htm Dr Jorge Ramírez Medina EGADE Business School
  • 26. P(z > .83) = 1 – P(z < .83) = 1- .7967 = .2033 Step 3: Calcule el área bajo la curva normal estandar a la derecha de z = .83. Probabilidad de faltantes P(x > 20) El Tuercas 5w-20 Motor Oil Distribución de probabilidad Normal estandarizada Dr Jorge Ramírez Medina EGADE Business School
  • 27. 0 .83 Area = .7967 Area = 1 - .7967 = .2033 z El Tuercas 5w-20 Motor Oil Distribución de probabilidad Normal estandarizada Dr Jorge Ramírez Medina EGADE Business School
  • 28. Si se desea que la probabilidad de faltantes no sea más de 0.05, cuál deberá ser el punto de reorden? El Tuercas 5w-20 Motor Oil Distribución de probabilidad Normal estandarizada Dr Jorge Ramírez Medina EGADE Business School
  • 29. 0 Area = .9500 Area = .0500 z z.05 El Tuercas 5w-20 Motor Oil Distribución de probabilidad Normal estandarizada Dr Jorge Ramírez Medina EGADE Business School
  • 30. Paso 1: encuentre el valor de z que corta un área de .05 en la cola derecha de la distribución normal estándar. z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09 . . . . . . . . . . . 1.5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441 1.6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545 1.7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633 1.8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706 1.9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767 . . . . . . . . . . . Buscamos el complemento de el área en la cola (1 - .05 = .95) El Tuercas 5w-20 Motor Oil Distribución de probabilidad Normal estandarizada Dr Jorge Ramírez Medina EGADE Business School
  • 31. paso 2: Convierta z.05 al correspondiente valor de x. x = m + z.05s = 15 + 1.645(6) = 24.87 o 25 Un punto de reorden de 25 litros llevará la probabilidad de faltantes durante el reabasto (poco menos de) .05. El Tuercas 5w-20 Motor Oil Distribución de probabilidad Normal estandarizada Dr Jorge Ramírez Medina EGADE Business School
  • 32. Distribución de muestreo de la media muestral • Es la distribución de probabilidad de la población de todas las posibles medias muestrales que pueden ser obtenidas de todas las posibles muestras del mismo tamaño. Dr. Jorge Ramírez Medina EGADE Business School
  • 33. Forma de distribución muestral de x Dr Jorge Ramírez Medina EGADE Business School
  • 34. Si se usa una muestra aleatoria simple grande (n > 30) el teorema del límite central nos permite concluir que la distribución de puede ser aproximada como una distribución normal. Cuando la muestra aleatoria simple es pequeña (n < 30), la distribución de muestreo de puede ser considerada normal sólo si asumimos que la población tiene una distribución normal. Forma de distribución muestral de x Dr Jorge Ramírez Medina EGADE Business School x x
  • 35. Una estimación del intervalo se puede calcular por sumar y restar un margen de error del estimador puntual: Estimador puntual +/- Margen de Error Margen de Error y estimación de intervalos Por ejemplo la forma general de una estimación del intervalo para una media poblacional es: Margen de Error Dr Jorge Ramírez Medina EGADE Business School x
  • 36. Estimación de intervalo de la media de una Población : s conocida  El margen de error puede ser calculado con: – La desviación estándar de la población s , o – La desviación estándar de la muestra s  s raramente se conoce con exactitud, se pueden obtener estimados de datos históricos. Dr Jorge Ramírez Medina EGADE Business School
  • 37. m /2 /2 Estimación de intervalo de la media de una Población : s conocida x Dr Jorge Ramírez Medina EGADE Business School Distribución de Muestreo de 1 -  de todos los valores de x xz s 2/ xz s 2/ intervalo incluye m intervalo no incluye m http://onlinestatbook.com/stat_sim/conf_interval/index.html
  • 38. • Estimación de intervalo de m donde: es la media muestral 1 - es el coeficiente de confidencia z/2 es el valor z que provee un área de /2 en la cola superior de la distribución de probabilidad normal estandarizada s es la desviación estándar de la población n es el tamaño de la muestra Estimación de intervalo de la media de una Población : s conocida x Dr Jorge Ramírez Medina EGADE Business School n zx s  2/
  • 39. • Selección del tamaño de la muestra en la mayoría de las aplicaciones, un tamaño de muestra de n = 30 es adecuado. Si la distribución de la población es de un alto sesgo o contiene outliers, se recomienda un tamaño de muestra de 50 ó más. Estimación de intervalo de la media de una Población : s conocida Dr Jorge Ramírez Medina EGADE Business School
  • 40. • Selección del tamaño de la muestra si la población no está normalmente distribuida pero es simétrica (+/-) un tamaño de muestra pequeño de 15 es suficiente. Si se cree que la distribución de la población es aproximadamente normal, se puede utilizar un tamaño de muestra de menos de 15. Estimación de intervalo de la media de una Población : s conocida Dr Jorge Ramírez Medina EGADE Business School
  • 41. • Ejemplo: DiscoSuena Estimación de intervalo de la media de una Población : s conocida n=36 U= $31,100 S= $4,500 Intervalo de confianza del 95% x s Dr Jorge Ramírez Medina EGADE Business School
  • 42. 95% de las medias muestrales, están dentro de un + 1.96 de la media poblacional m.sx El margen de error es: Estimación de intervalo de la media de una Población : s conocida La estimación del intervalo para m es: $31,100 + $1,470 o $29,630 to $32,570 470,1 36 500,4 96.12/        n z s  Dr Jorge Ramírez Medina EGADE Business School
  • 43. Para el ejemplo de los autos Dr. Jorge Ramírez Medina EGADE Business School
  • 44. • Si no se puede tener un estimado de la desviación estándar de la población s se utiliza la desviación estándar s de la muestra para estimar s . • En este caso, la estimación del intervalo para m está basada en la distribución t. Estimación de intervalo de la media de una Población : s desconocida Dr Jorge Ramírez Medina EGADE Business School
  • 45. La distribución t es una familia de distribuciones de probabilidad similares. Una distribución t específica depende de un parámetro conocido como grados de libertad. Los grados de libertad se refieren a el número de piezas independientes de información que se usan en el cálculo de s. Distribución t Dr Jorge Ramírez Medina EGADE Business School
  • 46. Conforme la distribución t tiene más grados de libertad, ésta tiene menos dispersión. Conforme se incrementan los grados de libertad, la diferencia entre la distribución t y la distribución de probabilidad normal estandarizada se hace más pequeña. Distribución t William Sealy Gosset Dr Jorge Ramírez Medina EGADE Business School
  • 47. Distribución t distribución normal estándar Distribución t (20 grados de libertad) Distribución t (10 grados de libertad) 0 z, t Dr Jorge Ramírez Medina EGADE Business School
  • 48. Para más de 100 grados de libertad, el valor de z normal estandarizado, da una buena aproximación del valor t. Los valores z normal estandarizados, se pueden encontrar en la tabla t, con infinito grados de libertad. Distribución t Dr Jorge Ramírez Medina EGADE Business School
  • 49. Degrees Area in Upper Tail of Freedom .20 .10 .05 .025 .01 .005 . . . . . . . 50 .849 1.299 1.676 2.009 2.403 2.678 60 .848 1.296 1.671 2.000 2.390 2.660 80 .846 1.292 1.664 1.990 2.374 2.639 100 .845 1.290 1.660 1.984 2.364 2.626 .842 1.282 1.645 1.960 2.326 2.576 Valores z normal estandarizados Distribución t Dr Jorge Ramírez Medina EGADE Business School
  • 50. Asignación para la siguiente sesión Dr. Jorge Ramírez Medina EGADE Business School