SlideShare una empresa de Scribd logo
MEDIDAS DE DISPERSIÓN
Y DE FORMA
Ing. William Jaime León Velásquez
wjleonv@yahoo.com
http://www.slideshare.net/williamleon20/clase04-eyp
Universidad
Nacional Mayor de
San Marcos
ESTADISTICA Y
PROBABILIDADES
04
Medidas de
dispersión
Medidas de forma
CONTENIDO
TEMATICO
07/09/2015 Ing. William Jaime León Velásquez 2
MEDIDAS
DE
DISPERSION
Ing. William León Velásquez
• Las Medidas de Dispersión,
son indicadores de
variabilidad y cuya
importancia reside en la
necesidad de tomar
decisiones, basadas en
estadísticas básicas.
MEDIDAS DE DISPERSIÓN
4 ING. WILLIAM LEON V.
Ejemplo:
• Se tiene una producción de
franelas y se sabe que
semanalmente se producen un
promedio de 500 franelas, se
puede decir que todos los días se
producen 100 franelas
• Nada nos garantiza eso porque
podrían producirse en sólo dos
días 250 franelas y el promedio
semanal nos daría un valor
idéntico,
MEDIDAS DE DISPERSIÓN
5 ING. WILLIAM LEON V.
• Si adicionalmente nos informan
que tiene una variación de 5
franelas, tendremos entonces
una mejor comprensión del
proceso, pues este último
número nos indica que
semanalmente se producen
entre 495 y 505 franelas, es
decir, que diariamente sí se
deben producir
aproximadamente 100
franelas.
MEDIDAS DE DISPERSIÓN
6 ING. WILLIAM LEON V.
La Dispersión se refiere a la
variabilidad entre los valores,
es decir, qué tan grandes
son las diferencias entre
los valores.
La idea de dispersión se
relaciona con la mayor o
menor concentración de los
datos en torno a un valor
central, generalmente la
media aritmética.
MEDIDAS DE DISPERSIÓN
7 ING. WILLIAM LEON V.
• Observe las dos figuras. La primera presenta una
distribución con datos más concentrados alrededor de su
promedio 400 que la otra figura con respecto a su
promedio 800, es decir la primera figura es una
distribución con menos dispersión.
MEDIDAS DE DISPERSIÓN
8 ING. WILLIAM LEON V.
Ejemplos:
 Las figuras siguientes muestran a tres
distribuciones con promedio 70, sin
embargo las tres difieren en cuanto a su
variabilidad alrededor de la media.
MEDIDAS DE DISPERSIÓN
9 ING. WILLIAM LEON V.
poca variabilidad alguna variabilidad gran variabilidad
Ejemplos:
• Se tienen dos grupos de estudiantes que sometidos a
una prueba arrojaron los siguientes puntajes:
MEDIDAS DE DISPERSIÓN. EJEMPLO
10 ING. WILLIAM LEON V.
GRUPO A GRUPO B
Puntaje Nº
estudiant
es
Puntaje Nº estudiantes
9 2 11 5
10 4 12 10
11 6
13 5
13 4
Total 20
15 2
17 2
Total 20
MEDIDAS DE DISPERSIÓN
Al calcular el promedio aritmético para ambos
grupos se obtiene:
Este resultado puede conducir a conclusiones
equivocadas cuando se está comparando
distribuciones,
Pues se podría pensar que ambas secciones son
idénticas en su rendimiento,
ING. WILLIAM LEON V. 11
12 BA xx
Siendo esta conclusión falsa ya que
observando los datos se aprecia que la
sección B es más homogénea.
Por lo tanto
En este caso el promedio no tiene
suficiente grado de representatividad
por lo tanto poco podrá describirnos
acerca de los datos en estudio.
MEDIDAS DE DISPERSIÓN
12 ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN
13 ING. WILLIAM LEON V.
iX
Es necesario entonces calcular
otras medidas estadísticas
para mostrar cómo varían los
datos alrededor del promedio
y esto se logra mediante las
medidas de dispersión.
1.- Para evaluar la confiabilidad del promedio
que se está utilizando:
Una dispersión pequeña indica que los datos
se encuentran acumulados muy cerca,
alrededor de la medida de tendencia central
establecida.
Por tanto, la medida de tendencia central se considera
confiable o bastante representativa de los datos.
Por el contrario, una dispersión grande indica que la medida
escogida para representar los datos no es muy confiable, es
decir, no es muy representativa de los datos.
FUNCIONES DE LAS MEDIDAS DE
DISPERSIÓN
14 ING. WILLIAM LEON V.
2.- Para apreciar cuán dispersas están dos o
más distribuciones:
Para poder comparar dos distribuciones de
frecuencias entre sí, no sólo necesitamos la
medida de tendencia central, sino también
la dispersión entre las observaciones para
no elaborar conclusiones erróneas.
A mayor medida de dispersión  el grupo es
más heterogéneo.
A menor medida de dispersión  el grupo es
más homogéneo o uniforme.
FUNCIONES DE LAS MEDIDAS DE
DISPERSIÓN
15 ING. WILLIAM LEON V.
MEDIDAS DE DISPERSIÓN ABSOLUTA
16 ING. WILLIAM LEON V.
Cuantifican el grado de
concentración o de
dispersión de los valores
de la variable en torno de
un promedio de la
distribución.
MEDIDAS DE DISPERSIÓN ABSOLUTA
17 ING. WILLIAM LEON V.
Principales medidas de dispersión absoluta:
•Rango o Recorrido : R
•Varianza : S2
•Desviación Estándar : S
Es la diferencia entre los valores
máximo y mínimo de los datos.
Esta medida es muy fácil de calcular sin
embargo no es muy recomendable
porque sólo toma en cuenta los valores
extremos, sin considerar los demás
valores.
RANGO O RECORRIDO: R
18 ING. WILLIAM LEON V.
mínXmáxXR 
Interpretación de Rango:
El Rango se puede interpretar
como la amplitud existente entre
una serie de datos,
Es decir,
mide cuán lejos está el valor más
pequeño y el valor más grande de
la muestra o población.
RANGO O RECORRIDO: R
19 ING. WILLIAM LEON V.
Se tiene una producción de franelas y
se sabe que diariamente se producen
un promedio de 500 franelas. Si un
día se produce un mínimo de 415
franelas y otro día se produce un
máximo de 573 franelas entonces el
RANGO de producción estará entre
158 franelas, es decir,
Podemos tener una producción de
158 franelas a partir del valor
mínimo.
RANGO O RECORRIDO: R
20 ING. WILLIAM LEON V.
Ejemplo
• Es un valor numérico que cuantifica
el grado de dispersión de los valores
de una variable respecto a su media
aritmética.
• Es el promedio de los cuadrados de
las desviaciones de la variable
respecto a su media aritmética.
VARIANZA S2 , VX
21 ING. WILLIAM LEON V.
   





 
2
xiXMXV
Notación:
Varianza muestral.
Varianza poblacional.
VARIANZA S2 , VX
22 ING. WILLIAM LEON V.
:2
S
:2

VARIANZA S2 , VX
23 ING. WILLIAM LEON V.
Nota:
• La varianza nunca es negativa.
• Cuando la variable toma un
único valor; es decir cuando es
constante entonces la varianza
es cero.
• Mientras más se aproxima a
cero, más concentrados están
los valores de la serie alrededor
de la media. Por el contrario,
mientras mayor sea la varianza,
más dispersos están.
S2 para datos no agrupados:
24 ING. WILLIAM LEON V.













 



2
n
iX
n2
i
X
1n
1
)x(V
• Calcular e interpretar la varianza de los pesos de un grupo de
personas.
Los datos son los siguientes:
56 65 68 70 72 76 78 80
S2 para datos no agrupados:
25 ING. WILLIAM LEON V.
Ejemplo:
 n = 8
S2 para datos no agrupados:
26 ING. WILLIAM LEON V.
565
8
1i
iX 

32940
8
1i
2
iX 

2
oskil6184,60
2
8
565
832940
7
12
XS 














Ejemplo:
En promedio los pesos
del grupo de personas,
se alejan con respecto al
promedio aritmético en
aproximadamente 61
kilos al cuadrado.
S2 para datos no agrupados:
27 ING. WILLIAM LEON V.
Ejemplo:
• a) Si n < 30 :
S2 para datos agrupados
28 ING. WILLIAM LEON V.


































2
n
k
1i
iXif
n
k
1i
2
i
Xif
1n
12
XS
1.- Calcular e interpretar la varianza para la siguiente tabla
de frecuencias.

S2 para datos agrupados
29
ING. WILLIAM LEON V.
Edad
Ii
n = 20
4 - 6 4
6 - 10 5
10 - 16 7  n < 30
16 - 20 3
20 - 30 1
Total n = 20
Nº de
personas
if
Ejemplo:
V ( X ) = 29,21  29 años2
• En promedio la edad de estas personas se aleja
con respecto a su promedio aritmético en
aproximadamente 29 años al cuadrado.
S2 para datos agrupados
30 ING. WILLIAM LEON V.

















































2
20
230
203200
19
1
2
n
k
1i
iXif
n
k
1i
2
i
Xif
1n
1
)X(V
Ejemplo:
b) Si n  30 :
S2 para datos agrupados
31 ING. WILLIAM LEON V.
2
2
i
2
k
1i
iXih
k
1i
XihS 












2
2
i
2
n
k
1i
iXif
n
k
1i
Xif
S
















Usando
frecuencias
relativas:
Usando
frecuencias
absolutas:
Calcular e interpretar la varianza de la siguiente tabla.
S2 para datos agrupados
32 ING. WILLIAM LEON V.
Peso
Ii
Nº de
ingenieros
fi
n = 40
 n > 30
50 - 60 6
60 - 70 8
70 - 80 10
80 - 90 9
90 -100 7
Total n = 40
Ejemplo:
En promedio el peso de los ingenieros se aleja
con respecto al peso promedio en
aproximadamente 172 kilos al cuadrado.
S2 para datos agrupados
33 ING. WILLIAM LEON V.
94,171
2
40
3030
40
400236
n
k
1i
iXif
n
k
1i
Xif
S
2
2
i
2























Ejemplo:
Si una muestra de tamaño n se particiona en k
muestras de tamaño 𝑛𝑖 cada una con su
correspondiente promedio aritmético, 𝑋𝑖 y 𝑆𝑖
2
su
varianza
VARIANZA TOTAL O GLOBAL
34 ING. WILLIAM LEON V.
1 2 k
……….
.
……….
……….
.
2
kS2
2S
2
1S
kx2x1x
kn2n1n
La varianza para los k grupos juntos se calcula
mediante la fórmula:
VARIANZA TOTAL O GLOBAL
35 ING. WILLIAM LEON V.
2
n
xn
n
)Sx(n
S
k
1i
ii
k
1i
2
i
2
ii
2
T
























k
1i
inn
donde
 Se tienen tres grupos, de seis,
nueve y siete estudiantes
respectivamente. Si las notas
correspondientes a cada uno de
ellos son:
VARIANZA TOTAL O GLOBAL
36 ING. WILLIAM LEON V.
Ejemplo:
Grupo 1: 12 16 08 11 10 12
Grupo 2: 17 14 07 13 11 18 13 15 14
Grupo 3: 10 13 11 08 12 09 12
= 2,98
En promedio las notas de los estudiantes de los tres
grupos se alejan con respecto al promedio total en
aproximadamente 3 puntos.
VARIANZA TOTAL O GLOBAL
37 ING. WILLIAM LEON V.
  89,809,12
22
)24,371,10(7)53,1056,13(9)1,75,11(6
21
222
2




k
i
T
S
T
S
Ejemplo:
Es la raíz cuadrada positiva de la
varianza y posee las mismas
unidades que la media
aritmética,
Estas unidades ya no están
elevadas al cuadrado como en
la varianza.
DESVIACIÓN ESTÁNDAR
38 ING. WILLIAM LEON V.
)X(VS 
La desviación estándar o desviación típica se
obtiene para simplificar la interpretación de la
varianza.
Cuando se calcula la varianza, se basa en datos
elevados al cuadrado, por lo que, el resultado
obtenido debe interpretarse en unidades al
cuadrado;
por esta razón se obtiene la desviación estándar
como la raíz cuadrada de la variancia.
DESVIACIÓN ESTÁNDAR
39 ING. WILLIAM LEON V.
Interpretación de la Desviación
Estándar:
• Es una medida que muestra la
distancia promedio de los valores
observados con respecto a su media.
• La distancia de cada valor con su
media se mide tomando el valor
absoluto de la diferencia entre ese
valor y la media, es decir, es la
distancia de cada dato respecto a su
promedio.
DESVIACIÓN ESTÁNDAR
40 ING. WILLIAM LEON V.
• Si se tiene una producción de
franelas y sabemos que
diariamente se producen un
promedio de 500 franelas,
adicionalmente tenemos también
que la desviación es de 25
franelas, tendremos entonces
una mejor comprensión del
proceso pues este último número
nos indica que diariamente se
producen entre 475 y 525
franelas
DESVIACIÓN ESTÁNDAR
41 ING. WILLIAM LEON V.
Ejemplo :
DESVIACIÓN ESTÁNDAR
Distribuciones con igual promedio aritmético
y diferente desviación estándar
ING. WILLIAM LEON V. 42
𝑋=52
S=24
𝑋=52
S=12
𝑋=52
S=6
𝑋=52
S=12
DESVIACIÓN ESTÁNDAR
1.- Si la desviación típica del
salario de los ingenieros
de sistemas es $1,000 y
la media aritmética es
$3,000,
Entonces los salarios de
los ingenieros fluctúan
entre $2,000 y $4,000
dólares.
ING. WILLIAM LEON V. 43
Ejemplos:
DESVIACIÓN ESTÁNDAR
2.-Calcular la desviación estándar
de las notas obtenidas por un
grupo de alumnos del cuarto
ciclo de la Facultad de Ingeniería
Industrial de la UNMSM en la
primera evaluación de
estadística.
12 07 14 11 16
18 09 14 10
ING. WILLIAM LEON V. 44
Ejemplos:
DESVIACIÓN ESTÁNDAR
•  n = 9
ING. WILLIAM LEON V. 45
111
9
1i
iX 

4671
9
1i
2
iX 

  puntos5,325,12XS25,12
2
9
111
94671
8
1
XV 














Por lo tanto:
Ejemplos:
DESVIACIÓN ESTÁNDAR
 Nota:
 La varianza y la desviación estándar
se utilizan para comparar grupos cuya
variable está expresada en las mismas
unidades.
 Así, el grupo más homogéneo, más
uniforme o en el que la media
aritmética es más representativa será
aquel en el cual la varianza o la
desviación estándar es menor.
ING. WILLIAM LEON V. 46
DESVIACIÓN ESTÁNDAR
En varias semanas consecutivas, los oficiales de
policía: Martínez y Castro aplicaron las siguientes
infracciones por exceso de velocidad:
ING. WILLIAM LEON V. 47
¿Cuál de los oficiales es más homogéneo
con respecto al número de infracciones?
Ejemplo:
Martínez : 31 38 42 32 39 26
Castro : 35 43 38 37 33 28 27
DESVIACIÓN ESTÁNDAR
Solución:
ING. WILLIAM LEON V. 48
35,87
2
6
208
63907
5
1
S2
M 














 31,95
2
7
241
74898
6
1
S2
C 















2
MS2
C
S 
El oficial Castro es más homogéneo en aplicar
infracciones por exceso de velocidad porque su
varianza es menor.
Ejemplo:
PROPIEDADES DE LA DESVIACIÓN
ESTÁNDAR
PROPIEDADES DE LA DESVIACIÓN
ESTÁNDAR
PROPIEDADES DE LA DESVIACIÓN
ESTÁNDAR
PROPIEDADES DE LA DESVIACIÓN
ESTÁNDAR
1. La desviación estándar será siempre un valor
positivo o
cero, en el caso de que las puntuaciones sean
iguales.
ING. WILLIAM LEON V. 52
PROPIEDADES DE LA DESVIACIÓN
ESTÁNDAR
2.- Si a todos los valores de la variable se les suma un número la
desviación estándar no varía.
ING. WILLIAM LEON V. 53
PROPIEDADES DE LA DESVIACIÓN
ESTÁNDAR
3.- Si todos los valores de la variable se multiplican por un
número la desviación estándar queda multiplicada por dicho
número.
ING. WILLIAM LEON V. 54
PROPIEDADES DE LA DESVIACIÓN
ESTÁNDAR
4. Si tenemos varias distribuciones con la misma media y
conocemos sus respectivas desviaciones estándar se puede
calcular la desviación estándar total.
• Si todas las muestras tienen el mismo tamaño:
• Si las muestras tienen distinto tamaño:
ING. WILLIAM LEON V. 55
• La variancia y la desviación típica
también tienen sus limitaciones.
• Es similar a la media aritmética que es
vulnerable a la influencia de casos
extremos.
• Además, cuando las medias aritméticas
no son iguales o cuando las unidades
de medición son distintas, la
comparación de desviaciones típicas
puede no ser significativa.
MEDIDAS DE DISPERSIÓN RELATIVA
56 ING. WILLIAM LEON V.
• Es la desviación estándar
dividida sobre la media
aritmética multiplicada por 100.
El mismo nos permite
comparar desviaciones típicas
de variables con unidades de
medición distintas.
COEFICIENTE DE VARIACIÓN
57 ING. WILLIAM LEON V.
100
x
S
CV 
El coeficiente de variación se expresa en
unidades independientes de la naturaleza de la
variable.
• Interpretación del Coeficiente de
Variación:
• El Coeficiente de Variación, mide la
variabilidad relativa a la Media.
Expresa la proporción de variabilidad
de una característica por cada unidad
de la Media.
COEFICIENTE DE VARIACIÓN
58 ING. WILLIAM LEON V.
• Sabemos que la fábrica de
textiles produce 500 franelas
diarias con una desviación
típica de más o menos (±) 25
franelas, entonces, el
Coeficiente de Variación será
25/500 = 0,05, es decir,
tenemos una variación de 5%
en la producción diaria de
franelas.
COEFICIENTE DE VARIACIÓN
59 ING. WILLIAM LEON V.
• En la práctica, se acostumbra considerar que un
coeficiente de variación según la tabla.
COEFICIENTE DE VARIACIÓN
60 ING. WILLIAM LEON V.
Valor del
coeficiente
De variación (%)
Interpretación del coeficiente
Variabilidad Estabilidad
Igual a cero Nula Muy alta
Mayor de 0 hasta 20 Baja Alta
Mayor de 20 hasta
60
Moderada Moderada
Mayor de 60hata 90 Alta Baja
Mayor de 90 Muy alta Nula
• Se desea comparar los sueldos
de los trabajadores de dos
empresas A y B. Para tal efecto
se tienen los datos de la tabla
siguiente :
• ¿Se puede afirmar que los
sueldos de los trabajadores de
la empresa A son más
uniformes? ¿Por qué?
COEFICIENTE DE VARIACIÓN
61 ING. WILLIAM LEON V.
Ejemplo:
COEFICIENTE DE VARIACIÓN
62 ING. WILLIAM LEON V.
Empresa A Empresa B
Sueldos
( $ )
Nº trabajadores Sueldos
( S/.)
Nº trabajadores
380 10 600-650 7
410 9 650-700 9
450 12 700-750 14
480 8 750-800 6
500 7 800-850 4
 Por lo tanto, los sueldos de los trabajadores de la
empresa A no son más uniformes; sino los sueldos
de la empresa B porque presenta menor coeficiente
de variación.
COEFICIENTE DE VARIACIÓN
63 ING. WILLIAM LEON V.
78,439x A  75,713xB 
55,42SA
 67,59S
B

%68,9100
78,439
55,42
CVA  %36,8100
75,713
67,59
CVA 
Tipificación. Valor Z
• La tipificación es el proceso de restar la media y
dividir entre su desviación típica a una variable
X.
• De este modo se obtiene una nueva variable
ING. WILLIAM LEON V. 64
 de media 0 y desviación estándar σ z = 1, que se
denomina variable tipificada.
• Ejemplo:
• Podemos preguntar si un
elefante es más grueso que
una hormiga determinada, cada
uno en relación con su
población.
ING. WILLIAM LEON V. 65
Esta nueva variable carece de unidades y permite hacer
comparables dos medidas que en un principio no lo
son, por aludir a conceptos diferentes.
Tipificación. Valor Z
• Ejemplo: Comparar el nivel académico
de dos estudiantes de diferentes
Universidades para la concesión de una
beca de estudios.
• En principio sería injusto concederla
directamente al que posea una nota
media más elevada, ya que la dificultad
para conseguir una buena calificación
puede ser mucho mayor en un centro
que en el otro, lo que limita las
posibilidades de uno de los estudiante y
favorece al otro.
ING. WILLIAM LEON V. 66
Ejemplo. Tipificación. Valor Z
También es aplicable al caso en que se quieran comparar
individuos semejantes de poblaciones diferentes.
Ejemplo: Tipificación
• Se desea dar una beca a uno de dos estudiantes de
sistemas educativos diferentes. Se asignará al que tenga
mejor expediente académico.
– La estudiante A tiene una calificación de 8 en un
sistema donde la calificación de los alumnos se
comporta como N(6,1).
– La estudiante B tiene una calificación de 80 en un
sistema donde la calificación de los alumnos se
comporta como N(70,10).
67
Ejemplo: Tipificación
• Solución
– No se puede comparar directamente 8 puntos
de A frente a los 80 de B,
– Pero como ambas poblaciones se comportan
de modo normal, Entonces se puede tipificar y
observar las puntuaciones sobre una
distribución de referencia N(0,1)
Tema 5: Modelos probabilísticos 68.
Ejemplo: Tipificación
69
1
10
7080
2
1
68










B
BB
B
A
AA
A
x
z
x
z




Como ZA>ZB, se puede decir que el
porcentaje de compañeros del
mismo sistema de estudios que ha
superado en calificación el
estudiante A es mayor que el que
ha superado el estudiante B.
Se puede concluir que el
estudiante A es mejor candidato
para la beca.
Teorema de Chebyshev.
• La desigualdad de Chebyshev es un resultado estadístico
que ofrece una cota inferior a la probabilidad de que el
valor de una variable aleatoria con varianza finita esté a
una cierta distancia de su esperanza matemática o de su
media;
• Equivalentemente, el teorema proporciona una cota
superior a la probabilidad de que los valores caigan fuera
de esa distancia respecto de la media.
• El teorema es aplicable incluso en distribuciones que no
tienen forma de "curva de campana" y acota la cantidad
de datos que están o no "en medio".
07/09/2015 Ing. William Jaime León Velásquez 70
Teorema de Chebyshev.
Teorema: Sea X una variable aleatoria de media µ y
varianza finita s².
• Entonces, para todo número real k > 0,
07/09/2015 Ing. William Jaime León Velásquez 71
𝑃( 𝑋 − 𝜇 > 𝑘𝜎) ≤
1
𝑘2
Sólo los casos con k > 1 proporcionan información útil.
Teorema de Chebyshev. Ejemplo
• El número de artículos producidos en una
fábrica durante una semana es una
variable aleatoria con media 50.
• Si la varianza de una semana de
producción se sabe que es igual a 25,
entonces
• ¿Qué se puede decir acerca de la
probabilidad de que en esta semana la
producción difiera en más de 10 a la
media?
07/09/2015 Ing. William Jaime León Velásquez 72
Teorema de Chebyshev. Ejemplo
Solución:
• Por la desigualdad de Chebyshev
• μ=50, σ2=25, K=10, Reemplazando:
07/09/2015 Ing. William Jaime León Velásquez 73
𝑃( 𝑋 − 𝜇 > 𝑘𝜎2) ≤
1
𝑘2
entonces la probabilidad de que en la semana de
producción el número de artículos exceda en mas
de 10 a la media es a lo más 0.25.
Teorema de Chebyshev.
• Otra consecuencia del teorema es que para cada
distribución de media µ y desviación típica finita s, al
menos la mitad de los valores caerán en el intervalo
07/09/2015 Ing. William Jaime León Velásquez 74
𝜇 − 2𝜎, 𝜇 + 2𝜎
Teorema de Chebyshev.
• En una clínica infantil se ha ido anotando, durante un mes,
el número de metros que cada niño anda, seguido y sin
caerse, el primer día que comienza a caminar,
obteniéndose la tabla de información adjunta:
número de metros
1 2 3 4 5 6 7 8
número de niños
2 6 10 5 10 3 2 2
Se pide:.
a)Calcular la media aritmética,
b) Varianza y desviación típica.
c) ¿Entre qué dos valores se encuentra, como mínimo, el 75%
de las observaciones?07/09/2015 Ing. William Jaime León Velásquez 75
Teorema de Chebyshev.
a)La media x viene dada por:
07/09/2015 Ing. William Jaime León Velásquez 76
b) Ahora determina las medidas de dispersión.
 Utilizar la relación
Teorema de Chebyshev.
• Consecuentemente, la desviación típica es
07/09/2015 Ing. William Jaime León Velásquez 77
Teorema de Chebyshev.
• c) El Teorema de Chebyshev garantiza que, como
mínimo, el (1−
1
𝑘2 )· 100% de los datos se concentran
en el intervalo (𝑥−kσ, 𝑥+kσ) y, por tanto, fuera de
dicho intervalo se encuentra, a lo sumo, el
1
𝑘2 · 100% de
ellos.
Conforme a este teorema, imponemos que
De donde
y
07/09/2015 Ing. William Jaime León Velásquez 78
Teorema de Chebyshev.
• Por lo tanto, k = 2.
• Podemos así garantizar que, al menos, el 75% de los
datos se encuentran entre los valores
y
07/09/2015
Ing. William Jaime León Velásquez
79
MEDIDAS
DE
FORMA
Ing. William León Velásquez
MEDIDAS DE FORMA
81 ING. WILLIAM LEON V.
• Una distribución es asimétrica
cuando sus datos tienden a
agruparse hacia uno de los
extremos de la distribución.
• Cuando una curva es
asimétrica, tiene un sesgo.
ASIMETRÍA O SESGO
82 ING. WILLIAM LEON V.
El sesgo puede ser de dos tipos:
• Si los datos tienden a agruparse en las primeras
clases, se dice que el distribución tiene un sesgo
positivo o que es asimétrica positiva.
• Si los datos tienden a agruparse en las últimas
clases de la distribución, se dice que esta tiene
sesgo negativo o que es asimétrica negativa.
ASIMETRÍA O SESGO
83 ING. WILLIAM LEON V.
• Si una distribución es simétrica, entonces: = Me = Mo.
• Entre más diferencia halla entre la y la Mo, más asimétrica
es la distribución. El coeficiente de Karl Pearson que
simbolizamos como SK, mide ésta diferencia en unidades de
desviación estándar así:
El coeficiente de asimetría
COEFICIENTE DE KARL PEARSON
84 ING. WILLIAM LEON V.
X
X
• Si la media es mayor que la moda, entonces, SK es positivo.
Es decir, el sesgo es positivo.
• Si la media es menor que la moda, SK es negativo, es decir el
sesgo es negativo.
• Si la media es igual a la moda, SK=0 y la distribución es
simétrica.
El coeficiente de asimetría
COEFICIENTE DE KARL PEARSON
85 ING. WILLIAM LEON V.
Según es grado de asimetría una
distribución puede ser:
El coeficiente de asimetría (CA)
86 ING. WILLIAM LEON V.
Simétrica
sk = 0
Asimétrica positiva
sk > 0
Asimétrica negativa
sk< 0
EJEMPLO
• Se ha recopilado la información del
contenido de grasa(expresado en
libras) de 200 frascos de Yogur en
presentación de 2.5 libras, referidos a
una muestra aleatoria extraída de un
lote de 3.600 frascos correspondientes
a la producción de un mes de la
compañía LÁCTEOS S.A.
• El valor de la media es 0.2608, el valor
de la moda es 0.258 y el valor de la
desviación estándar es 0.0408.
Calcular el el coeficiente de karl
Pearson
EJEMPLO
• SK = (0.2608 - 0.258)/0.0408 = 0.069.
• Lo anterior significa que la asimetría es
positiva.
• Significa además, que la diferencia
entre la y la Mo equivale a 0.069
veces la desviación estándar.
Aplicando la formula:
X
Mide el grado de
elevación o de agudeza
de una distribución
comparada con la curva
normal.
CURTOSIS O APUNTAMIENTO
89 ING. WILLIAM LEON V.
Según su grado de curtosis, una distribución puede
ser:
CURTOSIS O APUNTAMIENTO
90
ING. WILLIAM LEON V.
a) En la medida en que los diferentes
tramos de la variable presenten
frecuencias muy similares en todo su
recorrido, entonces podemos
afirmar que existe poca curtosis o
concentración de los datos. Esta
situación contribuye a que la
dispersión sea alta. Una distribución
con éstas características, se
denomina PLATICÚRTICA O
ACHATADA
PLATICÚRTICA O ACHATADA
91
ING. WILLIAM LEON V.
b) Por el contrario, si existe una
cantidad muy significativa de datos
que se encuentran concentrados en
algún tramo de la variable, entonces
decimos que la distribución es
altamente concentrada o que tiene
alta curtosis. Una distribución de
éstas características se denomina
LEPTOCÚRTICA O APUNTADA.
LEPTOCÚRTICA O APUNTADA
92
ING. WILLIAM LEON V.
c) Si la concentración es intermedia
entre las dos situaciones anteriores,
se dice que la distribución es
MESOCÚRTICA o MODERADA
CONCENTRACIÓN DE LOS DATOS.
Una distribución con esta
característica es propia de la
distribución normal,
MESOCÚRTICA o MODERADA
93
ING. WILLIAM LEON V.
Coeficiente de Curtosis
94 ING. WILLIAM LEON V.
Éste coeficiente, resulta del cociente
existente entre el momento de orden cuatro
respecto a la media y la desviación estándar
elevada a la cuarta.
COEFICIENTE DE CURTOSIS A4
95 ING. WILLIAM LEON V.
• La mayoría de los autores consideran que:
• a) Si A4 - 3 = 0, la distribución es mesocúrtica o
moderada concentración de los datos. Tal es el
caso de la distribución normal
• b) Si A4 - 3 > 0, la distribución es apuntada o
leptocúrtica o alta concentración de los datos.
• Si A4 - 3 < 0, la distribución es achatada o
platicúrtica o baja concentración de los datos.
COEFICIENTE DE CURTOSIS A4
96 ING. WILLIAM LEON V.
• Las tablas siguientes, nos permiten aclarar aún más el concepto de
concentración de los datos.
• La tabla (a) es una distribución platicúrtica, puesto que las
frecuencias son más o menos similares.
• La tabla (b), es una distribución leptocúrtica, puesto que la cuarta
categoría, se destaca por tener una frecuencia muy alta frente a las
demás.
• La tabla (c), es una distribución intermedia entre la (a) y la (b), por
lo cual es muy posible que se acerque a una distribución
mesocúrtica.
COEFICIENTE DE CURTOSIS A4
97
• Se ha recopilado la información del
contenido de grasa(expresado en libras) de
200 frascos de Yogur en presentación de 2.5
libras, referidos a una muestra aleatoria
extraída de un lote de 3.600 frascos
correspondientes a la producción de un mes
de la compañía LÁCTEOS S.A.
• Se tiene el siguiente cuadro
COEFICIENTE DE CURTOSIS A4
98 ING. WILLIAM LEON V.
• Reemplazando en la fórmula
COEFICIENTE DE CURTOSIS A4
99 ING. WILLIAM LEON V.
En éste caso, la distribución es achatada o platicúrtica o
poca concentración de los datos. No obstante observemos,
que el valor “- 0.47”, es muy cercano a cero, lo cual quiere
decir, que la distribución es casi una distribución
mesocúrtica.
FINwjleonv@yahoo.com
07/09/2015 Ing. William Jaime León Velásquez 100

Más contenido relacionado

PPTX
Presentación ANOVA
PPTX
Análisis de la varianza (ANOVA)
PPTX
18. Regresión Lineal
PPTX
Distribucion de Poisson
PDF
Estadistica y probabilidad
PPTX
Prueba no paramétrica- Wilcoxon
PPTX
CONCEPTOS BÁSICOS DE ESTADISTICA
PPTX
6. Medidas de forma. Medidas de asimetría, coeficiente de asimetría de Fisher...
Presentación ANOVA
Análisis de la varianza (ANOVA)
18. Regresión Lineal
Distribucion de Poisson
Estadistica y probabilidad
Prueba no paramétrica- Wilcoxon
CONCEPTOS BÁSICOS DE ESTADISTICA
6. Medidas de forma. Medidas de asimetría, coeficiente de asimetría de Fisher...

La actualidad más candente (20)

DOCX
Ejemplos de ejercicios bernoulli
PDF
probabilidad y estadística. Ejercicios resueltos
PPTX
Medidas de Dispersión
PPTX
Análisis de Varianza (ANOVA)
PDF
Análisis de Regresión Múltiple
PDF
Interpretacion y Reportes de Resultados de Estadística Descriptiva
PDF
Análisis de Regresión Lineal
PDF
Análisis de correlación y regresión lineal simple
PPS
Muestreo y distrib muestrales de una media
PPT
Pruebas No Parametricas
PPT
Pruebas no parametricas de wilcoxon 2007.
PDF
Prueba de hipotesis para proporciones Est ind clase02
PPTX
Desviacion estandar
PPTX
Estimación por Intervalos
DOCX
Coeficiente de asimetría de pearson
PPTX
7. Análisis de Varianza (ANOVA)
PDF
Distrib.binomial
PDF
Distribuciones continuas de probabilidad
PPTX
Pruebas de bondad de ajuste
DOC
Distribuciones de probabilidad con ejemplos
Ejemplos de ejercicios bernoulli
probabilidad y estadística. Ejercicios resueltos
Medidas de Dispersión
Análisis de Varianza (ANOVA)
Análisis de Regresión Múltiple
Interpretacion y Reportes de Resultados de Estadística Descriptiva
Análisis de Regresión Lineal
Análisis de correlación y regresión lineal simple
Muestreo y distrib muestrales de una media
Pruebas No Parametricas
Pruebas no parametricas de wilcoxon 2007.
Prueba de hipotesis para proporciones Est ind clase02
Desviacion estandar
Estimación por Intervalos
Coeficiente de asimetría de pearson
7. Análisis de Varianza (ANOVA)
Distrib.binomial
Distribuciones continuas de probabilidad
Pruebas de bondad de ajuste
Distribuciones de probabilidad con ejemplos
Publicidad

Destacado (20)

DOCX
Coeficiente de variación
DOCX
Ejercicio de datos agrupados
DOC
Tarea 1 estadistica
PPTX
Regla Empírica Y Teorema De Tshebyshev
PPTX
MEDIDAS DE DISPERSION ABSOLUTAS Y RELATIVAS
DOCX
Ejercicio pH sanguineo
PDF
Estadistica.pptx...exposicion
PPTX
medidas de dispercion
PDF
Seminario 10. correlación bivariada
PPT
Otras Medidas de Dispersión
PPTX
Medidas de dispersión
PDF
Estadistica Diana
PPTX
Medidas de la forma de distribución
PPTX
Pres unid i estadistica descriptiva 2011
PPTX
Estadística
PPTX
Temas 6 y 7 de bioestadística. Semestre b 2012. Medidas de dispersión, varia...
PPTX
Presentacion medidas de dispersion estadistica
PPT
Lupita camarena
PPTX
Estadigrafos centrales y de dispersion
Coeficiente de variación
Ejercicio de datos agrupados
Tarea 1 estadistica
Regla Empírica Y Teorema De Tshebyshev
MEDIDAS DE DISPERSION ABSOLUTAS Y RELATIVAS
Ejercicio pH sanguineo
Estadistica.pptx...exposicion
medidas de dispercion
Seminario 10. correlación bivariada
Otras Medidas de Dispersión
Medidas de dispersión
Estadistica Diana
Medidas de la forma de distribución
Pres unid i estadistica descriptiva 2011
Estadística
Temas 6 y 7 de bioestadística. Semestre b 2012. Medidas de dispersión, varia...
Presentacion medidas de dispersion estadistica
Lupita camarena
Estadigrafos centrales y de dispersion
Publicidad

Similar a Clase04 eyp (20)

PDF
MEDIDAS DE DISPERSION DE DATOS
PPTX
Medidas De Dispersion
PDF
ANALISIS DE VARIANZAS
PPT
Medidas de dispersión
PDF
Clase5_Medidas de dispersion.pdf
PPTX
MEDIDAS DE DISPERSION Y FORMA CLASE4 UNS
PDF
00652520963IM07S11035705SESIoN4_MEDIDAS_DISPERSION__3_.pdf.pdf
PDF
00652520963IM07S11035705SESIoN4_MEDIDAS_DISPERSION__3_.pdf (1).pdf
PPT
10069139_Medidas de Dispersión-1 (2).ppt
PPT
Estadistica I 05
PPTX
Medidas de Dispersión Ejercicios Laboratorio.pptx
PPTX
404323396-Unidad-IV-UTEC-mm2018-pptx.pptx
PPT
Dispersion04
PPTX
a quien interese
PPTX
Medidas de dispersion
PPTX
Medidas_Dispersiondsfasdfsdfsfsfsdfffffff.pptx
PPTX
Presentación n3 medidas de dispersion
PDF
CLASE 5 MEDIDAS DE DISPERSION-2024-II.pdf
MEDIDAS DE DISPERSION DE DATOS
Medidas De Dispersion
ANALISIS DE VARIANZAS
Medidas de dispersión
Clase5_Medidas de dispersion.pdf
MEDIDAS DE DISPERSION Y FORMA CLASE4 UNS
00652520963IM07S11035705SESIoN4_MEDIDAS_DISPERSION__3_.pdf.pdf
00652520963IM07S11035705SESIoN4_MEDIDAS_DISPERSION__3_.pdf (1).pdf
10069139_Medidas de Dispersión-1 (2).ppt
Estadistica I 05
Medidas de Dispersión Ejercicios Laboratorio.pptx
404323396-Unidad-IV-UTEC-mm2018-pptx.pptx
Dispersion04
a quien interese
Medidas de dispersion
Medidas_Dispersiondsfasdfsdfsfsfsdfffffff.pptx
Presentación n3 medidas de dispersion
CLASE 5 MEDIDAS DE DISPERSION-2024-II.pdf

Más de Universidad Nacional Mayor de San Marcos (13)

PDF
Distribuciones muestrales
PDF
PDF
PDF
Análisis de Correlacion Lineal
PDF
Metodos No Parametricos Parte II. Est ind clase12
PDF
Metodos No Parametricos Parte I. Est ind clase11
PDF
Pruebas de Bondad de Ajuste. Independencia y Homogenidad. Est ind clase10
PDF
Analisis de la varianza Est ind clase04
PDF
Prueba de Hipotesis para Muestras Pequeñas Est ind clase03
PDF
Prueba de Hipotesis Est ind clase01
Distribuciones muestrales
Análisis de Correlacion Lineal
Metodos No Parametricos Parte II. Est ind clase12
Metodos No Parametricos Parte I. Est ind clase11
Pruebas de Bondad de Ajuste. Independencia y Homogenidad. Est ind clase10
Analisis de la varianza Est ind clase04
Prueba de Hipotesis para Muestras Pequeñas Est ind clase03
Prueba de Hipotesis Est ind clase01

Último (20)

PDF
biología es un libro sobre casi todo el tema de biología
PDF
Educación Artística y Desarrollo Humano - Howard Gardner Ccesa007.pdf
PDF
Fundamentos_Educacion_a_Distancia_ABC.pdf
PPTX
AGENTES PATÓGENOS Y LAS PRINCIPAL ENFERMEAD.pptx
PDF
COMUNICACION EFECTIVA PARA LA EDUCACION .pdf
PDF
Gasista de unidades unifuncionales - pagina 23 en adelante.pdf
PDF
Crear o Morir - Andres Oppenheimer Ccesa007.pdf
PDF
Metodologías Activas con herramientas IAG
PDF
COMPLETO__PROYECTO_VIVAN LOS NIÑOS Y SUS DERECHOS_EDUCADORASSOS.pdf
PDF
GUIA DE: CANVA + INTELIGENCIA ARTIFICIAL
DOCX
UNIDAD DE APRENDIZAJE 5 AGOSTO tradiciones
PDF
TRAUMA_Y_RECUPERACION consecuencias de la violencia JUDITH HERMAN
DOCX
2 GRADO UNIDAD 5 - 2025.docx para primaria
PDF
Conecta con la Motivacion - Brian Tracy Ccesa007.pdf
PDF
Habitos de Ricos - Juan Diego Gomez Ccesa007.pdf
PDF
Atencion prenatal. Ginecologia y obsetricia
PDF
Romper el Circulo de la Creatividad - Colleen Hoover Ccesa007.pdf
PDF
SESION 12 INMUNIZACIONES - CADENA DE FRÍO- SALUD FAMILIAR - PUEBLOS INDIGENAS...
PDF
OK OK UNIDAD DE APRENDIZAJE 5TO Y 6TO CORRESPONDIENTE AL MES DE AGOSTO 2025.pdf
PDF
Unidad de Aprendizaje 5 de Educacion para el Trabajo EPT Ccesa007.pdf
biología es un libro sobre casi todo el tema de biología
Educación Artística y Desarrollo Humano - Howard Gardner Ccesa007.pdf
Fundamentos_Educacion_a_Distancia_ABC.pdf
AGENTES PATÓGENOS Y LAS PRINCIPAL ENFERMEAD.pptx
COMUNICACION EFECTIVA PARA LA EDUCACION .pdf
Gasista de unidades unifuncionales - pagina 23 en adelante.pdf
Crear o Morir - Andres Oppenheimer Ccesa007.pdf
Metodologías Activas con herramientas IAG
COMPLETO__PROYECTO_VIVAN LOS NIÑOS Y SUS DERECHOS_EDUCADORASSOS.pdf
GUIA DE: CANVA + INTELIGENCIA ARTIFICIAL
UNIDAD DE APRENDIZAJE 5 AGOSTO tradiciones
TRAUMA_Y_RECUPERACION consecuencias de la violencia JUDITH HERMAN
2 GRADO UNIDAD 5 - 2025.docx para primaria
Conecta con la Motivacion - Brian Tracy Ccesa007.pdf
Habitos de Ricos - Juan Diego Gomez Ccesa007.pdf
Atencion prenatal. Ginecologia y obsetricia
Romper el Circulo de la Creatividad - Colleen Hoover Ccesa007.pdf
SESION 12 INMUNIZACIONES - CADENA DE FRÍO- SALUD FAMILIAR - PUEBLOS INDIGENAS...
OK OK UNIDAD DE APRENDIZAJE 5TO Y 6TO CORRESPONDIENTE AL MES DE AGOSTO 2025.pdf
Unidad de Aprendizaje 5 de Educacion para el Trabajo EPT Ccesa007.pdf

Clase04 eyp

  • 1. MEDIDAS DE DISPERSIÓN Y DE FORMA Ing. William Jaime León Velásquez wjleonv@yahoo.com http://www.slideshare.net/williamleon20/clase04-eyp Universidad Nacional Mayor de San Marcos ESTADISTICA Y PROBABILIDADES 04
  • 2. Medidas de dispersión Medidas de forma CONTENIDO TEMATICO 07/09/2015 Ing. William Jaime León Velásquez 2
  • 4. • Las Medidas de Dispersión, son indicadores de variabilidad y cuya importancia reside en la necesidad de tomar decisiones, basadas en estadísticas básicas. MEDIDAS DE DISPERSIÓN 4 ING. WILLIAM LEON V.
  • 5. Ejemplo: • Se tiene una producción de franelas y se sabe que semanalmente se producen un promedio de 500 franelas, se puede decir que todos los días se producen 100 franelas • Nada nos garantiza eso porque podrían producirse en sólo dos días 250 franelas y el promedio semanal nos daría un valor idéntico, MEDIDAS DE DISPERSIÓN 5 ING. WILLIAM LEON V.
  • 6. • Si adicionalmente nos informan que tiene una variación de 5 franelas, tendremos entonces una mejor comprensión del proceso, pues este último número nos indica que semanalmente se producen entre 495 y 505 franelas, es decir, que diariamente sí se deben producir aproximadamente 100 franelas. MEDIDAS DE DISPERSIÓN 6 ING. WILLIAM LEON V.
  • 7. La Dispersión se refiere a la variabilidad entre los valores, es decir, qué tan grandes son las diferencias entre los valores. La idea de dispersión se relaciona con la mayor o menor concentración de los datos en torno a un valor central, generalmente la media aritmética. MEDIDAS DE DISPERSIÓN 7 ING. WILLIAM LEON V.
  • 8. • Observe las dos figuras. La primera presenta una distribución con datos más concentrados alrededor de su promedio 400 que la otra figura con respecto a su promedio 800, es decir la primera figura es una distribución con menos dispersión. MEDIDAS DE DISPERSIÓN 8 ING. WILLIAM LEON V. Ejemplos:
  • 9.  Las figuras siguientes muestran a tres distribuciones con promedio 70, sin embargo las tres difieren en cuanto a su variabilidad alrededor de la media. MEDIDAS DE DISPERSIÓN 9 ING. WILLIAM LEON V. poca variabilidad alguna variabilidad gran variabilidad Ejemplos:
  • 10. • Se tienen dos grupos de estudiantes que sometidos a una prueba arrojaron los siguientes puntajes: MEDIDAS DE DISPERSIÓN. EJEMPLO 10 ING. WILLIAM LEON V. GRUPO A GRUPO B Puntaje Nº estudiant es Puntaje Nº estudiantes 9 2 11 5 10 4 12 10 11 6 13 5 13 4 Total 20 15 2 17 2 Total 20
  • 11. MEDIDAS DE DISPERSIÓN Al calcular el promedio aritmético para ambos grupos se obtiene: Este resultado puede conducir a conclusiones equivocadas cuando se está comparando distribuciones, Pues se podría pensar que ambas secciones son idénticas en su rendimiento, ING. WILLIAM LEON V. 11 12 BA xx
  • 12. Siendo esta conclusión falsa ya que observando los datos se aprecia que la sección B es más homogénea. Por lo tanto En este caso el promedio no tiene suficiente grado de representatividad por lo tanto poco podrá describirnos acerca de los datos en estudio. MEDIDAS DE DISPERSIÓN 12 ING. WILLIAM LEON V.
  • 13. MEDIDAS DE DISPERSIÓN 13 ING. WILLIAM LEON V. iX Es necesario entonces calcular otras medidas estadísticas para mostrar cómo varían los datos alrededor del promedio y esto se logra mediante las medidas de dispersión.
  • 14. 1.- Para evaluar la confiabilidad del promedio que se está utilizando: Una dispersión pequeña indica que los datos se encuentran acumulados muy cerca, alrededor de la medida de tendencia central establecida. Por tanto, la medida de tendencia central se considera confiable o bastante representativa de los datos. Por el contrario, una dispersión grande indica que la medida escogida para representar los datos no es muy confiable, es decir, no es muy representativa de los datos. FUNCIONES DE LAS MEDIDAS DE DISPERSIÓN 14 ING. WILLIAM LEON V.
  • 15. 2.- Para apreciar cuán dispersas están dos o más distribuciones: Para poder comparar dos distribuciones de frecuencias entre sí, no sólo necesitamos la medida de tendencia central, sino también la dispersión entre las observaciones para no elaborar conclusiones erróneas. A mayor medida de dispersión  el grupo es más heterogéneo. A menor medida de dispersión  el grupo es más homogéneo o uniforme. FUNCIONES DE LAS MEDIDAS DE DISPERSIÓN 15 ING. WILLIAM LEON V.
  • 16. MEDIDAS DE DISPERSIÓN ABSOLUTA 16 ING. WILLIAM LEON V. Cuantifican el grado de concentración o de dispersión de los valores de la variable en torno de un promedio de la distribución.
  • 17. MEDIDAS DE DISPERSIÓN ABSOLUTA 17 ING. WILLIAM LEON V. Principales medidas de dispersión absoluta: •Rango o Recorrido : R •Varianza : S2 •Desviación Estándar : S
  • 18. Es la diferencia entre los valores máximo y mínimo de los datos. Esta medida es muy fácil de calcular sin embargo no es muy recomendable porque sólo toma en cuenta los valores extremos, sin considerar los demás valores. RANGO O RECORRIDO: R 18 ING. WILLIAM LEON V. mínXmáxXR 
  • 19. Interpretación de Rango: El Rango se puede interpretar como la amplitud existente entre una serie de datos, Es decir, mide cuán lejos está el valor más pequeño y el valor más grande de la muestra o población. RANGO O RECORRIDO: R 19 ING. WILLIAM LEON V.
  • 20. Se tiene una producción de franelas y se sabe que diariamente se producen un promedio de 500 franelas. Si un día se produce un mínimo de 415 franelas y otro día se produce un máximo de 573 franelas entonces el RANGO de producción estará entre 158 franelas, es decir, Podemos tener una producción de 158 franelas a partir del valor mínimo. RANGO O RECORRIDO: R 20 ING. WILLIAM LEON V. Ejemplo
  • 21. • Es un valor numérico que cuantifica el grado de dispersión de los valores de una variable respecto a su media aritmética. • Es el promedio de los cuadrados de las desviaciones de la variable respecto a su media aritmética. VARIANZA S2 , VX 21 ING. WILLIAM LEON V.            2 xiXMXV
  • 22. Notación: Varianza muestral. Varianza poblacional. VARIANZA S2 , VX 22 ING. WILLIAM LEON V. :2 S :2 
  • 23. VARIANZA S2 , VX 23 ING. WILLIAM LEON V. Nota: • La varianza nunca es negativa. • Cuando la variable toma un único valor; es decir cuando es constante entonces la varianza es cero. • Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.
  • 24. S2 para datos no agrupados: 24 ING. WILLIAM LEON V.                   2 n iX n2 i X 1n 1 )x(V
  • 25. • Calcular e interpretar la varianza de los pesos de un grupo de personas. Los datos son los siguientes: 56 65 68 70 72 76 78 80 S2 para datos no agrupados: 25 ING. WILLIAM LEON V. Ejemplo:
  • 26.  n = 8 S2 para datos no agrupados: 26 ING. WILLIAM LEON V. 565 8 1i iX   32940 8 1i 2 iX   2 oskil6184,60 2 8 565 832940 7 12 XS                Ejemplo:
  • 27. En promedio los pesos del grupo de personas, se alejan con respecto al promedio aritmético en aproximadamente 61 kilos al cuadrado. S2 para datos no agrupados: 27 ING. WILLIAM LEON V. Ejemplo:
  • 28. • a) Si n < 30 : S2 para datos agrupados 28 ING. WILLIAM LEON V.                                   2 n k 1i iXif n k 1i 2 i Xif 1n 12 XS
  • 29. 1.- Calcular e interpretar la varianza para la siguiente tabla de frecuencias.  S2 para datos agrupados 29 ING. WILLIAM LEON V. Edad Ii n = 20 4 - 6 4 6 - 10 5 10 - 16 7  n < 30 16 - 20 3 20 - 30 1 Total n = 20 Nº de personas if Ejemplo:
  • 30. V ( X ) = 29,21  29 años2 • En promedio la edad de estas personas se aleja con respecto a su promedio aritmético en aproximadamente 29 años al cuadrado. S2 para datos agrupados 30 ING. WILLIAM LEON V.                                                  2 20 230 203200 19 1 2 n k 1i iXif n k 1i 2 i Xif 1n 1 )X(V Ejemplo:
  • 31. b) Si n  30 : S2 para datos agrupados 31 ING. WILLIAM LEON V. 2 2 i 2 k 1i iXih k 1i XihS              2 2 i 2 n k 1i iXif n k 1i Xif S                 Usando frecuencias relativas: Usando frecuencias absolutas:
  • 32. Calcular e interpretar la varianza de la siguiente tabla. S2 para datos agrupados 32 ING. WILLIAM LEON V. Peso Ii Nº de ingenieros fi n = 40  n > 30 50 - 60 6 60 - 70 8 70 - 80 10 80 - 90 9 90 -100 7 Total n = 40 Ejemplo:
  • 33. En promedio el peso de los ingenieros se aleja con respecto al peso promedio en aproximadamente 172 kilos al cuadrado. S2 para datos agrupados 33 ING. WILLIAM LEON V. 94,171 2 40 3030 40 400236 n k 1i iXif n k 1i Xif S 2 2 i 2                        Ejemplo:
  • 34. Si una muestra de tamaño n se particiona en k muestras de tamaño 𝑛𝑖 cada una con su correspondiente promedio aritmético, 𝑋𝑖 y 𝑆𝑖 2 su varianza VARIANZA TOTAL O GLOBAL 34 ING. WILLIAM LEON V. 1 2 k ………. . ………. ………. . 2 kS2 2S 2 1S kx2x1x kn2n1n
  • 35. La varianza para los k grupos juntos se calcula mediante la fórmula: VARIANZA TOTAL O GLOBAL 35 ING. WILLIAM LEON V. 2 n xn n )Sx(n S k 1i ii k 1i 2 i 2 ii 2 T                         k 1i inn donde
  • 36.  Se tienen tres grupos, de seis, nueve y siete estudiantes respectivamente. Si las notas correspondientes a cada uno de ellos son: VARIANZA TOTAL O GLOBAL 36 ING. WILLIAM LEON V. Ejemplo: Grupo 1: 12 16 08 11 10 12 Grupo 2: 17 14 07 13 11 18 13 15 14 Grupo 3: 10 13 11 08 12 09 12
  • 37. = 2,98 En promedio las notas de los estudiantes de los tres grupos se alejan con respecto al promedio total en aproximadamente 3 puntos. VARIANZA TOTAL O GLOBAL 37 ING. WILLIAM LEON V.   89,809,12 22 )24,371,10(7)53,1056,13(9)1,75,11(6 21 222 2     k i T S T S Ejemplo:
  • 38. Es la raíz cuadrada positiva de la varianza y posee las mismas unidades que la media aritmética, Estas unidades ya no están elevadas al cuadrado como en la varianza. DESVIACIÓN ESTÁNDAR 38 ING. WILLIAM LEON V. )X(VS 
  • 39. La desviación estándar o desviación típica se obtiene para simplificar la interpretación de la varianza. Cuando se calcula la varianza, se basa en datos elevados al cuadrado, por lo que, el resultado obtenido debe interpretarse en unidades al cuadrado; por esta razón se obtiene la desviación estándar como la raíz cuadrada de la variancia. DESVIACIÓN ESTÁNDAR 39 ING. WILLIAM LEON V.
  • 40. Interpretación de la Desviación Estándar: • Es una medida que muestra la distancia promedio de los valores observados con respecto a su media. • La distancia de cada valor con su media se mide tomando el valor absoluto de la diferencia entre ese valor y la media, es decir, es la distancia de cada dato respecto a su promedio. DESVIACIÓN ESTÁNDAR 40 ING. WILLIAM LEON V.
  • 41. • Si se tiene una producción de franelas y sabemos que diariamente se producen un promedio de 500 franelas, adicionalmente tenemos también que la desviación es de 25 franelas, tendremos entonces una mejor comprensión del proceso pues este último número nos indica que diariamente se producen entre 475 y 525 franelas DESVIACIÓN ESTÁNDAR 41 ING. WILLIAM LEON V. Ejemplo :
  • 42. DESVIACIÓN ESTÁNDAR Distribuciones con igual promedio aritmético y diferente desviación estándar ING. WILLIAM LEON V. 42 𝑋=52 S=24 𝑋=52 S=12 𝑋=52 S=6 𝑋=52 S=12
  • 43. DESVIACIÓN ESTÁNDAR 1.- Si la desviación típica del salario de los ingenieros de sistemas es $1,000 y la media aritmética es $3,000, Entonces los salarios de los ingenieros fluctúan entre $2,000 y $4,000 dólares. ING. WILLIAM LEON V. 43 Ejemplos:
  • 44. DESVIACIÓN ESTÁNDAR 2.-Calcular la desviación estándar de las notas obtenidas por un grupo de alumnos del cuarto ciclo de la Facultad de Ingeniería Industrial de la UNMSM en la primera evaluación de estadística. 12 07 14 11 16 18 09 14 10 ING. WILLIAM LEON V. 44 Ejemplos:
  • 45. DESVIACIÓN ESTÁNDAR •  n = 9 ING. WILLIAM LEON V. 45 111 9 1i iX   4671 9 1i 2 iX     puntos5,325,12XS25,12 2 9 111 94671 8 1 XV                Por lo tanto: Ejemplos:
  • 46. DESVIACIÓN ESTÁNDAR  Nota:  La varianza y la desviación estándar se utilizan para comparar grupos cuya variable está expresada en las mismas unidades.  Así, el grupo más homogéneo, más uniforme o en el que la media aritmética es más representativa será aquel en el cual la varianza o la desviación estándar es menor. ING. WILLIAM LEON V. 46
  • 47. DESVIACIÓN ESTÁNDAR En varias semanas consecutivas, los oficiales de policía: Martínez y Castro aplicaron las siguientes infracciones por exceso de velocidad: ING. WILLIAM LEON V. 47 ¿Cuál de los oficiales es más homogéneo con respecto al número de infracciones? Ejemplo: Martínez : 31 38 42 32 39 26 Castro : 35 43 38 37 33 28 27
  • 48. DESVIACIÓN ESTÁNDAR Solución: ING. WILLIAM LEON V. 48 35,87 2 6 208 63907 5 1 S2 M                 31,95 2 7 241 74898 6 1 S2 C                 2 MS2 C S  El oficial Castro es más homogéneo en aplicar infracciones por exceso de velocidad porque su varianza es menor. Ejemplo:
  • 49. PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR
  • 50. PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR
  • 51. PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR
  • 52. PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR 1. La desviación estándar será siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. ING. WILLIAM LEON V. 52
  • 53. PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR 2.- Si a todos los valores de la variable se les suma un número la desviación estándar no varía. ING. WILLIAM LEON V. 53
  • 54. PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR 3.- Si todos los valores de la variable se multiplican por un número la desviación estándar queda multiplicada por dicho número. ING. WILLIAM LEON V. 54
  • 55. PROPIEDADES DE LA DESVIACIÓN ESTÁNDAR 4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas desviaciones estándar se puede calcular la desviación estándar total. • Si todas las muestras tienen el mismo tamaño: • Si las muestras tienen distinto tamaño: ING. WILLIAM LEON V. 55
  • 56. • La variancia y la desviación típica también tienen sus limitaciones. • Es similar a la media aritmética que es vulnerable a la influencia de casos extremos. • Además, cuando las medias aritméticas no son iguales o cuando las unidades de medición son distintas, la comparación de desviaciones típicas puede no ser significativa. MEDIDAS DE DISPERSIÓN RELATIVA 56 ING. WILLIAM LEON V.
  • 57. • Es la desviación estándar dividida sobre la media aritmética multiplicada por 100. El mismo nos permite comparar desviaciones típicas de variables con unidades de medición distintas. COEFICIENTE DE VARIACIÓN 57 ING. WILLIAM LEON V. 100 x S CV  El coeficiente de variación se expresa en unidades independientes de la naturaleza de la variable.
  • 58. • Interpretación del Coeficiente de Variación: • El Coeficiente de Variación, mide la variabilidad relativa a la Media. Expresa la proporción de variabilidad de una característica por cada unidad de la Media. COEFICIENTE DE VARIACIÓN 58 ING. WILLIAM LEON V.
  • 59. • Sabemos que la fábrica de textiles produce 500 franelas diarias con una desviación típica de más o menos (±) 25 franelas, entonces, el Coeficiente de Variación será 25/500 = 0,05, es decir, tenemos una variación de 5% en la producción diaria de franelas. COEFICIENTE DE VARIACIÓN 59 ING. WILLIAM LEON V.
  • 60. • En la práctica, se acostumbra considerar que un coeficiente de variación según la tabla. COEFICIENTE DE VARIACIÓN 60 ING. WILLIAM LEON V. Valor del coeficiente De variación (%) Interpretación del coeficiente Variabilidad Estabilidad Igual a cero Nula Muy alta Mayor de 0 hasta 20 Baja Alta Mayor de 20 hasta 60 Moderada Moderada Mayor de 60hata 90 Alta Baja Mayor de 90 Muy alta Nula
  • 61. • Se desea comparar los sueldos de los trabajadores de dos empresas A y B. Para tal efecto se tienen los datos de la tabla siguiente : • ¿Se puede afirmar que los sueldos de los trabajadores de la empresa A son más uniformes? ¿Por qué? COEFICIENTE DE VARIACIÓN 61 ING. WILLIAM LEON V. Ejemplo:
  • 62. COEFICIENTE DE VARIACIÓN 62 ING. WILLIAM LEON V. Empresa A Empresa B Sueldos ( $ ) Nº trabajadores Sueldos ( S/.) Nº trabajadores 380 10 600-650 7 410 9 650-700 9 450 12 700-750 14 480 8 750-800 6 500 7 800-850 4
  • 63.  Por lo tanto, los sueldos de los trabajadores de la empresa A no son más uniformes; sino los sueldos de la empresa B porque presenta menor coeficiente de variación. COEFICIENTE DE VARIACIÓN 63 ING. WILLIAM LEON V. 78,439x A  75,713xB  55,42SA  67,59S B  %68,9100 78,439 55,42 CVA  %36,8100 75,713 67,59 CVA 
  • 64. Tipificación. Valor Z • La tipificación es el proceso de restar la media y dividir entre su desviación típica a una variable X. • De este modo se obtiene una nueva variable ING. WILLIAM LEON V. 64  de media 0 y desviación estándar σ z = 1, que se denomina variable tipificada.
  • 65. • Ejemplo: • Podemos preguntar si un elefante es más grueso que una hormiga determinada, cada uno en relación con su población. ING. WILLIAM LEON V. 65 Esta nueva variable carece de unidades y permite hacer comparables dos medidas que en un principio no lo son, por aludir a conceptos diferentes. Tipificación. Valor Z
  • 66. • Ejemplo: Comparar el nivel académico de dos estudiantes de diferentes Universidades para la concesión de una beca de estudios. • En principio sería injusto concederla directamente al que posea una nota media más elevada, ya que la dificultad para conseguir una buena calificación puede ser mucho mayor en un centro que en el otro, lo que limita las posibilidades de uno de los estudiante y favorece al otro. ING. WILLIAM LEON V. 66 Ejemplo. Tipificación. Valor Z También es aplicable al caso en que se quieran comparar individuos semejantes de poblaciones diferentes.
  • 67. Ejemplo: Tipificación • Se desea dar una beca a uno de dos estudiantes de sistemas educativos diferentes. Se asignará al que tenga mejor expediente académico. – La estudiante A tiene una calificación de 8 en un sistema donde la calificación de los alumnos se comporta como N(6,1). – La estudiante B tiene una calificación de 80 en un sistema donde la calificación de los alumnos se comporta como N(70,10). 67
  • 68. Ejemplo: Tipificación • Solución – No se puede comparar directamente 8 puntos de A frente a los 80 de B, – Pero como ambas poblaciones se comportan de modo normal, Entonces se puede tipificar y observar las puntuaciones sobre una distribución de referencia N(0,1) Tema 5: Modelos probabilísticos 68.
  • 69. Ejemplo: Tipificación 69 1 10 7080 2 1 68           B BB B A AA A x z x z     Como ZA>ZB, se puede decir que el porcentaje de compañeros del mismo sistema de estudios que ha superado en calificación el estudiante A es mayor que el que ha superado el estudiante B. Se puede concluir que el estudiante A es mejor candidato para la beca.
  • 70. Teorema de Chebyshev. • La desigualdad de Chebyshev es un resultado estadístico que ofrece una cota inferior a la probabilidad de que el valor de una variable aleatoria con varianza finita esté a una cierta distancia de su esperanza matemática o de su media; • Equivalentemente, el teorema proporciona una cota superior a la probabilidad de que los valores caigan fuera de esa distancia respecto de la media. • El teorema es aplicable incluso en distribuciones que no tienen forma de "curva de campana" y acota la cantidad de datos que están o no "en medio". 07/09/2015 Ing. William Jaime León Velásquez 70
  • 71. Teorema de Chebyshev. Teorema: Sea X una variable aleatoria de media µ y varianza finita s². • Entonces, para todo número real k > 0, 07/09/2015 Ing. William Jaime León Velásquez 71 𝑃( 𝑋 − 𝜇 > 𝑘𝜎) ≤ 1 𝑘2 Sólo los casos con k > 1 proporcionan información útil.
  • 72. Teorema de Chebyshev. Ejemplo • El número de artículos producidos en una fábrica durante una semana es una variable aleatoria con media 50. • Si la varianza de una semana de producción se sabe que es igual a 25, entonces • ¿Qué se puede decir acerca de la probabilidad de que en esta semana la producción difiera en más de 10 a la media? 07/09/2015 Ing. William Jaime León Velásquez 72
  • 73. Teorema de Chebyshev. Ejemplo Solución: • Por la desigualdad de Chebyshev • μ=50, σ2=25, K=10, Reemplazando: 07/09/2015 Ing. William Jaime León Velásquez 73 𝑃( 𝑋 − 𝜇 > 𝑘𝜎2) ≤ 1 𝑘2 entonces la probabilidad de que en la semana de producción el número de artículos exceda en mas de 10 a la media es a lo más 0.25.
  • 74. Teorema de Chebyshev. • Otra consecuencia del teorema es que para cada distribución de media µ y desviación típica finita s, al menos la mitad de los valores caerán en el intervalo 07/09/2015 Ing. William Jaime León Velásquez 74 𝜇 − 2𝜎, 𝜇 + 2𝜎
  • 75. Teorema de Chebyshev. • En una clínica infantil se ha ido anotando, durante un mes, el número de metros que cada niño anda, seguido y sin caerse, el primer día que comienza a caminar, obteniéndose la tabla de información adjunta: número de metros 1 2 3 4 5 6 7 8 número de niños 2 6 10 5 10 3 2 2 Se pide:. a)Calcular la media aritmética, b) Varianza y desviación típica. c) ¿Entre qué dos valores se encuentra, como mínimo, el 75% de las observaciones?07/09/2015 Ing. William Jaime León Velásquez 75
  • 76. Teorema de Chebyshev. a)La media x viene dada por: 07/09/2015 Ing. William Jaime León Velásquez 76 b) Ahora determina las medidas de dispersión.  Utilizar la relación
  • 77. Teorema de Chebyshev. • Consecuentemente, la desviación típica es 07/09/2015 Ing. William Jaime León Velásquez 77
  • 78. Teorema de Chebyshev. • c) El Teorema de Chebyshev garantiza que, como mínimo, el (1− 1 𝑘2 )· 100% de los datos se concentran en el intervalo (𝑥−kσ, 𝑥+kσ) y, por tanto, fuera de dicho intervalo se encuentra, a lo sumo, el 1 𝑘2 · 100% de ellos. Conforme a este teorema, imponemos que De donde y 07/09/2015 Ing. William Jaime León Velásquez 78
  • 79. Teorema de Chebyshev. • Por lo tanto, k = 2. • Podemos así garantizar que, al menos, el 75% de los datos se encuentran entre los valores y 07/09/2015 Ing. William Jaime León Velásquez 79
  • 81. MEDIDAS DE FORMA 81 ING. WILLIAM LEON V.
  • 82. • Una distribución es asimétrica cuando sus datos tienden a agruparse hacia uno de los extremos de la distribución. • Cuando una curva es asimétrica, tiene un sesgo. ASIMETRÍA O SESGO 82 ING. WILLIAM LEON V.
  • 83. El sesgo puede ser de dos tipos: • Si los datos tienden a agruparse en las primeras clases, se dice que el distribución tiene un sesgo positivo o que es asimétrica positiva. • Si los datos tienden a agruparse en las últimas clases de la distribución, se dice que esta tiene sesgo negativo o que es asimétrica negativa. ASIMETRÍA O SESGO 83 ING. WILLIAM LEON V.
  • 84. • Si una distribución es simétrica, entonces: = Me = Mo. • Entre más diferencia halla entre la y la Mo, más asimétrica es la distribución. El coeficiente de Karl Pearson que simbolizamos como SK, mide ésta diferencia en unidades de desviación estándar así: El coeficiente de asimetría COEFICIENTE DE KARL PEARSON 84 ING. WILLIAM LEON V. X X
  • 85. • Si la media es mayor que la moda, entonces, SK es positivo. Es decir, el sesgo es positivo. • Si la media es menor que la moda, SK es negativo, es decir el sesgo es negativo. • Si la media es igual a la moda, SK=0 y la distribución es simétrica. El coeficiente de asimetría COEFICIENTE DE KARL PEARSON 85 ING. WILLIAM LEON V.
  • 86. Según es grado de asimetría una distribución puede ser: El coeficiente de asimetría (CA) 86 ING. WILLIAM LEON V. Simétrica sk = 0 Asimétrica positiva sk > 0 Asimétrica negativa sk< 0
  • 87. EJEMPLO • Se ha recopilado la información del contenido de grasa(expresado en libras) de 200 frascos de Yogur en presentación de 2.5 libras, referidos a una muestra aleatoria extraída de un lote de 3.600 frascos correspondientes a la producción de un mes de la compañía LÁCTEOS S.A. • El valor de la media es 0.2608, el valor de la moda es 0.258 y el valor de la desviación estándar es 0.0408. Calcular el el coeficiente de karl Pearson
  • 88. EJEMPLO • SK = (0.2608 - 0.258)/0.0408 = 0.069. • Lo anterior significa que la asimetría es positiva. • Significa además, que la diferencia entre la y la Mo equivale a 0.069 veces la desviación estándar. Aplicando la formula: X
  • 89. Mide el grado de elevación o de agudeza de una distribución comparada con la curva normal. CURTOSIS O APUNTAMIENTO 89 ING. WILLIAM LEON V.
  • 90. Según su grado de curtosis, una distribución puede ser: CURTOSIS O APUNTAMIENTO 90 ING. WILLIAM LEON V.
  • 91. a) En la medida en que los diferentes tramos de la variable presenten frecuencias muy similares en todo su recorrido, entonces podemos afirmar que existe poca curtosis o concentración de los datos. Esta situación contribuye a que la dispersión sea alta. Una distribución con éstas características, se denomina PLATICÚRTICA O ACHATADA PLATICÚRTICA O ACHATADA 91 ING. WILLIAM LEON V.
  • 92. b) Por el contrario, si existe una cantidad muy significativa de datos que se encuentran concentrados en algún tramo de la variable, entonces decimos que la distribución es altamente concentrada o que tiene alta curtosis. Una distribución de éstas características se denomina LEPTOCÚRTICA O APUNTADA. LEPTOCÚRTICA O APUNTADA 92 ING. WILLIAM LEON V.
  • 93. c) Si la concentración es intermedia entre las dos situaciones anteriores, se dice que la distribución es MESOCÚRTICA o MODERADA CONCENTRACIÓN DE LOS DATOS. Una distribución con esta característica es propia de la distribución normal, MESOCÚRTICA o MODERADA 93 ING. WILLIAM LEON V.
  • 94. Coeficiente de Curtosis 94 ING. WILLIAM LEON V.
  • 95. Éste coeficiente, resulta del cociente existente entre el momento de orden cuatro respecto a la media y la desviación estándar elevada a la cuarta. COEFICIENTE DE CURTOSIS A4 95 ING. WILLIAM LEON V.
  • 96. • La mayoría de los autores consideran que: • a) Si A4 - 3 = 0, la distribución es mesocúrtica o moderada concentración de los datos. Tal es el caso de la distribución normal • b) Si A4 - 3 > 0, la distribución es apuntada o leptocúrtica o alta concentración de los datos. • Si A4 - 3 < 0, la distribución es achatada o platicúrtica o baja concentración de los datos. COEFICIENTE DE CURTOSIS A4 96 ING. WILLIAM LEON V.
  • 97. • Las tablas siguientes, nos permiten aclarar aún más el concepto de concentración de los datos. • La tabla (a) es una distribución platicúrtica, puesto que las frecuencias son más o menos similares. • La tabla (b), es una distribución leptocúrtica, puesto que la cuarta categoría, se destaca por tener una frecuencia muy alta frente a las demás. • La tabla (c), es una distribución intermedia entre la (a) y la (b), por lo cual es muy posible que se acerque a una distribución mesocúrtica. COEFICIENTE DE CURTOSIS A4 97
  • 98. • Se ha recopilado la información del contenido de grasa(expresado en libras) de 200 frascos de Yogur en presentación de 2.5 libras, referidos a una muestra aleatoria extraída de un lote de 3.600 frascos correspondientes a la producción de un mes de la compañía LÁCTEOS S.A. • Se tiene el siguiente cuadro COEFICIENTE DE CURTOSIS A4 98 ING. WILLIAM LEON V.
  • 99. • Reemplazando en la fórmula COEFICIENTE DE CURTOSIS A4 99 ING. WILLIAM LEON V. En éste caso, la distribución es achatada o platicúrtica o poca concentración de los datos. No obstante observemos, que el valor “- 0.47”, es muy cercano a cero, lo cual quiere decir, que la distribución es casi una distribución mesocúrtica.
  • 100. FINwjleonv@yahoo.com 07/09/2015 Ing. William Jaime León Velásquez 100