SlideShare una empresa de Scribd logo
Probabilidad y Estadística
Fecha: del 28 de enero al 01 de febrero de 2019
Bloque 3
Aplicas la estadística descriptiva
S1-COMPRENDIENDO LAS MEDIDAS ESTADÍSTICAS DE TENDENCIA
CENTRAL
Medidas de centralización para datos agrupados.
Cuando los datos se encuentran ya resumidos en distribuciones de frecuencias, en las cuales los valores de
nuestra variable de estudio no se encuentran agrupados en intervalos, la manera en que se puede calcular las
medidas de tendencia central se muestran en los siguientes ejemplos:
Ejemplo 1. Se entrevistaron a 20 jóvenes con respecto al número de veces que acuden al cine cada mes. La
siguiente tabla de distribución de frecuencias muestra, de forma resumida los datos obtenidos:
La media.
Para obtener el número medio de visitas al mes por estas veinte personas, se puede apreciar en la tabla que:
una persona no asiste en un mes al cine, que cuatro manifiestan acudir una vez al mes, diez personas dijeron
que acuden dos veces al mes, tres personas asisten tres veces al mes y finalmente, dos personas acuden cuatro
veces al mes. La media se calcula sumando los datos que se han descomprimido de la tabla obteniendo:
Veces que asiste al cine Frecuencia
0 1
1 4
2 10
3 3
4 2
Total 20
La media se calcula sumando los datos que se han descomprimido de la tabla obteniendo:
x = 0 + 1 +1 +1 + 1 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 3 + 3 + 3 + 4 + 4 = 41 = 2.05
20 20
Sin embargo, hacer esto resultaría bastante tedioso cuando el número de datos es grande. Puesto que, la
multiplicación abrevia sumas repetidas de un mismo valor; una alternativa para calcular la media aritmética
es sumar las multiplicaciones de cada frecuencia por su dato correspondiente, y posteriormente, dividir el
resultado entre la sumatoria de frecuencias absolutas. De esta manera, la primera fórmula para el cálculo
de la media, que es:
se transforma en :
1 + 4 + 10 +3 + 2 20
n
ΣXi
i = 1
x = n
k
Σfi xi
1(0) + 4(1) + 10(2) + 3(3) + 2(4) 41
x =
i = 1
= = = 2.05
k Σfi i = 1
En esta expresión la letra “k”
representa al número de
valores diferentes que toma la
variable de estudio, en este es
cinco.
La moda
Al realizar una inspección visual, se puede apreciar que el dato de mayor frecuencia es el 2, que se repite 10
veces, por lo tanto la moda es 2, la cual se representa como x = 2.
Finalmente, la mediana se obtiene de la siguiente forma: Como el número de datos es 20, el lugar que ocupa
la mediana es (20+1)/2 = 10.5, es decir la mediana se encuentra en medio de los valores que ocupan el
décimo y onceavo lugares. Para deducir los datos, que se ubican en estas posiciones, sumamos las
frecuencias absolutas hasta cubrir estos dos lugares; es decir: como el cero ocupa el primer lugar y los cuatro
números uno, del segundo al quinto lugares; el número 2 abarca del sexto al décimo quinto lugares, por lo
tanto las dos posiciones buscadas las cubre el número 2, de aquí que la mediana se calcule promediando dos
números dos, por lo cual la mediana es 2.
Generalmente en todas las tablas de distribución de frecuencias la primera columna contiene todos los
posibles valores de la variable de estudio, y es dentro de esa gama de valores numéricos que se encuentran
todas las medidas de tendencia central.
Ejemplo 2. La siguiente distribución de frecuencias representa el número de balances generales realizados por un
Contador Público a una empresa durante 25 días laborados.
La media, la moda y la mediana serán valores comprendidos en el intervalo de [0, 4].
Ejemplo 3. El número de materias aprobadas de un grupo de alumnos de quinto cuatrimestre de preparatoria, se
resumen en la siguiente distribución de frecuencias.
La media, la moda y la mediana serán valores comprendidos en el intervalo de [ 5, 8 ].
Número de
balances
Frecuencia absoluta
(Número de días)
0 2
1 7
2 9
3 5
4 2
Materias
aprobadas
Frecuencia absoluta
(Número de alumnos)
5 3
6 4
7 6
8 10
Resuelve los siguientes problemas.
1.Los siguientes datos resumidos en una distribución de frecuencias absolutas representan la información obtenida
al aplicar una encuesta con respecto al número de deportes que practican estudiantes de preparatoria:
Obtener los valores de la media, la moda y la mediana.
¿Cuál de las tres medidas de centralización representa mejor a estos datos? ¿Por qué?
Actividad 7
Variable de estudio
Número de deportes que practica
Frecuencia
Número de alumnos
0 3
1 14
2 7
3 5
4 3
Total
2.El siguiente histograma corresponde a esta distribución de frecuencias, localiza en el eje horizontal los
valores de la media, la moda y la mediana.
Describe el gráfico en términos del número de hijos:
¿Cuál de las tres medidas de centralización consideras que representarían mejor a estos datos? ¿Por qué?
Si visitas a una familia de ese fraccionamiento que fue elegida al azar, ¿Qué cantidad de hijos esperas que
tenga? ¿Por qué?
Número de hijos por familia
12
10
8
6
4
2
0
0 1 2 3 4 5 6
Número de hijos
3.La siguiente tabla muestra los resultados de una encuesta aplicada a una muestra aleatoria de alumnos de un
plantel de preparatoria.
a)¿Tipo de variable de estudio? ¿Cuántos alumnos fueron entrevistados?
b)Determina la media, la moda y la mediana del número de materias aprobadas.
c)¿Cuál consideras es la medida de centralización más adecuada para representar estos datos? ¿Por qué?
Variable de estudio:
Número de materias reprobadas.
Frecuencia:
Número de alumnos
0 12
1 10
2 7
3 5
4 2
5 1
Total
El caso de los datos agrupados en intervalos.
Otra forma en que pueden estar resumidos los datos es mediante distribuciones de frecuencias, en las cuales
los valores de variable se encuentran agrupados en intervalos de clase.
En estos casos las tres medidas de tendencia central requieren de expresiones algebraicas para su cálculo.
La media aritmética.
De cada intervalo se calcula su marca de clase, la cual se convertirá en el valor representativo de su intervalo
correspondiente; es decir, lo reemplazará. La media se calculará aplicando la siguiente fórmula:
Donde:
f representa la frecuencia de cada intervalo.
mc la marca de clase de cada uno de los intervalos de clase.
k representa el número de intervalos.
Σk
f mc
i = 1 i i
x =
k
i = 1 fi
Σ
La Moda.
En el caso de variables continuas es más correcto hablar de intervalos modales, como aquel o aquellos que
tienen mayor frecuencia con respecto al intervalo anterior y al posterior.
Localizado el intervalo modal, como el mostrado en la figura de arriba se procede a trazar los segmentos
auxiliares AA’ y BB’; el punto donde se cruzan y se proyecta al eje horizontal es donde está la moda.
B A
H H dp
da B
A
Moda
C
Frecuencias absolutas
Intervalos
Ei Es
Intervalo modal
Una fórmula práctica para el cálculo de la moda se obtiene a partir de semejanza de polígonos, como se muestra
a continuación:
A partir del trazo auxiliar se forman dos triángulos semejantes ABC y A´B´C, cuyas alturas y bases son
proporcionales entre sí, además, apoyándose del Teorema de Thales, se obtiene:
HC = H´C = HC + H´C
AB A´B´ AB + A´B´
Sustituyendo HC por la moda menos Ei, y AB por “da”, así como HC+H´C por A (amplitud del intervalo), además,
como A´B´ se cambia por dp, entonces, AB+A´B´se reemplaza por da+dp; todo lo anterior se visualiza de la
siguiente forma:
Moda – Ei = A
da da + dp
Al despejar la moda se deduce:
Moda =E + d A
i da + dp
x^ =E + da A
i da + dp
Donde:
E = Extremo inferior o límite real inferior del intervalo modal (intervalo de mayor frecuencia).
da = Diferencia de la frecuencia del intervalo modal y la frecuencia del intervalo anterior.
d = Diferencia de la frecuencia del intervalo modal y la frecuencia del intervalo posterior.
A = La amplitud del intervalo modal.
La Mediana.
En este caso se deduce una fórmula por medio de interpolación lineal como se muestra enseguida. Sea [Eik, Esk)
el intervalo donde se ha encontrado que por debajo él están el 50% de las observaciones. Entonces se obtiene la
mediana a partir de las frecuencias absolutas acumuladas, mediante interpolación lineal (teorema de Thales)
como sigue:
Media
Por semejanza de los triángulos ACC´ y ABB´, podemos establecer las siguientes proporciones:
CC´ = AC por las propiedades de la igualdad de proporciones, se deduce :
BB’ AB
Frecuencias
acumuladas
ni
n/2 B´
ni -1 A
C´
Frecuencia del intervalo mediana
(f mediana)
C
B
CC´ = BB´ = 2 i – 1 ........(1)
AC AB mediana - Ei
Como CC´ = f mediana , como recordarás, A representa a la amplitud de cada intervalo y que además se
AC A
obtiene de la diferencia: Es – Ei.
Como n – n i – 1 n -
2 = 2 f anteriores, reemplazando ambas igualdades en (1) se tiene :
mediana – Ei mediana – Ei
Σ
De lo cual se desprende que:
mediana = Ei +
n
- f anteriores
2 (A)
f mediana
x = Ei +
n
- f anteriores
2 (A)
Ei: Extremo inferior o límite real inferior del intervalo mediana.
Σf anteriores: Sumatoria de frecuencias anteriores al intervalo mediana.
f mediana: Frecuencia del intervalo mediana.
A: Amplitud del intervalo mediana.
A continuación se muestran algunos ejemplos para el cálculo de la media, la moda y la mediana para datos
agrupados en intervalos.
Ejemplo 1. La siguiente distribución de frecuencias muestra el ingreso mensual de 22 trabajadores de una empresa
comercial, determina la media salarial.
Ingresos mensuales Frecuencia (f )
[3200, 4000) 9
[4000, 4800) 5
[4800, 5600) 4
[5600, 6400) 3
[6400, 7200] 1
Total 22
Para el cálculo de la media se sugiere agregar las columnas de las marcas de clase y la correspondiente al
producto de las frecuencias por las marcas de clase asociadas, esto se muestra enseguida:
La media se obtiene dividiendo la sumatoria de los productos de las frecuencias por las marcas de clase que les
corresponden entre la suma de frecuencias absolutas:
Ingresos
mensuales
Frecuencia (f)
Marca de clase
(mc)
f (mc)
[3200, 4000) 9 3600 32,400
[4000, 4800) 5 4400 22,000
[4800, 5600) 4 5200 20,800
[5600, 6400) 3 6000 18,000
[6400, 7200] 1 6800 6,800
Total 22 100,000
Ejemplo 2. Se entrevistaron a 30 administradores de empresas con respecto al tiempo que requieren para efectuar
una auditoría; la siguiente distribución de frecuencias muestra de forma resumida los datos registrados. Determina
la moda del tiempo invertido.
Pasos:
Primero: se inicia con una inspección visual de la distribución de frecuencias, se puede observar que es unimodal,
por presentar una moda y además, es sesgada a la derecha, debido a que la mayoría de los datos se sitúan a la
derecha del intervalo modal.
Segundo: se ubica el intervalo de clase modal, siendo éste el de mayor frecuencia [13, 17 ), de él se elige su
extremo inferior, en este caso 13.
Tiempo invertido
(horas)
Frecuencia (f)
[9, 13) 3
[13, 17) 12
[17, 21) 7
[21, 25) 4
[25, 29) 3
[29, 33] 1
Total 30
Tercero: se calculan las diferencias entre la frecuencia del intervalo modal y las de los intervalos anterior y
posterior, respectivamente, obteniéndose así:
da = 12 – 3 = 9 dp = 12 – 7 = 5
Cuarto: se determina la amplitud de cada intervalo, ésta se obtiene de la resta de los extremos inferiores de
dos intervalos consecutivos.
A = 17 – 13 = 4
Quinto: se sustituyen los valores requeridos en la fórmula y se realizan las operaciones necesarias para obtener
un valor aproximado de la moda.
Ejemplo 3. Los datos siguientes muestran de forma resumida en una distribución de frecuencias absolutas, el tiempo
en horas que invierten los 21 empleados del taller de ensamblado de una fábrica de motores para tractocamiones.
Primero: se inicia con una inspección visual de la distribución de frecuencias, se puede observar que es bimodal, por lo
tanto presenta dos modas.
Segundo: Ubicamos los intervalos de clase modal siendo éstos los de mayor frecuencia [0, 0.9 ) y [1.8, 2.7 ) para
cada uno de ellos determinaremos los valores necesarios para el uso de la fórmula.
Tiempo de ensamblado
(horas)
Frecuencia
[0, 0.9 ) 7
[0.9, 1.8 ) 2
[1.8, 2.7 ) 8
[2.7, 3.6 ) 3
[3.6, 4.5 ] 1
Total 21
Tiempo de ensamblado
(horas)
Frecuencia
[0, 0.9 ) 7
[0.9, 1.8 ) 2
[1.8, 2.7 ) 8
[2.7, 3.6 ) 3
[3.6, 4.5 ] 1
Total 21
Intervalo
De clase
modale
Tercero: se calculan las diferencias entre la frecuencia del intervalo modal y las de los intervalos anterior y
posterior, respectivamente:
Para el intervalo modal [0 , 0.9) da = 7 – 0 = 7 dp = 7 – 2 = 5
Para el intervalo modal [1.8, 2.7) da = 8 - 2 = 6 dp = 8 – 3 = 5
Cuarto: se determina la amplitud de cada intervalo restando los extremos inferiores consecutivos de intervalo
de clase, esto se puede verificar con los extremos inferiores en dos intervalos consecutivos cualquiera, por lo
tanto, es válida para los dos intervalos modales.
A = 0.9 – 0 = 0.9
Quinto: se sustituyen los valores requeridos en la fórmula y se realizan las operaciones necesarias para obtener
un valor aproximado de la moda.
Entonces la moda del tiempo de ensamblado son: 0.5247 horas y 2.29 horas
Ejemplo 4. La distribución de frecuencias absolutas que se muestra a continuación resume los pesos de los 20
empleados del departamento de crédito y cobranza de una empresa comercial; determina el valor mediana de los
pesos.
Primero: se determina el intervalo mediana; como la frecuencia total es 20, para ubicar el intervalo mediana se
realizan los siguientes cálculos: (20+1)/2=10.5, por lo tanto, se buscará la mediana en el dato que ocupe los lugares
décimo y décimo primero. Si se observa en las frecuencias absolutas acumuladas, se encuentra que la mediana está
en el tercer intervalo, ya que hasta el segundo va una frecuencia acumulada de 4, por lo tanto, el intervalo [61.4,
65.1 ) es el intervalo mediana.
Peso Frecuencia
Frecuencia
acumulada
[54.0, 57.7 ) 1 1
[57.7, 61.4 ) 3 4
[61.4, 65.1 ) 8 12
[65.1, 68.8 ) 5 17
[68.8, 72.5 ] 3 20
Total 20
Ahora se aplica la fórmula sustituyendo los valores necesarios:
Resuelve los siguientes problemas.
1. Un estudiante en la clase de Estadística comenta que los cálculos de las medidas de tendencia central, son
siempre aproximados, esto cuando se calculan en distribuciones de frecuencia de datos agrupados por intervalos.
¿Compartes la opinión del joven?
¿Por qué?
2. Los siguientes datos resumidos en una distribución de frecuencias, representan el tiempo (horas) de estudios
semanales de estudiantes universitarios. Determina los valores aproximados de la media, la moda y la mediana.
Actividad 8
Intervalos
Frecuencia
absoluta
Marca de Clase f (mc)
Frecuencia
acumulada
[0.0, 1.4 ) 5
[1.4, 2.8 ) 7
[2.8, 4.2 ) 8
[4.2, 5.6 ) 4
[5.6, 7.0 ) 2
[7.0, 8.4 ] 1
Total
3. Los siguientes datos resumidos en intervalos representan los pesos de estudiantes de bachillerato. Se te
proporcionan columnas adicionales para los cálculos que creas necesarios.
a) ¿Cuál es la variable de estudio?
b) ¿Cuántos alumnos se participan en el estudio?
c) Calcular el valor de la media, el de la moda y el de la mediana.
d) ¿Cuál medida de centralización consideras que mejor representa estos datos? ¿Por qué?
e) Construye el histograma que corresponde a esta distribución de frecuencias y localiza en el eje horizontal los
valores de las tres medidas de tendencia central.
Pesos ( en kg) Frecuencia
[ 48, 56 ) 1
[ 56, 64 ) 5
[ 64, 72 ) 9
[ 72, 80 ) 15
[ 80, 88 ) 7
[ 88, 96 ] 13
Total
Bibliografía.
Estadistica 3era Edicion McGrawHill
Autor: Lincoln L. Chao
Estadistica 4ª. Edicion Schaum
Autor : Murray R. Spiegel y Larry J. Stephens

Más contenido relacionado

PPTX
Ingenieria Economica
PPT
Introducción a la Estadística
DOCX
Efecto en la inflación en estudios económicos evaluación de proyectos
PPTX
Estructura socioeconómica de México (1940-1982)
PPT
Gobierno de José López Portillo 1976 1982
DOC
Amortizacion y Fondos de Amortizacion
PPTX
Media ponderada
PPTX
Probabilidad clásica, de frecuencia relativa y subjetiva
Ingenieria Economica
Introducción a la Estadística
Efecto en la inflación en estudios económicos evaluación de proyectos
Estructura socioeconómica de México (1940-1982)
Gobierno de José López Portillo 1976 1982
Amortizacion y Fondos de Amortizacion
Media ponderada
Probabilidad clásica, de frecuencia relativa y subjetiva

La actualidad más candente (20)

DOCX
Diferencias entre sistema de amortización francés y el sistema de amortizació...
PDF
Ensayo de estadística inferencial
PPT
Liberalismo político
PPTX
distribuciones fundamentales de muestreo.pptx
PPSX
Probabilidad y Estadistica
DOC
Problemas resueltos de interes compuesto
PPT
Sucesos En MéXico Entre 1940 Y 1960
PPT
Tiro Vertical
PPTX
Distribución binomial
PPTX
Estadística y probabilidad
PPTX
Cuapiaxtla y sus comunidades
PPTX
Regresion lineal
PDF
11 Estadistica Descriptiva
PPT
Infraestructura Y Super Extructura
PPTX
Cambio social
PPT
Estadistica cuarto medio
PPTX
Espacio muestral
PPTX
Escala de mediciones
PDF
Función lineal. demanda y oferta
PPT
Keyness
Diferencias entre sistema de amortización francés y el sistema de amortizació...
Ensayo de estadística inferencial
Liberalismo político
distribuciones fundamentales de muestreo.pptx
Probabilidad y Estadistica
Problemas resueltos de interes compuesto
Sucesos En MéXico Entre 1940 Y 1960
Tiro Vertical
Distribución binomial
Estadística y probabilidad
Cuapiaxtla y sus comunidades
Regresion lineal
11 Estadistica Descriptiva
Infraestructura Y Super Extructura
Cambio social
Estadistica cuarto medio
Espacio muestral
Escala de mediciones
Función lineal. demanda y oferta
Keyness
Publicidad

Similar a Py e 9 (20)

PPTX
PPTX
Presentación 2
PPTX
MATERIAL MATEMATICA123112321321321321321321
PDF
INTERVAOS DE CLASE.pdf
PDF
MATERIAL INVESTIGACION.pdf
PPTX
Estadistica Descriptiva por Gabriela Mendez
PPTX
Medidas de tendencia central, posición y de Dispercion
DOCX
Medidas de tedencia_central_posicion_y_dispersion.pdf
PPTX
Medidas de dispersión y posición
PPTX
Medidas de tendencia central
PPTX
MEDIDAS DE TENDENCIA CENTRAL, Moda, Medianapptx
PPT
mediana_moda_y_media._clase_3.ppt
PPTX
Clase 3- Ingeniería y Arquitectura 2024.pptx
PPTX
Estadística I
PPTX
Presentacion(medidas de tendencia central)
PDF
Clase 4_Medidas de tendencia central.pdf
PPTX
630264452-TENDENCIA-CENTRAL-PPT-pptx.pptx
PDF
Comunidad_Emagister_66885_66885.pdf
PDF
Media Mediana y Moda.pdf
PDF
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Presentación 2
MATERIAL MATEMATICA123112321321321321321321
INTERVAOS DE CLASE.pdf
MATERIAL INVESTIGACION.pdf
Estadistica Descriptiva por Gabriela Mendez
Medidas de tendencia central, posición y de Dispercion
Medidas de tedencia_central_posicion_y_dispersion.pdf
Medidas de dispersión y posición
Medidas de tendencia central
MEDIDAS DE TENDENCIA CENTRAL, Moda, Medianapptx
mediana_moda_y_media._clase_3.ppt
Clase 3- Ingeniería y Arquitectura 2024.pptx
Estadística I
Presentacion(medidas de tendencia central)
Clase 4_Medidas de tendencia central.pdf
630264452-TENDENCIA-CENTRAL-PPT-pptx.pptx
Comunidad_Emagister_66885_66885.pdf
Media Mediana y Moda.pdf
Comunidad_Emagister_66885_66885. Medidas de Tendencia Central.pdf
Publicidad

Más de Fernando Acosta (20)

PPTX
PPTX
PPTX
Fisica semana 9
PPTX
PPTX
Fisica semana 8
PPTX
PPTX
Fisica semana 7
PPTX
Fisica semana 6
PPTX
PPTX
Fisica semana 5
PPTX
PPTX
PPTX
Fisica semana 4
PPTX
Horario ciencias fisica
PDF
Horario fu 3
PPTX
Fisica semana 3
PPTX
Fu 3 2-2
PPTX
Fisica semana 2
PPTX
Fu 3 2-1
PPTX
Fisica semana 1
Fisica semana 9
Fisica semana 8
Fisica semana 7
Fisica semana 6
Fisica semana 5
Fisica semana 4
Horario ciencias fisica
Horario fu 3
Fisica semana 3
Fu 3 2-2
Fisica semana 2
Fu 3 2-1
Fisica semana 1

Último (20)

PPTX
Presentación de la Cetoacidosis diabetica.pptx
PDF
Integrando la Inteligencia Artificial Generativa (IAG) en el Aula
PDF
Unidad de Aprendizaje 5 de Matematica 1ro Secundaria Ccesa007.pdf
PDF
ACERTIJO Súper Círculo y la clave contra el Malvado Señor de las Formas. Por ...
PDF
Introducción a la historia de la filosofía
PDF
PFB-MANUAL-PRUEBA-FUNCIONES-BASICAS-pdf.pdf
PDF
LIBRO 2-SALUD Y AMBIENTE-4TO CEBA avanzado.pdf
PDF
2.0 Introduccion a processing, y como obtenerlo
PDF
La Formacion Universitaria en Nuevos Escenarios Ccesa007.pdf
DOCX
Informe_practica pre Final.docxddadssasdddddddddddddddddddddddddddddddddddddddd
PDF
Cronograma de clases de Práctica Profesional 2 2025 UDE.pdf
PDF
informe tipos de Informatica perfiles profesionales _pdf
PDF
La Inteligencia Emocional - Fabian Goleman TE4 Ccesa007.pdf
DOC
Manual de Convivencia 2025 actualizado a las normas vigentes
PPTX
LAS MIGRACIONES E INVASIONES Y EL INICIO EDAD MEDIA
PDF
Escuelas Desarmando una mirada subjetiva a la educación
PDF
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE_COM.pdf
PDF
Tomo 1 de biologia gratis ultra plusenmas
PDF
el - LIBRO-PACTO-EDUCATIVO-GLOBAL-OIEC.pdf
PDF
Los hombres son de Marte - Las mujeres de Venus Ccesa007.pdf
Presentación de la Cetoacidosis diabetica.pptx
Integrando la Inteligencia Artificial Generativa (IAG) en el Aula
Unidad de Aprendizaje 5 de Matematica 1ro Secundaria Ccesa007.pdf
ACERTIJO Súper Círculo y la clave contra el Malvado Señor de las Formas. Por ...
Introducción a la historia de la filosofía
PFB-MANUAL-PRUEBA-FUNCIONES-BASICAS-pdf.pdf
LIBRO 2-SALUD Y AMBIENTE-4TO CEBA avanzado.pdf
2.0 Introduccion a processing, y como obtenerlo
La Formacion Universitaria en Nuevos Escenarios Ccesa007.pdf
Informe_practica pre Final.docxddadssasdddddddddddddddddddddddddddddddddddddddd
Cronograma de clases de Práctica Profesional 2 2025 UDE.pdf
informe tipos de Informatica perfiles profesionales _pdf
La Inteligencia Emocional - Fabian Goleman TE4 Ccesa007.pdf
Manual de Convivencia 2025 actualizado a las normas vigentes
LAS MIGRACIONES E INVASIONES Y EL INICIO EDAD MEDIA
Escuelas Desarmando una mirada subjetiva a la educación
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE_COM.pdf
Tomo 1 de biologia gratis ultra plusenmas
el - LIBRO-PACTO-EDUCATIVO-GLOBAL-OIEC.pdf
Los hombres son de Marte - Las mujeres de Venus Ccesa007.pdf

Py e 9

  • 1. Probabilidad y Estadística Fecha: del 28 de enero al 01 de febrero de 2019 Bloque 3 Aplicas la estadística descriptiva
  • 2. S1-COMPRENDIENDO LAS MEDIDAS ESTADÍSTICAS DE TENDENCIA CENTRAL Medidas de centralización para datos agrupados. Cuando los datos se encuentran ya resumidos en distribuciones de frecuencias, en las cuales los valores de nuestra variable de estudio no se encuentran agrupados en intervalos, la manera en que se puede calcular las medidas de tendencia central se muestran en los siguientes ejemplos: Ejemplo 1. Se entrevistaron a 20 jóvenes con respecto al número de veces que acuden al cine cada mes. La siguiente tabla de distribución de frecuencias muestra, de forma resumida los datos obtenidos: La media. Para obtener el número medio de visitas al mes por estas veinte personas, se puede apreciar en la tabla que: una persona no asiste en un mes al cine, que cuatro manifiestan acudir una vez al mes, diez personas dijeron que acuden dos veces al mes, tres personas asisten tres veces al mes y finalmente, dos personas acuden cuatro veces al mes. La media se calcula sumando los datos que se han descomprimido de la tabla obteniendo: Veces que asiste al cine Frecuencia 0 1 1 4 2 10 3 3 4 2 Total 20
  • 3. La media se calcula sumando los datos que se han descomprimido de la tabla obteniendo: x = 0 + 1 +1 +1 + 1 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 2 + 3 + 3 + 3 + 4 + 4 = 41 = 2.05 20 20 Sin embargo, hacer esto resultaría bastante tedioso cuando el número de datos es grande. Puesto que, la multiplicación abrevia sumas repetidas de un mismo valor; una alternativa para calcular la media aritmética es sumar las multiplicaciones de cada frecuencia por su dato correspondiente, y posteriormente, dividir el resultado entre la sumatoria de frecuencias absolutas. De esta manera, la primera fórmula para el cálculo de la media, que es: se transforma en : 1 + 4 + 10 +3 + 2 20 n ΣXi i = 1 x = n k Σfi xi 1(0) + 4(1) + 10(2) + 3(3) + 2(4) 41 x = i = 1 = = = 2.05 k Σfi i = 1 En esta expresión la letra “k” representa al número de valores diferentes que toma la variable de estudio, en este es cinco.
  • 4. La moda Al realizar una inspección visual, se puede apreciar que el dato de mayor frecuencia es el 2, que se repite 10 veces, por lo tanto la moda es 2, la cual se representa como x = 2. Finalmente, la mediana se obtiene de la siguiente forma: Como el número de datos es 20, el lugar que ocupa la mediana es (20+1)/2 = 10.5, es decir la mediana se encuentra en medio de los valores que ocupan el décimo y onceavo lugares. Para deducir los datos, que se ubican en estas posiciones, sumamos las frecuencias absolutas hasta cubrir estos dos lugares; es decir: como el cero ocupa el primer lugar y los cuatro números uno, del segundo al quinto lugares; el número 2 abarca del sexto al décimo quinto lugares, por lo tanto las dos posiciones buscadas las cubre el número 2, de aquí que la mediana se calcule promediando dos números dos, por lo cual la mediana es 2. Generalmente en todas las tablas de distribución de frecuencias la primera columna contiene todos los posibles valores de la variable de estudio, y es dentro de esa gama de valores numéricos que se encuentran todas las medidas de tendencia central.
  • 5. Ejemplo 2. La siguiente distribución de frecuencias representa el número de balances generales realizados por un Contador Público a una empresa durante 25 días laborados. La media, la moda y la mediana serán valores comprendidos en el intervalo de [0, 4]. Ejemplo 3. El número de materias aprobadas de un grupo de alumnos de quinto cuatrimestre de preparatoria, se resumen en la siguiente distribución de frecuencias. La media, la moda y la mediana serán valores comprendidos en el intervalo de [ 5, 8 ]. Número de balances Frecuencia absoluta (Número de días) 0 2 1 7 2 9 3 5 4 2 Materias aprobadas Frecuencia absoluta (Número de alumnos) 5 3 6 4 7 6 8 10
  • 6. Resuelve los siguientes problemas. 1.Los siguientes datos resumidos en una distribución de frecuencias absolutas representan la información obtenida al aplicar una encuesta con respecto al número de deportes que practican estudiantes de preparatoria: Obtener los valores de la media, la moda y la mediana. ¿Cuál de las tres medidas de centralización representa mejor a estos datos? ¿Por qué? Actividad 7 Variable de estudio Número de deportes que practica Frecuencia Número de alumnos 0 3 1 14 2 7 3 5 4 3 Total
  • 7. 2.El siguiente histograma corresponde a esta distribución de frecuencias, localiza en el eje horizontal los valores de la media, la moda y la mediana. Describe el gráfico en términos del número de hijos: ¿Cuál de las tres medidas de centralización consideras que representarían mejor a estos datos? ¿Por qué? Si visitas a una familia de ese fraccionamiento que fue elegida al azar, ¿Qué cantidad de hijos esperas que tenga? ¿Por qué? Número de hijos por familia 12 10 8 6 4 2 0 0 1 2 3 4 5 6 Número de hijos
  • 8. 3.La siguiente tabla muestra los resultados de una encuesta aplicada a una muestra aleatoria de alumnos de un plantel de preparatoria. a)¿Tipo de variable de estudio? ¿Cuántos alumnos fueron entrevistados? b)Determina la media, la moda y la mediana del número de materias aprobadas. c)¿Cuál consideras es la medida de centralización más adecuada para representar estos datos? ¿Por qué? Variable de estudio: Número de materias reprobadas. Frecuencia: Número de alumnos 0 12 1 10 2 7 3 5 4 2 5 1 Total
  • 9. El caso de los datos agrupados en intervalos. Otra forma en que pueden estar resumidos los datos es mediante distribuciones de frecuencias, en las cuales los valores de variable se encuentran agrupados en intervalos de clase. En estos casos las tres medidas de tendencia central requieren de expresiones algebraicas para su cálculo. La media aritmética. De cada intervalo se calcula su marca de clase, la cual se convertirá en el valor representativo de su intervalo correspondiente; es decir, lo reemplazará. La media se calculará aplicando la siguiente fórmula: Donde: f representa la frecuencia de cada intervalo. mc la marca de clase de cada uno de los intervalos de clase. k representa el número de intervalos. Σk f mc i = 1 i i x = k i = 1 fi Σ
  • 10. La Moda. En el caso de variables continuas es más correcto hablar de intervalos modales, como aquel o aquellos que tienen mayor frecuencia con respecto al intervalo anterior y al posterior. Localizado el intervalo modal, como el mostrado en la figura de arriba se procede a trazar los segmentos auxiliares AA’ y BB’; el punto donde se cruzan y se proyecta al eje horizontal es donde está la moda. B A H H dp da B A Moda C Frecuencias absolutas Intervalos Ei Es Intervalo modal
  • 11. Una fórmula práctica para el cálculo de la moda se obtiene a partir de semejanza de polígonos, como se muestra a continuación: A partir del trazo auxiliar se forman dos triángulos semejantes ABC y A´B´C, cuyas alturas y bases son proporcionales entre sí, además, apoyándose del Teorema de Thales, se obtiene: HC = H´C = HC + H´C AB A´B´ AB + A´B´ Sustituyendo HC por la moda menos Ei, y AB por “da”, así como HC+H´C por A (amplitud del intervalo), además, como A´B´ se cambia por dp, entonces, AB+A´B´se reemplaza por da+dp; todo lo anterior se visualiza de la siguiente forma: Moda – Ei = A da da + dp
  • 12. Al despejar la moda se deduce: Moda =E + d A i da + dp x^ =E + da A i da + dp Donde: E = Extremo inferior o límite real inferior del intervalo modal (intervalo de mayor frecuencia). da = Diferencia de la frecuencia del intervalo modal y la frecuencia del intervalo anterior. d = Diferencia de la frecuencia del intervalo modal y la frecuencia del intervalo posterior. A = La amplitud del intervalo modal.
  • 13. La Mediana. En este caso se deduce una fórmula por medio de interpolación lineal como se muestra enseguida. Sea [Eik, Esk) el intervalo donde se ha encontrado que por debajo él están el 50% de las observaciones. Entonces se obtiene la mediana a partir de las frecuencias absolutas acumuladas, mediante interpolación lineal (teorema de Thales) como sigue: Media Por semejanza de los triángulos ACC´ y ABB´, podemos establecer las siguientes proporciones: CC´ = AC por las propiedades de la igualdad de proporciones, se deduce : BB’ AB Frecuencias acumuladas ni n/2 B´ ni -1 A C´ Frecuencia del intervalo mediana (f mediana) C B
  • 14. CC´ = BB´ = 2 i – 1 ........(1) AC AB mediana - Ei Como CC´ = f mediana , como recordarás, A representa a la amplitud de cada intervalo y que además se AC A obtiene de la diferencia: Es – Ei. Como n – n i – 1 n - 2 = 2 f anteriores, reemplazando ambas igualdades en (1) se tiene : mediana – Ei mediana – Ei Σ De lo cual se desprende que: mediana = Ei + n - f anteriores 2 (A) f mediana x = Ei + n - f anteriores 2 (A)
  • 15. Ei: Extremo inferior o límite real inferior del intervalo mediana. Σf anteriores: Sumatoria de frecuencias anteriores al intervalo mediana. f mediana: Frecuencia del intervalo mediana. A: Amplitud del intervalo mediana. A continuación se muestran algunos ejemplos para el cálculo de la media, la moda y la mediana para datos agrupados en intervalos. Ejemplo 1. La siguiente distribución de frecuencias muestra el ingreso mensual de 22 trabajadores de una empresa comercial, determina la media salarial. Ingresos mensuales Frecuencia (f ) [3200, 4000) 9 [4000, 4800) 5 [4800, 5600) 4 [5600, 6400) 3 [6400, 7200] 1 Total 22
  • 16. Para el cálculo de la media se sugiere agregar las columnas de las marcas de clase y la correspondiente al producto de las frecuencias por las marcas de clase asociadas, esto se muestra enseguida: La media se obtiene dividiendo la sumatoria de los productos de las frecuencias por las marcas de clase que les corresponden entre la suma de frecuencias absolutas: Ingresos mensuales Frecuencia (f) Marca de clase (mc) f (mc) [3200, 4000) 9 3600 32,400 [4000, 4800) 5 4400 22,000 [4800, 5600) 4 5200 20,800 [5600, 6400) 3 6000 18,000 [6400, 7200] 1 6800 6,800 Total 22 100,000
  • 17. Ejemplo 2. Se entrevistaron a 30 administradores de empresas con respecto al tiempo que requieren para efectuar una auditoría; la siguiente distribución de frecuencias muestra de forma resumida los datos registrados. Determina la moda del tiempo invertido. Pasos: Primero: se inicia con una inspección visual de la distribución de frecuencias, se puede observar que es unimodal, por presentar una moda y además, es sesgada a la derecha, debido a que la mayoría de los datos se sitúan a la derecha del intervalo modal. Segundo: se ubica el intervalo de clase modal, siendo éste el de mayor frecuencia [13, 17 ), de él se elige su extremo inferior, en este caso 13. Tiempo invertido (horas) Frecuencia (f) [9, 13) 3 [13, 17) 12 [17, 21) 7 [21, 25) 4 [25, 29) 3 [29, 33] 1 Total 30
  • 18. Tercero: se calculan las diferencias entre la frecuencia del intervalo modal y las de los intervalos anterior y posterior, respectivamente, obteniéndose así: da = 12 – 3 = 9 dp = 12 – 7 = 5 Cuarto: se determina la amplitud de cada intervalo, ésta se obtiene de la resta de los extremos inferiores de dos intervalos consecutivos. A = 17 – 13 = 4 Quinto: se sustituyen los valores requeridos en la fórmula y se realizan las operaciones necesarias para obtener un valor aproximado de la moda.
  • 19. Ejemplo 3. Los datos siguientes muestran de forma resumida en una distribución de frecuencias absolutas, el tiempo en horas que invierten los 21 empleados del taller de ensamblado de una fábrica de motores para tractocamiones. Primero: se inicia con una inspección visual de la distribución de frecuencias, se puede observar que es bimodal, por lo tanto presenta dos modas. Segundo: Ubicamos los intervalos de clase modal siendo éstos los de mayor frecuencia [0, 0.9 ) y [1.8, 2.7 ) para cada uno de ellos determinaremos los valores necesarios para el uso de la fórmula. Tiempo de ensamblado (horas) Frecuencia [0, 0.9 ) 7 [0.9, 1.8 ) 2 [1.8, 2.7 ) 8 [2.7, 3.6 ) 3 [3.6, 4.5 ] 1 Total 21
  • 20. Tiempo de ensamblado (horas) Frecuencia [0, 0.9 ) 7 [0.9, 1.8 ) 2 [1.8, 2.7 ) 8 [2.7, 3.6 ) 3 [3.6, 4.5 ] 1 Total 21 Intervalo De clase modale Tercero: se calculan las diferencias entre la frecuencia del intervalo modal y las de los intervalos anterior y posterior, respectivamente: Para el intervalo modal [0 , 0.9) da = 7 – 0 = 7 dp = 7 – 2 = 5 Para el intervalo modal [1.8, 2.7) da = 8 - 2 = 6 dp = 8 – 3 = 5
  • 21. Cuarto: se determina la amplitud de cada intervalo restando los extremos inferiores consecutivos de intervalo de clase, esto se puede verificar con los extremos inferiores en dos intervalos consecutivos cualquiera, por lo tanto, es válida para los dos intervalos modales. A = 0.9 – 0 = 0.9 Quinto: se sustituyen los valores requeridos en la fórmula y se realizan las operaciones necesarias para obtener un valor aproximado de la moda. Entonces la moda del tiempo de ensamblado son: 0.5247 horas y 2.29 horas
  • 22. Ejemplo 4. La distribución de frecuencias absolutas que se muestra a continuación resume los pesos de los 20 empleados del departamento de crédito y cobranza de una empresa comercial; determina el valor mediana de los pesos. Primero: se determina el intervalo mediana; como la frecuencia total es 20, para ubicar el intervalo mediana se realizan los siguientes cálculos: (20+1)/2=10.5, por lo tanto, se buscará la mediana en el dato que ocupe los lugares décimo y décimo primero. Si se observa en las frecuencias absolutas acumuladas, se encuentra que la mediana está en el tercer intervalo, ya que hasta el segundo va una frecuencia acumulada de 4, por lo tanto, el intervalo [61.4, 65.1 ) es el intervalo mediana. Peso Frecuencia Frecuencia acumulada [54.0, 57.7 ) 1 1 [57.7, 61.4 ) 3 4 [61.4, 65.1 ) 8 12 [65.1, 68.8 ) 5 17 [68.8, 72.5 ] 3 20 Total 20
  • 23. Ahora se aplica la fórmula sustituyendo los valores necesarios:
  • 24. Resuelve los siguientes problemas. 1. Un estudiante en la clase de Estadística comenta que los cálculos de las medidas de tendencia central, son siempre aproximados, esto cuando se calculan en distribuciones de frecuencia de datos agrupados por intervalos. ¿Compartes la opinión del joven? ¿Por qué? 2. Los siguientes datos resumidos en una distribución de frecuencias, representan el tiempo (horas) de estudios semanales de estudiantes universitarios. Determina los valores aproximados de la media, la moda y la mediana. Actividad 8 Intervalos Frecuencia absoluta Marca de Clase f (mc) Frecuencia acumulada [0.0, 1.4 ) 5 [1.4, 2.8 ) 7 [2.8, 4.2 ) 8 [4.2, 5.6 ) 4 [5.6, 7.0 ) 2 [7.0, 8.4 ] 1 Total
  • 25. 3. Los siguientes datos resumidos en intervalos representan los pesos de estudiantes de bachillerato. Se te proporcionan columnas adicionales para los cálculos que creas necesarios. a) ¿Cuál es la variable de estudio? b) ¿Cuántos alumnos se participan en el estudio? c) Calcular el valor de la media, el de la moda y el de la mediana. d) ¿Cuál medida de centralización consideras que mejor representa estos datos? ¿Por qué? e) Construye el histograma que corresponde a esta distribución de frecuencias y localiza en el eje horizontal los valores de las tres medidas de tendencia central. Pesos ( en kg) Frecuencia [ 48, 56 ) 1 [ 56, 64 ) 5 [ 64, 72 ) 9 [ 72, 80 ) 15 [ 80, 88 ) 7 [ 88, 96 ] 13 Total
  • 26. Bibliografía. Estadistica 3era Edicion McGrawHill Autor: Lincoln L. Chao Estadistica 4ª. Edicion Schaum Autor : Murray R. Spiegel y Larry J. Stephens