SlideShare una empresa de Scribd logo
UCV/FACES/EAC Estadísticas I  Distribuciones de Frecuencia y Gráficas Prof. Leonardo Simmons
DISTIBUCIONES DE FRECUENCIA Uno de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de los resultados, es decir, recoger la información de la muestra o población resumida en una tabla, que denominaremos  distribución de frecuencias.  en la que cada valor de la variable se le asocian sus frecuencias absolutas, relativas y acumuladas. Las distribuciones de frecuencias varían en sus columnas dependiendo del nivel de agrupación de las observaciones de la variable estudiada y si ésta corresponde a una  variable cualitativa,  a una  variable discreta  o a una  variable continua.
DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) Caso: Variable Cualitativa (Atributo) La estructura de una DFDNA para una variable cualitativa es como sigue: Donde: X i  = es el i-ésimo valor de la variable de estudio f i  = es la frecuencia del i-ésimo valor de la variable H i  y %h i  = son la respectivas frecuencias relativas 100 1.00 n = N %h k h k f k x k : : : : %h 2 h 2 f 2 x 2 %h 1 h 1 f 1 x 1 %h h f X
DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) P.ej:  Se preguntó a un grupo de alumnos de Ingeniería Industrial su materia preferida y estas fueron sus respuestas:  P.ej:  Organicemos estas repuestas en una DFDNA:
DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) De la tabla se pueden extraer conclusiones como: La materia “más preferida” por los estudientes en la muestra es matemáticas con 24% y en segundo lugar Ing. Industrial con 22% La materia “menos preferida” es Ing. Económica con 10% La proporción de alumnos que prefieren Prob. Y estadísticas es 0,20 Se puede representar gráficamente la información contenida en la DFDNA: Fuente: Encuesta Fuente: Encuesta
DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) Caso: Variable Cuantitativa (Discreta) La estructura de una DFDNA para una variable cuantitativa (Discreta) es como sigue: %H k : %H 2 %H 1 %H H k : H 2 H 1 H F k : F 2 F 1 F 100 1.00 n = N %h k h k f k x k : : : : %h 2 h 2 f 2 x 2 %h 1 h 1 f 1 x 1 %h h f X
DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) P.ej:  Una encuesta entre un grupo de madres-solteras, para analizar los problemas económicos que enfrentan, en determinada comunidad; arrojó los siguientes resultados acerca del número de niños (menores de 12 años) en el hogar:
DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) Gráficas asociadas….. Histogramas 1 2 3 4 5 % Hogares 5 15 20 25 30 10 35 No. de Niños Distribución del Porcentaje de Niños por Hogares Fuente: Encuesta de Hogares Fuente: Encuesta de Hogares
DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) Gráficas asociadas….. Ojiva Ascendente   Circular Fuente: Encuesta de Hogares 1 2 3 4 5 % Hogares 20 60 80 100 30 40 35 No. de Niños Distribución Acumulada del Porcentaje de  Niños por Hogares Fuente: Encuesta de Hogares
DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) La distribución de frecuencia de datos agrupados (DFDA) por lo general se usa para organizar los valores poblacionales o muestrales de una variable cuantitativa continua. Las observaciones de la variable se agrupan en clases o intervalos de tal manera que las frecuencias hacen referencia a la clase o intervalo de valores de la variable y no a un valor en particular como en el caso de la DFDNA. A continuación se detalla el procedimiento para construir una DFDA: Ordenar los datos Determinar el Rango (R) de la variable: R = X max  - M min  Determinar el número de clases o intervalos (K) de la distribución: Empíricamente Método de 2 K : K es el exponente de 2 tal que 2 K ≥ n Formula de Sturges:  K = parte entera (1+ 3,32 Log (n))
DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Calcular el rango de las clases o intervalos (C) de la distribución: C = R/K Asiganar los limites de las clases o intervalos con la siguiente regla: l 1 = X min  , donde l 1  = Limite inferior de la clase 1 L 1 = l 1  + C, donde L 1  = Limite superior de la clase 1 l 2 = L 1 , donde l 2  = Limite inferior de la clase 2 L 2 = l 2  + C …..y así sucesivamente hasta llegar a que L k  = X max Clasificar cada observación de la variable en una y solo una de las clases, usando la siguiente regla: Las primeras K-1 clases son [) – cerradas en el limite inferior y abiertas en el limite superior La última clase (K) es [] – cerrada en ambos limites Determinar las frecuencias relativas y acumuladas; además de la marca de clases:  X i  =(L i  + l i )/2
DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DDNA) P.ej: La tienda CABRERA’S Y ASOCIADOS esta interesada en efectuar un análisis de sus cuentas por cobrar. Uno de los factores que más interesaba a la administración de la tienda era el de los saldos de las cuentas de crédito. Se escogió al azar una muestra aleatoria de 30 cuentas y se anotó el saldo de cada cuenta (en Miles de Bs.F) como sigue: Determinar el Rango (R) de la variable: R = X ma - M min = 93,91–7,42= 86,49 Determinar el número de clases o intervalos (K) de la distribución: Método de 2 K : K= 5 ya que 2 5  = 32  ≥ 30 Formula de Sturges:  K = parte entera (1+ 3,32 Log (30)) =parte entera (5,9069=5
DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Calcular el rango de las clases o intervalos (C) de la distribución: C = R/K = 86,49/5 = 17,298 * Nota (*): como la variable se midío con 2 decimales redondeamos el valor calculado de C con la misma cantidad de decimales, es decir: C = 17,30 Asiganar los limites de las clases o intervalos con la siguiente regla: l 1 = X min  = 7,42 ;  L 1 = l 1  + C = 7,42 + 17,30 = 24,72;  ..y así sucesivamente  Clasificar cada observación de la variable en una y solo una de las clases, usando la siguiente regla: Las primeras K-1 clases son [) – cerradas en el limite inferior y abiertas en el limite superior La última clase (K) es [] – cerrada en ambos limites Determinar las frecuencias relativas y acumuladas; además de la marca de clases:  X i  =(L i  + l i )/2
DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Resultando la siguiente DFDA:
DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Grafica asociada a la DFDA: Histograma 7,42  24,72  42,02  59,39  76,62  93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 5 10 15 20 25 30 35 % Cuentas por Cobrar Distribución de los Saldo de la Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados
DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Grafica asociada a la DFDA: Polígono de Frecuencia 7,42  24,72  42,02  59,39  76,62  93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 5 10 15 20 25 30 35 % Cuentas por Cobrar Distribución de los Saldo de la Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados 16,07 33,37 50,57 67,97 85,27
DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Grafica asociada a la DFDA: Histograma  +  Polígono de Frecuencia (Integrados) 7,42  24,72  42,02  59,39  76,62  93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 5 10 15 20 25 30 35 % Cuentas por Cobrar Distribución de los Saldo de la Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados
DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Grafica asociada a la DFDA:  Ojiva Ascendente 7,42  24,72  42,02  59,39  76,62  93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 20 40 60 80 100 % Cuentas por Cobrar Distribución Acumulada de los Saldo de las Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados
DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DDNA) Ejemplo de interpretación de los resultados contenidos en la tabla: f 1   :  Diez (10) de las cuentas investigadas tienen saldo entre 7,42 y 24,72 miles BsF, lo cual representa el 10% – h 1  – de la muestra. H 3   : 0,70 es la proporción de cuentas por pagar de la muestra con un saldo menor que 59,32 BsF.  %H 3  : El 70% de las cuentas investigadas presentan saldo de a lo sumo 59,32 BsF. X 3  : La cantidad 50,67 BsF es el saldo que representa a todas las cuentas con saldo entre 42,02 y 59,32 BsF.
DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DDNA) Con ayuda de las gráficas podemos responder a preguntas como: ¿Que porcentaje aproximadamente de cuentas tienen saldos entre 30 y 65 BsF? Como se aprecia 30 y 65 BsF no son limites de clases por eso no podemos responder directamente con la tabla esta pregunta y nos tenemos que valer de la gráfica de frecuencias acumuladas (ojiva) para ello:  -Aprox. el 40% de las cuentas tienen saldo  ≤ a 30 Mil BsF -Aprox. el 73% de las cuentas tienen saldo ≤ a 65 Mil BsF Luego: 73%-40% = 33% entonces: aprox. El 33% de las cuentas tienen saldo entre 30 y 65 miles BsF 30 65 40 73 7,42  24,72  42,02  59,39  76,62  93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 20 40 60 80 100 % Cuentas por Cobrar Distribución Acumulada de los Saldo de las Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados
ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Las técnicas del análisis exploratorio de datos consiste en operaciones aritméticas sencillas y gráficas fáciles de trazar, que pueden emplearse para resumir con rapidez los datos de una muestra. La técnica conocida como  diagrama tallo y hoja  se usa para mostrar en forma simultanea el orden del rango y la forma de un conjunto de datos. Persigue los siguientes objetivos: Representación visual de la información  Descubrir un patrón de comportamiento de los datos, es decir, qué distribución pueden seguir los datos Identificar si hay valores extremos o datos anormales en la muestra  Es aplicables a variables cuantitativas de valores formados por al menos dos cifras. Principio : Cada número se divide en dos partes, una que llamaremos "Tallo" y la otra denominada " ramas u Hojas".
ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Ejemplo: Considere los siguientes números: 65, 57, 79, 69, 53, 63, 71. Los tallos serán las decenas, y las hojas serán las unidades, de la siguiente manera, luego: Procedimiento: 1. Se define cómo se van a dividir los números en tallos y hojas, es decir, se identifican cuales van a ser los tallos, y cuales va a ser las hojas.  2. En una columna se listan los tallos en orden ascendente. 3. Se recorren los datos y se colocan, en la columna siguiente, las hojas de acuerdo al tallo que tengan y se ordenan en forma creciente Resto de los números (cifras secundarias) ubicadas a la derecha Hoja Formado por uno o más dígitos principales (cifras mas significativas), ubicados a la izquierda del número. Tallo 19 7 359 6 37 5 Ramas Tallo
ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Ejemplo : Considere la siguiente información sobre duración de baterías de carro, en años. Se pide: Construir el diagrama de tallos y hojas usando como tallos la parte entera.  Construir el diagrama de tallos y hojas partiendo cada tallo en dos. 3.5 4.2 3.0  3.9  2.6  3.2 3.8  4.7  3.4 1.9  4.1  3.2  4.4  3.7  3.1 3.3  3.1 3.9  3.3  2.9  3.6  3.4  4.3  2.5  3.7 4.7  3.1 3.8  3.3  3.1  1.6  3.4  2.6 3.0  3.7 3.2  4.5 3.5  4.1 2.2  Duración de baterías (en años)
ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Usando como tallos la parte entera  Tallos : Dígitos principales (Parte entera);  Hojas : Dígitos secundarios (Parte decimal)  Partiendo cada tallo en dos En este caso el tallo 1 únicamente tendría la parte superior, y el tallo 4 tendría tanto la parte inferior como la superior 40 Total 9  1 1 2 3 4 5 6 7 7 4  25 0 0 1 1 1 1 2 2 2 3 3 3 4 4 4 5 5 6 7 7 7 8 8 9 9 3  5 2 5 6 6  9 2  1 9  1  Frecuencia Hojas Tallo
ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja 40 Total 4 5 6 7 7 4 S 5 1 1 2 3 4 4 I 10 5 5 6 7 7 7 8 8 9 9  3 S 15 0 0 1 1 1 1 2 2 2 3 3 3 4 4 4  3 I 4 5 6 6 9 2 S 1 2 2 I 1 9 1 S Frecuencia Ramas Tallo
ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Observaciones: Se recomienda que el número de tallos esté entre 5 y 20.  A veces, de acuerdo con la información que se tenga, pueden resultar muy pocos tallos, con lo cual las ramas quedan muy concentradas, y realmente no se obtiene mucha información. En estos casos, puede ser conveniente partir los tallos en dos: Un tallo inferior (que tenga, por ejemplo, las hojas menores que 5), y un tallo superior (que tenga las hojas mayores o iguales a cinco).  Así, por ejemplo, el tallo 6 puede dividirse en 6I, para los valores entre 60 y 64, y el tallo 6S, para los valores entre 65 y 69.  •  Cuando se parten los tallos en dos, todos los tallos deben partirse en dos. Solamente el primero y el último tallo podrían dejarse sin partir, en caso de que en el primer tallo sólo haya información para el tallo superior, y cuando para el último tallo sólo haya información para el tallo inferior.
TAREA No. 2 Resolver del libro  Estadística para Administración y Economía – Anderson – 8va. Edición , capitulo 2, los ejercicios del 1 al 10 (pag. 28 al 30) Resolver del libro  Estadística para Administración y Economía – Anderson – 8va. Edición , capitulo 2, los ejercicios del 11 al 21 (pag. 36 al 39) Resolver del libro  Estadística para Administración y Economía – Anderson – 8va. Edición , capitulo 2, los ejercicios del 22 al 28 (pag. 42 al 43) Si usted trabaja identifique al una variable cuantitativa importante que corresponda con algún proceso administrativo en el que usted interviene, p.ej: ventas, inventario, personal, etc. Recolecte una muestra de al menos 50 observaciones de dicha variable y construya una DFDA y sus respectivas gráficas. Saque algunas conclusiones

Más contenido relacionado

PPT
CLASIFICACIÓN Y NOMENCLATURA DE SALES. Lic Javier Cucaita
PDF
Ejercicios quimica-organica-corzo1-150701013455-lva1-app6892
DOC
Propiedades de los éteres
PPT
Haluros de alquilo
PPTX
Nomenclatura de cetona sd0
DOCX
Prueba de entrada de química orgánica
PDF
Carboniloqoa
CLASIFICACIÓN Y NOMENCLATURA DE SALES. Lic Javier Cucaita
Ejercicios quimica-organica-corzo1-150701013455-lva1-app6892
Propiedades de los éteres
Haluros de alquilo
Nomenclatura de cetona sd0
Prueba de entrada de química orgánica
Carboniloqoa

La actualidad más candente (20)

PPTX
Alcoholes y fenoles
DOC
2 ejercicios resueltos-de__cidos_carbox_licos (1)
DOC
Ir ejercicios(2)
PPTX
Nomenclatura de aminas
PPTX
éTeres isómeros del pentanol
DOCX
Quimica de los alcoholes
PPT
QuíMica OrgáNica 2°Parte
PPTX
Ésteres por Johanna Caizatoa
DOCX
HIDROCARBUROS AROMATICOS
PPT
Alquenos
PPT
Clases de reacciones
PPTX
éTeres y epóxidos
DOCX
G1-P3-Informe Ácidos carboxílicos.docx
DOCX
Propiedades fisicas y quimicas de los alcanos, alquenos y alquinos.
DOCX
Ejercicios espectrofotometria
PDF
Orbitales 2010
PPTX
Compuestos polifuncionales
PPTX
Aromaticos
PPT
Balanceo óxido reducción
PPTX
AMINAS .pptx
Alcoholes y fenoles
2 ejercicios resueltos-de__cidos_carbox_licos (1)
Ir ejercicios(2)
Nomenclatura de aminas
éTeres isómeros del pentanol
Quimica de los alcoholes
QuíMica OrgáNica 2°Parte
Ésteres por Johanna Caizatoa
HIDROCARBUROS AROMATICOS
Alquenos
Clases de reacciones
éTeres y epóxidos
G1-P3-Informe Ácidos carboxílicos.docx
Propiedades fisicas y quimicas de los alcanos, alquenos y alquinos.
Ejercicios espectrofotometria
Orbitales 2010
Compuestos polifuncionales
Aromaticos
Balanceo óxido reducción
AMINAS .pptx
Publicidad

Destacado (20)

PPT
Estadistica I 04
PPT
Estadistica I 03
PPT
Programa Estadistica I
PDF
Estadistica primera parte
PPTX
Estadística Básica
PPT
tema:medidas de posición
PDF
9 rn9 variantepasocampanazárate
PPTX
Manual para aprender word
PPTX
Manual para aprender Word
PPTX
Manual para aprender word.
PDF
9 instrumentos sampieri
DOCX
Distribuciones de frecuencias
PPT
Aprendiendo A Aprender Word 2003
PPTX
Capitulo 5
DOC
(Ejercicio Resuelto)
PPTX
Recolección De los Datos Cuantitativos
PPTX
Mediana
PPTX
Aprender word
PPTX
Plantilla 04 1_
DOCX
Practica word 2016
Estadistica I 04
Estadistica I 03
Programa Estadistica I
Estadistica primera parte
Estadística Básica
tema:medidas de posición
9 rn9 variantepasocampanazárate
Manual para aprender word
Manual para aprender Word
Manual para aprender word.
9 instrumentos sampieri
Distribuciones de frecuencias
Aprendiendo A Aprender Word 2003
Capitulo 5
(Ejercicio Resuelto)
Recolección De los Datos Cuantitativos
Mediana
Aprender word
Plantilla 04 1_
Practica word 2016
Publicidad

Similar a Estadistica I 02 (20)

PPTX
Estadística Básica
PPTX
Estadistica descriptiva
PPTX
473045652-Distribucion-de-Frecuencia-Para-Variables-Cualitativas.pptx
PDF
MEDIDAS DE DISPERSIÓN
PDF
02 calculo
DOC
Separata de medidas variabilidad o dispersion
DOC
Separata de medidas variabilidad o dispersion
DOC
Guia de estadistica
PDF
Estadistica
PPTX
01 presentacion de datos u ap
PPTX
Medidas de dispersión
PPTX
Medidas de dispersión
PPSX
Cap 3c2 medidas numéricas si agrupadas
PPTX
PDF
CLASE 5 MEDIDAS DE DISPERSION-2024-II.pdf
DOCX
Estadistica 1
PPTX
CAPITULO 2 ORGANIZACION Y CLASIFICACION DE DATOS1.pptx
PPT
Variables
PDF
Tecnica de agrupacion de datos Ejercicio Resuelto Sueldos semanales d.pdf
Estadística Básica
Estadistica descriptiva
473045652-Distribucion-de-Frecuencia-Para-Variables-Cualitativas.pptx
MEDIDAS DE DISPERSIÓN
02 calculo
Separata de medidas variabilidad o dispersion
Separata de medidas variabilidad o dispersion
Guia de estadistica
Estadistica
01 presentacion de datos u ap
Medidas de dispersión
Medidas de dispersión
Cap 3c2 medidas numéricas si agrupadas
CLASE 5 MEDIDAS DE DISPERSION-2024-II.pdf
Estadistica 1
CAPITULO 2 ORGANIZACION Y CLASIFICACION DE DATOS1.pptx
Variables
Tecnica de agrupacion de datos Ejercicio Resuelto Sueldos semanales d.pdf

Último (20)

PDF
Aqui No Hay Reglas Hastings-Meyer Ccesa007.pdf
PDF
La Evaluacion Formativa en Nuevos Escenarios de Aprendizaje UGEL03 Ccesa007.pdf
PDF
Como Potenciar las Emociones Positivas y Afrontar las Negativas Ccesa007.pdf
PDF
PFB-MANUAL-PRUEBA-FUNCIONES-BASICAS-pdf.pdf
PDF
Escuelas Desarmando una mirada subjetiva a la educación
PDF
el - LIBRO-PACTO-EDUCATIVO-GLOBAL-OIEC.pdf
PDF
Cronograma de clases de Práctica Profesional 2 2025 UDE.pdf
PDF
La Formacion Universitaria en Nuevos Escenarios Ccesa007.pdf
PDF
Aumente su Autoestima - Lair Ribeiro Ccesa007.pdf
PDF
2.0 Introduccion a processing, y como obtenerlo
PDF
Atencion prenatal. Ginecologia y obsetricia
PPTX
Presentación de la Cetoacidosis diabetica.pptx
PDF
Ernst Cassirer - Antropologia Filosofica.pdf
PDF
IDH_Guatemala_2.pdfnjjjkeioooe ,l dkdldp ekooe
DOCX
PLAN DE CASTELLANO 2021 actualizado a la normativa
PDF
Iniciación Al Aprendizaje Basado En Proyectos ABP Ccesa007.pdf
PDF
Tomo 1 de biologia gratis ultra plusenmas
PDF
Unidad de Aprendizaje 5 de Educacion para el Trabajo EPT Ccesa007.pdf
PDF
Mi Primer Millon - Poissant - Godefroy Ccesa007.pdf
PDF
Gasista de unidades unifuncionales - pagina 23 en adelante.pdf
Aqui No Hay Reglas Hastings-Meyer Ccesa007.pdf
La Evaluacion Formativa en Nuevos Escenarios de Aprendizaje UGEL03 Ccesa007.pdf
Como Potenciar las Emociones Positivas y Afrontar las Negativas Ccesa007.pdf
PFB-MANUAL-PRUEBA-FUNCIONES-BASICAS-pdf.pdf
Escuelas Desarmando una mirada subjetiva a la educación
el - LIBRO-PACTO-EDUCATIVO-GLOBAL-OIEC.pdf
Cronograma de clases de Práctica Profesional 2 2025 UDE.pdf
La Formacion Universitaria en Nuevos Escenarios Ccesa007.pdf
Aumente su Autoestima - Lair Ribeiro Ccesa007.pdf
2.0 Introduccion a processing, y como obtenerlo
Atencion prenatal. Ginecologia y obsetricia
Presentación de la Cetoacidosis diabetica.pptx
Ernst Cassirer - Antropologia Filosofica.pdf
IDH_Guatemala_2.pdfnjjjkeioooe ,l dkdldp ekooe
PLAN DE CASTELLANO 2021 actualizado a la normativa
Iniciación Al Aprendizaje Basado En Proyectos ABP Ccesa007.pdf
Tomo 1 de biologia gratis ultra plusenmas
Unidad de Aprendizaje 5 de Educacion para el Trabajo EPT Ccesa007.pdf
Mi Primer Millon - Poissant - Godefroy Ccesa007.pdf
Gasista de unidades unifuncionales - pagina 23 en adelante.pdf

Estadistica I 02

  • 1. UCV/FACES/EAC Estadísticas I Distribuciones de Frecuencia y Gráficas Prof. Leonardo Simmons
  • 2. DISTIBUCIONES DE FRECUENCIA Uno de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de los resultados, es decir, recoger la información de la muestra o población resumida en una tabla, que denominaremos distribución de frecuencias. en la que cada valor de la variable se le asocian sus frecuencias absolutas, relativas y acumuladas. Las distribuciones de frecuencias varían en sus columnas dependiendo del nivel de agrupación de las observaciones de la variable estudiada y si ésta corresponde a una variable cualitativa, a una variable discreta o a una variable continua.
  • 3. DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) Caso: Variable Cualitativa (Atributo) La estructura de una DFDNA para una variable cualitativa es como sigue: Donde: X i = es el i-ésimo valor de la variable de estudio f i = es la frecuencia del i-ésimo valor de la variable H i y %h i = son la respectivas frecuencias relativas 100 1.00 n = N %h k h k f k x k : : : : %h 2 h 2 f 2 x 2 %h 1 h 1 f 1 x 1 %h h f X
  • 4. DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) P.ej: Se preguntó a un grupo de alumnos de Ingeniería Industrial su materia preferida y estas fueron sus respuestas: P.ej: Organicemos estas repuestas en una DFDNA:
  • 5. DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) De la tabla se pueden extraer conclusiones como: La materia “más preferida” por los estudientes en la muestra es matemáticas con 24% y en segundo lugar Ing. Industrial con 22% La materia “menos preferida” es Ing. Económica con 10% La proporción de alumnos que prefieren Prob. Y estadísticas es 0,20 Se puede representar gráficamente la información contenida en la DFDNA: Fuente: Encuesta Fuente: Encuesta
  • 6. DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) Caso: Variable Cuantitativa (Discreta) La estructura de una DFDNA para una variable cuantitativa (Discreta) es como sigue: %H k : %H 2 %H 1 %H H k : H 2 H 1 H F k : F 2 F 1 F 100 1.00 n = N %h k h k f k x k : : : : %h 2 h 2 f 2 x 2 %h 1 h 1 f 1 x 1 %h h f X
  • 7. DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) P.ej: Una encuesta entre un grupo de madres-solteras, para analizar los problemas económicos que enfrentan, en determinada comunidad; arrojó los siguientes resultados acerca del número de niños (menores de 12 años) en el hogar:
  • 8. DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) Gráficas asociadas….. Histogramas 1 2 3 4 5 % Hogares 5 15 20 25 30 10 35 No. de Niños Distribución del Porcentaje de Niños por Hogares Fuente: Encuesta de Hogares Fuente: Encuesta de Hogares
  • 9. DISTIBUCION DE FRECUENCIA DATOS NO AGRUPADOS (DFDNA) Gráficas asociadas….. Ojiva Ascendente Circular Fuente: Encuesta de Hogares 1 2 3 4 5 % Hogares 20 60 80 100 30 40 35 No. de Niños Distribución Acumulada del Porcentaje de Niños por Hogares Fuente: Encuesta de Hogares
  • 10. DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) La distribución de frecuencia de datos agrupados (DFDA) por lo general se usa para organizar los valores poblacionales o muestrales de una variable cuantitativa continua. Las observaciones de la variable se agrupan en clases o intervalos de tal manera que las frecuencias hacen referencia a la clase o intervalo de valores de la variable y no a un valor en particular como en el caso de la DFDNA. A continuación se detalla el procedimiento para construir una DFDA: Ordenar los datos Determinar el Rango (R) de la variable: R = X max - M min Determinar el número de clases o intervalos (K) de la distribución: Empíricamente Método de 2 K : K es el exponente de 2 tal que 2 K ≥ n Formula de Sturges: K = parte entera (1+ 3,32 Log (n))
  • 11. DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Calcular el rango de las clases o intervalos (C) de la distribución: C = R/K Asiganar los limites de las clases o intervalos con la siguiente regla: l 1 = X min , donde l 1 = Limite inferior de la clase 1 L 1 = l 1 + C, donde L 1 = Limite superior de la clase 1 l 2 = L 1 , donde l 2 = Limite inferior de la clase 2 L 2 = l 2 + C …..y así sucesivamente hasta llegar a que L k = X max Clasificar cada observación de la variable en una y solo una de las clases, usando la siguiente regla: Las primeras K-1 clases son [) – cerradas en el limite inferior y abiertas en el limite superior La última clase (K) es [] – cerrada en ambos limites Determinar las frecuencias relativas y acumuladas; además de la marca de clases: X i =(L i + l i )/2
  • 12. DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DDNA) P.ej: La tienda CABRERA’S Y ASOCIADOS esta interesada en efectuar un análisis de sus cuentas por cobrar. Uno de los factores que más interesaba a la administración de la tienda era el de los saldos de las cuentas de crédito. Se escogió al azar una muestra aleatoria de 30 cuentas y se anotó el saldo de cada cuenta (en Miles de Bs.F) como sigue: Determinar el Rango (R) de la variable: R = X ma - M min = 93,91–7,42= 86,49 Determinar el número de clases o intervalos (K) de la distribución: Método de 2 K : K= 5 ya que 2 5 = 32 ≥ 30 Formula de Sturges: K = parte entera (1+ 3,32 Log (30)) =parte entera (5,9069=5
  • 13. DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Calcular el rango de las clases o intervalos (C) de la distribución: C = R/K = 86,49/5 = 17,298 * Nota (*): como la variable se midío con 2 decimales redondeamos el valor calculado de C con la misma cantidad de decimales, es decir: C = 17,30 Asiganar los limites de las clases o intervalos con la siguiente regla: l 1 = X min = 7,42 ; L 1 = l 1 + C = 7,42 + 17,30 = 24,72; ..y así sucesivamente Clasificar cada observación de la variable en una y solo una de las clases, usando la siguiente regla: Las primeras K-1 clases son [) – cerradas en el limite inferior y abiertas en el limite superior La última clase (K) es [] – cerrada en ambos limites Determinar las frecuencias relativas y acumuladas; además de la marca de clases: X i =(L i + l i )/2
  • 14. DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Resultando la siguiente DFDA:
  • 15. DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Grafica asociada a la DFDA: Histograma 7,42 24,72 42,02 59,39 76,62 93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 5 10 15 20 25 30 35 % Cuentas por Cobrar Distribución de los Saldo de la Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados
  • 16. DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Grafica asociada a la DFDA: Polígono de Frecuencia 7,42 24,72 42,02 59,39 76,62 93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 5 10 15 20 25 30 35 % Cuentas por Cobrar Distribución de los Saldo de la Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados 16,07 33,37 50,57 67,97 85,27
  • 17. DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Grafica asociada a la DFDA: Histograma + Polígono de Frecuencia (Integrados) 7,42 24,72 42,02 59,39 76,62 93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 5 10 15 20 25 30 35 % Cuentas por Cobrar Distribución de los Saldo de la Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados
  • 18. DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DFDA) Grafica asociada a la DFDA: Ojiva Ascendente 7,42 24,72 42,02 59,39 76,62 93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 20 40 60 80 100 % Cuentas por Cobrar Distribución Acumulada de los Saldo de las Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados
  • 19. DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DDNA) Ejemplo de interpretación de los resultados contenidos en la tabla: f 1 : Diez (10) de las cuentas investigadas tienen saldo entre 7,42 y 24,72 miles BsF, lo cual representa el 10% – h 1 – de la muestra. H 3 : 0,70 es la proporción de cuentas por pagar de la muestra con un saldo menor que 59,32 BsF. %H 3 : El 70% de las cuentas investigadas presentan saldo de a lo sumo 59,32 BsF. X 3 : La cantidad 50,67 BsF es el saldo que representa a todas las cuentas con saldo entre 42,02 y 59,32 BsF.
  • 20. DISTIBUCION DE FRECUENCIA DATOS AGRUPADOS (DDNA) Con ayuda de las gráficas podemos responder a preguntas como: ¿Que porcentaje aproximadamente de cuentas tienen saldos entre 30 y 65 BsF? Como se aprecia 30 y 65 BsF no son limites de clases por eso no podemos responder directamente con la tabla esta pregunta y nos tenemos que valer de la gráfica de frecuencias acumuladas (ojiva) para ello: -Aprox. el 40% de las cuentas tienen saldo ≤ a 30 Mil BsF -Aprox. el 73% de las cuentas tienen saldo ≤ a 65 Mil BsF Luego: 73%-40% = 33% entonces: aprox. El 33% de las cuentas tienen saldo entre 30 y 65 miles BsF 30 65 40 73 7,42 24,72 42,02 59,39 76,62 93,92 Saldo de la Cuentas por Cobrar (Miles Bs.F) 20 40 60 80 100 % Cuentas por Cobrar Distribución Acumulada de los Saldo de las Cuentas por Cobrar (Miles Bs.F) Cabrera & Asociados Fuente: Archivos de Cabrera & Asociados
  • 21. ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Las técnicas del análisis exploratorio de datos consiste en operaciones aritméticas sencillas y gráficas fáciles de trazar, que pueden emplearse para resumir con rapidez los datos de una muestra. La técnica conocida como diagrama tallo y hoja se usa para mostrar en forma simultanea el orden del rango y la forma de un conjunto de datos. Persigue los siguientes objetivos: Representación visual de la información Descubrir un patrón de comportamiento de los datos, es decir, qué distribución pueden seguir los datos Identificar si hay valores extremos o datos anormales en la muestra Es aplicables a variables cuantitativas de valores formados por al menos dos cifras. Principio : Cada número se divide en dos partes, una que llamaremos "Tallo" y la otra denominada " ramas u Hojas".
  • 22. ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Ejemplo: Considere los siguientes números: 65, 57, 79, 69, 53, 63, 71. Los tallos serán las decenas, y las hojas serán las unidades, de la siguiente manera, luego: Procedimiento: 1. Se define cómo se van a dividir los números en tallos y hojas, es decir, se identifican cuales van a ser los tallos, y cuales va a ser las hojas. 2. En una columna se listan los tallos en orden ascendente. 3. Se recorren los datos y se colocan, en la columna siguiente, las hojas de acuerdo al tallo que tengan y se ordenan en forma creciente Resto de los números (cifras secundarias) ubicadas a la derecha Hoja Formado por uno o más dígitos principales (cifras mas significativas), ubicados a la izquierda del número. Tallo 19 7 359 6 37 5 Ramas Tallo
  • 23. ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Ejemplo : Considere la siguiente información sobre duración de baterías de carro, en años. Se pide: Construir el diagrama de tallos y hojas usando como tallos la parte entera. Construir el diagrama de tallos y hojas partiendo cada tallo en dos. 3.5 4.2 3.0 3.9 2.6 3.2 3.8 4.7 3.4 1.9 4.1 3.2 4.4 3.7 3.1 3.3 3.1 3.9 3.3 2.9 3.6 3.4 4.3 2.5 3.7 4.7 3.1 3.8 3.3 3.1 1.6 3.4 2.6 3.0 3.7 3.2 4.5 3.5 4.1 2.2 Duración de baterías (en años)
  • 24. ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Usando como tallos la parte entera Tallos : Dígitos principales (Parte entera); Hojas : Dígitos secundarios (Parte decimal) Partiendo cada tallo en dos En este caso el tallo 1 únicamente tendría la parte superior, y el tallo 4 tendría tanto la parte inferior como la superior 40 Total 9 1 1 2 3 4 5 6 7 7 4 25 0 0 1 1 1 1 2 2 2 3 3 3 4 4 4 5 5 6 7 7 7 8 8 9 9 3 5 2 5 6 6 9 2 1 9 1 Frecuencia Hojas Tallo
  • 25. ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja 40 Total 4 5 6 7 7 4 S 5 1 1 2 3 4 4 I 10 5 5 6 7 7 7 8 8 9 9 3 S 15 0 0 1 1 1 1 2 2 2 3 3 3 4 4 4 3 I 4 5 6 6 9 2 S 1 2 2 I 1 9 1 S Frecuencia Ramas Tallo
  • 26. ANALISIS EXPLORATORIO DE DATOS Diagrama de Tallo y Hoja Observaciones: Se recomienda que el número de tallos esté entre 5 y 20. A veces, de acuerdo con la información que se tenga, pueden resultar muy pocos tallos, con lo cual las ramas quedan muy concentradas, y realmente no se obtiene mucha información. En estos casos, puede ser conveniente partir los tallos en dos: Un tallo inferior (que tenga, por ejemplo, las hojas menores que 5), y un tallo superior (que tenga las hojas mayores o iguales a cinco). Así, por ejemplo, el tallo 6 puede dividirse en 6I, para los valores entre 60 y 64, y el tallo 6S, para los valores entre 65 y 69. • Cuando se parten los tallos en dos, todos los tallos deben partirse en dos. Solamente el primero y el último tallo podrían dejarse sin partir, en caso de que en el primer tallo sólo haya información para el tallo superior, y cuando para el último tallo sólo haya información para el tallo inferior.
  • 27. TAREA No. 2 Resolver del libro Estadística para Administración y Economía – Anderson – 8va. Edición , capitulo 2, los ejercicios del 1 al 10 (pag. 28 al 30) Resolver del libro Estadística para Administración y Economía – Anderson – 8va. Edición , capitulo 2, los ejercicios del 11 al 21 (pag. 36 al 39) Resolver del libro Estadística para Administración y Economía – Anderson – 8va. Edición , capitulo 2, los ejercicios del 22 al 28 (pag. 42 al 43) Si usted trabaja identifique al una variable cuantitativa importante que corresponda con algún proceso administrativo en el que usted interviene, p.ej: ventas, inventario, personal, etc. Recolecte una muestra de al menos 50 observaciones de dicha variable y construya una DFDA y sus respectivas gráficas. Saque algunas conclusiones