SlideShare una empresa de Scribd logo
ESTADÍSTICA APLICADA N. Guarín S.




                  http://tifon.unalmed.edu.co/~pagudel/estadistica.html



.




                                                             N. GUARÍN S.
                                                           nguarins@epm.net.co

            BIOGRAFÍA DEL AUTOR                                                  TABLA DE CONTENIDO




.



    ISBN                            Se publica bajo el total consentimiento del autor            Colombia




    http://tifon.unalmed.edu.co/~pagudel/estadistica.html [15/09/2002 7:40:42]
ESTADÍSTICA APLICADA Tabla de Contenido




                      Tabla de Contenido
                      .

                           Introducción

                      1. La Estadística

                           1.1 Importancia
                           1.2 Definición
                           1.3 División
                      .
                      2. Etapas del Método Estadístico

                           2.1 Planteamiento del problema
                           2.2 Fijación de los objetivos
                           2.3 Formulación de las hipótesis
                           2.4 Definición de la unidad de observación y de la unidad de medida
                           2.5 Determinación de la población y de la muestra
                           2.6 La recolección
                           2.7 Crítica, clasificación y ordenación
                           2.8 La tabulación
                           2.9 La presentación
                           2.10 El análisis
                           2.11 Publicación
                           Cuestionario
                      .
                      3. Distribución de Frecuencias

                           3.1 Distribución de frecuencias simple
                               Ejercicios
                           3.2 Distribución de frecuencias por intervalo
                           3.3 Reglas empíricas para la construcción de Intervalos
                               Cuestionario y ejercicios propuestos
                      .
                      4. Representación Gráfica

                           4.1 Definición
                           4.2 Componentes de una gráfica

http://tifon.unalmed.edu.co/~pagudel/tabla.html (1 de 4) [15/09/2002 7:40:53]
ESTADÍSTICA APLICADA Tabla de Contenido

                           4.3 Principales tipos de gráficos
                            4.3.1 Gráfico de líneas
                            4.3.2 Gráfico de líneas compuesto
                            4.3.3 Gráfico de barras
                            4.3.4 Gráfico de barras compuesto
                            4.3.5 Gráfico de sectores circulares
                            4.3.6 Histograma de frecuencias
                            4.3.7 Polígono de frecuencias
                            4.3.8 Histograma de frecuencias acumuladas
                           Cuestionario y ejercicios propuestos
                      .
                      5. Medidas de Tendencia Central

                           5.1 Media aritmética
                            5.1.1 Propiedades de la media aritmética
                            5.1.2 Media aritmética con cambio origen y de escala
                            5.1.3 Media aritmética ponderada
                           5.2 Mediana
                            5.2.1 La mediana cuando los datos no están agrupados en intervalos
                            5.2.2 La mediana cuando la información está agrupada en intervalos
                           5.3 La Moda
                            5.3.1 La moda cuando los datos no están agrupados en intervalos
                            5.3.2 Cálculo de la moda con la información agrupada en intervalos
                           Cuestionario y ejercicios propuestos
                      .
                      6. Medidas de Posición (Percentiles)

                           6.1 Cuartiles
                           6.2 Quintiles
                           6.3 Deciles
                           6.4 Centiles
                           6.5 Resumen
                           Cuestionario y ejercicios propuestos
                      .
                      7. Medidas de Dispersión

                           7.1 Rango o recorrido
                           7.2 Desviación media
                           7.3 Varianza
            .....
                           7.4 Coeficiente de variabilidad
                           Cuestionario y ejercicios propuestos


http://tifon.unalmed.edu.co/~pagudel/tabla.html (2 de 4) [15/09/2002 7:40:53]
ESTADÍSTICA APLICADA Tabla de Contenido

                      .
                      8. Regresión y Correlación Lineal

                           8.1 Tablas de doble entrada
                           8.2 Correlación
                           8.3 Regresión lineal
                            8.3.1 Ajuste rectilíneo (método de los mínimos cuadrados)
                            8.3.2 Ajuste parabólica (método de los mínimos cuadrados)
                           Cuestionario y ejercicios propuestos
                      .
                      9. Tasas e Índices

                           9.1 Tasa
                           9.2 Índice
                            9.2.1 Índice simple
                              9.2.1.1 Índice de base fija
                              9.2.1.2 Índice de base móvil
                            9.2.2 Índices compuestos (globales)
                              9.2.2.1 Índice de Laspeyres
                              9.2.2.2 Índice de Passche
                              9.2.2.3 Índice ideal de Fisher
                           Cuestionario y ejercios propuestos
                      .
                      10.Nociones de Probabilidad (Eventos)

                           10.1 Nociones de conteo
                            10.1.1 Principio fundamental 1
                            10.1.2 Principio fundamental 2
                            10.1.3 Permutaciones
                            10.1.4 Variaciones
                            10.1.5 Combinaciones
                            10.1.6 Permutaciones con repetición
                            10.1.7 Variaciones con repetición
                            Ejercicios propuestos
                           10.2 Definición de probabilidad
                            10.2.1 Probabilidad a priori
                            10.2.2 Probabilidad a posteriori
                            10.2.3 Probabilidad subjetiva
                           10.3 Axiomas de la teoría de probabilidades
                           10.4 Probabilidad condicional e independencia estadística
                            Cuestionario y ejercicios propuestos


http://tifon.unalmed.edu.co/~pagudel/tabla.html (3 de 4) [15/09/2002 7:40:53]
ESTADÍSTICA APLICADA Tabla de Contenido

                           10.5 Variable aleatoria
                           10.6 Función de probabilidad
                            10.6.1 Función de probabilidad
                            10.6.2 Función de distribución
                            Cuestionario y ejercicios propuestos
                           10.7 Valor esperado (esperanza matemática)
                            10.7.1 Media aritmética poblacional
                            10.7.2 Varianza poblacional
                            Cuestionario y ejercicios propuestos
                      .
                      11.Distribuciones Especiales

                           11.1 Distribución de Bernoulli
                           11.2 Distribución binomial, tablas binomiales
                           11.3 Distribución de Poisson, tablas de Poisson
                           11.4 Distribución normal
                           11.5 Distribución normal estándar, tablas normales
                                Cuestionario y ejercicios propuestos
                           11.6 El tamaño de la muestra
                      .

                           Apéndice No. 1

                           Apéndice No. 2

                           Apéndice No. 3

                            Solución a Algunos Ejercicios Propuestos

                            Enlaces

                            Bibliografía

                      .
.....

                                                           ...                  ...




http://tifon.unalmed.edu.co/~pagudel/tabla.html (4 de 4) [15/09/2002 7:40:53]
ESTADÍSTICA APLICADA Introducción




                Introducción

                                                                                    Las acciones que acometemos hoy
                                                                                        se basan en un plan de ayer y
                                                                                         las expectativas del mañana.

                La palabra estadística se origina, en las técnicas de recolección, organización,
                conservación, y tratamiento de los datos propios de un estado, con que los antiguos
                gobernantes controlaban sus súbditos y dominios económicos. Estas técnicas
                evolucionaron a la par con el desarrollo de las matemáticas, utilizando sus herramientas
                en el proceso del análisis e interpretación de la información.

                Para mediados del siglo XVII en Europa, los juegos de azar eran frecuentes, aunque sin
                mayores restricciones legales. El febril jugador De Méré consultó al famoso matemático y
                filosofo Blaise Pascal (1623-1662) para que le revelara las leyes que controlan el juego de
                los dados, el cual, interesado en el tema, sostuvo una correspondencia epistolar con el
                tímido Pierre de Fermat (1601-1665, funcionario público apasionado por las matemáticas;
                célebre porque no publicaba sus hallazgos) dando origen a la teoría de la probabilidad, la
                cual se ha venido desarrollando y constituyéndose en la base primordial de la estadística.

                En nuestros días, son de uso cotidiano las diferentes técnicas estadísticas que partiendo de
                observaciones muestrales o históricas, crean modelos lógico-matemáticos que se
                "aventuran" describir o pronosticar un determinado fenómeno con cierto grado de
                certidumbre medible.

                 El presente texto no pretende teorizar el saber estadístico, desde luego, no es un libro para
           . . . estadísticos, ya que, adrede se obvia el rigor científico de lo expuesto en beneficio de la
.....
           . . sencillez necesaria para el neófito; con un lenguaje coloquial se conduce al lector a través
                 del contenido, a partir de dos o tres ejemplos que ilustran la aplicabilidad de los temas
                 tratados.

                El avance tecnológico en la informática ha contribuido enormemente al desarrollo de la
                estadística, sobre todo en la manipulación de la información, pues en el mercado existen
                paquetes estadísticos de excelente calidad, como el SAS, SPSS, SCA, STATGRAPHICS,
                amén de otros, que "corren" en un ordenador sin mayores exigencias técnicas,
                permitiendo el manejo de grandes volúmenes de información y de variables.

                La estadística, entonces, dejó de ser una técnica exclusiva de los estados, para convertirse
                en una herramienta imprescindible de todas las ciencias, de donde proviene la
                desconcertante des-uniformidad en las definiciones de los diferentes autores, ya que cada
                estudioso la define de acuerdo con lo que utiliza de ella y tenemos definiciones como que:
                la estadística es la tecnología del método científico, o que es el conocimiento relacionado

 http://tifon.unalmed.edu.co/~pagudel/introduccion.html (1 de 2) [15/09/2002 7:40:57]
ESTADÍSTICA APLICADA Introducción

               con la toma de decisiones en condiciones de incertidumbre, o que la estadística son
               métodos para obtener conclusiones a partir de los resultados de los experimentos o
               procesos, o que es un método para describir o medir las propiedades de una población. En
               fin, no se trata de discutir si la estadística es una ciencia, una técnica o una herramienta,
               sino de la utilización de sus métodos en provecho de la evolución del conocimiento.

               La estadística hace inferencias sobre una población, partiendo de una muestra
               representativa de ella. Es a partir del proceso del diseño y toma de la muestra desde donde
               comienzan a definirse las bondades y confiabilidad de nuestras aseveraciones, hechas,
               preferentemente, con un mínimo costo y mínimo error posible.




                                                       ...                             ...




http://tifon.unalmed.edu.co/~pagudel/introduccion.html (2 de 2) [15/09/2002 7:40:57]
ESTADÍSTICA APLICADA 1. La Estadística




               1. La Estadística

                                                                                " El poder se nutre de la información
                                                                                                  y el conocimiento".

               1.1 IMPORTANCIA

               En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el
               punto de incursionar en la totalidad de las ciencias; inclusive, en la lingüística se aplican
               técnicas estadísticas para esclarecer la paternidad de un escrito o los caracteres más
               relevantes de un idioma.

               La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se entiende
               mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado
               de incertidumbre... y la Estadística ayuda en la incertidumbre, trabaja con ella y nos
               orienta para tomar las decisiones con un determinado grado de confianza.

               Los críticos de la estadística afirman que a través de ella es posible probar cualquier cosa,
               lo cual es un concepto profano que se deriva de la ignorancia en este campo y de lo
               polifacético de los métodos estadísticos. Sin embargo muchos "investigadores"
               tendenciosos han cometido abusos con la estadística, elaborando "investigaciones" de
               intención, teniendo previamente los resultados que les interesan mostrar a personas
               ingenuas y desconocedoras de los hechos. Otros, por ignorancia o negligencia, abusan de
               la estadística utilizando modelos inapropiados o razonamientos ilógicos y erróneos que
               conducen al rotundo fracaso de sus investigaciones.

               Lincoln L. Chao* hace referencia a uno de los más estruendosos fracasos, debido a los
               abusos en la toma de una muestra:

               Se trata del error cometido por la Literary Digest que, en sus pronósticos para las
               elecciones presidenciales en EE.UU. para 1936, afirmó que Franklin D. Roosvelt
               obtendría 161 votos electorales y Alfred Landon, 370. La realidad mostró a Roosvelt con
               523 votos y a Landon con 8 solamente.
           ..
              El error se debió a que la muestra fue tomada telefónicamente a partir de la lista de
.....      ..
              suscriptores de la Digest y, en 1936, las personas que se daban el lujo de tener teléfonos y
           .
              suscripciones a revistas no configuraban una muestra representativa de los votantes de
              EE.UU. y, por ende, no podía hacerse un pronóstico confiable con tan sesgada
              información.


               1.2 DEFINICIÓN


 http://tifon.unalmed.edu.co/~pagudel/1estadistica.html (1 de 2) [15/09/2002 7:41:00]
ESTADÍSTICA APLICADA 1. La Estadística



              Definir la estadística es una tarea difícil porque tendríamos que definir cada una de las
              técnicas que se emplean en los diferentes campos en los que interviene. Sin embargo,
              diremos, en forma general, que la estadística es un conjunto de técnicas que, partiendo de
              la observación de fenómenos, permiten al investigador obtener conclusiones útiles sobre
              ellos.


              1.3 DIVISIÓN

              La estadística se divide en dos grandes ramas de estudio que son: La estadística
              descriptiva, la cual se encarga de la recolección, clasificación y descripción de datos
              muestrales o poblacionales, para su interpretación y análisis, que es de la que nos
              ocuparemos en este curso; y la estadística matemática o inferencial, que desarrolla
              modelos teóricos que se ajusten a una determinada realidad con cierto grado de confianza.

              Estas dos ramas no son independientes; por el contrario, son complementarias y entre
              ambas dan la suficiente ilustración sobre una posible realidad futura, con el fin de que
              quien tenga poder de decisión, tome las medidas necesarias para transformar ese futuro o
              para mantener las condiciones existentes.



              ______________________________
              * LINCOLN, L. Chao. Estadística para Ciencias Administrativas. Trad. Jesús María
              Castaño.




                                                       ...                             ...




http://tifon.unalmed.edu.co/~pagudel/1estadistica.html (2 de 2) [15/09/2002 7:41:00]
ESTADÍSTICA APLICADA 2. Etapas del Método Estadístico




               2. Etapas del Método Estadístico

               El método estadístico, parte de la observación de un fenómeno, y como no puede siempre
               mantener las mismas condiciones predeterminadas o a voluntad del investigador, deja
               que actúen libremente, pero se registran las diferentes observaciones y se analizan sus
               variaciones.

               Para el planeamiento de una investigación, por norma general, se siguen las siguientes
               etapas:

               2.1 Planteamiento del problema.
               2.2 Fijación de los objetivos.
               2.3 Formulación de la hipótesis.
               2.4 Definición de la unidad de observación y de la unidad de medida.
               2.5 Determinación de la población y de la muestra.
               2.6 La recolección.
               2.7 Crítica, clasificación y ordenación.
               2.8 Tabulación.
               2.9 Presentación.
               2.10 Análisis.
               2.11 Publicación.


               2.1 PLANTEAMIENTO DEL PROBLEMA

               Al abordar una investigación se debe tener bien definido qué se va a investigar y por qué
               se pretende estudiar algo. Es decir, se debe establecer una delimitación clara, concreta e
               inteligible sobre el o los fenómenos que se pretenden estudiar, para lo cual se deben tener
               en cuenta, entre otras cosas, la revisión bibliográfica del tema, para ver su accesibilidad y
               consultar los resultados obtenidos por investigaciones similares, someter nuestras
               proposiciones básicas a un análisis lógico; es decir, se debe hacer una ubicación histórica
               y teórica del problema.


               2.2 FIJACIÓN DE LOS OBJETIVOS

               Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta dónde
               queremos llegar; en otras palabras, debemos fijar cuales son nuestras metas y objetivos.
               Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigüedades y

http://tifon.unalmed.edu.co/~pagudel/2etapas.html (1 de 5) [15/09/2002 7:41:04]
ESTADÍSTICA APLICADA 2. Etapas del Método Estadístico

               debe, además, establecerse diferenciación entre lo de corto, mediano y largo plazo, así
               como entre los objetivos generales y los específicos.


               2.3 FORMULACIÓN DE LAS HIPÓTESIS

               Una hipótesis es ante todo, una explicación provisional de los hechos objeto de estudio, y
               su formulación depende del conocimiento que el investigador posea sobre la población
               investigada. Una hipótesis estadística debe ser susceptible de docimar, esto es, debe
               poderse probar para su aceptación o rechazo.

               Una hipótesis que se formula acerca de un parámetro (media, proporción, varianza, etc.),
               con el propósito de rechazarla, se llama Hipótesis de Nulidad y se representa por Ho; a su
               hipótesis contraria se le llama Hipótesis Alternativa (H1).


               2.4 DEFINICIÓN DE LA UNIDAD DE OBSERVACIÓN Y DE LA UNIDAD DE
               MEDIDA

               La Unidad de Observación, entendida como cada uno de los elementos constituyentes de
               la población estudiada, debe definirse previamente, resaltando todas sus características;
               pues, al fin de cuentas, es a ellas a las que se les hará la medición.

               La unidad de observación puede estar constituida por uno o varios individuos u objetos y
               denominarse respectivamente simple o compleja.

               El criterio sobre la unidad de medición debe ser previamente definido y unificado por
               todo el equipo de investigación. Si se trata de medidas de longitud, volumen, peso, etc.,
               debe establecerse bajo qué unidad se tomarán las observaciones ya sea en metros,
               pulgadas, libras, kilogramos, etc.

               Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en
               las cuales se ha de efectuar la toma de la información.


               2.5 DETERMINACIÓN DE LA POBLACIÓN Y DE LA MUESTRA

               Estadísticamente, la población se define como un conjunto de individuos o de objetos
               que poseen una o varias características comunes. No se refiere esta definición únicamente
               a los seres vivientes; una población puede estar constituida por los habitantes de un país o
               por los peces de un estanque, así como por los establecimientos comerciales de un barrio
               o las unidades de vivienda de una ciudad.

               Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aquí
               el término infinito no está siendo tomado con el rigor semántico de la palabra; por
               ejemplo, los peces dentro de un estanque son un conjunto finito; sin embargo, en
               términos estadísticos, puede ser considerado como infinito.

               Muestra es un subconjunto de la población a la cual se le efectúa la medición con el fin

http://tifon.unalmed.edu.co/~pagudel/2etapas.html (2 de 5) [15/09/2002 7:41:04]
ESTADÍSTICA APLICADA 2. Etapas del Método Estadístico


                de estudiar las propiedades del conjunto del cual es obtenida.

               En la práctica, estudiar todos y cada uno de los elementos que conforman la población no
               es aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad de sus
               elementos, porque a veces es necesario destruir lo que se está midiendo, por ser
               demasiado grande el número de sus componentes o no se pueden controlar; por eso se
               recurre al análisis de los elementos de una muestra con el fin de hacer inferencias
               respecto al total de la población. Existen diversos métodos para calcular el tamaño de la
               muestra y también para tomar los elementos que la conforman, pero no es el objetivo de
               este curso estudiarlos. Diremos solamente que la muestra debe ser representativa de la
               población y sus elementos escogidos al azar para asegurar la objetividad de la
           ...
.....          investigación.
           ..

                2.6 LA RECOLECCIÓN

                Una de las etapas más importantes de la investigación es la recolección de la
                información, la cual ha de partir, a menos que se tenga experiencia con muestras
                análogas, de una o varias muestras piloto en las cuales se pondrán a prueba los
                cuestionarios y se obtendrá una aproximación de la variabilidad de la población, con el
                fin de calcular el tamaño exacto de la muestra que conduzca a una estimación de los
                parámetros con la precisión establecida.

                El establecimiento de las fuentes y cauces de información, así como la cantidad y
                complejidad de las preguntas, de acuerdo con los objetivos de la investigación son
                decisiones que se han de tomar teniendo en cuenta la disponibilidad de los recursos
                financieros, humanos y de tiempo y las limitaciones que se tengan en la zona geográfica,
                el grado de desarrollo, la ausencia de técnica, etc.

                Es, entonces, descubrir dónde está la información y cómo y a qué "costo" se puede
                conseguir; es determinar si la encuesta se debe aplicar por teléfono, por correo, o si se
                necesitan agentes directos que recojan la información; establecer su número óptimo y
                preparar su entrenamiento adecuado.


                2.7 CRITICA, CLASIFICACIÓN Y ORDENACIÓN

                Después de haber reunido toda la información pertinente, se necesita la depuración de los
                datos recogidos. Para hacer la crítica de una información, es fundamental el
                conocimiento de la población por parte de quien depura para poder detectar falsedades en
                las respuestas, incomprensión a las preguntas, respuestas al margen, amén de todas las
                posibles causas de nulidad de una pregunta o nulidad de todo un cuestionario.

                Separado el material de "desecho" con la información depurada se procede a establecer
                las clasificaciones respectivas y con la ayuda de hojas de trabajo, en las que se establecen
                los cruces necesarios entre las preguntas, se ordenan las respuestas y se preparan los
                modelos de tabulación de las diferentes variables que intervienen en la investigación.


 http://tifon.unalmed.edu.co/~pagudel/2etapas.html (3 de 5) [15/09/2002 7:41:04]
ESTADÍSTICA APLICADA 2. Etapas del Método Estadístico

               El avance tecnológico y la popularización de los computadores hacen que estas tareas,
               manualmente dispendiosas, puedan ser realizadas en corto tiempo.


               2.8 LA TABULACIÓN

               Una tabla es un resumen de información respecto a una o más variables, que ofrece
               claridad al lector sobre lo que se pretende describir; para su fácil interpretación una tabla
               debe tener por lo menos: Un titulo adecuado el cual debe ser claro y conciso. La Tabla
               propiamente dicha con los correspondientes subtítulos internos y la cuantificación de los
               diferentes ítems de las variables, y las notas de pie de cuadro que hagan claridad sobre
               situaciones especiales de la tabla, u otorguen los créditos a la fuente de la información.


               2.9 LA PRESENTACIÓN

               Una información estadística adquiere más claridad cuando se presenta en la forma
               adecuada. Los cuadros, tablas y gráficos facilitan el análisis, pero se debe tener cuidado
               con las variables que se van a presentar y la forma de hacerlo. No es aconsejable saturar
               un informe con tablas y gráficos redundantes que, antes que claridad, crean confusión.
               Además la elección de determinada tabla o gráfico para mostrar los resultados, debe
               hacerse no sólo en función de las variables que relaciona, sino del lector a quien va
               dirigido el informe.


               2.10 EL ANÁLISIS

               La técnica estadística ofrece métodos y procedimientos objetivos que convierten las
               especulaciones de primera mano en aseveraciones cuya confiabilidad puede ser evaluada
               y ofrecer una premisa medible en la toma de una decisión.

               Es el análisis donde se cristaliza la investigación. Esta es la fase de la determinación de
               los parámetros y estadísticos muestrales para las estimaciones e inferencias respecto a la
               población, el ajuste de modelos y las pruebas de las hipótesis planteadas, con el fin de
               establecer y redactar las conclusiones definitivas.


               2.11 PUBLICACIÓN

               Toda conclusión es digna de ser comunicada a un auditorio. Es más, hay otros estudiosos
               del mismo problema a quienes se les puede aportar información, conocimientos y otros
               puntos de vista acerca de él.



               CUESTIONARIO

               1. ¿Por qué se considera importante la estadística?


http://tifon.unalmed.edu.co/~pagudel/2etapas.html (4 de 5) [15/09/2002 7:41:04]
ESTADÍSTICA APLICADA 2. Etapas del Método Estadístico

               2. Enuncie las ramas en las que se divide la estadística y establezca su campo de acción.

               3. Enumere las etapas del método estadístico.

               4. ¿Por qué es importante la revisión bibliográfica en el desarrollo de una investigación
               estadística?.

               5. ¿Qué es la hipótesis nula?.

               6. Defina: Población, Muestra, Censo y Muestreo.

               7. ¿Por qué usualmente se recurre al análisis a través de muestras y no de poblaciones?.

               8. ¿Para qué se utiliza un muestreo piloto?.

               9. ¿Con qué fin se critica una información?

               10. ¿Cuáles son los componentes de una tabla?




                                                       ...                        ...




http://tifon.unalmed.edu.co/~pagudel/2etapas.html (5 de 5) [15/09/2002 7:41:04]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias




  3. Distribución de Frecuencias

  Después de recoger toda la información correspondiente a la investigación,
  es decir, al agotar todo el trabajo de campo, nuestro escritorio se llena de un
  cúmulo de datos y cifras desordenadas los cuales, al ser tomados como
  observaciones individuales, dicen muy poco sobre la población estudiada; es,
  entonces, tarea del investigador “hacer hablar las cifras”, comenzando por la
  clasificación y ordenación, consignando la información en tablas inteligibles
  que denominamos distribuciones de frecuencias.


  3.1 DISTRIBUCIÓN DE FRECUENCIAS SIMPLE

  Para una mayor sencillez, en la exposición del tema, nos valemos del siguiente ejemplo:
  Supongamos que en la fábrica de confecciones “La Hilacha”, ha estallado un conflicto laboral y
  sus cincuenta operarias solicitan un aumento en el salario integral diario sopena de paralizar la
  fábrica.

  El Gerente-propietario recoge la información respecto a la variable salario diario de sus 50
  operarias y la relaciona en la tabla No 1.




                                                               Tabla No.1




http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (1 de 10) [15/09/2002 7:41:19]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias




                                                              Tabla No. 2




                                                              Tabla No. 3


http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (2 de 10) [15/09/2002 7:41:19]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias




                                                              Tabla No. 4




  Como se puede observar, hay una gran diferencia entre los datos brutos de la tabla No.1 y el
  ordenamiento y agrupamiento de la tabla No. 4.

http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (3 de 10) [15/09/2002 7:41:19]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias



        Con el fin de obtener una mejor tabla interpretativa, introduciremos la siguiente simbología:

        n: El tamaño de la muestra, es el número de observaciones.
        Xi: La variable; es cada uno de los diferentes valores que se han observado.

        La variable xi, toma los x1, x2... xm valores.

        fi: La frecuencia absoluta o simplemente frecuencia, es el número de veces
        que se repite la variable Xi; así f1, es el número de veces que se repite la
        observación x1, f2 el número de veces que se repite la observación x2 etc.

           fa: La frecuencia acumulada, se obtiene acumulando la frecuencia
           absoluta.

           fr: Frecuencia relativa; es el resultado de dividir c/u de las frecuencias
           absolutas por el tamaño de la muestra.

           fra: Frecuencia relativa acumulada; se obtiene dividiendo la frecuencia acumulada entre el
           tamaño de la muestra.




                                 Distribución Teórica de Frecuencias de n Observaciones




.   .
.   .
.   .
.   .

    http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (4 de 10) [15/09/2002 7:41:19]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias


. .




      Veamos el ejemplo que venimos trabajando:

                                                  Tabla No. 5
                           Distribución de Frecuencias del Salario Diario de 50 Obreras




 http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (5 de 10) [15/09/2002 7:41:19]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias




  En la práctica, cuando se tiene confianza en el ordenamiento, no son necesarias tantas tablas; se
  puede pasar de la tabla No1 directamente a la tabla No 6.

                                                 Tabla No. 6
                         Salario Diario de 50 Operarias de La Fabrica de Confecciones
                                         “La Hilacha”(Miles de Pesos)




  Analizando las columnas porcentuales fr y fra se obtienen, entre otras las siguientes conclusiones:

        q   Sólo el 4% de las obreras gana el máximo salario/día de la fabrica, el cual corresponde a
            $58.000.00
        q   El salario diario mínimo ($50.000.00) lo gana únicamente una obrera, lo que constituye el
            2% del personal asalariado.
        q   El 62% de las operarias tiene un salario diario entre $53.000.00 y $55.000.00
        q   El 60% de las obreras tiene un salario/día de $54.000.00 o menos.
        q   El 64% tiene un ingreso/día de $54.000.00 o más.




  CUESTIONARIO Y EJERCICIOS PROPUESTOS

  1. ¿Qué es frecuencia absoluta?

  2. Cómo se obtiene:
  2.1 ¿La frecuencia acumulada?

http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (6 de 10) [15/09/2002 7:41:19]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias

  2.2 ¿La frecuencia relativa?
  2.3 ¿La frecuencia relativa acumulada

  3. En una distribución de frecuencias ¿se pueden establecer conclusiones porcentuales, utilizando
  solamente la frecuencia relativa? ¿Por qué?

  4. La siguiente tabla relaciona las ausencias al trabajo de 50 obreras, durante el mes de octubre, en
  la fabrica de confecciones "la hilacha".




  4.1 Construir una distribución de frecuencias simple.
  4.2 Sacar 3 conclusiones.

  5. Años de experiencia de las 50 operarias de la fabrica de confecciones "la hilacha"




  Ordenar la Información y responder :
  5.1 ¿Qué porcentaje de las obreras tiene experiencia inferior o igual a 6 años?
  5.2 ¿Que porcentaje tiene experiencia entre 5 y 7 años (incluyendo los extremos)?

  6.

                         Palabras por Minuto Escritas por un Grupo de Mecanógrafas




http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (7 de 10) [15/09/2002 7:41:19]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias




  Construir una distribución de frecuencias y resaltar 3 conclusiones

  7. La siguiente tabla muestra, las respuestas obtenidas en un cuestionario aplicado a las obreras de
  la fábrica "La hilacha", respecto a la edad, estado civil, número de hijos, experiencia, años de
  estudio, ingresos diarios, gastos en educación y ausencias al trabajo en el último mes, así como una
  calificación del desempeño otorgada por el supervisor.




http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (8 de 10) [15/09/2002 7:41:19]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias




http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (9 de 10) [15/09/2002 7:41:19]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias

  Hacer las respectivas distribuciones de frecuencias, para cada una de las variables.




                                                ...                                      ...




http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (10 de 10) [15/09/2002 7:41:19]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias




     3. Distribución de Frecuencias

     3.2 DISTRIBUCIÓN DE FRECUENCIAS POR INTERVALOS

      Usualmente los valores de los datos no permiten un agrupamiento de ellos en una tabla de
     frecuencias simple, debido a que se encuentran distribuidos a través de todo el recorrido y el
     número de veces que se repite cada observación no es significativo en todos los casos, y en la
     mayoría de ellos su frecuencia es baja. Una tabla de frecuencias construida en estas condiciones,
     no presenta ninguna utilidad.

     Ilustraremos el caso a través de un ejemplo, para ello, supongamos que la fabrica de
     baldosas”De las casas”, con el objeto de ofrecer una garantía de su producto, desea hacer un
     estudio técnico de su producción, para lo cual extrae una muestra de 100 baldosas, cada una de
     las cuales se somete a una prueba de resistencia, destructiva cuyos datos expresados en Kg/
     Cm2, se relacionan a continuación:

                                                     Tabla No. 7
                                 Resistencia en Kg/Cm2 de 100 Baldosas de La Fabrica
                                                   “De Las Casas”




     La clasificación en una distribución de frecuencias simple daría como resultante un
     ordenamiento de por lo menos 80 items; la mayoría de ellos con frecuencia unitaria.

     Se hace necesario el agrupamiento en intervalos o clases que haga más compacta, manejable y
     presentable la información.

http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (1 de 8) [15/09/2002 7:41:40]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias



     El número de clases y la amplitud de los intervalos los fija el investigador de acuerdo con el
     conocimiento que posea de la población, la necesidad de hacer comparación con otras
     investigaciones y la presentación de la información. Sin embargo, se recomienda que la
     información no sea demasiado compacta, lo cual le restaría precisión, ni demasiado dispersa, ya
     que no se tendría claridad.

     En términos generales, es usual que el número de intervalos no sea inferior a 5 ni superior a 15.
     Struges propone que el número de clases o intervalos sea determinado por la expresión m ≅1 +
     3.3 log(n).*

     La amplitud debe ser igual para todos los intervalos y, en lo posible, no se debe trabajar con
     clases abiertas.

     3.3 REGLAS EMPÍRICAS PARA LA CONSTRUCCIÓN DE
     INTERVALOS

     Cuando no se tiene experiencia en el manejo de la información es aconsejable seguir los pasos
     que se dan a continuación:

     3.3.1 Determinar los datos de mayor y menor valor Xmax, Xmin.

     3.3.2 Calcular el rango o recorrido

     3.3.3 Determinar el número de intervalos (m) y la amplitud de clase (A):                           ,
     Debe tenerse presente que m es un número natural. Luego se busca la amplitud A:



                             ,

     3.3.4 Calcular el rango ampliado:

     3.3.5   Establecer la diferencia               , es decir la cantidad en que ha sido alterado el
     recorrido, la cual no debe ser superior a la amplitud.

     (“a”) También puede ser definida como la cantidad positiva más pequeña
     que le hace falta al rango o recorrido para ser divisible exactamente por la
     amplitud


                   3.3.6      Distribuir adecuadamente la cantidad “a” de la siguiente manera:



http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (2 de 8) [15/09/2002 7:41:40]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias



     Al valor X min se le resta aproximadamente     y la parte restante se le
     suma a X max, obteniendo el límite inferior del primer intervalo y el
     límite superior del último, respectivamente.




     3.3.7  Construir los intervalos, calcular los puntos medios o marcas de clase y hacer el
     agrupamiento de frecuencias.

                    Distribución Teórica de Frecuencias por Intervalos de n
                                        Observaciones




               n:          Número de observaciones
               LIPI:       Límite inferior del primer intervalo

http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (3 de 8) [15/09/2002 7:41:40]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias

                LSUI: Límite superior del último interval
                Xi:   Punto medio del intervalo, o marca de clase



                * Con el fin de prever dobles conteos, quien clasifica deberá
                especificar si los intervalos son abiertos a la derecha o abiertos
                a la izquierda, en estas notas, trabajaremos con intervalos
                abiertos a la derecha; es decir, del tipo           , donde el
                límite superior no está incluido dentro de la clase.


      Retomemos el ejercicio de la Tabla No. 7 y construyamos una distribución de frecuencia por
      intervalos.


       3.3.1                                                           ,

     .
     . 3.3.2 Rango                                                                   ,
....
     .
.
     .
     . 3.3.3 Número de intervalos                                                ,
                                                                                     ,




      No es lógico tener 7.6 intervalos, por lo tanto se procede a aproximar el número de intervalos a
      un número natural cercano.

      Aproximemos,                     , y busquemos la amplitud.



                               ,

      Ya terminado el número de clases en m=7 encontramos que la amplitud debe ser mayor que 94.
      Fijémosla, entonces, en A = 100, que hace más manejable y presentable la tabla con la
      información.

      3.3.4 Rango ampliado                            ,                      .

      3.3.5 Hemos alterado el rango original                               , cambiándolo por el rango ampliado


 http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (4 de 8) [15/09/2002 7:41:40]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias

                    . La diferencia está representada por                               o sea

     3.3.6 Tenemos por tanto, que distribuir adecuadamente la diferencia entre los rangos




     Como se dijo antes, no estamos hablando de restar o sumar estrictamente                    sino una cantidad
     aproximada que brinde una buena presentación.


     3.3.7 Construcción de los intervalos.

                                   Tabla No. 8
                          Construcción de los Intervalos
                        para la Resistencia de las Baldosas




     Se puede desde luego, proceder a agrupar la información en los respectivos intervalos, haciendo
     la salvedad de que ninguno de los límites superiores de clase son considerados dentro de los
     intervalos.

                                          Tabla No. 9
                          Distribución de Frecuencias por Intervalos
                de la Resistencia de 100 Baldosas de la Fabrica “de las Casas”




http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (5 de 8) [15/09/2002 7:41:40]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias




     Conclusiones:

            q   El 72% de las baldosas tiene una resistencia entre 300 y 600 Kg/Cm 2.
            q   El 86% de las baldosas resiste menos de 600 Kg/Cm2.
            q   Sólo el 5% resiste 700 o más Kg/Cm2.



     CUESTIONARIO Y EJERCICIOS PROPUESTOS

     1. ¿Por qué se recurre al agrupamiento en distribuciones de frecuencias por intervalos?

     2. ¿Cómo se determina el número de intervalos y la amplitud de ellos?

     3. ¿Qué es una marca de clase?

     4.

                            Consumo de agua, en m3de 184 familias
                n un barrio residencial de una ciudad durante el mes de octubre:




http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (6 de 8) [15/09/2002 7:41:40]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias




               Construir una distribución de frecuencias por intervalos.
               4.1 Asumiendo el número de intervalos m = 8
               4.2 Asumiendo el número de intervalos m = 9
               4.3 Comparar las dos distribuciones y las conclusiones que de ellas se deriven.

     5.

               Calificaciones Obtenidas por 130 Estudiantes en un Examen de Estadística:




http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (7 de 8) [15/09/2002 7:41:40]
ESTADÍSTICA APLICADA 3 Distribución de Frecuencias




     Construir una distribución de frecuencias por intervalos y resaltar cuatro (4) conclusiones.



     ______________________________
     * Ver Apéndice No. 2




                                                  ...                                   ...




http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (8 de 8) [15/09/2002 7:41:40]
ESTADÍSTICA APLICADA 4. Representación Gráfica




     4. Representación Gráfica

     A pesar de la gran ayuda que prestan las tablas y cuadros con información organizada, no todos
     los públicos alcanzan a comprenderla o no disponen del tiempo suficiente para analizarla.

     Es por ello que la mayoría de los investigadores acostumbran a reforzar la descripción a través
     de dibujos, generalmente con formas geométricas, que ayudan a visualizar el comportamiento de
     las variables tratadas.


     4.1 DEFINICIÓN

     Una gráfica o diagrama es un dibujo complementario a una tabla o cuadro, que permite observar
     las tendencias de un fenómeno en estudio y facilita el análisis estadístico de las variables allí
     relacionadas.


     4.2 COMPONENTES DE UNA GRÁFICA

     Una gráfica, al igual que un cuadro o una tabla, debe constar de:

     4.2.1 Título adecuado: El cual debe ser claro y conciso, que responda a las preguntas: Qué
     relaciona, cuándo y dónde se hicieron las observaciones.

     4.2.2 El cuerpo: o gráfico en sí, cuya elección debe considerar el o los tipos variables a
     relacionar, el público a quien va dirigido y el diseño artístico del gráfico.

     4.2.3 Notas de pie de gráfico: Donde se presentan aclaraciones respecto al gráfico, las escalas
     de los ejes, o se otorgan los créditos a las fuentes respectivas.

     Es de anotar que por medio de gráficos tendenciosos se pueden deformar o resaltar situaciones o
     estados, que presentados en un gráfico apropiado, mostrarían un comportamiento normal.

     Generalmente una información es distorsionada por algunas de las siguientes causas:

               4.2.1.1 La relación entre los ejes no es la mas apropiada ( ver gráficos No.1 y
               No.2.

               4.2.1.2 Gráficos con escalas desproporcionadas, o mala elección del punto de
               origen ( ver gráfico No.3).




http://tifon.unalmed.edu.co/~pagudel/4grafica.html (1 de 12) [15/09/2002 7:41:55]
ESTADÍSTICA APLICADA 4. Representación Gráfica

                                               Variación de La Inflación en Colombia
                                                                    1995-2000




                                                                  Gráfico No. 1




                                                                  Gráfico No. 2




http://tifon.unalmed.edu.co/~pagudel/4grafica.html (2 de 12) [15/09/2002 7:41:55]
ESTADÍSTICA APLICADA 4. Representación Gráfica



                                                                  Gráfico No. 3




     Como se puede observar, el gráfico No.1 “realza” el decrecimiento de la variable inflación,
     mientras que el No.2 intenta mostrar una estabilización o decrecimiento parsimonioso.

     Los dos dibujos son incorrectos debido a que no conservan una proporción adecuada entre sus
     ejes. Sin embargo, el gráfico No. 3 tiene una buena proporción entre los ejes. Pero, la distorsión
     se debe a la mala numeración en el eje “Y” pues, el punto de origen O ha sido eliminado y
     asignado un valor arbitrario, la escala es inadecuada para resaltar el decrecimiento inflacionario
     de los dos últimos periodos.

     Ambas situaciones son erróneas o tendenciosas y se deben corregir asignando escalas apropiadas
     a los ejes y utilizando la siguiente regla:




     Donde:                Lx: Longitud del eje horizontal

                  Ly: Longitud del eje vertical


     “La longitud del eje vertical es igual a tres cuartos de la longitud del eje horizontal”.



     4.3 PRINCIPALES TIPOS DE GRÁFICOS

http://tifon.unalmed.edu.co/~pagudel/4grafica.html (3 de 12) [15/09/2002 7:41:55]
ESTADÍSTICA APLICADA 4. Representación Gráfica



     Existe una gran cantidad de gráficos para la representación de datos estadísticos, ya que de ellos
     depende el diseño artístico de quien los elabora, así como de su imaginación al combinar varios
     tipos de ellos, como forma de presentar una información.

     Entre los gráficos más comunes tenemos:


     4.3.1 Gráfico de Líneas: Usado básicamente para mostrar el comportamiento de una variable
     cuantitativa a través del tiempo. El gráfico de líneas consiste en segmentos rectilíneos unidos
     entre sí, los cuales resaltan las variaciones de la variable por unidad de tiempo. Para su
     construcción ha de procederse de la siguiente manera: en el eje de las ordenadas se marcan los
     puntos de acuerdo con la escala que se esté utilizando. En el caso de una escala aritmética,
     distancias iguales en el eje, representan distancias iguales en la variable.

                                             Variación de la Inflación en Colombia
                                                          1995 -2000




     El eje de la variable X se divide en unidades de tiempo iguales, teniendo presente el número de
     ítems que ha de presentarse, así como la longitud del eje. Es de anotar la conveniencia de
     mostrar la interrupción y acercamiento del eje a su origen cuando esto haya ocurrido.


     4.3.2 Gráfico de Líneas Compuesto: Cuando se tienen varias variables a representar, con el fin
     de establecer comparaciones entre ellas (siempre que su unidad de medida sea la misma); se
     utiliza plasmarlos en un sólo gráfico, el cual es el resultado de representar varias variables en un
     mismo plano.


                                    Variación de la Inflación y el Salario de la Hilacha




http://tifon.unalmed.edu.co/~pagudel/4grafica.html (4 de 12) [15/09/2002 7:41:55]
ESTADÍSTICA APLICADA 4. Representación Gráfica




        4.3.3 Gráfico de Barras: El gráfico de barras, como su nombre lo indica, está constituido por
        barras rectangulares de igual ancho, conservando la misma distancia de separación entre sí. Se
        utiliza básicamente para mostrar y comparar frecuencias de variables cualitativas o
        comportamientos en el tiempo, cuando el número de ítems es reducido.

                                      Número de Hijos de 50 Obreras en "La Hilacha"




        Éstos gráficos suelen ser de barras verticales, aunque se pueden utilizar de forma horizontal.


        4.3.4 Gráfico de Barras Compuesto

                                                Preferencias de Partido Según Sexo
    .
    .
...
    .
..

 http://tifon.unalmed.edu.co/~pagudel/4grafica.html (5 de 12) [15/09/2002 7:41:55]
ESTADÍSTICA APLICADA 4. Representación Gráfica

   .
   .




       4.3.5 Gráfico de Sectores Circulares Usualmente llamado gráfico de pastel, debido a su forma
       característica de una circunferencia dividida en cascos, por medio de radios que dan la sensación
       de un pastel tajado en porciones.

       Se usa para representar variables cualitativas en porcentajes o cifras absolutas cuando el número
       de ítems no es superior a 5 y se quiere resaltar uno de ellos. Para su construcción se procede de
       la siguiente forma: La circunferencia tiene en su interior 360 grados, los cuales hacemos
       corresponder al total de la información, es decir al 100%; luego, para determinar el número de
       grados correspondiente a cada componente se multiplica el porcentaje respectivo por 360 y se
       divide por 100, los cuales se miden con la ayuda de un transportador para formar los casquetes
       de los diferentes ítems.

                                       Estado Civil de 50 Operarias de "La Hilacha"




       4.3.6 Histograma de Frecuencias: Para la construcción de un histograma de frecuencias de


http://tifon.unalmed.edu.co/~pagudel/4grafica.html (6 de 12) [15/09/2002 7:41:55]
ESTADÍSTICA APLICADA 4. Representación Gráfica

     fácil interpretación y que no falsee la información, debe disponerse de una distribución de
     frecuencias por intervalos con amplitud igual para cada clase o intervalo. En el eje de las
     abscisas procedemos a representar los intervalos de la variable, y en el eje de las ordenadas las
     frecuencias de cada clase.

     El histograma se construye dibujando barras contiguas que tienen como base la amplitud de cada
     intervalo y como alturas las frecuencias respectivas.

                            Histograma de Frecuencias de la Resistencia de 100 Baldosas




     4.3.7 Polígono de Frecuencias

                                                     Resistencia de 100 Baldosas




http://tifon.unalmed.edu.co/~pagudel/4grafica.html (7 de 12) [15/09/2002 7:41:55]
ESTADÍSTICA APLICADA 4. Representación Gráfica




     Para la construcción de un polígono de frecuencias, se marcan los puntos medios de cada uno los
     intervalos en la parte superior de cada barra del histograma de frecuencias, los cuales se unen
     con segmentos de recta.


     4.3.8 Histograma de Frecuencias Acumuladas El histograma de frecuencias acumuladas
     también es obtenido a partir de una distribución de frecuencias, tomando en el eje horizontal las
     clases de la variable, y en el eje vertical las frecuencias acumuladas correspondientes a cada
     intervalo

                                                     Resistencia de 100 Baldosas




http://tifon.unalmed.edu.co/~pagudel/4grafica.html (8 de 12) [15/09/2002 7:41:55]
ESTADÍSTICA APLICADA 4. Representación Gráfica

                                                     Resistencia de 100 Baldosas




     CUESTIONARIO Y EJERCICIOS PROPUESTOS

     1. ¿Cuál es el objetivo de un gráfico?

     2. Describa los componentes de una gráfica .

     3. ¿Cuáles son las principales causas de distorsión de la información de un gráfico?

     4. ¿ Cuál debe de ser la proporción entre los ejes del plano cartesiano para la construcción de un
     gráfico?

     5. Para los ejercicios 4 y 5 del capitulo 3, numeral 3.2 construir:
      5.1 Un histograma de frecuencias
      5.2 Un polígono de frecuencias.
      5.3 Un histograma de frecuencias acumuladas
      5.4 Un polígono de frecuencias acumuladas

     6.

                                         Costo Promedio del Consumo de Energía
                                        de la Fábrica de Confecciones "La Hilacha".




http://tifon.unalmed.edu.co/~pagudel/4grafica.html (9 de 12) [15/09/2002 7:41:55]
ESTADÍSTICA APLICADA 4. Representación Gráfica




     Construir un gráfico de líneas para esta información.


     7.

                                Índice de Precios al Consumidor 1999-2001




http://tifon.unalmed.edu.co/~pagudel/4grafica.html (10 de 12) [15/09/2002 7:41:55]
ESTADÍSTICA APLICADA 4. Representación Gráfica




     Graficar : El valor del índice, la variación mensual y la variación anual, en función del tiempo.


     8. Resultados electorales en Colombia, en la elección de presidente de la república para el
     período 1986-1990:

        Liberal 58%
        Conservador 36%
        Otros 6%


http://tifon.unalmed.edu.co/~pagudel/4grafica.html (11 de 12) [15/09/2002 7:41:55]
ESTADÍSTICA APLICADA 4. Representación Gráfica

     Construir un gráfico apropiado para esta información.




                                                  ...                                ...




http://tifon.unalmed.edu.co/~pagudel/4grafica.html (12 de 12) [15/09/2002 7:41:55]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central




            5. Medidas de Tendencia Central
            En los capítulos anteriores, nos referimos a la clasificación, ordenación y presentación de
            datos estadísticos, limitando el análisis de la información a la interpretación porcentual de
            las distribuciones de frecuencia.

            El análisis estadístico propiamente dicho, parte de la búsqueda de parámetros sobre los
            cuales pueda recaer la representación de toda la información.

            Las medidas de tendencia central, llamadas así porque tienden a localizarse en el centro de
            la información, son de gran importancia en el manejo de las técnicas estadísticas, sin
            embargo, su interpretación no debe hacerse aisladamente de las medidas de dispersión, ya
            que la representabilidad de ellas está asociada con el grado de concentración de la
            información.

            Las principales medidas de tendencia central son:

            5.1 Media aritmética.
            5.2 Mediana
            5.3 Moda.


            5.1 MEDIA ARITMÉTICA

            Cotidiana e inconscientemente estamos utilizando la media aritmética. Cuando por ejemplo,
            decimos que un determinado fumador consume una cajetilla de cigarrillos diaria, no
            aseguramos que diariamente deba consumir exactamente los 20 cigarrillos que contiene un
            paquete sino que es el resultado de la observación, es decir, dicho sujeto puede consumir
            18, un día; 19 otro; 20, 21, 22; pero según nuestro criterio, el número de unidades estará
            alrededor de 20.

            Matemáticamente, la media aritmética se define como la suma de los valores observados
            dividida entre el número de observaciones.




                         :
                         Media aritmética de la variable X
                       : Valores de la variable X
                     n: Número de observaciones

http://tifon.unalmed.edu.co/~pagudel/5medidas.html (1 de 13) [15/09/2002 7:42:38]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central


                         : Signo de sumatoria, indica que se debe sumar




            Ejemplo: Cantidad de cigarrillos consumidos por un fumador en una semana.

            . . . Lunes:     18
                  Martes: 21
                  Miércoles: 22
                  Jueves:    21
                  Viernes: 20
                  Sábado: 19
                  Domingo: 19


            Entonces la media aritmética es.




            El fumador consume en promedio 20 cigarrillos diarios.

            Cuando la variable está agrupada en una distribución de frecuencias, la media aritmética se
            calcula por la fórmula:




                     Ejemplo:


http://tifon.unalmed.edu.co/~pagudel/5medidas.html (2 de 13) [15/09/2002 7:42:38]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central


                                               Cantidad de Cigarrillos Consumidos
                                              por un Fumador en una Semana Dada:




                     Ejemplo:

                     Calculo de La Media Aritmética.
                      El Salario/día de 50 Operarias




http://tifon.unalmed.edu.co/~pagudel/5medidas.html (3 de 13) [15/09/2002 7:42:38]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central




                     = 54.100 pesos/día

            Si la información está relacionada en una distribución de frecuencias por intervalos, se
            toman como valores de la variable las marcas de clase de los intervalos, entiéndase por
            marca de clase el punto medio entre los límites de cada clase o intervalo.

                     Ejemplo:

                                               Cálculo de La Media Aritmética de la
                                                   Resistencia de 100 Baldosas




http://tifon.unalmed.edu.co/~pagudel/5medidas.html (4 de 13) [15/09/2002 7:42:38]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central




                     La resistencia promedio de las 100 baldosas es de 448
                     Kg/Cm².


            5.1.1 Propiedades de la Media Aritmética

                     5.1.1.1 La suma de las diferencias de los datos con respecto a la media
                     aritmética es igual cero.




                     Demostración:



                     pero




http://tifon.unalmed.edu.co/~pagudel/5medidas.html (5 de 13) [15/09/2002 7:42:38]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central


                      Como




                      Ejemplo de Comprobación:

                      En el Ejercicio del Fumador Cuya Media Aritmética
                                    es de 20 Cigarrillos / día:




                      Para una distribución de frecuencias:

                                      Salario/día de 50 Operarias en
           .                     La Fábrica de Confecciones "La Hilacha"
           .
.....      .                                 (Miles De Pesos)
           .
           .




 http://tifon.unalmed.edu.co/~pagudel/5medidas.html (6 de 13) [15/09/2002 7:42:38]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central




                     5.1.1.2 La suma de las diferencias cuadráticas de los datos,
                     con respecto a la Media Aritmética, es mínima.

                     Quiere decir esta propiedad que cualquier otro parámetro p,
                     diferente a la media aritmética hace mayor la expresión:


                                           que

                     Para


                     Demostración:

                     Debemos, entonces, probar que:




http://tifon.unalmed.edu.co/~pagudel/5medidas.html (7 de 13) [15/09/2002 7:42:38]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central


                     veamos:




                     pero                                        (propiedad a.)

                     entonces:




                     como


                     luego




http://tifon.unalmed.edu.co/~pagudel/5medidas.html (8 de 13) [15/09/2002 7:42:38]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central




                     5.1.1.3 Si a cada uno de los resultados le sumamos o le
                     restamos una constante C , la Media Aritmética queda
                     alterada en esa constante.

                     Demostración:

                     Tenemos los datos x1,x2,.... ....xn . Cuya media aritmética
                     es

                     sea


                     La media aritmética de la nueva variable es:




                     entonces



                     En el ejemplo de las baldosas,                                 , a cada uno de los
                     datos restémosle una constante                                  .




http://tifon.unalmed.edu.co/~pagudel/5medidas.html (9 de 13) [15/09/2002 7:42:38]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central




                     5.1.1.4 Si cada uno de los datos se multiplica por una
                     constante k, entonces la media aritmética queda
                     multiplicada por esa constante:

                     Tenemos los datos x1,x2,.... ....xn cuya media aritmética es


                     sea
                                                                                     ,




                     Si multiplicamos cada una de las resistencias de las 100
                     baldosas por

                     una constante                            tenemos:



http://tifon.unalmed.edu.co/~pagudel/5medidas.html (10 de 13) [15/09/2002 7:42:38]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central




            5.1.2 Media Aritmética con Cambio de Origen y de Escala

            En estadística es usual la transformación de variables utilizando las dos últimas
            propiedades:

            C = un valor de tendencia central (media, mediana, moda o cualquier otro parámetro.

            k = generalmente la desviación standar, desviación media, la amplitud etc.

                     Sea

             .....                                para nuestro ejemplo C = 450, k = 100




http://tifon.unalmed.edu.co/~pagudel/5medidas.html (11 de 13) [15/09/2002 7:42:38]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central




            A la nueva variable “Y” le calculamos la media aritmética.




            5.1.3 Media Aritmética Ponderada

            Hemos visto que la Media Aritmética se calcula con base a la magnitud de los datos,
            otorgándoles igual importancia a cada uno de ellos. Sin embargo en muchas ocasiones la
            magnitud del dato esta ponderada con un determinado peso que lo afecta relativamente.

            La Media Aritmética ponderada tiene en cuenta la importancia relativa de cada uno de los
            datos, para lo cual la definimos con la siguiente expresión:




                     donde

                          : Media aritmética ponderada

http://tifon.unalmed.edu.co/~pagudel/5medidas.html (12 de 13) [15/09/2002 7:42:38]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central


                     xi: Valor de la variable X
                     wi: Ponderación del ítem xi


            Ejemplo:

                     Las calificaciones de un estudiante están conformadas por los siguientes
                     factores:

                     Un examen cuyo valor es 40% en el cual obtuvo una nota de 4.5, un trabajo
                     de consulta con ponderación del 10% y calificación de 1.0, una exposición
                     equivalente al 15% con nota de 2.0, y por último una investigación con valor
                     del 35% calificada con 3.5.




                     entonces la nota definitiva es:




                                                     ...                             ...




http://tifon.unalmed.edu.co/~pagudel/5medidas.html (13 de 13) [15/09/2002 7:42:38]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central




          5. Medidas de Tendencia Central

          5.2 LA MEDIANA

          Otra medida de tendencia central, utilizada principalmente en estadística no paramétrica, es
          la mediana, la cual no se basa en la magnitud de los datos, como la media aritmética, sino en
          la posición central que ocupa en el orden de su magnitud, dividiendo la información en dos
          partes iguales, dejando igual número de datos por encima y por debajo de ella.


          5.2.1 La Mediana Cuando los datos no están Agrupados en Intervalos.

          Partiendo de la información bruta, ordenamos los datos ascendente o descendentemente:

                                                                               se define




                    Mediana =                              , si n es impar ó




                    Mediana =                                         , si n es par


                    En el ejercicio de los cigarrillos, consumidos por un fumador tenemos lunes
                    18, martes 21, miércoles 22, jueves 21, viernes 20, sábado 19, y domingo 19.
                    Ordenando ascendentemente :



                    n, es impar, entonces




                    Veamos cuando n es par:

http://tifon.unalmed.edu.co/~pagudel/52medidas.html (1 de 4) [15/09/2002 7:42:50]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central




                     Consumo mensual de agua, en m3, por la fábrica de
                     confecciones “la hilacha”.

                     Enero= 10,. . . . Mayo=               14, . . . . Septiembre= 18,
                     Febrero= 12,      Junio=              19,         Octubre=    22,
                     Marzo= 15,        Julio=              17,         Noviembre= 15,
                     Abril= 18,        Agosto=             18,         Diciembre= 13




                     Mediana=


      .
      .              Como se puede observar, en este caso la mediana no es un
..... .              dato perteneciente a la información, es un parámetro que
      .              divide la información dejando el 50% por encima y el 50%
      .
                     por debajo de ella.


           5.2.2 La Mediana Cuando la Información se Encuentra Agrupada en Intervalos

           Si la información esta agrupada en intervalos iguales, entonces la mediana se calcula según
           la siguiente expresión:




                      Me:          Mediana
                      LI:          Límite inferior del intervalo donde se encuentra la mediana
                                   (intervalo mediano), el cual se determina observando en que clase
                                   se encuentra la posición n/2.)


 http://tifon.unalmed.edu.co/~pagudel/52medidas.html (2 de 4) [15/09/2002 7:42:50]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central


                     n:           Número de observaciones

                               : Frecuencia acumulada anterior al intervalo mediano
                          :       Frecuencia del intervalo mediano
                     A:           Amplitud del intervalo



                    Ejemplo:

                       Resistencia de 100 Baldosas de la Fabrica “De Las Casas”




                    en la columna de frecuencia acumulada advertimos que la
                    observación número 50 se halla en el cuarto intervalo 4.




                    Se concluye que el 50% de las baldosas resiste menos de
                    445.45 Kg/Cm2 y el 50% resiste mas de 445.45 Kg/Cm2.




http://tifon.unalmed.edu.co/~pagudel/52medidas.html (3 de 4) [15/09/2002 7:42:50]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central




                                                    ...                             ...




http://tifon.unalmed.edu.co/~pagudel/52medidas.html (4 de 4) [15/09/2002 7:42:50]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central




            5. Medidas de Tendencia Central

            5.3 LA MODA

            La moda, como su nombre lo indica, es el valor más común (de mayor frecuencia dentro de
            una distribución. Una información puede tener una moda y se llama unimodal, dos modas y
            se llama bimodal, o varias modas y llamarse multimodal. Sin embargo puede ocurrir que la
            información no posea moda.




            5.3.1 La Moda Cuando los datos no están Agrupados en Intervalos

                         Salario de 50 Operarias de la
                     Fabrica de Confecciones "La Hilacha"




            El valor que más veces se repite es 54 con una frecuencia de 12,
            entonces decimos que la moda es Mo = 54.000.00 pesos diarios.

http://tifon.unalmed.edu.co/~pagudel/53medidas.html (1 de 4) [15/09/2002 7:42:59]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central




                       Cantidad de Cigarrillos Consumidos
                      por un Fumador en una Semana Dada:




               Los valores de mayor frecuencia corresponden a 19 y 21, por lo tanto
               se trata de una distribución bimodal con Mo1=19 y Mo2=21


               5.3.2 Cálculo de la Moda Cuando la Información está Agrupada en Intervalos

               Cuando la información se encuentra agrupada en intervalos de igual tamaño la moda se
               calcula con la siguiente expresión.


           .                                                                ,        donde:
           .
.....      .
           .
           .
                       Mo:           Moda
                       LI:           Límite inferior del intervalo modal
                       fm:           Frecuencia de la clase modal
                       f(m-1)   :    Frecuencia de la clase premodal
                       f(m+1) :      Frecuencia de la clase posmodal
                       A   :         Amplitud de los intervalos



                      Ejemplo:

                                                      Resistencia de 100 Baldosas




 http://tifon.unalmed.edu.co/~pagudel/53medidas.html (2 de 4) [15/09/2002 7:42:59]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central




                     A pesar que el valor 444.44 no es un dato real de la información asumimos
                     ese parámetro como el de mayor ocurrencia.




            CUESTIONARIO Y EJERCICIOS PROPUESTOS

            1. ¿Que es una medida de tendencia central?

            2. ¿Cuales son las principales medidas de tendencia central?

            3. Defina : media aritmética mediana y moda.

            4. ¿Cuándo se utiliza la media aritmética ponderada?

            5. Enuncie las propiedades de la media aritmética

            6. Para cada información de los ejercicios del capitulo 3, calcular e interpretar la media
            aritmética, la mediana y la moda.

            7. La tripulación de un avión, en su itinerario compra los siguientes galones de gasolina:

            Ciudad X 200 galones a 4000 pesos el galón

http://tifon.unalmed.edu.co/~pagudel/53medidas.html (3 de 4) [15/09/2002 7:42:59]
ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central

            Ciudad Y 250 galones a 3500 pesos el galón
            Ciudad Z 300 galones a 3000 pesos el galón

            ¿Cuál es el costo promedio de la gasolina comprada?




                                                     ...                            ...




http://tifon.unalmed.edu.co/~pagudel/53medidas.html (4 de 4) [15/09/2002 7:42:59]
ESTADÍSTICA APLICADA 6. Medidas de Posición




          6. Medidas de Posición (Percentiles)
          En el Capitulo anterior, vimos lo referente a las medidas de tendencia central, las cuales, a su
          vez, son también medidas de posición ya que, de todas maneras ocupan un lugar dentro de la
          información.

          Nos ocuparemos ahora de ciertos parámetros posicionales muy útiles en la interpretación
          porcentual de la información.


          6.1 CUARTILES

          Las cuartillas o cuartiles son valores posicionales que dividen la información en cuatro partes
          iguales, el primer cuartil deja el 25% de la información por debajo de él, y el 75% por
          encima, el segundo cuartil, al igual que la mediana, divide la información en dos partes
          iguales, y por último el tercer cuartil deja el 75% por debajo de sí, y el 25% por encima.

          Gráficamente:




          Se necesita, entonces calcular tres cuartillas ya que la cuarta queda automáticamente
          determinada.



                                                           , donde:




                     k:            Oden del cuartil k = 1,2,3
                     LI:.......... Límite inferior del intervalo que contiene el cuartil
                     fa(i-1):      Frecuencia acumulada hasta el intervalo anterior al que   contiene
                                   el cuartil
                     fi :          Frecuencia del intervalo que contiene el cuartil
                     n:            Número de observaciones

http://tifon.unalmed.edu.co/~pagudel/6Percentiles.html (1 de 6) [15/09/2002 7:43:16]
ESTADÍSTICA APLICADA 6. Medidas de Posición


                     A:            Amplitud de los intervalos



                    Ejemplo:

                             Resistencia de 100 Baldosas de la Fabrica "De Las Casas"




                    Primer cuartil:



                    posición que debe ser ubicada en la frecuencia acumulada, para determinar que
                    clase contiene este cuartil.




                    El 25% de las baldosas resiste menos de 352.38 Kg/Cm2 y el 75% tiene una
                    resistencia superior.

                    Como el segundo cuartil es lo mismo que la mediana: Me=Q2=445.45Kg/Cm2

                    Calculemos la tercera cuartilla k=3




http://tifon.unalmed.edu.co/~pagudel/6Percentiles.html (2 de 6) [15/09/2002 7:43:16]
ESTADÍSTICA APLICADA 6. Medidas de Posición




                     El 75% de las baldosas tiene una resistencia inferior a 538..88 Kg/Cm2 y el
                     25% una resistencia superior.


           6.2 QUINTILES

           Los quintiles o quintillas dividen la información en cinco partes iguales, agrupándolas en
           porcentajes de 20, 40, 60, y 80 por ciento, en consecuencia debemos calcular cuatro
           parámetros:

           Gráficamente:



      .
      .
....
      .
.....
      .
      .




                     calculemos por ejemplo la segunda quintilla para el ejercicio que traemos:

                     k=2,




                     El 40% de las baldosas resiste menos de 415.15kg/cm2 y el 60% resiste más.




 http://tifon.unalmed.edu.co/~pagudel/6Percentiles.html (3 de 6) [15/09/2002 7:43:16]
ESTADÍSTICA APLICADA 6. Medidas de Posición


          6.3 DECILES

          Similarmente, los deciles o decillas dividen la información en diez partes iguales, en
          cantidades porcentuales de 10 en 10.




          6.4 CENTILES

          Obviamente los centiles dividen la información en 100 partes, lo cual facilita la interpretación
          porcentual de una distribución de frecuencias.




          6.5 RESUMEN

          En general para calcular cualquier percentil:



                                                            ,   donde:




                     r:             Número de partes en que se divide la información
                     k:             Orden del percentil k = 1,2,.....,r-1


http://tifon.unalmed.edu.co/~pagudel/6Percentiles.html (4 de 6) [15/09/2002 7:43:16]
ESTADÍSTICA APLICADA 6. Medidas de Posición


                     LI:            Límite inferior del intervalo que contiene el      percentil
                     fa(i-1):       Frecuencia acumulada hasta el intervalo anterior al que contiene el
                                    percentil
                     fi:            Frecuencia del intervalo que contiene el percentil
                      n:            Número de observaciones
                     A:             Amplitud de los intervalos


                    En nuestro ejercicio, si el gerente de la fabrica de baldosas desea ofrecer un
                    garantía de resistencia mínima. Basado en la muestra que se ha obtenido, si no
                    quiere remplazar ninguna pieza, lógicamente debe afirmar que el producto
                    resiste 100 o más Kg/Cm2. Pero si esta dispuesto a remplazar el 5% de su
                    producción, entonces:




                    Se debe dar una garantía de 210kg/cm2 de resistencia mínima.




          CUESTIONARIO Y EJERCICIOS PROPUESTOS

          1. ¿ Para qué se utilizan los percentiles ?

          2. ¿ En cuantas partes se divide la información con:

                    2.1 Los cuartiles
                    2.2 Los quintiles
                    2.3 Los deciles
                    2.4 Los centiles

          3. Para la información de los ejercicios 4 y 5 de la sección 3.2 calcular e interpretar ;

                    3.1 La primera y tercera cuartilla

http://tifon.unalmed.edu.co/~pagudel/6Percentiles.html (5 de 6) [15/09/2002 7:43:16]
ESTADÍSTICA APLICADA 6. Medidas de Posición

                    3.2 El segundo y cuarto quintil
                    3.3 ¿ Que porcentaje hay entre la primera y tercera quintilla ?
                    3.4 ¿ Que porcentaje hay entre la primera cuartilla y la segunda quintilla ?
                    3.5 ¿ Que porcentaje hay entre la tercera cuartilla y el noveno decil ?




                                                     ...                               ...




http://tifon.unalmed.edu.co/~pagudel/6Percentiles.html (6 de 6) [15/09/2002 7:43:16]
ESTADÍSTICA APLICADA 7. Medidas de Dispersión




       7. Medidas de Dispersión
       En el análisis estadístico no basta el cálculo e interpretación de las medidas de tendencia
       central o de posición, ya que, por ejemplo, cuando pretendemos representar toda una
       información con la media aritmética, no estamos siendo absolutamente fieles a la realidad, pues
       suelen existir datos extremos inferiores y superiores a la media aritmética, los cuales, en honor
       a la verdad, no están siendo bien representados por este parámetro.

       En dos informaciones con igual media aritmética, no significa este hecho, que las
       distribuciones sean exactamente iguales, por lo tanto, debemos analizar el grado de
       homogeneidad entre sus datos. Por ejemplo, los valores 5, 50, 95 tiene igual media aritmética,
       y mediana que los valores 49, 50,51; sin embargo, para la primera información la media
       aritmética , se encuentra muy alejada de los valores extremos 5 y 95, cosa que no ocurre con la
       segunda información que posee igual media aritmética y mediana, vemos entonces que la
       primera información es mas heterogénea o dispersa que la segunda.

       Para medir el grado de dispersión de una variable, se utilizan principalmente los siguientes
       indicadores:

       7.1 Rango o recorrido
       7.2 Desviación media
       7.3 Varianza y desviación típica o estándar
       7.4 Coeficiente de variabilidad.




       7.1 RANGO O RECORRIDO

       Es la medida de dispersión mas sencilla ya que solo considera los dos valores extremos de una
       colección de datos, sin embargo, su mayor utilización está en el campo de la estadística no
       paramétrica.

                 R = Xmax – Xmin

       Xmax, Xmin son el máximo y el mínimo valor de la variable X, respectivamente.

       En el ejemplo introductorio, vemos que el rango para la primera información es
       R1=95-5=90, mientras que R2=51-49=2, se hace pues manifiesta la gran dispersión de la
       primera información contra la homogeneidad de la segunda.




http://tifon.unalmed.edu.co/~pagudel/7dispersion.html (1 de 6) [15/09/2002 7:43:27]
ESTADÍSTICA APLICADA 7. Medidas de Dispersión




       7.2 DESVIACIÓN MEDIA

       La desviación media, mide la distancia absoluta promedio entre cada uno de los datos, y el
       parámetro que caracteriza la información. Usualmente se considera la desviación media con
       respecto a la media aritmética:



                                                    , donde




                  DM :         Desviación media
                  xi :         Diferentes valores de la variable X
                  fi :         Número de veces que se repite la observación xi
                               Media aritmética de la información
                  n:           Tamaño de la muestra.
                  m:           Número de agrupamientos o intervalos


                 Ejemplo:

                                Salario de 50 Operarias de la
                            Fabrica de Confecciones “La Hilacha”




http://tifon.unalmed.edu.co/~pagudel/7dispersion.html (2 de 6) [15/09/2002 7:43:27]
ESTADÍSTICA APLICADA 7. Medidas de Dispersión




                  1.400.00 es el error promedio que se comete al remplazar los ingresos diarios de
                  cada una de las 50 obreras por 54.100 pesos.




         7.3 VARIANZA

         El problema de los signos en la desviación media, es eludido tomando los valores absolutos de
         las diferencias de los datos con respecto a la media aritmética. Ahora bien, la varianza obvia
         los signos elevando las diferencias al cuadrado, lo cual resulta ser más elegante, aparte de que
         es supremamente útil en el ajuste de modelos estadísticos que generalmente conllevan formas
         cuadráticas.

         La varianza es uno de los parámetros más importantes en estadística paramétrica, se puede
         decir que, teniendo conocimiento de la varianza de una población, se ha avanzado mucho en el
         conocimiento de la población misma.

         Numéricamente definimos la varianza, como desviación cuadrática media de los datos con
         respecto a la media aritmética:



                                                      , donde:


                  S2 :     Varianza
     .            xi :     Valor de la variable X
     .                 :   Media aritmética de la información
....
     .            fi :     Frecuencia absoluta de la observación xi
.
     .
                  n:       Tamaño de la muestra.
     .
                  m:       Número de agrupamientos o intervalos




                                   Salario/dia de 50 Operarias en la Fábrica de
                                                   Confecciones
                                          “La Hilacha” (Miles de Pesos)



 http://tifon.unalmed.edu.co/~pagudel/7dispersion.html (3 de 6) [15/09/2002 7:43:27]
ESTADÍSTICA APLICADA 7. Medidas de Dispersión




                 Como los datos están expresados en miles de pesos y la varianza se encuentra en
                 forma cuadrática obtenemos una varianza de 3’210.000 pesos. Sin embargo para
                 una mejor comprensión debemos recurrir a la desviación típica o estándar
                 definida como la raíz cuadrada de la varianza:




                 El error estándar es de 1.791 pesos/diarios.


                 En el ejemplo de las baldosas:


                              Resistencia de 100 Baldosas de La Fábrica “De Las Casas”




http://tifon.unalmed.edu.co/~pagudel/7dispersion.html (4 de 6) [15/09/2002 7:43:27]
ESTADÍSTICA APLICADA 7. Medidas de Dispersión




       7.4 COEFICIENTE DE VARIABILIDAD

       Generalmente interesa establecer comparaciones de la dispersión, entre diferentes muestras que
       posean distintas magnitudes o unidades de medida.

       El coeficiente de variabilidad tiene en cuenta el valor de la media aritmética, para establecer un
       número relativo, que hace comparable el grado de dispersión entre dos o mas variables, y se
       define como:




       Comparemos la homogeneidad de las dos informaciones anteriores, las cuales tienen diferente
       unidad de medida.

                 para el salario:




                 para la resistencia

http://tifon.unalmed.edu.co/~pagudel/7dispersion.html (5 de 6) [15/09/2002 7:43:27]
ESTADÍSTICA APLICADA 7. Medidas de Dispersión




                 Concluimos que es mucho más dispersa la información correspondiente a la
                 resistencia de las baldosas.




       CUESTIONARIO Y EJERCICIOS PROPUESTOS

       1. ¿ Cuál es la utilidad de las medidas de dispersión?

       2. ¿ Cuales son las principales medidas de dispersión?

       3. ¿ Cuál es la medida adecuada para comparar la dispersión entre varias variables que posean
       diferente magnitud o diferente unidad de medida?

       4. Para cada una de las informaciones de los ejercicios de los capítulos anteriores, calcular e
       interpretar:

                 4.1 Rango
                 4.2 Desviación media
                 4.3 Coeficiente de variabilidad




                                                   ...                                ...




http://tifon.unalmed.edu.co/~pagudel/7dispersion.html (6 de 6) [15/09/2002 7:43:27]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




      8. Regresión y Correlación Lineal
      Hasta ahora hemos hecho la tabulación y el análisis para una sola variable. Pero los
      investigadores, además de analizar una información en forma individual, generalmente se
      interesan en establecer cruces y buscar relaciones entre diferentes variables.



      8.1 TABLAS DE DOBLE ENTRADA

      Para la presentación bidimensional de las variables "X, Y" se procede de la siguiente manera:

                  q   Se ordenan las variables "X, Y" respectivamente
                  qSe tabulan los valores X horizontalmente, y los valores Y
                   verticalmente.
            q   Se buscan las frecuencias para cada par ordenado (xi,yj).
            q   Se suma horizontalmente para obtener las frecuencias de “Y” fyj, y
                verticalmente para obtener las frecuencias de “X” fxi .

                xi :    Valores de la variable X, i=1,2,....m
                yj :    Valores de la variable Y, j=1,2,... k
                fxi : Frecuencia de la observación xi
                fyj : Frecuencia de la observación yj
                fij : Frecuencia conjunta de los valores (xi,yj)
                fa0xi : Frecuencia acumulada de la variable “X”, en el item i
                fayj : Frecuencia acumulada de la variable “Y”, en el item j
                frxi : Frecuencia relativa para la variable “X”, en el item i
                fryj : Frecuencia relativa para la variable “Y”, en el item j
                fraxi : Frecuencia relativa acumulada para la variable “X”
                frayj : Frecuencia relativa acumulada para la variable “Y”.




http://tifon.unalmed.edu.co/~pagudel/8regresion.html (1 de 11) [15/09/2002 7:44:09]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal


                                      Tabla de Doble Entrada para la
                                   Representación de dos Variables “X, Y”




      Como se puede advertir en la disposición de las frecuencias, la interpretación de la variable “Y”,
      puede hacerse analizando los relativos propios en forma horizontal, en tanto que el análisis de la
      variable “X” se hace en forma vertical.



                       Experiencia Laboral y Salario Diario de 50 Obreras de la Fábrica
                          de Confecciones “La Hilacha”. “X” : Experiencia en Años,
                                         “Y”: Salario Miles de Pesos




http://tifon.unalmed.edu.co/~pagudel/8regresion.html (2 de 11) [15/09/2002 7:44:09]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal

      Analizando los relativos para cada una de las variables podemos sacar, entre otras, las siguientes
      conclusiones:

            q   El 64% tiene una experiencia igual o inferior a 6 años.

            q   El 68% tiene una experiencia entre 5 y 7 años incluyendo sus extremos.

            q   El 60% gana 54.000 pesos diarios o menos.

            q   El 62% gana entre 53.000 y 55.000 pesos incluyendo sus extremos.

      Las tablas de doble entrada también pueden usarse para variables cualitativas, o combinarse
      variables cualitativas con cuantitativas.

                                        Estado Civil y Número de Hijos de
                                      50 Obreras de la Fabrica “La Hilacha"
                                      X: Estado Civil, Y : Número De Hijos.




      Se deja al lector la interpretación y análisis de esta tabla.



      8.2 CORRELACIÓN

      En el análisis conjunto para dos o más variables es básica la búsqueda del tipo y grado de la
      relación que pueda existir entre ellas, o si por el contrario, las variables sean independientes
      entre sí y la relación que puedan mostrar se debe únicamente al azar, o a través de terceras
      variables.

      El sondeo del tipo y grado de la correlación, parte desde la misma presunción del investigador,
      teniendo presente que la búsqueda de relaciones entre variables debe ser lógica, es decir
      relacionar lo que sea razonable y no datos cuya asociación sea desde cualquier punto de vista
      absurda.

http://tifon.unalmed.edu.co/~pagudel/8regresion.html (3 de 11) [15/09/2002 7:44:09]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal



      Veamos algunas variables susceptibles de relacionar:

            q   El peso y estatura de un grupo de adultos.

            q   Edad y peso de un grupo de niños.

            q   Ingresos y gastos de arrendamiento de un grupo de familias.

            q   Escolaridad e ingreso mensual de un grupo de empleados.

            q   Ventas y utilidades de un almacén de variedades.

      En el cuestionario aplicado a las obreras de la "Hilacha", parece que se indaga por ciertas
      variables que puedan explicar el salario devengado por ellas; como podría ser, los años de
      experiencia, los años de estudio, las ausencias al trabajo, la evaluación del desempeño por parte
      de su supervisor, amén de otras variables que pueden tener influencia en la asignación salarial.

      Para fortalecer el indicio de correlación inicial, se grafica cada uno de los
      pares ordenados de las variables (xi,yj) en un plano cartesiano, para
      observar la “nube de puntos” o diagrama de dispersión, donde se advierte
      la tendencia o no, de la información representada.




http://tifon.unalmed.edu.co/~pagudel/8regresion.html (4 de 11) [15/09/2002 7:44:09]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




      A pesar de la ilustración visual que ofrecen las gráficas, solo podemos
      percibir la tendencia, mas no el grado o fortaleza de la relación, entre la
      variable independiente “X” y la variable dependiente “Y”.

      Para cuantificar la calidad de la dependencia, entre las dos variables, el
      indicador mas acostumbrado es el Coeficiente de correlación, definido
      como:



                                   , donde:




                r : Coeficiente de correlación entre “X” y “Y”
                Sx: Desviación típica de “X”
                Sy: Desciacion típica de “Y”
                Sx,y : Covarianza entre “X” y “Y”




http://tifon.unalmed.edu.co/~pagudel/8regresion.html (5 de 11) [15/09/2002 7:44:09]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal



     .
     .
....
     .
.
     .
     .




 http://tifon.unalmed.edu.co/~pagudel/8regresion.html (6 de 11) [15/09/2002 7:44:09]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




      En la práctica, cuando no tenemos la información agrupada en una tabla de
      doble entrada, asumimos que cada observación bivariada tiene frecuencia
      unitaria, entonces r se convierte en:




                Tabla de Trabajo para el Calculo de L Coeficiente de Correlacion




http://tifon.unalmed.edu.co/~pagudel/8regresion.html (7 de 11) [15/09/2002 7:44:09]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




      El coeficiente de correlación, es un indicador del grado de la relación entre las dos variables, el
      cual oscila en el intervalo cerrado                        , es decir,          .

      Cuando r toma un valor extremo, ya sea r=1 ó r=-1 existe una correlación perfecta positiva o
      negativa según el signo, como lo podemos corroborar en el siguiente ejemplo:



                     Aspiración Salarial, de Acuerdo a La Experiencia de las Obreras de la
                                    Fabrica de Confecciones “La Hilacha”




                                                                ,   Correlación perfecta positiva



      Sin embargo, no todas las relaciones son tan ideales, en el común de los
      casos –1< r <1. Empíricamente se afirma que:

                               1.   Si                Correlación perfecta
                               2.   Si                  ó                Correlación excelente
                               3.   Si                    ó                Correlación buena
                               4.   Si                     ó                Correlación regular
                               5.   Si                      ó                 Correlación mala
                               6.   Si                        No hay correlación
http://tifon.unalmed.edu.co/~pagudel/8regresion.html (8 de 11) [15/09/2002 7:44:09]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




      Existen desde luego, pruebas estadísticas que miden la bondad de un
      coeficiente de correlación con un determinado nivel de confiafilidad, pero
      no son tema de este curso.

                       Salario Actual y Años de Experiencia de 50
                           Obreras de la Fabrica “La Hilacha”
                   Exp Mil/dia             Exp Mil/dia

                 Años X         Y      XYX2 Y2 Años X                  Y        XY X2      Y2

                     4         52      208 16 2704          8         57        456   64   3249

                     5         54      270 25 2916          6         54        324   36   2916

                     7         55      385 49 3025          6         55        330   36   3025

                     6         54      324 36 2916          5         53        265   25   2809

                     5         53      265 25 2809          7         55        385   49   3025

                     7         56      392 49 3136          8         56        448   64   3136

                     5         54      270 25 2916          5         53        265   25   2809

                     9         58      522 81 3364          9         57        513   81   3249

                     3         51      153 9 2601           6         54        324   36   2916

                     6         54      324 36 2916          5         53        265   25   2809

                     7         54      378 49 2916          2         50        100   4    2500

                     3         51      153 9 2601           6         55        330   36   3025

                     6         54      324 36 2916          4         52        208   16   2704

                     7         55      385 49 3025          5         53        265   25   2809

                     6         54      324 36 2916          6         54        324   36   2916




http://tifon.unalmed.edu.co/~pagudel/8regresion.html (9 de 11) [15/09/2002 7:44:09]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal

                     8         56      448 64 3136          4         52       208     16   2704

                     4         52      208 16 2704          8         57       456     64   3249

                     6         54      324 36 2916          7         56       392     49   3136

                     5         53      265 25 2809          3         51       153     9    2601

                     7         55      385 49 3025          8         58       464     64   3364

                     7         55      385 49 3025          6         55       330     36   3025

                     7         55      385 49 3025          5         53       265     25   2809

                     4         52      208 16 2704          6         54       324     36   2916

                     7         55      385 49 3025          6         53       318     36   2809

                     5         53      265 25 2809          7         56       392     49   3136

                                            TOTAL 294                2705 160391850146501




      Se vislumbra una relación positiva, con coeficiente de correlación:




      Entre la experiencia y el salario actual hay una excelente correlación
      positiva.

      Si escudriñamos en la magnitud de las relaciones entre las diferentes
      variables cuantitativas, que se han indagado a las obreras de “LA
      HILACHA” encontramos los siguientes coeficientes de correlación:

http://tifon.unalmed.edu.co/~pagudel/8regresion.html (10 de 11) [15/09/2002 7:44:09]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




      En el problema que nos ocupa, la variable salario/día tiene una excelente
      correlación positiva, con los años de experiencia, y una buena correlación
      directa con la calificación y la escolaridad, empero hay una buena relación
      inversa, con la variable ausencias al trabajo.




                                                  ...                                  ...




http://tifon.unalmed.edu.co/~pagudel/8regresion.html (11 de 11) [15/09/2002 7:44:09]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




     8. Regresión y Correlación Lineal

     8.3 REGRESIÓN LINEAL

     Teniendo ya conocimiento de la intensidad de la correlación entre las variables, manifestada a
     través del diagrama de dispersión, y el coeficiente de correlación, podemos ensayar el ajuste de
     un modelo estadístico que se adapte mejor a las n observaciones; lo que lleva por nombre
     regresión. Uno de los procedimientos muy comunes en el ajuste regresivo es el método de los
     mínimos cuadrados, que produce estimaciones con menor error cuadrático promedio



     8.3.1 Ajuste Rectilíneo (Método de los Mínimos Cuadrados)

     La forma general de una ecuación de línea recta es:

                                    con:

               X:     Variable independiente
               Y:     Variable dependiente
               a :    Término independiente o intercepto
               b:     Coeficiente de X

     Debemos establecer los parámetro “a” y “b” de la ecuación para poder
     expresar los valores de la variable Y en función de los valores de la variable
     X, esto es:




     multipliquemos cada una de estas ecuaciones por su respectivo valor de X




http://tifon.unalmed.edu.co/~pagudel/83regresion.html (1 de 17) [15/09/2002 7:45:13]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




     Las ecuaciones (1) y (2) son llamadas ecuaciones normales de la línea
     recta, de donde se pueden despejar los parámetros a, b en función de los
     datos originales.

               De (1) tenemos:




               Remplazando (3) en (2):




http://tifon.unalmed.edu.co/~pagudel/83regresion.html (2 de 17) [15/09/2002 7:45:13]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




     Las estimaciones para los parámetros son:




     El gorrito “ ^ ” colocado sobre el parámetro indica estimaciones
     fundamentadas, en los datos muestrales.

     Para ajustar el modelo rectilíneo a los ingresos diarios actuales explicados
     por los años de experiencia, en la “Hilacha”, aprovechamos los totales ya
     calculados en el coeficiente de correlación:




     Como quiera que los items de la variable salario están en unidades de mil
     pesos, la ecuación de pronóstico definitiva es:




http://tifon.unalmed.edu.co/~pagudel/83regresion.html (3 de 17) [15/09/2002 7:45:13]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




                               Salario Real y Estimado Vs. Experiencia




     Insistimos en la existencia de pruebas estadísticas, que miden la bondad de los parámetros
     estimados y del modelo en sí, a estas alturas de nuestro documento no tenemos las herramientas
     para aplicarlas, sin embargo en el mercado hay software estadístico, que calcula los parámetros,
     ajusta los modelos y efectúa las respectivas pruebas, sin exigir al usuario grandes conocimientos
     de estadística matemática. Se debe tener cuidado, eso sí, en la interpretación adecuada de los
     resultados.

     El siguiente es el reporte parcial producido por el programa de computador Statgraphics plus :


http://tifon.unalmed.edu.co/~pagudel/83regresion.html (4 de 17) [15/09/2002 7:45:14]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




     El programa calcula:

                                     y
                                     y consecuentemente el modelo

                                                                                   ,

     el paquete hace también las pruebas t student para la hipótesis nula H0 :
     a=0 vs la hipótesis alternativa H1 :        y H0 : b = 0 vs H1 :       , dado
     que el valor “p” para ambos casos p= 0.0000, con una confiabilidad
     superior al 99% se rechazan ambas hipótesis de nulidad, a favor de las
     hipótesis alternativas. En cuanto al valor p = 0.0000 (para la prueba F) en
     la tabla de análisis de varianza, también se interpreta la validez del modelo
     con un nivel de confiabilidad superior al 99%.

     De otro lado corrobora una correlación positiva excelente r=0.957578 y un
     coeficiente de determinación R-cuadrado, de 91.6956% que indica el
     porcentaje de la variable salario explicado por la variable experiencia.

     El coficiente de determinación R2 viene expresado como:



http://tifon.unalmed.edu.co/~pagudel/83regresion.html (5 de 17) [15/09/2002 7:45:14]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




               Aprovechemos este pequeño paréntesis, para decir que hoy la
               tecnología informática ha hecho posible la formulación y
               solución de complejos modelos multivariados, que constan de
               cientos de variables, que en años recientes solo se podían
               teorizar.

               En la búsqueda de las variables que explican la variable salario,
               en la fabrica “La Hilacha” obtenemos el siguiente reporte del
               programa Statgraphics plus:




http://tifon.unalmed.edu.co/~pagudel/83regresion.html (6 de 17) [15/09/2002 7:45:14]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




     El software, analiza los diferentes valores “p” y descalifica la variable
     edad, al nivel del 90% de confidencialidad, debido a que p=0.1451 hace
     que el coeficiente de esta variable no sea significante dentro del modelo.




http://tifon.unalmed.edu.co/~pagudel/83regresion.html (7 de 17) [15/09/2002 7:45:14]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




    .
    .
...
    .
..
    .
    .



        Eliminada la variable edad, encontramos un modelo válido con un nivel de
        confianza superior al 99% cuyos coeficientes son admitidos con una
        confiabilidad superior al 95%.




        R-cuadrado para este modelo es 95.58% , es decir el porcentaje del salario
        que está siendo explicado por las variables independientes, es ligeramente
        menor al R-cuadrado anterior (95.8%), sacrificio insignificante cuando se
        trata de reducir la complejidad del modelo.

        Veamos las estimaciones producidas por la ecuación



 http://tifon.unalmed.edu.co/~pagudel/83regresion.html (8 de 17) [15/09/2002 7:45:14]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal


                                     Miles                estim
                hijosExpEsco-              GastauseCalif         Error
                                     $/dia               salario




                  2      4      5       52      5      3      1     52.51         0.51

                  2      5      5       54      6      2      1     53.23 -       0.77

                  3      7      4       55      8      1      4     55.25         0.25

                  3      6      4       54      9      1      3     54.36         0.36

                  1      5      3       53      3      2      2     52.91 -       0.09

                  0      7      8       56      1      1      4     55.84 -       0.16

                  1      5      3       54      2      2      3     53.26 -       0.74

                  0      9      9       58      0      0      5     57.79 -       0.21

                  3      3      3       51     10      3      1     51.35         0.35

                  3      6      3       54      9      2      2     53.59 -       0.41

                  1      7      6       54      3      2      3     54.98         0.98

                  2      3      3       51      6      5      1     50.82 -       0.18

                  0      6      7       54      1      1      2     54.55         0.55

                  0      7      7       55      1      1      3     55.34         0.34

                  0      6      5       54      2      2      3     53.93 -       0.07

                  0      8      8       56      3      1      4     56.18         0.18

                  1      4      3       52      2      3      2     52.20         0.20

                  2      6      4       54      5      2      2     53.87 -       0.13




http://tifon.unalmed.edu.co/~pagudel/83regresion.html (9 de 17) [15/09/2002 7:45:14]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal

                  2      5      4       53      5      3      2     53.05         0.05

                  0      7      9       55      4      2      3     55.26         0.26

                  0      7      8       55      4      1      3     55.29         0.29

                  1      7      6       55      4      2      3     54.89 -       0.11

                  2      4      3       52      7      3      1     51.82 -       0.18

                  1      7      6       55      3      1      3     55.26         0.26

                  3      5      3       53      7      2      2     53.25         0.25

                  0      8      9       57      3      1      5     56.67 -       0.33

                  4      6      5       54     13      2      3     54.30         0.30

                  3      6      5       55      8      2      3     54.43 -       0.57

                  3      5      4       53      8      2      2     53.40         0.40

                  3      7      4       55      9      0      3     55.18         0.18

                  1      8      6       56      4      0      4     56.23         0.23

                  2      5      4       53      6      2      2     53.23         0.23

                  0      9      8       57      2      0      4     57.10         0.10

                  1      6      5       54      3      1      3     54.47         0.47

                  2      5      3       53      6      2      3     53.23         0.23

                  2      2      3       50      7      5      1     50.18         0.18

                  2      6      5       55      6      0      3     54.82 -       0.18

                  2      4      3       52      6      4      1     51.64 -       0.36

                  2      5      4       53      8      3      1     52.50 -       0.50



http://tifon.unalmed.edu.co/~pagudel/83regresion.html (10 de 17) [15/09/2002 7:45:14]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal

                  2      6      4       54      8      1      2     53.85 -       0.15

                  3      4      3       52     11      4      1     51.51 -       0.49

                  1      8      9       57      3      0      4     57.07         0.07

                  0      7      8       56      5      0      4     55.72 -       0.28

                  2      3      3       51      6      4      1     51.10         0.10

                  1      8      9       58      3      0      4     57.07 -       0.93

                  2      6      5       55      4      0      2     54.77 -       0.23

                  1      5      5       53      2      4      1     52.71 -       0.29

                  2      6      4       54      3      1      1     54.10         0.10

                  2      6      5       53      7      3      1     53.39         0.39

                  1      7      6       56      3      0      3     55.54 -       0.46




     8.3.2 Ajuste Parabólico (Método Mínimos Cuadrados)

     Suele suceder que al dibujar la nube de puntos correspondiente a n
     observaciones bivariante, se observa una tendencia no rectilínea, pero a la
     cual se le puede ajustar un modelo teórico conocido.

     Dentro de la familia de modelos, es de aplicación común el ajuste regresivo
     polinomial de grado s “       ”. Similarmente con el procedimiento seguido
     en el ajuste rectilíneo, vamos a encontrar las ecuaciones normales par una
     parábola, de forma general
     es decir                  ,                 , .......,              . Si
     cada una de estas ecuaciones la multiplicamos por su respectivo valor de x,
     y repetimos la acción tenemos:




http://tifon.unalmed.edu.co/~pagudel/83regresion.html (11 de 17) [15/09/2002 7:45:14]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




               sumando se obtienen las siguientes ecuaciones normales

                                                               (1)

                                                                          (2)

                                                                                (3)


     De donde se pueden estimar los parámetros de la parábola “                         ”.

               Ejemplo: En un experimento agropecuario, se toma una muestra
               de 15 unidades de una variedad de árbol frutal, se observa el
               rendimiento en frutos de acuerdo con la cantidad de fertilizante
               utilizado:




     Resolviendo se obtienen las siguientes estimaciones de los parámetros:

                                 ,                  ,




http://tifon.unalmed.edu.co/~pagudel/83regresion.html (12 de 17) [15/09/2002 7:45:14]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




     El programa Statgraphics produce el siguiente reporte:




http://tifon.unalmed.edu.co/~pagudel/83regresion.html (13 de 17) [15/09/2002 7:45:14]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




http://tifon.unalmed.edu.co/~pagudel/83regresion.html (14 de 17) [15/09/2002 7:45:14]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal

                                                Parábola Ajustada




     CUESTIONARIO Y EJERCICIOS PROPUESTOS

     1.

                       Ingresos y Gastos en Arrendamiento de un Grupo
                                de Familias; en Miles de Pesos.




http://tifon.unalmed.edu.co/~pagudel/83regresion.html (15 de 17) [15/09/2002 7:45:14]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal




               1.1 Calcular el coeficiente de correlación e interpretarlo.
               1.2 Ajustar el modelo adecuado para esta información.
               1.3 ¿ Cuánto se estima, debe pagar una familia con ingreso mensual de 270.000
               pesos?

     2. ¿ Que es un coeficiente de correlación ?
     3. Cuando hay correlación:

               3.1 Perfecta
               3.2 Excelente
               3.3 Buena

http://tifon.unalmed.edu.co/~pagudel/83regresion.html (16 de 17) [15/09/2002 7:45:14]
ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal



     4. ¿ Cuales son las ecuaciones normales de la línea recta ?




                                                  ...                                   ...




http://tifon.unalmed.edu.co/~pagudel/83regresion.html (17 de 17) [15/09/2002 7:45:14]
ESTADÍSTICA APLICADA 9. Tasas e Índices




            9. Tasas e Índices
            Como ya se dijo, el análisis de un fenómeno basado en las cifras absolutas, ofrece una idea
            general de su tendencia o comportamiento; pero para efectos de establecer comparaciones
            adecuadas del mismo fenómeno con otra región, o su ocurrencia a través del tiempo, se
            utilizan ciertos indicadores denominados tasas e índices



            9.1 TASA

            Una tasa es la resultante de una fracción, en donde el numerador está contenido dentro del
            denominador:

                      Ejemplos:




                      D: Tasa de deserción escolar.
                      R: Número de retiros durante el año.
                      M: Número total de matriculados durante el año.




                      TE:   Tasa de empleo.
                      PEAO: Población económicamente activa ocupada.
                      PEA : Población económicamente activa.

            Valga anotar que a las tasas se les debe multiplicar por una constante k, la cual
            generalmente es 100, 1000 o múltiplos de ellos, con el fin de convertirlos en porcentajes,
            por millares etc.

            En demografía, las tasas son de uso frecuente, entre otras, mencionaremos las siguientes:




                      Donde:



http://tifon.unalmed.edu.co/~pagudel/9tasas.html (1 de 10) [15/09/2002 7:45:36]
ESTADÍSTICA APLICADA 9. Tasas e Índices

                      TM : Tasa de mortalidad.
                      D : Número de defunciones en un periodo y área dada.
                      P : Población total en esa área a mitad del periodo.




                      Donde

                      TN : Tasa de natalidad
                      N : Número de nacidos vivos ocurridos en un periodo y área dada
                      P : Población total del área a mitad del periodo.




                      Donde:

                      TC : Tasa de nupcialidad.
                      M : Número de matrimonios efectuados en un periodo y área dada.
                      P : Total de la población a mitad del periodo.

            El siguiente cuadro muestra la evolución de la tasa de desempleo en Colombia, resultados
            obtenidos de la encuesta nacional de hogares para los periodos comprendidos entre los años
            1.990 –2.000

                                                 Tasas de Desempleo en Colombia
                                                           1.990-2.000




http://tifon.unalmed.edu.co/~pagudel/9tasas.html (2 de 10) [15/09/2002 7:45:36]
ESTADÍSTICA APLICADA 9. Tasas e Índices




            9.2 ÍNDICE

            Un número índice, como comúnmente se le llama, es un indicador de los cambios relativos
            de una o más variables a través del tiempo.

            Entre las principales aplicaciones de los números índice, está la de establecer
            comparaciones entre los indicadores de las diferentes zonas geográficas, profesiones ,
            grupos étnicos etc.

            Para la construcción de un número índice, se procede ante todo, a fijar el periodo de
            referencia o "periodo base" de la serie temporal, teniendo presente que debe ser un periodo
            normal, esto es, que no se hayan presentado situaciones fortuitas (guerras, terremotos,
            incendios u otro tipo de imprevisto), que incidan en el valor de la variable para ese periodo.
            Además debe considerarse un periodo reciente que haga comparables los diferentes valores
            de las variables consideradas.

http://tifon.unalmed.edu.co/~pagudel/9tasas.html (3 de 10) [15/09/2002 7:45:36]
ESTADÍSTICA APLICADA 9. Tasas e Índices




            9.2.1 Índice Simple

            Un número índice simple, es aquel que se calcula para una sola variable, dividiendo cada
            uno de los valores de la serie cronológica, por el valor correspondiente al "periodo base"
            previamente definido.

                      9.2.1.1 Índice de Base Fija


                                           , si la variable se refiere a precios
                                           , si la variable se refiere a cantidades

                      Ip : Índice de precios
                      Pn: Precio del artículo en el periodo n
                      P0 : Precio del artículo en el periodo base
                      Iq : Índice de cantidades
                      qn : Cantidad del articulo en el periodo n
                      q0 : Cantidad del articulo en el periodo bas



                        Precio Promedio del Kilovatio/Hora 1995-2001
                      Pagado por la Fabrica de Confecciones “La Hilacha”




                                               Consumo Promedio de Energía en
                                           La Fabrica de Confecciones “La Hilacha”

http://tifon.unalmed.edu.co/~pagudel/9tasas.html (4 de 10) [15/09/2002 7:45:36]
ESTADÍSTICA APLICADA 9. Tasas e Índices




                       En la primera tabla hemos calculado los índices de precios simples, con base
                       en 1995 y 1998 respectivamente, pero no se han tenido en cuenta las
                       cantidades, mientras que en la segunda tabla se han calculado los índices de
                       cantidades sin considerar los precios.

                       Calculemos, ahora los índices del valor relativo, que considere tanto los
           .
                       precios como las cantidades:
           .
.....      .
           .
           .

                                          Precio y Consumo Promedio de Energía en
                                          La Fabrica de Confecciones “La Hilacha”




                       9.2.1.2 Índice de Base Móvil



 http://tifon.unalmed.edu.co/~pagudel/9tasas.html (5 de 10) [15/09/2002 7:45:36]
ESTADÍSTICA APLICADA 9. Tasas e Índices

                      Solo hemos considerado, los índices simples de base fija, esto es, con un
                      periodo base determinado. Es común que interese comparar un índice con el
                      índice del periodo inmediatamente anterior, en consecuencia se debe fijar el
                      periodo base en el periodo anterior al referenciado, y así sucesivamente hasta
                      completar la serie, al cual se le nombra índice de base móvil.

                                         Variaciones del Salario Promedio Diario en
                                         La Fabrica de Confecciones “La Hilacha”




            9.2.2 Índices Compuestos (Globales)

            Un número índice compuesto, muestra los cambios de un conjunto de variables, auque sus
            unidades de medidas, cantidades y precios, en el tiempo, sean diferentes entre sí. Cuando
            hablamos por ejemplo de los índices indicadores del costo de la canasta familiar, se toman
            en cuenta muchos artículos cuyos consumos inciden en el costo de vida, con una
            ponderación o importancia diferente en cada caso. Colectivamente no es lo mismo un
            cambio en el precio de la carne, huevos o leche, que un cambio en el precio de los
            perfumes, joyas o cualquier otro artículo suntuoso.



                      9.2.2.1 Índice de Laspeyres

                      Este índice asume como ponderaciones, en el cálculo del índice global, las
                      cantidades de los artículos en el periodo base.




                      Donde:



http://tifon.unalmed.edu.co/~pagudel/9tasas.html (6 de 10) [15/09/2002 7:45:36]
ESTADÍSTICA APLICADA 9. Tasas e Índices

                      PL :   Índice de precios global (Laspeyres).
                      q0 :   Cantidad del periodo base.
                      p0 :   Precio del artículo en el periodo base
                      pn :   Precio del artículo en el periodo n




                                             Índice de Precios de Cuatro Artículos




                      9.2.2.2 Índice de Paasche

                      El estadístico Paasche, sugiere que las ponderaciones sean las cantidades
                      utilizadas en el periodo n. Se obtiene entonces el siguiente indicador:




                      Este índice, es poco utilizado debido al dinamismo de qn , necesitando nuevas
                      ponderaciones cada vez que se cambia de periodo.


                      9.2.2.3 Índice ideal de Fisher

                      Se propone el promedio geométrico entre los dos índices anteriores:




                      Una de las principales aplicaciones de los índices de precios, es la de medir la
                      deflación e inflación, que es la variación que existe en el poder adquisitivo

http://tifon.unalmed.edu.co/~pagudel/9tasas.html (7 de 10) [15/09/2002 7:45:36]
ESTADÍSTICA APLICADA 9. Tasas e Índices


                      del dinero. También podemos utilizar, los índices de precios al consumidor
                      para determinar el salario real de un grupo de personas.




                            Salario Promedio Nominal y Real en la Fabrica “La Hilacha”




                      Dado el deterioro del salario real en los dos últimos años debería considerarse
                      un generoso aumento.



            CUESTIONARIO Y EJERCICIOS PROPUESTOS

            1. ¿Qué es una tasa?

            2. ¿Qué es un índice?

            3. ¿Para qué se utilizan los números índices?

            4. ¿Cómo se construye un número índice simple?

            5. ¿Cómo se construye un número índice compuesto?

            6. Los precios y las cantidades de un articulo X vienen dados en la siguiente tabla:




http://tifon.unalmed.edu.co/~pagudel/9tasas.html (8 de 10) [15/09/2002 7:45:36]
ESTADÍSTICA APLICADA 9. Tasas e Índices




                      Tomando como año base 1995, calcular para los otros años:

                      6.1 Los índices de precios.
                      6.2 Los índices de cantidades.
                      6.3 Los índices de valores.

            7. A continuación se relacionan los precios y las cantidades del año base, de cuatro
            artículos diferentes:




            Calcular el índice de Laspeyres

            8.

                                 Salario Mínimo Legal Diario en Colombia e Índice
                                 de Precios al Consumidor para el Año 2.000-2001
                                         (Periodo Base Diciembre de 1998).




http://tifon.unalmed.edu.co/~pagudel/9tasas.html (9 de 10) [15/09/2002 7:45:36]
ESTADÍSTICA APLICADA 9. Tasas e Índices




            Calcular el salario real para cada uno de los meses.




                                                     ...                           ...




http://tifon.unalmed.edu.co/~pagudel/9tasas.html (10 de 10) [15/09/2002 7:45:36]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




            10. Nociones de Probabilidad
            (Eventos)
                                                                             “Los planes corresponden al hombre,
                                                                                      las probabilidades a Dios.”
                                                                                                  Proverbio chino


            Todo experimento debe ser susceptible de repeticiones conservando las mismas condiciones
            con las cuales se realizó su antecesor. Esto es, el investigador debe fijar esas condiciones,
            bajo las cuales se realizarán las sucesivas repeticiones del experimento y conservarlas en
            cada una de las réplicas, de tal manera que sus inferencias resulten lo más fiables posible.
            Sin embargo, aun así no siempre se obtienen los mismos resultados, pues a veces participan
            factores incontrolables que aparentemente no obedecen a ninguna causa natural, ni
            intervención humana intencionada y que denominamos Azar o casualidad.

            Desde el punto de vista de la presencia o no de la contingencia en los resultados, si
            definimos experimentos determinísticos y experimentos aleatorios:

            Experimento determinístico es aquel en el cual, bajo las mismas condiciones
            experimentales, las repeticiones del experimento absolutamente todas, siempre producen el
            mismo resultado.

            El experimento Aleatorio, conservando las mismas condiciones experimentales, los
            resultados no se pueden predecir, con exactitud, para ninguna repetición.

            Sí, por ejemplo lanzamos una moneda al aire para observar de cual lado cae, no podemos
            pronosticar con certeza, si se presenta sello o se presenta cara. Tenemos entonces presente
            el componente del azar y por consiguiente un experimento aleatorio. No ocurriría igual si la
            moneda estuviese diseñada igual por ambos lados y por consiguiente sería un experimento
            determinístico:

            Todos los posibles resultados de un experimento aleatorio, conforman
            el espacio muestral que representaremos por “S”, a cualquier
            subconjunto del espacio muestral se le denomina suceso o evento
            aleatorio y lo denotaremos con “E”.        . Cada uno de los elementos
            del espacio muestral se denomina evento elemental “e”:

            Definiciones sobre Sucesos:

                  q   El evento                ocurre cuando se verifica uno de los dos, o ambos sucesos.

http://tifon.unalmed.edu.co/~pagudel/10Probabilidad.html (1 de 6) [15/09/2002 7:46:03]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)

                  q   El evento                se presenta cuando ocurren los dos simultáneamente.

            Evento o suceso elemental

            Evento o suceso seguro Siempre se presenta en un experimento: S

            Evento o suceso imposible nunca ocurre dentro un experimento: •

            Eventos incompatibles Dos o más sucesos son incompatibles o excluyentes cuando la
            ocurrencia de uno impide la presencia de los otros. Si E1, E2 excluyentes entonces


            Sucesos complementarios o contrarios Dos sucesos son complementarios cuando son
            mutuamente excluyentes y su unión conforma: el espacio muestral:        son
            complementarios                 .             . Si E es un evento seguro, entonces E=S




            En general, los sucesos o eventos, tienen las mismas propiedades de los conjuntos.

            Propiedades de los eventos:


http://tifon.unalmed.edu.co/~pagudel/10Probabilidad.html (2 de 6) [15/09/2002 7:46:03]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




                   q   El complemento de la unión de dos sucesos es la intersección de sus complementos:

           .       q   El complemento de la intersección de dos sucesos es la unión de sus complementos:
           .
.....      .
           .
           .           Ejemplo:

                       Lanzamos una moneda para observar, si cae del lado de cara o del lado de
                       sello:

                             q   Espacio muestral
                             q   Eventos elementales         ,
                             q   Evento seguro
                             q   Evento imposible
                             q   E1 y E2 son eventos excluyentes.


                       Ejemplo:

                       Lanzar un par de dados, marcados c/u con los números 1,2,3,4,5 y 6

                       Espacio muestral




 http://tifon.unalmed.edu.co/~pagudel/10Probabilidad.html (3 de 6) [15/09/2002 7:46:03]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




                      E1: (suma igual a 2):                             suceso elemental
                      E2: (suma igual a 3):
                      E3: (suma igual a 4):
                      E4: (suma igual a 5):
                      E5: (suma igual a 6):
                      E6: (suma igual a 7):
                      E7: (suma igual a 8):
                      E8: (suma igual a 9):
                      E9: (suma igual a 10):
                      E10: (suma igual a 11):
                      E11: (suma igual a 12):                               suceso elemental

            Con la unión e intersección de dos o mas eventos, se generan nuevos sucesos.


                      Ejemplo:

                      En una mesa hay un juego (28 fichas) de dominó, se voltea
                      una ficha para observar sus números:

                      Espacio muestral




http://tifon.unalmed.edu.co/~pagudel/10Probabilidad.html (4 de 6) [15/09/2002 7:46:03]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




                      E1: La diferencia absoluta entre sus componentes sea igual
                      a0


                      E2: La diferencia absoluta entre sus componentes sea igual
                      a1


                      E3: La diferencia absoluta entre sus componentes sea igual
                      a2


                      E4: La diferencia absoluta entre sus componentes sea igual
                      a3


                      E5: La diferencia absoluta entre sus componentes sea igual
                      a4


                      E6: La diferencia absoluta entre sus componentes sea igual
                      a5


                      E7: La diferencia absoluta entre sus componentes sea igual
                      a6

http://tifon.unalmed.edu.co/~pagudel/10Probabilidad.html (5 de 6) [15/09/2002 7:46:03]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




                                                     ...                                 ...




http://tifon.unalmed.edu.co/~pagudel/10Probabilidad.html (6 de 6) [15/09/2002 7:46:03]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




            10. Nociones de Probabilidad
            (Eventos)

            10.1 NOCIONES DE CONTEO

            10.1.1 Principio Fundamental 1

            Si un suceso A puede ocurrir de n maneras y otro suceso B puede
            ocurrir m maneras, entonces el suceso A ó B (Sucede el evento A ó
            sucede el evento B) puede ocurrir de      formas, siempre y cuando
            los eventos no puedan suceder simultáneamente.

                      Ejemplo:
                      En el lanzamiento de un dado, de cuantas maneras se puede
                      obtener un número inferior a 2 o mayor que 4?

                      A: (número inferior a 2) sucede solo de una manera.
                      B : (número superior a 4), sucede de dos maneras
                      A ó B (número inferior a 2 o superior a 4)

                      sucede de 1+2=3 maneras.

            10.1.2 Principio Fundamental 2


            Si un seceso A puede suceder de n maneras y un suceso B de m formas,
            entonces el suceso A y B (sucede el evento A y sucede el Evento B)
            puede ocurrir de n(m) modos.

                      Ejemplo:
                      De cuantas maneras distintas pueden caer 2 dados, lanzados
                      simultáneamente:

                      A: (dado 1) puede caer de 6 maneras.

http://tifon.unalmed.edu.co/~pagudel/101probabilidad.html (1 de 5) [15/09/2002 7:46:15]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)


                      B : (dado 2) puede caer de 6 maneras
                      A y B (dado 1 y dado 2 ) sucede de 6(6) =36 maneras

            10.1.3 Permutaciones

            Se le llama permutacion a cada uno de los arreglos de n elementos,
            cuya diferenciación mutua se debe al orden en que están colocados sus
            elementos. Al total de permutaciones obtenidas con n elementos se le
            representa por:

                                                                              1

                      Ejemplo:
                      Cuantas palabras diferentes se pueden formar con las letras
                      n, l, o, e; así no tengan sentido?


                      nloe, nleo, nelo, neol, nole noel, lnoe, lneo, leno, leon, lone, loen, elon, elno,
                      enlo, enol, eoln, eonl, olne, olen, oeln, oenl, onle, onel.


            10.1.4 Variaciones

             A cada uno de los arreglos de r elementos obtenidos de un grupo de n elementos         ,
            cuya diferenciación mutua se deba a los elementos ó el orden de colocación, se le denomina
            variación. El número total de variaciones se representa por:




                      Ejemplo:
                      Cuantos números de tres cifras se pueden construir con los dígitos
                      1,2,3,4,5,6,7,8,9,0 si ninguno se puede repetir




            10.1.5 Combinaciones


http://tifon.unalmed.edu.co/~pagudel/101probabilidad.html (2 de 5) [15/09/2002 7:46:15]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)


             A cada uno de los arreglos de r elementos obtenidos de un grupo de n elementos         ,
             cuya diferenciación mutua se deba a los elementos sin importar el orden de colocación de
           . ellos, se le denomina combinación. El número total de combinaciones se representa por:
           .
.....      .
           .
           .


                       Ejemplo:
                       De cuantas maneras se puede escoger un comité de 4
                       hombres de un grupo de 8?




             10.1.6 Permutaciones con Repetición

             En el caso de las permutaciones, si el elmento1 se repite r1 veces, el elemento 2 se repite r2
             veces, etc. Y el elemento k se repite rk, se le llama permutaciones con repetición y se
             calcula con:




                       Ejemplo:
                       Cuantas palabras diferentes, aun sin significado, se pueden formar con las
                       letras de la palabra amorosos?




             10.1.7 Variaciones con Repetición

             En el caso de las variaciones si los elementos se pueden repetir hasta r veces se
             les denomina variaciones con repetición y se obtienen por:




                       Ejemplo:
                       ¿Cuantos números de cuatro cifras existen?

 http://tifon.unalmed.edu.co/~pagudel/101probabilidad.html (3 de 5) [15/09/2002 7:46:15]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




            EJERCICIOS PROPUESTOS

            1. ¿De cuántas maneras se pueden colocar dos anillos diferentes en la misma mano, de
            modo que no estén en el mismo dedo?

            2. Al lanzar cinco dados de distintos colores ¿cuántos resultados podemos obtener?

            3. Con los números 1,2,3,4,5 y 6:

                      3.1 ¿Cuántos números distintos de siete cifras podríamos formar?
                      3.2 ¿Podremos numerar a los 3224564 habitantes de una ciudad con esos
                      números?

            4. Se lanzan al aire uno tras otro cinco dados equilibrados de seis caras. ¿Cuál es el número
            de casos posibles?

            5. ¿Cuántos números de seis cifras existen que estén formados por cuatro números dos y
            por dos números tres?

            6. Lola tiene 25 bolitas (10 rojas, 8 azules y 7 blancas) para hacerse un collar. En- garzando
            las 25 bolitas en un hilo, ¿cuántos collares distintos podrá realizar?

            7. ¿Cuántas palabras distintas, con o sin sentido, podremos formar con las letras de la
            palabra educación? ¿y con la palabra vacaciones?

            8. Un grupo de amigos formado por Raúl, Sonia, Ricardo y Carmen organizan una fiesta,
            acuerdan que dos de ellos se encargarán de comprar la comida y las bebidas ¿De cuántas
            formas posibles puede estar compuesta la pareja encargada de dicha misión?

            9. Una fábrica de helados dispone de cinco sabores distintos (vainilla, chocolate, nata, fresa
            y cola) y quiere hacer helados de dos sabores ¿Cuántos tipos de helado podrán fabricar?

            10. Un grupo de amigos y amigas se encuentran y se dan un beso para saludarse. Si se han
            dado en total 21 besos, ¿cuántas personas había?

            11. En una carrera de 500 metros participan doce corredores ¿De cuántas maneras pueden
            adjudicarse las medallas de oro, plata, bronce?

            12. ¿De cuántas formas pueden cubrirse los cargos de presidente, vicepresidente, secretario
            y tesorero de un club deportivo sabiendo que hay 14 candidatos?



http://tifon.unalmed.edu.co/~pagudel/101probabilidad.html (4 de 5) [15/09/2002 7:46:15]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)



            ______________________________
            1 A n! se le denomina factorial de n




                                                      ...                                 ...




http://tifon.unalmed.edu.co/~pagudel/101probabilidad.html (5 de 5) [15/09/2002 7:46:15]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




            10. Nociones de Probabilidad
            (Eventos)

            10.2 DEFINICIÓN DE PROBABILIDAD

            Los eventos aleatorios no son predecibles con absoluta certeza, no obstante podemos
            medir el grado de confianza con que se hace un pronóstico, sobre la ocurrencia o no de un
            determinado suceso.


            10.2.1 Probabilidad Clásica o "a priori"

            Si un evento puede ocurrir de n maneras, equiprobables y mutuamente excluyentes, de las
            cuales m maneras son favorables al suceso A; se define probabilidad del suceso A como:




                      Ejemplo:
                      En el lanzamiento de un dado de seis caras una vez, si




            10.2.2 Probabilidad "a posteriori" o de Frecuencia Relativa

            Si un experimento se repite n veces         , de las cuales m veces se
            presenta el suceso A, entonces es de esperarse que:

http://tifon.unalmed.edu.co/~pagudel/102probabilidad.html (1 de 6) [15/09/2002 7:46:40]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




            La proporción de veces que se presenta el suceso A tiende a
            estabilizarse en un número entre 0 y 1 llamado probabilidad de A.
            Si por ejemplo, lanzamos un dado cien veces y observamos la presencia del número “2” en
            16 veces,

                      en tal caso




            10.2.3 Probabilidad Subjetiva

            En la probabilidad subjetiva intervienen preferencias y emociones del
            analista que en general, son diferentes para cada caso. Por ejemplo, un
            apostador puede preferir el número “3” porque su horóscopo se lo
            recomienda.



            10.3 AXIOMAS DE LA TEORÍA DE PROBABILIDADES

            Para todo experimento, la probabilidad de ocurrencia de un evento A, p(A), es una función
            que cumple con los siguientes axiomas:

            10.3.1

            10.3.2
            10.3.3 Si dos o más sucesos son incompatibles entre sí, entonces la
            probabilidad de la unión de ellos, es igual a la suma de sus
            probabilidades respectivas




http://tifon.unalmed.edu.co/~pagudel/102probabilidad.html (2 de 6) [15/09/2002 7:46:40]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)

               De estos tres axiomas podemos, fácilmente, deducir que:

                       10.3.3.1                      La Probabilidad de un evento imposible es
                       igual a cero.

                       10.3.3.2              La probabilidad de un evento es igual
                       a la unidad menos la probabilidad de su complemento.
                       10.3.3.3           Toda probabilidad está definida entre la
                       probabilidad del suceso imposible y la probabilidad del
                       evento seguro.
                       10.3.3.4                                                    .

                       10.3.3.5



                       Si dos eventos son compatibles, la probabilidad de su unión
                       es igual a la suma de sus probabilidades menos la
                       probabilidad de su intersección.




           .
           .
.....      .
           .
           .




 http://tifon.unalmed.edu.co/~pagudel/102probabilidad.html (3 de 6) [15/09/2002 7:46:40]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




                      En el ejemplo del lanzamiento de dos dados si:

                      A : (suma sea mayor que 5 pero menor que 10)




                      B : (la suma sea mayor que 8)




            10.4 PROBABILIDAD CONDICIONAL
                 E INDEPENDENCIA ESTADÍSTICA

            Si tenemos los sucesos A, B en un experimento aleatorio, con p(B)>0, se llama
            probabilidad condicional a: p(A/B) La probabilidad de ocurrencia del evento “A” dado que


http://tifon.unalmed.edu.co/~pagudel/102probabilidad.html (4 de 6) [15/09/2002 7:46:40]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)

            ya se ha presentado el suceso “B”.




                      Ejemplo:
                      a un grupo de personas se le pregunta sobre la intención de
                      voto para las próximas elecciones.




                      p(vote dado que es masculino)=




                      p(vote dado que es femenino)=




            Independencia Estadística




            Por ejemplo la probabilidad de obtener un número impar en el segundo
            lanzamiento de un dado, no depende de si en el primer lanzamiento se
http://tifon.unalmed.edu.co/~pagudel/102probabilidad.html (5 de 6) [15/09/2002 7:46:40]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)


            obtuvo un número impar.



            CUESTIONARIO Y EJERCICIOS PROPUESTOS

            1. Defina:

                      1.1 Experimento aleatorio, y experimento determinístico
                      1.2 Evento elemental, suceso seguro, suceso imposible, eventos excluyentes y
                      eventos independientes.

            2. Para cada uno de los eventos definidos en el lanzamiento de dos dados, calcular su
            respectiva probabilidad de ocurrencia.

            3. En el experimento de seleccionar una ficha de dominó, determinar las probabilidades
            para todos sus eventos elementales.

            4. Para el ejemplo de la intención de voto según el sexo, calcular la probabilidad de no
            votante dado que es de sexo masculino.




                                                     ...                                  ...




http://tifon.unalmed.edu.co/~pagudel/102probabilidad.html (6 de 6) [15/09/2002 7:46:40]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




           10. Nociones de Probabilidad
           (Eventos)

           10.5 VARIABLE ALEATORIA

           En el cálculo de probabilidades, generalmente, es más sencillo identificar los eventos
           numéricamente, y no con la simple descripción del suceso que pueda ocurrir, es más, en
           muchas ocasiones no podemos registrar todos los sucesos inmersos en el espacio muestral
           del experimento. Debemos recurrir a cuantificar esos símbolos iniciales en números reales
           que se puedan operar matemáticamente.

           Definición: Una variable aleatoria es una función definida sobre un espacio muestral a los
           números reales. Si ese espacio muestral especificado como dominio es numerable, decimos
           que la variable es de tipo discreto, en caso contrario diremos que es de tipo continuo.

           En el experimento de lanzar una moneda, una vez, definimos la variable aleatoria X: el
           número de sellos obtenido.




                     X(c) = 0
                     X(s) = 1

           En la tirada de dos dados si X es la suma obtenida:




http://tifon.unalmed.edu.co/~pagudel/105probabilidad.html (1 de 7) [15/09/2002 7:47:02]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




           10.6 FUNCIÓN DE PROBABILIDAD

           Las variables aleatorias, transforman eventos del espacio muestral en eventos numéricos, los
           cuales desde luego, tienen asociada una probabilidad de ocurrencia.


           10.6.1 Función de Probabilidad f(x)=p(X=x) :

           Es una función definida sobre una variable aleatoria a los reales en el
           intervalo     que cumple con los axiomas de la teoría de la
           probabilidad.




           10.6.2 Función de Distribución F(x)=p(X=x)

http://tifon.unalmed.edu.co/~pagudel/105probabilidad.html (2 de 7) [15/09/2002 7:47:02]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)



           Es la acumulada de una función de probabilidad.




                     -∞ : Limite inferior de la variable X

                     Ejemplo:

                                  En el Lanzamiento de una Moneda,
                                         X: Número de Sellos




                     Ejemplo:

                                  X es la Suma Obtenida en el Lanzamiento de dos Dados:




http://tifon.unalmed.edu.co/~pagudel/105probabilidad.html (3 de 7) [15/09/2002 7:47:02]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)

          .
          .
.....     .
          .
          .




                      Ejemplo:

                                          Si X: Diferencia en Valor Absoluto,
                                    Entre los dos Sectores de una Ficha de Dominó:




              Hemos creado 3 ejemplos de funciones de probabilidad para variables
              aleatorias discretas con sus respectivas funciones de distribución, que
              nos permiten calcular las probabilidades para cualquier tipo de evento.
              Calculemos algunas para el lanzamiento del par de dados, donde X es la
              suma obtenida:




              Consultando directamente en la función de distribución de esta variable
              discreta, F(x)=p(X≤x) tenemos:

 http://tifon.unalmed.edu.co/~pagudel/105probabilidad.html (4 de 7) [15/09/2002 7:47:02]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




           Para el caso continuo, supongamos que un practicante de tiro al blanco siempre acierta
           indistintamente, en un círculo de 20 centímetros de radio.




http://tifon.unalmed.edu.co/~pagudel/105probabilidad.html (5 de 7) [15/09/2002 7:47:02]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




           La distancia que hay entre el punto “a=0” (centro) y cualquier punto de la circunferencia
           “b=20” es                        .




           ¿ Cuál es la probabilidad que un disparo impacte a menos de 15 cm del centro? ¿ a más de 9
           centímetros? ¿Entre 7 y 14 centímetros?



           Para toda variable continua:




http://tifon.unalmed.edu.co/~pagudel/105probabilidad.html (6 de 7) [15/09/2002 7:47:02]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)


           CUESTIONARIO Y EJERCICIOS PROPUESTOS

           1. Defina: Variable aleatoria, variable aleatoria discreta, variable aleatoria continua, función
           de probabilidad y función de distribución.

           2. En el ejercicio de la ficha de dominó, si X representa la diferencia absoluta entre los dos
           números, representar y calcular la probabilidad de ocurrencia de los siguientes eventos:

                     2.1 La diferencia sea menor o igual a 5
                     2.2 La diferencia sea mayor que 2
                     2.3 La diferencia sea mayor que 2 pero menor o igual 5
                     2.4 La diferencia sea mayor que 5 ó menor que 3




                                                     ...                                  ...




http://tifon.unalmed.edu.co/~pagudel/105probabilidad.html (7 de 7) [15/09/2002 7:47:02]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




            10. Nociones de Probabilidad
            (Eventos)

            10.7 VALOR ESPERADO (ESPERANZA MATEMÁTICA)

            10.7.1 Media Aritmética Poblacional

            En el tratamiento de las medidas de tendencia central, resaltamos la importancia de la
            media aritmética de una variable, como parámetro representativo de una muestra.

            En el análisis poblacional, la media aritmética o valor esperado de una variable aleatoria, se
            define como el promedio ponderado de los diferentes valores que puede asumir la variable
            X, usando como ponderaciones las probabilidades respectivas de ocurrencia.




                      si X es discreta ó


                      si X es continua

                      -∞ :    límite inferior de la variable
                       ∞:     límite superior de la variable


                      Ejemplo:

                                 X es la Suma Obtenida en el Lanzamiento de Dos Dados




http://tifon.unalmed.edu.co/~pagudel/107probabilidad.html (1 de 3) [15/09/2002 7:47:10]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)




           .
           .
.....      .
           .
           .




                       En promedio la suma obtenida en N tiradas es de “7”. Si
                       pagaramos en pesos la suma obtenida en cada lanzamiento,
                       deberíamos cobrar más de 7 pesos para obtener utilidad en
                       el juego.

                       En la variable X, distancia del centro al punto de impacto
                       del tirador, el valor esperado es:




               10.7.2 Varianza Poblacional

               Similarmente a la definición de la media aritmética poblacional, la varianza se define como:




                       ó




               CUESTIONARIO Y EJERCICIOS PROPUESTOS

               1. Calcular el valor esperado para la variable diferencia en el ejemplo del dominó.


 http://tifon.unalmed.edu.co/~pagudel/107probabilidad.html (2 de 3) [15/09/2002 7:47:10]
ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos)

            2. Si usted juega chance, calcule su valor real de acuerdo con los premios que espera
            obtener y compárelo con lo que realmente paga.

            3. Tome un billete de lotería y calcule su precio equitativo.

            4. Un contrabandista se enfrenta al siguiente dilema: Introducir o no, mercancía por valor
            de 5'000.000 obteniendo una utilidad de 1'000.000. El riesgo de ser detectado y castigado
            con el decomiso de la mercancía es del 17%. ¿Que le aconseja usted.?




                                                     ...                                  ...




http://tifon.unalmed.edu.co/~pagudel/107probabilidad.html (3 de 3) [15/09/2002 7:47:10]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




           11. Distribuciones Especiales
           En el capítulo anterior desarrollamos modelos probabilísticos a partir de abstracciones de los
           experimentos previamente descritos, a los cuales se les crea una función de probabilidad,
           que describa las posibilidades de esa realidad experimental.

           Muchos de los acontecimientos cotidianos, pueden ser asimilados a funciones probabilísticas
           teóricas, que son de gran ayuda en la toma de decisiones bajo condiciones de incertidumbre.
           Eminentes estudiosos de la estadística han planteado modelos probabilísticos que han
           contribuido al desarrollo de la ciencia. Veamos algunos de ellos:




           11.1 DISTRIBUCIÓN DE BERNOULLI

           Se puede afirmar que el experimento de Bernoulli, describe el modelo aleatorio más sencillo,
           el cual tiene las siguientes características:

                 q   En el experimento sólo se hace un ensayo.

                 q   En el experimento sólo se admiten dos resultados incompatibles, que llamaremos
                     éxito y fracaso.

                 q   La probabilidad de un éxito es p(E)=p.

                 q   La probabilidad de un fracaso es p(F)=1-p = q

                 q   X : es el número de éxitos x = 0,1.




http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (1 de 13) [15/09/2002 7:47:48]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




           Es el caso cuando se lanza una moneda una vez y se observa de cual lado cae o se analiza un
           artículo para ver si está defectuoso o no, se obtiene o no un trabajo etc.



           11.2 DISTRIBUCIÓN BINOMIAL

           La distribución binomial se obtiene haciendo n pruebas de Bernoulli independientes entre sí,
           en tal caso tiene las siguientes características:

                 q   n : número de repeticiones independientes del experimento de Bernoulli.
                 q   Todas las pruebas deben tener una probabilidad constante de éxito “p” y una
                     probabilidad constante de fracaso “q”=1-p.
                 q   X : es el número de éxitos en las n pruebas, entonces; n-X : número de fracasos.

           Analicemos el experimento con tres repeticiones:




                                                                                        .   (1)




http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (2 de 13) [15/09/2002 7:47:48]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




                     (1) se puede expresar como:




                     (2) se puede expresar como:




                     (3) se puede expresar como:




                     (4) se puede expresar como:




                     entonces para n=3, tenemos que:




http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (3 de 13) [15/09/2002 7:47:48]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




           En general la función de probabilidad binomial tiene la siguiente forma:




           y la función de distribución:




           La media aritmética de una variable aleatoria con distribución binomial es
                              , y varianza                . Con los parámetros n, y p se tipifica la
           distribución binomial y la representamos como:             .

           La distribución binomial es simétrica cuando p=0.5, en caso contrario es asimétrica a la
           izquierda o a la derecha, según el valor de p sea inferior o superior a 0.5. Ver gráfico:




http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (4 de 13) [15/09/2002 7:47:48]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




           Tablas Binomiales




http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (5 de 13) [15/09/2002 7:47:48]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




          .
          .
.....     .
          .
          .




 http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (6 de 13) [15/09/2002 7:47:48]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (7 de 13) [15/09/2002 7:47:48]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (8 de 13) [15/09/2002 7:47:48]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (9 de 13) [15/09/2002 7:47:48]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (10 de 13) [15/09/2002 7:47:48]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (11 de 13) [15/09/2002 7:47:48]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




                     Ejemplo:

                     Se sabe que el 20% de la cartera de una empresa está vencida, se toma una
                     muestra al azar de 15 cuentas. ¿Cuál es la probabilidad de que:

                     1. Haya cuatro ó menos cuentas vencidas?
                     2. Haya menos de cuatro cuentas vencidas?
                     3. Haya más de dos cuentas vencidas.
                     4. Haya más de dos pero menos de cinco cuentas vencidas?
                     5. Haya exactamente 3 cuentas vencidas?
                     6. No haya cuentas vencidas?
                     7. Cuál es valor esperado de cuentas vencidas?
                     8. Cuál es la desviación estándar para el número de cuentas vencidas?


                     Solución:

                     X: número de cuentas vencidas.
                     Éxito: Cuenta vencida.
                     Probabilidad de éxito : p=0.2
                     Número de pruebas n=15




http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (12 de 13) [15/09/2002 7:47:48]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales

                     1. En las tablas de distribuciones binomiales,                                , en la intersección
                        x=4 y p=0.2, consultamos                                             .

                     2.

                     3.

                     4.



                     5.



                     6.

                     7.

                     8.




                                                     ...                                     ...




http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (13 de 13) [15/09/2002 7:47:48]
ESTADÍSTICA APLICADA        11. Distribuciones Especiales




            11. Distribuciones Especiales

            11.3 DISTRIBUCIÓN DE POISSON

            La distribución de Poisson es de gran utilidad cuando tenemos variables distribuidas a
            través del tiempo ó del espacio. Es el caso del número de llamadas que entran a una central
            telefónica en una unidad de tiempo, la cantidad de personas que atiende un cajero en una
            hora, los baches por kilómetro en una autopista, los artículos defectuosos que hay en un
            lote de producción; amén de su utilización como aproximación binomial cuando p es muy
            cercano a cero, o n superior a 30. (p<0.1 , n>30).

            La función de probabilidad de Poisson es:




                      Donde:

                                                : es decir, la media aritmética es igual a la varianza.

                                          :        (la base de los logaritmos naturales).
                      X:                           número de éxitos en la unidad de tiempo o de espacio
                                                   considerado.



                      Ejemplo:

                      Un cajero de un banco atiende en promedio 7 personas por
                      hora, cual es la probabilidad de que un una hora
                      determinada:
                      1. Atienda menos de 5 personas
                      2. Atienda más de 8 personas
                      3. Atienda más de 5 pero menos de 8 personas

http://tifon.unalmed.edu.co/~pagudel/113distribuciones.html (1 de 5) [15/09/2002 7:48:05]
ESTADÍSTICA APLICADA        11. Distribuciones Especiales

                      4. Atienda exactamente 7 personas

                      Consultando la tabla para la distribución de Poisson:

                      1.

                      2.

                      3.




                      4.




                      Ejemplo:

                      En cierto núcleo poblacional, el 0.5% es portador del V.I.H. En una muestra
                      de 80 personas, cual es la probabilidad:

                      1. De que haya alguna persona portadora.
                      2. No haya personas portadoras.


                      Solución:



                      1.
                      2.


            Probabilidades de Poisson Acumuladas




http://tifon.unalmed.edu.co/~pagudel/113distribuciones.html (2 de 5) [15/09/2002 7:48:05]
ESTADÍSTICA APLICADA        11. Distribuciones Especiales




           .
           .
.....      .
           .
           .




               11.4 DISTRIBUCIÓN NORMAL

               Dada la caracterización propia de este modelo continuo, donde coinciden las medidas de
               tendencia central, media, moda y mediana; la simetría respecto a estos parámetros y la
               facilidad de su aplicación hacen de la distribución normal, una herramienta de uso común,
               máxime que la mayoría de las variables económicas y sociales se ajustan a una función
               normal.

               La distribución normal, también es útil como aproximación de los modelos binomial y
               poisson expuestos anteriormente, y yendo un poco más adelante, sustentados en el teorema
               del “límite central” podemos afirmar que, cuando el tamaño de la muestra es lo
               suficientemente grande, podemos asumir el supuesto de normalidad para una suma de


 http://tifon.unalmed.edu.co/~pagudel/113distribuciones.html (3 de 5) [15/09/2002 7:48:05]
ESTADÍSTICA APLICADA        11. Distribuciones Especiales

            variables.

            La forma acampanada de la variable normal, resalta la perfección de esta curva definida
            por los parámetros




            se representa como:

            La aparente complejidad de la distribución normal no debe preocupar al lector, donde:

                      X : Variable aleatoria distribuida normalmente
                          Media aritmética de la variable
                          Varianza de la variable
                      e     2.71828 constante (base de los logaritmos naturales)
                            3.1416 constante

            Sin embargo, existen infinitas distribuciones normales, ya que por cada media aritmética ó
            varianza diferente se describe una función también diferente:

                                         Normal Diferente Media Igual Varianza




                                         Normal Diferente Varianza Igual Media




http://tifon.unalmed.edu.co/~pagudel/113distribuciones.html (4 de 5) [15/09/2002 7:48:05]
ESTADÍSTICA APLICADA        11. Distribuciones Especiales




                                                       ...                                  ...




http://tifon.unalmed.edu.co/~pagudel/113distribuciones.html (5 de 5) [15/09/2002 7:48:05]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




      11. Distribuciones Especiales

      11.5 DISTRIBUCIÓN NORMAL ESTANDAR

      Con el sinnúmero de diferentes distribuciones normales que se generarían con cada media o
      varianza diferente, se hace necesario efectuar un cambio de origen y de escala en la variable
      original, para estandarizarla y obtener una nueva variable cuya manipulación es más fácil:




      con                       , la nueva variable Z se distribuye normalmente con media
      aritmética                    y varianza




      Dado que la distribución normal es una variable continua




                Ejemplo:

                Si asumimos que la resistencia de las baldosas se distribuye
                normalmente con                   y

                                               Resistencia de 100 Baldosas




http://tifon.unalmed.edu.co/~pagudel/115distribuciones.html (1 de 7) [15/09/2002 7:48:33]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




                Si extraemos una baldosa al azar : Cual es la probabilidad de que:

                      1.   Resista menos de 448 Kg/cm2?
                      2.   Resista más de 588 Kg/cm2 ?
                      3.   Resista entre 308 y 588 Kg/cm2 ?
                      4.   Resista entre 168 y 728 Kg/cm2 ?
                      5.   Resista más de 600 Kg/cm2 ?
                      6.   Resista menos de 200 ó más de 700 Kg/cm2 ?

                Con la ayuda de los valores tabulados:




http://tifon.unalmed.edu.co/~pagudel/115distribuciones.html (2 de 7) [15/09/2002 7:48:33]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




http://tifon.unalmed.edu.co/~pagudel/115distribuciones.html (3 de 7) [15/09/2002 7:48:33]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




     .
     .
....
     .
.
     .
     .




 http://tifon.unalmed.edu.co/~pagudel/115distribuciones.html (4 de 7) [15/09/2002 7:48:33]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




http://tifon.unalmed.edu.co/~pagudel/115distribuciones.html (5 de 7) [15/09/2002 7:48:33]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




      CUESTIONARIO Y EJERCICIOS PROPUESTOS

      1. La probabilidad de que un visitante efectúe una compra en un almacén,
      durante un día dado es 0.8. Si al negocio entran 20 clientes, ¿cuál es la
      probabilidad de que el almacén realice:

                1.1 Exactamente 16 ventas?
                1.2 Menos de 17 ventas?
                1.3 Más de 14 ventas?
                1.4 Exactamente 5 ventas?
                1.5 ¿Cuál es el número esperado de ventas?

      2. Si un almacén tiene en promedio 5 ventas por hora. ¿Cual es la
      probabilidad de que en una hora determinada:

                2.1 Haya exactamente 4 ventas?
                2.2 Haya más de 3 ventas?
                2.3 No se efectúen ventas?

http://tifon.unalmed.edu.co/~pagudel/115distribuciones.html (6 de 7) [15/09/2002 7:48:33]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales



      3. Una de cada 10 personas mayores de 40 años de una comunidad, sufren
      de hipertensión. Se toma una muestra de 50 personas mayores de 40 años.
      Utilizando primero la distribución binomial y luego la aproximación a la
      distribución de Poisson, responder y comparar los resultados:

                3.1 ¿Cuál es la probabilidad que haya más de 4 hipertensos?
                3.2 ¿Cuál es la probabilidad que haya exactamente 5
                hipertensos?

      4. Un lote de arandelas tiene un diámetro normal con media 10
      milímetros y desviación típica 0.5 milímetros. Se toma una arandela al
      azar. ¿Cuál es la probabilidad de que tenga un diámetro:

                4.1 Superior a 10.5 milímetros?
                4.2 Entre 9 y 11 milímetros?
                4.3 Menos de 9 milímetros?




                                                   ...                                      ...




http://tifon.unalmed.edu.co/~pagudel/115distribuciones.html (7 de 7) [15/09/2002 7:48:33]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




            11. Distribuciones Especiales

            11.6 EL TAMAÑO DE LA MUESTRA

            El teorema del limite central, sustenta la aproximación a la normalidad para muchas
            distribuciones discretas. Cuando el tamaño de la muestra es grande, y dicha muestra es
            tomada de cualquier distribución con media •, finita y varianza σ2 finita, entonces la media
            aritmética muestral tiene una distribución normal con media y varianza




            Podemos entonces establecer intervalos de confianza para
                                                                      ,
            α : es denominado el nivel de significancia , si la significancia es por
            ejemplo, α=0.05 entonces la confiabilidad es del 0.95.




http://tifon.unalmed.edu.co/~pagudel/116distribuciones.html (1 de 6) [15/09/2002 7:49:11]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales



            Si        entonces el 95% de las muestras se encontrarán en el
            intervalo



                                                             ,

            ahora bien , como los parámetros poblacional • y σ son desconocidos, para muestras
            grandes (n>30) la varianza muestral S2 es un buen estimador de la varianza poblacional σ2 ,
            podemos afirmar con una confiabilidad predeterminada que la media aritmética poblacional
            • se halla en el intervalo




            estamos admitiendo que la diferencia máxima entre • y                           es de:




                      esto es:




                      entonces el tamaño de muestra mínimo es




                      donde :

                         : Valor crítico obtenido de la tabla normal, para una
                           confiabilidad de
                      S2: Varianza muestral
                      e: Error máximo admitido

            Sin embargo, n está en función de la varianza, la cual en la práctica es desconocida, ante lo
            cual debemos hacer un muestreo piloto para estimar la varianza y proceder a reajustar el
            tamaño de la muestra mínimo.

http://tifon.unalmed.edu.co/~pagudel/116distribuciones.html (2 de 6) [15/09/2002 7:49:11]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




                       Ejemplo:

                       Se desea realizar una investigación para analizar, cual es la
                       resistencia promedio de una producción de baldosas. Si
                       admitimos un error máximo 25 Kg/Cm2, cual debe ser el
                       tamaño de muestra mínimo si exigimos una confiabilidad
                       del 95%, y en una muestra piloto obtuvimos una desviación
                       típica de 140 Kg/Cm2?




                       Con una confiabilidad del 90% se quiere estimar la
                       proporción de ciudadanos que votará en las próximas
                       elecciones. Cual debe ser el tamaño de la muestra, si
                       admitimos un error del 3% y se sabe que en las pasadas
                       elecciones hubo una abstención del 70%?

                       Dado que X es una distribución binomial con •x= np y



                       Entonces
           .
           .
.....      .
           .
           .           por consiguiente




 http://tifon.unalmed.edu.co/~pagudel/116distribuciones.html (3 de 6) [15/09/2002 7:49:11]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




http://tifon.unalmed.edu.co/~pagudel/116distribuciones.html (4 de 6) [15/09/2002 7:49:11]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




http://tifon.unalmed.edu.co/~pagudel/116distribuciones.html (5 de 6) [15/09/2002 7:49:11]
ESTADÍSTICA APLICADA 11. Distribuciones Especiales




                                                      ...                                   ...




http://tifon.unalmed.edu.co/~pagudel/116distribuciones.html (6 de 6) [15/09/2002 7:49:11]
ESTADÍSTICA APLICADA Apéndice No. 1




            Apéndice No. 1
            Una expresión general para cualquier media particular es la siguiente:




            Si consideramos que todos los datos tiene frecuencia igual a la unidad, es decir:




            La fórmula general queda:




                      Donde:

                      M (t):      Media
                      Σx:         Suma de todos los datos.
                      n:          Número de datos
                      t:          Un valor arbitrario - < t <

            Como se puede observar; dándole valores a t, se obtienen medias particulares. Las más
            comunes son:

            Para t = 1,




http://tifon.unalmed.edu.co/~pagudel/apendice1.html (1 de 3) [15/09/2002 7:49:22]
ESTADÍSTICA APLICADA Apéndice No. 1


             Para t = -1,




           . La cual se denomina media armónica.
           .
.....      . Nótese que la media armónica es el recíproco de la media aritmética de los recíprocos de
           . los datos.
           .
             Antiguamente la media armónica era llamada subcontraria.

             Para t = 2,




             Si t = 0,




             Para resolver la indeterminación presentada por:


             se procede de la siguiente forma:


 http://tifon.unalmed.edu.co/~pagudel/apendice1.html (2 de 3) [15/09/2002 7:49:22]
ESTADÍSTICA APLICADA Apéndice No. 1




                                                     ...                            ...




http://tifon.unalmed.edu.co/~pagudel/apendice1.html (3 de 3) [15/09/2002 7:49:22]
ESTADÍSTICA APLICADA Apéndice No. 2




               Apéndice No. 2
               Para obtener la fórmula m                                   se deben hacer los siguientes supuestos:

                   1. El mínimo de datos que amerita clasificación en intervalos es 16.

                   2. El número de intervalos no debe ser inferior a (5).

                   3. Cada vez que se duplique la información se incrementa en uno (1) el número de
                      intervalos.

               Así las cosas, se obtiene la siguiente correspondencia:




           .
           .
.....      .
           .
           .




               Se llega a la siguiente igualdad:

                       n = 2m –1

               Tomando logaritmo a ambos lados de la ecuación




 http://tifon.unalmed.edu.co/~pagudel/apendice2.html (1 de 2) [15/09/2002 7:49:28]
ESTADÍSTICA APLICADA Apéndice No. 2




                                                     ...                            ...




http://tifon.unalmed.edu.co/~pagudel/apendice2.html (2 de 2) [15/09/2002 7:49:28]
ESTADÍSTICA APLICADA Apéndice No. 3




      Apéndice No. 3
      Ejercicio general de aplicación.

                      Número de Personas por Familia y Consumo
                Diario de Arroz, Según Encuesta a 50 Familias de Quibdó




      Como puede observarse, la variable X (número de personas por familia) es de tipo discreto,
      cuyos ítems no necesitan agruparse en intervalos; sin embargo, la variable Y (gramos de arroz
      diarios consumidos por familia) es una variable de tipo continuo y sus valores tienen poca
      frecuencia; en consecuencia, se hace necesario la agrupación en clases o intervalos:



http://tifon.unalmed.edu.co/~pagudel/apendice3.html (1 de 7) [15/09/2002 7:49:52]
ESTADÍSTICA APLICADA Apéndice No. 3

                1.

                2.

                3.




                4.

                5.

                6.




                7. Construcción de los intervalos:




      Así las cosas, se procede a construir una tabla de doble entrada, con las variables X, Y para
      efectuar el conteo respectivo.

                                        Numero de Personas por Familia
                              y Consumo Diario de Arroz, en un Grupo de 50 Familias




http://tifon.unalmed.edu.co/~pagudel/apendice3.html (2 de 7) [15/09/2002 7:49:52]
ESTADÍSTICA APLICADA Apéndice No. 3




        De la anterior tabla se pueden obtener, entre otras, las siguientes conclusiones:

            q   El 62 % de las familias las conforman entre 5 y 7 personas.

            q   El 62 % de las familias tienen 6 personas o menos.

            q   El 64 % de las familias consume entre 400 y 800 gramos de arroz, diariamente.

            q   El 84 % de las familias consume menos de 1000 gramos diarios de arroz.

        Calculemos ahora las medidas de tendencia central y dispersión más importantes, a través de la
        siguiente tabla:

                                   Tabla de Trabajo para el Cálculo de




    .

http://tifon.unalmed.edu.co/~pagudel/apendice3.html (3 de 7) [15/09/2002 7:49:52]
ESTADÍSTICA APLICADA Apéndice No. 3


. . . ..
.      .
       .
       .




           Luego, es más dispersa la variable y: Consumo de arroz.

           Búsqueda de la correlación entre las dos variables.


           1. Diagrama de Dispersión




           Se vislumbra una correlación positiva y una tendencia rectilínea.


           2. Cálculo del Coeficiente de Correlación.

                          Tabla de Trabajo para el Cálculo de Coeficiente de Correlacion




  http://tifon.unalmed.edu.co/~pagudel/apendice3.html (4 de 7) [15/09/2002 7:49:52]
ESTADÍSTICA APLICADA Apéndice No. 3




      Debido a que los datos están agrupados en frecuencias, debemos hacer los cálculos teniendo en
      cuenta las veces que cada par de observaciones se repite.




      Entre el número de personas por familia y el consumo de arroz, existe una correlación positiva
      excelente.

      Se pueden utilizar los mismos totales para efectos de calcular los parámetros a y b de la recta de
      regresión.


http://tifon.unalmed.edu.co/~pagudel/apendice3.html (5 de 7) [15/09/2002 7:49:52]
ESTADÍSTICA APLICADA Apéndice No. 3




      El modelo lineal queda por consiguiente:




      Modelo que predice el consumo de arroz, en función del número de personas por familia:




      Para finalizar, veamos el comportamiento gráfico del modelo rectilíneo entre el número de
      personas por familia y el consumo de arroz.

                                                          Recta de Regresión




http://tifon.unalmed.edu.co/~pagudel/apendice3.html (6 de 7) [15/09/2002 7:49:52]
ESTADÍSTICA APLICADA Apéndice No. 3




                                                  ...                               ...




http://tifon.unalmed.edu.co/~pagudel/apendice3.html (7 de 7) [15/09/2002 7:49:52]
ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos




       Solución a Algunos Ejercicios
       Propuestos
       3.1-6




       3.1-7 Edad




       3.1-7 Estado Civil

http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (1 de 12) [15/09/2002 7:50:20]
ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos




       3.1-7 Número de Hijos




       3.1-7 Experiencia Laboral




       3.1-7 Escolaridad




http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (2 de 12) [15/09/2002 7:50:20]
ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos




       3.1-7 Gastos en Educación




       3.1-7 Ausencias




       3.2-4


http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (3 de 12) [15/09/2002 7:50:20]
ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos




       3.1-7 Calificación




       3.2-4




       3.1-7 Calificación




http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (4 de 12) [15/09/2002 7:50:20]
ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos




       4-5 Histograma




       4-5 Polígono




       4-5 Histograma Acumulado




http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (5 de 12) [15/09/2002 7:50:20]
ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos




     .
     .
....
     .
.
     .
     .
         4-5 Polígono de Frecuencias Acumuladas




         4-8




 http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (6 de 12) [15/09/2002 7:50:20]
ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos


       5-6




       7-4




       8-1




http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (7 de 12) [15/09/2002 7:50:20]
ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos




       9-7




http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (8 de 12) [15/09/2002 7:50:20]
ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos




       9-8




       10.1-1    Si se usa el pulgar:




       10.1-2 Variaciones con repetición



http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (9 de 12) [15/09/2002 7:50:20]
ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos




       10.1-5 Permutaciones con repetición




       10.1-8 Combinaciones




       10.1-10 Combinaciones




       10.4-4




       10.6-2.1




       10.6-2.2




http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (10 de 12) [15/09/2002 7:50:20]
ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos


       10.6-2.3




       10.6-2.4




       10.5-4.1




       10.5-4.2




       10.5-4.3




http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (11 de 12) [15/09/2002 7:50:20]
ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos




                                                    ...                                ...




http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (12 de 12) [15/09/2002 7:50:21]
ESTADÍSTICA APLICADA Enlaces




                          Enlaces

                             Librería Virtual Elaleph
                             www.elaleph.com/

                             Universidad Nacional de Colombia sede Medellín
                             www.unalmed.edu.co/

                             El Portal de las Matemáticas
                             www.matematicas.net/

                             Libros y Software Gratis
                             www.recursosgratis.com/

                             DANE Colombia
                             www.dane.gov.co/

                             Planeación Nacional Colombia N.N.P.
                             www.dnp.gov.co/

                             Ministerio de Desarrollo Colombia
                             www.mindesa.gov.co/

                             Web Estadístico de Navarra
                             www.lander.es/

                              Bioestadística: Métodos y Aplicaciones
                             ftp.medprev.uma.es/libro

                             Aula Fácil
.....         .....          www.aulafacil.org/

                             Probabilidad y Estadística
                             w3.mor.itesm.mx/

                              Diseño de Experimentos y Teoria de Muestras

 http://tifon.unalmed.edu.co/~pagudel/enlaces.html (1 de 2) [15/09/2002 7:50:24]
ESTADÍSTICA APLICADA Enlaces

                            libros.netstoreusa.com/

                            Distribuciones Estadísticas
                            www.sisweb.com/

                             Probabilidad
                            thales.cica.es/

                            Distribución de Poisson
                            www.ual.es/

                            Tratamiento de la Incertidumbre
                            www.dc.fi.udc.es/

                            Universidad de Antioquia
                            extension.udea.edu.co/

                            Estadística Lejarza
                            www.uv.es/




                                                            ...                   ...




http://tifon.unalmed.edu.co/~pagudel/enlaces.html (2 de 2) [15/09/2002 7:50:24]
ESTADÍSTICA APLICADA Referencias Bibliográficas




                 Referencias Bibliográficas

                     Alatorre, et al., Introducción a los métodos estadísticos, México, UPN.

                     Azorín, Poch. Francisco. Curso de muestreo y aplicaciones, Aguilar, 1969.

                     Barahoma, Abel y otro. Metodología de trabajos científicos, Ipler, 1979.

                     Bencardino M., Ciro. Estadística, Apuntes y 600 Problemas Resueltos, 2a Edición,
                     Ecoe, 1982.

                     Castillo, Juana, Estadística inferencial básica, México, CCH, UNAM.

                     CHAO. Lincoln L. Estadística para Ciencias Administrativas, 2a Edición, MCGRAW-
                     HILL, 1980.

                     Dixon, Wilfrid J y otro. Introducción al Análisis Estadístico, 2a Edición, MCGRAW-
                     HILL, 1965.

                     Doms, Fernan P. La Estadística Qué Sencilla, 2a Edición, Paraninfo, 1969.

                     Downie, N. M. y otro. Métodos Estadísticos Aplicados. Harper Row Publishers Inc.,
                     1970.

                     Giardina, Basilio. Manual de Estadística, 3 Edición, 1972.

                     Haber, Audrey. Estadística General, Fondo Educativo Interamericano, 1973.

                     Hoel, Paul G. Estadística elemental, México, CECSA.

                     Johnson, Robert, Estadística elemental, Buenos Aires, Grupo Editorial
                     Iberoamericana.
           ...
.....                Kazmier, Leonard J. Estadística Aplicada a la Administración y la Economía,
           ..
                     MCGRAW-HILL, 1978.

                     Leitold Louis. El Cálculo con Geometría Analítica, 2a Edición, Harla S.A., 1973.

                     Levin Yack. Fundamentos de Estadística en la Investigación Social, 2a Edición, Harla
                     S., 1977.

                     Llerena, León, Ricardo y otro. Curso de Estadística General, U. de A., 1981.



 http://tifon.unalmed.edu.co/~pagudel/bibliografica.html (1 de 2) [15/09/2002 7:50:28]
ESTADÍSTICA APLICADA Referencias Bibliográficas

                    Mejía V., William. Bioestadística General, Escuela Nal. De Salud Pública, U. de A.,
                    1980.

                    National Council of Teachers. Of. Mathematics USA. Recopilación, Organización e
                    interpretación de Datos, Trilla, 1970.

                    Portilla, Ch. Enrique. Estadística, Primer Curso. Interamericano, 1980.

                    Richards, Larry E. Y otro. Estadística en los Negocios. ¿porqué y cuándo?,
                    MCGRAW-HILL,1978.

                    Seymour, Lipschutz, Teoría y problemas de probabilidad, México, McGraw-Hill.

                    Shao, Stephen P. Estadística para Economistas y Administradores de Empresas, 15a
                    Edición, 1979.

                    Spiegel, Murray R. Estadística, MCGRAW-HILL, 1970.

                    Spiegel, Murray, Teoría y problemas de estadística, México, McGraw-Hill.

                    Stevenson, William, Estadística, México, Harla.

                    Yamane, Taro, Estadística, México, Harla.




                                                        ...                             ...




http://tifon.unalmed.edu.co/~pagudel/bibliografica.html (2 de 2) [15/09/2002 7:50:28]
ESTADÍSTICA APLICADA Norbeto Guarín Salazar




                                       NORBERTO GUARÍN SALAZAR
                                                      Estadístico Universidad de Medellín
                                              M.Sc. Estadística Universidad Nacional de Colombia
                                                  Profesor Asociado Universidad del Chocó

.....         .....




                                                             ...                   ...




 http://tifon.unalmed.edu.co/~pagudel/nguarin.html [15/09/2002 7:50:30]

Más contenido relacionado

PDF
Capitulo 1 sears
PDF
Fisica 1 udec introduccion_a_la_mecanica_y_calor
PDF
33412697 fisica-introduccion-a-la-mecanica
PDF
libro fisica
PPT
Trabajo de estadistica
PPTX
PPT
Clusters
PPT
La gestión del conocimiento aplicada a la gestión integral de los PFC en el ...
Capitulo 1 sears
Fisica 1 udec introduccion_a_la_mecanica_y_calor
33412697 fisica-introduccion-a-la-mecanica
libro fisica
Trabajo de estadistica
Clusters
La gestión del conocimiento aplicada a la gestión integral de los PFC en el ...

Destacado (20)

PPT
Estadistica
PDF
Estadistica aplicada norberto.guarin.salazar
PPTX
Ejercicios de operadores matemáticos 1º
PPTX
Ejercicios matemáticos
PDF
Excel basico ejercicios
PPTX
Estadística.
PPTX
Estadistica aplicada
PDF
Anon curso de estadistica aplicada [pdf]
PPTX
Excel el libro
PPTX
Presentación excel
PPS
Power point estadistica
PPTX
Excell
PDF
Propiedades de las desigualdades
PPT
Distribución frecuencia datos no agrupados monica
PDF
Trabajo final de estadistica aplicada
PDF
Aritmetica de baldor
PDF
Proyecto modelo de Estadistica
PPTX
Trabajo estadistica completo
PDF
Ingles sin barreras manual 5 dvd
PPSX
TABLA DE FRECUENCIAS - NO AGRUPADOS
Estadistica
Estadistica aplicada norberto.guarin.salazar
Ejercicios de operadores matemáticos 1º
Ejercicios matemáticos
Excel basico ejercicios
Estadística.
Estadistica aplicada
Anon curso de estadistica aplicada [pdf]
Excel el libro
Presentación excel
Power point estadistica
Excell
Propiedades de las desigualdades
Distribución frecuencia datos no agrupados monica
Trabajo final de estadistica aplicada
Aritmetica de baldor
Proyecto modelo de Estadistica
Trabajo estadistica completo
Ingles sin barreras manual 5 dvd
TABLA DE FRECUENCIAS - NO AGRUPADOS
Publicidad

Similar a Curso de estadistica aplicada (20)

PDF
Módulo 2 Introducción a la Estadística
PPT
UTPL-ESTADÍSTICA I-I-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
PPTX
Presentación unidades
PDF
Estadística Descriptiva
 
PDF
Estadistica tratamiento estadistico de datos
PPTX
Aplicacion materia de estadistica
DOC
Guias 1 de estadistica
PPT
Estadistica I (I Bimestre)
PDF
Estadistica
PDF
TEORÍA ESTADISTICA
PDF
Probabilidad y estadistica teoria
PDF
Probabilidad y estadistica teoria
PDF
Pdf 13 estadistica
DOCX
Resumen estadistica descriptiva resumen
PDF
Estadistica luly
PDF
Unidad 1
DOCX
Estadadistica descriptiva exposicion
PPT
BioestadíStica Y EpidemiologíA
PDF
Módulo 4 estadísticas_descriptivas
Módulo 2 Introducción a la Estadística
UTPL-ESTADÍSTICA I-I-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
Presentación unidades
Estadística Descriptiva
 
Estadistica tratamiento estadistico de datos
Aplicacion materia de estadistica
Guias 1 de estadistica
Estadistica I (I Bimestre)
Estadistica
TEORÍA ESTADISTICA
Probabilidad y estadistica teoria
Probabilidad y estadistica teoria
Pdf 13 estadistica
Resumen estadistica descriptiva resumen
Estadistica luly
Unidad 1
Estadadistica descriptiva exposicion
BioestadíStica Y EpidemiologíA
Módulo 4 estadísticas_descriptivas
Publicidad

Último (20)

PDF
1. Intrdoduccion y criterios de seleccion de Farm 2024.pdf
PDF
IPERC...................................
PDF
PFB-MANUAL-PRUEBA-FUNCIONES-BASICAS-pdf.pdf
PDF
Atencion prenatal. Ginecologia y obsetricia
DOCX
Informe_practica pre Final.docxddadssasdddddddddddddddddddddddddddddddddddddddd
DOCX
PLAN DE CASTELLANO 2021 actualizado a la normativa
PDF
Teologia-Sistematica-Por-Lewis-Sperry-Chafer_060044.pdf
PPTX
MATEMATICAS GEOMETRICA USO TRANSPORTADOR
PDF
Introduccion a la Investigacion Cualitativa FLICK Ccesa007.pdf
PDF
Escuelas Desarmando una mirada subjetiva a la educación
PDF
5°-UNIDAD 5 - 2025.pdf aprendizaje 5tooo
PDF
Unidad de Aprendizaje 5 de Matematica 1ro Secundaria Ccesa007.pdf
PDF
La Inteligencia Emocional - Fabian Goleman TE4 Ccesa007.pdf
DOCX
PLAN DE AREA DE CIENCIAS SOCIALES TODOS LOS GRUPOS
PPTX
Doctrina 1 Soteriologuia y sus diferente
PDF
el - LIBRO-PACTO-EDUCATIVO-GLOBAL-OIEC.pdf
PDF
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE.pdf
PDF
IDH_Guatemala_2.pdfnjjjkeioooe ,l dkdldp ekooe
DOCX
V UNIDAD - PRIMER GRADO. del mes de agosto
PDF
ACERTIJO Súper Círculo y la clave contra el Malvado Señor de las Formas. Por ...
1. Intrdoduccion y criterios de seleccion de Farm 2024.pdf
IPERC...................................
PFB-MANUAL-PRUEBA-FUNCIONES-BASICAS-pdf.pdf
Atencion prenatal. Ginecologia y obsetricia
Informe_practica pre Final.docxddadssasdddddddddddddddddddddddddddddddddddddddd
PLAN DE CASTELLANO 2021 actualizado a la normativa
Teologia-Sistematica-Por-Lewis-Sperry-Chafer_060044.pdf
MATEMATICAS GEOMETRICA USO TRANSPORTADOR
Introduccion a la Investigacion Cualitativa FLICK Ccesa007.pdf
Escuelas Desarmando una mirada subjetiva a la educación
5°-UNIDAD 5 - 2025.pdf aprendizaje 5tooo
Unidad de Aprendizaje 5 de Matematica 1ro Secundaria Ccesa007.pdf
La Inteligencia Emocional - Fabian Goleman TE4 Ccesa007.pdf
PLAN DE AREA DE CIENCIAS SOCIALES TODOS LOS GRUPOS
Doctrina 1 Soteriologuia y sus diferente
el - LIBRO-PACTO-EDUCATIVO-GLOBAL-OIEC.pdf
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE.pdf
IDH_Guatemala_2.pdfnjjjkeioooe ,l dkdldp ekooe
V UNIDAD - PRIMER GRADO. del mes de agosto
ACERTIJO Súper Círculo y la clave contra el Malvado Señor de las Formas. Por ...

Curso de estadistica aplicada

  • 1. ESTADÍSTICA APLICADA N. Guarín S. http://tifon.unalmed.edu.co/~pagudel/estadistica.html . N. GUARÍN S. nguarins@epm.net.co BIOGRAFÍA DEL AUTOR TABLA DE CONTENIDO . ISBN Se publica bajo el total consentimiento del autor Colombia http://tifon.unalmed.edu.co/~pagudel/estadistica.html [15/09/2002 7:40:42]
  • 2. ESTADÍSTICA APLICADA Tabla de Contenido Tabla de Contenido . Introducción 1. La Estadística 1.1 Importancia 1.2 Definición 1.3 División . 2. Etapas del Método Estadístico 2.1 Planteamiento del problema 2.2 Fijación de los objetivos 2.3 Formulación de las hipótesis 2.4 Definición de la unidad de observación y de la unidad de medida 2.5 Determinación de la población y de la muestra 2.6 La recolección 2.7 Crítica, clasificación y ordenación 2.8 La tabulación 2.9 La presentación 2.10 El análisis 2.11 Publicación Cuestionario . 3. Distribución de Frecuencias 3.1 Distribución de frecuencias simple Ejercicios 3.2 Distribución de frecuencias por intervalo 3.3 Reglas empíricas para la construcción de Intervalos Cuestionario y ejercicios propuestos . 4. Representación Gráfica 4.1 Definición 4.2 Componentes de una gráfica http://tifon.unalmed.edu.co/~pagudel/tabla.html (1 de 4) [15/09/2002 7:40:53]
  • 3. ESTADÍSTICA APLICADA Tabla de Contenido 4.3 Principales tipos de gráficos 4.3.1 Gráfico de líneas 4.3.2 Gráfico de líneas compuesto 4.3.3 Gráfico de barras 4.3.4 Gráfico de barras compuesto 4.3.5 Gráfico de sectores circulares 4.3.6 Histograma de frecuencias 4.3.7 Polígono de frecuencias 4.3.8 Histograma de frecuencias acumuladas Cuestionario y ejercicios propuestos . 5. Medidas de Tendencia Central 5.1 Media aritmética 5.1.1 Propiedades de la media aritmética 5.1.2 Media aritmética con cambio origen y de escala 5.1.3 Media aritmética ponderada 5.2 Mediana 5.2.1 La mediana cuando los datos no están agrupados en intervalos 5.2.2 La mediana cuando la información está agrupada en intervalos 5.3 La Moda 5.3.1 La moda cuando los datos no están agrupados en intervalos 5.3.2 Cálculo de la moda con la información agrupada en intervalos Cuestionario y ejercicios propuestos . 6. Medidas de Posición (Percentiles) 6.1 Cuartiles 6.2 Quintiles 6.3 Deciles 6.4 Centiles 6.5 Resumen Cuestionario y ejercicios propuestos . 7. Medidas de Dispersión 7.1 Rango o recorrido 7.2 Desviación media 7.3 Varianza ..... 7.4 Coeficiente de variabilidad Cuestionario y ejercicios propuestos http://tifon.unalmed.edu.co/~pagudel/tabla.html (2 de 4) [15/09/2002 7:40:53]
  • 4. ESTADÍSTICA APLICADA Tabla de Contenido . 8. Regresión y Correlación Lineal 8.1 Tablas de doble entrada 8.2 Correlación 8.3 Regresión lineal 8.3.1 Ajuste rectilíneo (método de los mínimos cuadrados) 8.3.2 Ajuste parabólica (método de los mínimos cuadrados) Cuestionario y ejercicios propuestos . 9. Tasas e Índices 9.1 Tasa 9.2 Índice 9.2.1 Índice simple 9.2.1.1 Índice de base fija 9.2.1.2 Índice de base móvil 9.2.2 Índices compuestos (globales) 9.2.2.1 Índice de Laspeyres 9.2.2.2 Índice de Passche 9.2.2.3 Índice ideal de Fisher Cuestionario y ejercios propuestos . 10.Nociones de Probabilidad (Eventos) 10.1 Nociones de conteo 10.1.1 Principio fundamental 1 10.1.2 Principio fundamental 2 10.1.3 Permutaciones 10.1.4 Variaciones 10.1.5 Combinaciones 10.1.6 Permutaciones con repetición 10.1.7 Variaciones con repetición Ejercicios propuestos 10.2 Definición de probabilidad 10.2.1 Probabilidad a priori 10.2.2 Probabilidad a posteriori 10.2.3 Probabilidad subjetiva 10.3 Axiomas de la teoría de probabilidades 10.4 Probabilidad condicional e independencia estadística Cuestionario y ejercicios propuestos http://tifon.unalmed.edu.co/~pagudel/tabla.html (3 de 4) [15/09/2002 7:40:53]
  • 5. ESTADÍSTICA APLICADA Tabla de Contenido 10.5 Variable aleatoria 10.6 Función de probabilidad 10.6.1 Función de probabilidad 10.6.2 Función de distribución Cuestionario y ejercicios propuestos 10.7 Valor esperado (esperanza matemática) 10.7.1 Media aritmética poblacional 10.7.2 Varianza poblacional Cuestionario y ejercicios propuestos . 11.Distribuciones Especiales 11.1 Distribución de Bernoulli 11.2 Distribución binomial, tablas binomiales 11.3 Distribución de Poisson, tablas de Poisson 11.4 Distribución normal 11.5 Distribución normal estándar, tablas normales Cuestionario y ejercicios propuestos 11.6 El tamaño de la muestra . Apéndice No. 1 Apéndice No. 2 Apéndice No. 3 Solución a Algunos Ejercicios Propuestos Enlaces Bibliografía . ..... ... ... http://tifon.unalmed.edu.co/~pagudel/tabla.html (4 de 4) [15/09/2002 7:40:53]
  • 6. ESTADÍSTICA APLICADA Introducción Introducción Las acciones que acometemos hoy se basan en un plan de ayer y las expectativas del mañana. La palabra estadística se origina, en las técnicas de recolección, organización, conservación, y tratamiento de los datos propios de un estado, con que los antiguos gobernantes controlaban sus súbditos y dominios económicos. Estas técnicas evolucionaron a la par con el desarrollo de las matemáticas, utilizando sus herramientas en el proceso del análisis e interpretación de la información. Para mediados del siglo XVII en Europa, los juegos de azar eran frecuentes, aunque sin mayores restricciones legales. El febril jugador De Méré consultó al famoso matemático y filosofo Blaise Pascal (1623-1662) para que le revelara las leyes que controlan el juego de los dados, el cual, interesado en el tema, sostuvo una correspondencia epistolar con el tímido Pierre de Fermat (1601-1665, funcionario público apasionado por las matemáticas; célebre porque no publicaba sus hallazgos) dando origen a la teoría de la probabilidad, la cual se ha venido desarrollando y constituyéndose en la base primordial de la estadística. En nuestros días, son de uso cotidiano las diferentes técnicas estadísticas que partiendo de observaciones muestrales o históricas, crean modelos lógico-matemáticos que se "aventuran" describir o pronosticar un determinado fenómeno con cierto grado de certidumbre medible. El presente texto no pretende teorizar el saber estadístico, desde luego, no es un libro para . . . estadísticos, ya que, adrede se obvia el rigor científico de lo expuesto en beneficio de la ..... . . sencillez necesaria para el neófito; con un lenguaje coloquial se conduce al lector a través del contenido, a partir de dos o tres ejemplos que ilustran la aplicabilidad de los temas tratados. El avance tecnológico en la informática ha contribuido enormemente al desarrollo de la estadística, sobre todo en la manipulación de la información, pues en el mercado existen paquetes estadísticos de excelente calidad, como el SAS, SPSS, SCA, STATGRAPHICS, amén de otros, que "corren" en un ordenador sin mayores exigencias técnicas, permitiendo el manejo de grandes volúmenes de información y de variables. La estadística, entonces, dejó de ser una técnica exclusiva de los estados, para convertirse en una herramienta imprescindible de todas las ciencias, de donde proviene la desconcertante des-uniformidad en las definiciones de los diferentes autores, ya que cada estudioso la define de acuerdo con lo que utiliza de ella y tenemos definiciones como que: la estadística es la tecnología del método científico, o que es el conocimiento relacionado http://tifon.unalmed.edu.co/~pagudel/introduccion.html (1 de 2) [15/09/2002 7:40:57]
  • 7. ESTADÍSTICA APLICADA Introducción con la toma de decisiones en condiciones de incertidumbre, o que la estadística son métodos para obtener conclusiones a partir de los resultados de los experimentos o procesos, o que es un método para describir o medir las propiedades de una población. En fin, no se trata de discutir si la estadística es una ciencia, una técnica o una herramienta, sino de la utilización de sus métodos en provecho de la evolución del conocimiento. La estadística hace inferencias sobre una población, partiendo de una muestra representativa de ella. Es a partir del proceso del diseño y toma de la muestra desde donde comienzan a definirse las bondades y confiabilidad de nuestras aseveraciones, hechas, preferentemente, con un mínimo costo y mínimo error posible. ... ... http://tifon.unalmed.edu.co/~pagudel/introduccion.html (2 de 2) [15/09/2002 7:40:57]
  • 8. ESTADÍSTICA APLICADA 1. La Estadística 1. La Estadística " El poder se nutre de la información y el conocimiento". 1.1 IMPORTANCIA En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el punto de incursionar en la totalidad de las ciencias; inclusive, en la lingüística se aplican técnicas estadísticas para esclarecer la paternidad de un escrito o los caracteres más relevantes de un idioma. La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se entiende mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado de incertidumbre... y la Estadística ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las decisiones con un determinado grado de confianza. Los críticos de la estadística afirman que a través de ella es posible probar cualquier cosa, lo cual es un concepto profano que se deriva de la ignorancia en este campo y de lo polifacético de los métodos estadísticos. Sin embargo muchos "investigadores" tendenciosos han cometido abusos con la estadística, elaborando "investigaciones" de intención, teniendo previamente los resultados que les interesan mostrar a personas ingenuas y desconocedoras de los hechos. Otros, por ignorancia o negligencia, abusan de la estadística utilizando modelos inapropiados o razonamientos ilógicos y erróneos que conducen al rotundo fracaso de sus investigaciones. Lincoln L. Chao* hace referencia a uno de los más estruendosos fracasos, debido a los abusos en la toma de una muestra: Se trata del error cometido por la Literary Digest que, en sus pronósticos para las elecciones presidenciales en EE.UU. para 1936, afirmó que Franklin D. Roosvelt obtendría 161 votos electorales y Alfred Landon, 370. La realidad mostró a Roosvelt con 523 votos y a Landon con 8 solamente. .. El error se debió a que la muestra fue tomada telefónicamente a partir de la lista de ..... .. suscriptores de la Digest y, en 1936, las personas que se daban el lujo de tener teléfonos y . suscripciones a revistas no configuraban una muestra representativa de los votantes de EE.UU. y, por ende, no podía hacerse un pronóstico confiable con tan sesgada información. 1.2 DEFINICIÓN http://tifon.unalmed.edu.co/~pagudel/1estadistica.html (1 de 2) [15/09/2002 7:41:00]
  • 9. ESTADÍSTICA APLICADA 1. La Estadística Definir la estadística es una tarea difícil porque tendríamos que definir cada una de las técnicas que se emplean en los diferentes campos en los que interviene. Sin embargo, diremos, en forma general, que la estadística es un conjunto de técnicas que, partiendo de la observación de fenómenos, permiten al investigador obtener conclusiones útiles sobre ellos. 1.3 DIVISIÓN La estadística se divide en dos grandes ramas de estudio que son: La estadística descriptiva, la cual se encarga de la recolección, clasificación y descripción de datos muestrales o poblacionales, para su interpretación y análisis, que es de la que nos ocuparemos en este curso; y la estadística matemática o inferencial, que desarrolla modelos teóricos que se ajusten a una determinada realidad con cierto grado de confianza. Estas dos ramas no son independientes; por el contrario, son complementarias y entre ambas dan la suficiente ilustración sobre una posible realidad futura, con el fin de que quien tenga poder de decisión, tome las medidas necesarias para transformar ese futuro o para mantener las condiciones existentes. ______________________________ * LINCOLN, L. Chao. Estadística para Ciencias Administrativas. Trad. Jesús María Castaño. ... ... http://tifon.unalmed.edu.co/~pagudel/1estadistica.html (2 de 2) [15/09/2002 7:41:00]
  • 10. ESTADÍSTICA APLICADA 2. Etapas del Método Estadístico 2. Etapas del Método Estadístico El método estadístico, parte de la observación de un fenómeno, y como no puede siempre mantener las mismas condiciones predeterminadas o a voluntad del investigador, deja que actúen libremente, pero se registran las diferentes observaciones y se analizan sus variaciones. Para el planeamiento de una investigación, por norma general, se siguen las siguientes etapas: 2.1 Planteamiento del problema. 2.2 Fijación de los objetivos. 2.3 Formulación de la hipótesis. 2.4 Definición de la unidad de observación y de la unidad de medida. 2.5 Determinación de la población y de la muestra. 2.6 La recolección. 2.7 Crítica, clasificación y ordenación. 2.8 Tabulación. 2.9 Presentación. 2.10 Análisis. 2.11 Publicación. 2.1 PLANTEAMIENTO DEL PROBLEMA Al abordar una investigación se debe tener bien definido qué se va a investigar y por qué se pretende estudiar algo. Es decir, se debe establecer una delimitación clara, concreta e inteligible sobre el o los fenómenos que se pretenden estudiar, para lo cual se deben tener en cuenta, entre otras cosas, la revisión bibliográfica del tema, para ver su accesibilidad y consultar los resultados obtenidos por investigaciones similares, someter nuestras proposiciones básicas a un análisis lógico; es decir, se debe hacer una ubicación histórica y teórica del problema. 2.2 FIJACIÓN DE LOS OBJETIVOS Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta dónde queremos llegar; en otras palabras, debemos fijar cuales son nuestras metas y objetivos. Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigüedades y http://tifon.unalmed.edu.co/~pagudel/2etapas.html (1 de 5) [15/09/2002 7:41:04]
  • 11. ESTADÍSTICA APLICADA 2. Etapas del Método Estadístico debe, además, establecerse diferenciación entre lo de corto, mediano y largo plazo, así como entre los objetivos generales y los específicos. 2.3 FORMULACIÓN DE LAS HIPÓTESIS Una hipótesis es ante todo, una explicación provisional de los hechos objeto de estudio, y su formulación depende del conocimiento que el investigador posea sobre la población investigada. Una hipótesis estadística debe ser susceptible de docimar, esto es, debe poderse probar para su aceptación o rechazo. Una hipótesis que se formula acerca de un parámetro (media, proporción, varianza, etc.), con el propósito de rechazarla, se llama Hipótesis de Nulidad y se representa por Ho; a su hipótesis contraria se le llama Hipótesis Alternativa (H1). 2.4 DEFINICIÓN DE LA UNIDAD DE OBSERVACIÓN Y DE LA UNIDAD DE MEDIDA La Unidad de Observación, entendida como cada uno de los elementos constituyentes de la población estudiada, debe definirse previamente, resaltando todas sus características; pues, al fin de cuentas, es a ellas a las que se les hará la medición. La unidad de observación puede estar constituida por uno o varios individuos u objetos y denominarse respectivamente simple o compleja. El criterio sobre la unidad de medición debe ser previamente definido y unificado por todo el equipo de investigación. Si se trata de medidas de longitud, volumen, peso, etc., debe establecerse bajo qué unidad se tomarán las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc. Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las cuales se ha de efectuar la toma de la información. 2.5 DETERMINACIÓN DE LA POBLACIÓN Y DE LA MUESTRA Estadísticamente, la población se define como un conjunto de individuos o de objetos que poseen una o varias características comunes. No se refiere esta definición únicamente a los seres vivientes; una población puede estar constituida por los habitantes de un país o por los peces de un estanque, así como por los establecimientos comerciales de un barrio o las unidades de vivienda de una ciudad. Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aquí el término infinito no está siendo tomado con el rigor semántico de la palabra; por ejemplo, los peces dentro de un estanque son un conjunto finito; sin embargo, en términos estadísticos, puede ser considerado como infinito. Muestra es un subconjunto de la población a la cual se le efectúa la medición con el fin http://tifon.unalmed.edu.co/~pagudel/2etapas.html (2 de 5) [15/09/2002 7:41:04]
  • 12. ESTADÍSTICA APLICADA 2. Etapas del Método Estadístico de estudiar las propiedades del conjunto del cual es obtenida. En la práctica, estudiar todos y cada uno de los elementos que conforman la población no es aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad de sus elementos, porque a veces es necesario destruir lo que se está midiendo, por ser demasiado grande el número de sus componentes o no se pueden controlar; por eso se recurre al análisis de los elementos de una muestra con el fin de hacer inferencias respecto al total de la población. Existen diversos métodos para calcular el tamaño de la muestra y también para tomar los elementos que la conforman, pero no es el objetivo de este curso estudiarlos. Diremos solamente que la muestra debe ser representativa de la población y sus elementos escogidos al azar para asegurar la objetividad de la ... ..... investigación. .. 2.6 LA RECOLECCIÓN Una de las etapas más importantes de la investigación es la recolección de la información, la cual ha de partir, a menos que se tenga experiencia con muestras análogas, de una o varias muestras piloto en las cuales se pondrán a prueba los cuestionarios y se obtendrá una aproximación de la variabilidad de la población, con el fin de calcular el tamaño exacto de la muestra que conduzca a una estimación de los parámetros con la precisión establecida. El establecimiento de las fuentes y cauces de información, así como la cantidad y complejidad de las preguntas, de acuerdo con los objetivos de la investigación son decisiones que se han de tomar teniendo en cuenta la disponibilidad de los recursos financieros, humanos y de tiempo y las limitaciones que se tengan en la zona geográfica, el grado de desarrollo, la ausencia de técnica, etc. Es, entonces, descubrir dónde está la información y cómo y a qué "costo" se puede conseguir; es determinar si la encuesta se debe aplicar por teléfono, por correo, o si se necesitan agentes directos que recojan la información; establecer su número óptimo y preparar su entrenamiento adecuado. 2.7 CRITICA, CLASIFICACIÓN Y ORDENACIÓN Después de haber reunido toda la información pertinente, se necesita la depuración de los datos recogidos. Para hacer la crítica de una información, es fundamental el conocimiento de la población por parte de quien depura para poder detectar falsedades en las respuestas, incomprensión a las preguntas, respuestas al margen, amén de todas las posibles causas de nulidad de una pregunta o nulidad de todo un cuestionario. Separado el material de "desecho" con la información depurada se procede a establecer las clasificaciones respectivas y con la ayuda de hojas de trabajo, en las que se establecen los cruces necesarios entre las preguntas, se ordenan las respuestas y se preparan los modelos de tabulación de las diferentes variables que intervienen en la investigación. http://tifon.unalmed.edu.co/~pagudel/2etapas.html (3 de 5) [15/09/2002 7:41:04]
  • 13. ESTADÍSTICA APLICADA 2. Etapas del Método Estadístico El avance tecnológico y la popularización de los computadores hacen que estas tareas, manualmente dispendiosas, puedan ser realizadas en corto tiempo. 2.8 LA TABULACIÓN Una tabla es un resumen de información respecto a una o más variables, que ofrece claridad al lector sobre lo que se pretende describir; para su fácil interpretación una tabla debe tener por lo menos: Un titulo adecuado el cual debe ser claro y conciso. La Tabla propiamente dicha con los correspondientes subtítulos internos y la cuantificación de los diferentes ítems de las variables, y las notas de pie de cuadro que hagan claridad sobre situaciones especiales de la tabla, u otorguen los créditos a la fuente de la información. 2.9 LA PRESENTACIÓN Una información estadística adquiere más claridad cuando se presenta en la forma adecuada. Los cuadros, tablas y gráficos facilitan el análisis, pero se debe tener cuidado con las variables que se van a presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y gráficos redundantes que, antes que claridad, crean confusión. Además la elección de determinada tabla o gráfico para mostrar los resultados, debe hacerse no sólo en función de las variables que relaciona, sino del lector a quien va dirigido el informe. 2.10 EL ANÁLISIS La técnica estadística ofrece métodos y procedimientos objetivos que convierten las especulaciones de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y ofrecer una premisa medible en la toma de una decisión. Es el análisis donde se cristaliza la investigación. Esta es la fase de la determinación de los parámetros y estadísticos muestrales para las estimaciones e inferencias respecto a la población, el ajuste de modelos y las pruebas de las hipótesis planteadas, con el fin de establecer y redactar las conclusiones definitivas. 2.11 PUBLICACIÓN Toda conclusión es digna de ser comunicada a un auditorio. Es más, hay otros estudiosos del mismo problema a quienes se les puede aportar información, conocimientos y otros puntos de vista acerca de él. CUESTIONARIO 1. ¿Por qué se considera importante la estadística? http://tifon.unalmed.edu.co/~pagudel/2etapas.html (4 de 5) [15/09/2002 7:41:04]
  • 14. ESTADÍSTICA APLICADA 2. Etapas del Método Estadístico 2. Enuncie las ramas en las que se divide la estadística y establezca su campo de acción. 3. Enumere las etapas del método estadístico. 4. ¿Por qué es importante la revisión bibliográfica en el desarrollo de una investigación estadística?. 5. ¿Qué es la hipótesis nula?. 6. Defina: Población, Muestra, Censo y Muestreo. 7. ¿Por qué usualmente se recurre al análisis a través de muestras y no de poblaciones?. 8. ¿Para qué se utiliza un muestreo piloto?. 9. ¿Con qué fin se critica una información? 10. ¿Cuáles son los componentes de una tabla? ... ... http://tifon.unalmed.edu.co/~pagudel/2etapas.html (5 de 5) [15/09/2002 7:41:04]
  • 15. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias 3. Distribución de Frecuencias Después de recoger toda la información correspondiente a la investigación, es decir, al agotar todo el trabajo de campo, nuestro escritorio se llena de un cúmulo de datos y cifras desordenadas los cuales, al ser tomados como observaciones individuales, dicen muy poco sobre la población estudiada; es, entonces, tarea del investigador “hacer hablar las cifras”, comenzando por la clasificación y ordenación, consignando la información en tablas inteligibles que denominamos distribuciones de frecuencias. 3.1 DISTRIBUCIÓN DE FRECUENCIAS SIMPLE Para una mayor sencillez, en la exposición del tema, nos valemos del siguiente ejemplo: Supongamos que en la fábrica de confecciones “La Hilacha”, ha estallado un conflicto laboral y sus cincuenta operarias solicitan un aumento en el salario integral diario sopena de paralizar la fábrica. El Gerente-propietario recoge la información respecto a la variable salario diario de sus 50 operarias y la relaciona en la tabla No 1. Tabla No.1 http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (1 de 10) [15/09/2002 7:41:19]
  • 16. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias Tabla No. 2 Tabla No. 3 http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (2 de 10) [15/09/2002 7:41:19]
  • 17. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias Tabla No. 4 Como se puede observar, hay una gran diferencia entre los datos brutos de la tabla No.1 y el ordenamiento y agrupamiento de la tabla No. 4. http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (3 de 10) [15/09/2002 7:41:19]
  • 18. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias Con el fin de obtener una mejor tabla interpretativa, introduciremos la siguiente simbología: n: El tamaño de la muestra, es el número de observaciones. Xi: La variable; es cada uno de los diferentes valores que se han observado. La variable xi, toma los x1, x2... xm valores. fi: La frecuencia absoluta o simplemente frecuencia, es el número de veces que se repite la variable Xi; así f1, es el número de veces que se repite la observación x1, f2 el número de veces que se repite la observación x2 etc. fa: La frecuencia acumulada, se obtiene acumulando la frecuencia absoluta. fr: Frecuencia relativa; es el resultado de dividir c/u de las frecuencias absolutas por el tamaño de la muestra. fra: Frecuencia relativa acumulada; se obtiene dividiendo la frecuencia acumulada entre el tamaño de la muestra. Distribución Teórica de Frecuencias de n Observaciones . . . . . . . . http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (4 de 10) [15/09/2002 7:41:19]
  • 19. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias . . Veamos el ejemplo que venimos trabajando: Tabla No. 5 Distribución de Frecuencias del Salario Diario de 50 Obreras http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (5 de 10) [15/09/2002 7:41:19]
  • 20. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias En la práctica, cuando se tiene confianza en el ordenamiento, no son necesarias tantas tablas; se puede pasar de la tabla No1 directamente a la tabla No 6. Tabla No. 6 Salario Diario de 50 Operarias de La Fabrica de Confecciones “La Hilacha”(Miles de Pesos) Analizando las columnas porcentuales fr y fra se obtienen, entre otras las siguientes conclusiones: q Sólo el 4% de las obreras gana el máximo salario/día de la fabrica, el cual corresponde a $58.000.00 q El salario diario mínimo ($50.000.00) lo gana únicamente una obrera, lo que constituye el 2% del personal asalariado. q El 62% de las operarias tiene un salario diario entre $53.000.00 y $55.000.00 q El 60% de las obreras tiene un salario/día de $54.000.00 o menos. q El 64% tiene un ingreso/día de $54.000.00 o más. CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. ¿Qué es frecuencia absoluta? 2. Cómo se obtiene: 2.1 ¿La frecuencia acumulada? http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (6 de 10) [15/09/2002 7:41:19]
  • 21. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias 2.2 ¿La frecuencia relativa? 2.3 ¿La frecuencia relativa acumulada 3. En una distribución de frecuencias ¿se pueden establecer conclusiones porcentuales, utilizando solamente la frecuencia relativa? ¿Por qué? 4. La siguiente tabla relaciona las ausencias al trabajo de 50 obreras, durante el mes de octubre, en la fabrica de confecciones "la hilacha". 4.1 Construir una distribución de frecuencias simple. 4.2 Sacar 3 conclusiones. 5. Años de experiencia de las 50 operarias de la fabrica de confecciones "la hilacha" Ordenar la Información y responder : 5.1 ¿Qué porcentaje de las obreras tiene experiencia inferior o igual a 6 años? 5.2 ¿Que porcentaje tiene experiencia entre 5 y 7 años (incluyendo los extremos)? 6. Palabras por Minuto Escritas por un Grupo de Mecanógrafas http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (7 de 10) [15/09/2002 7:41:19]
  • 22. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias Construir una distribución de frecuencias y resaltar 3 conclusiones 7. La siguiente tabla muestra, las respuestas obtenidas en un cuestionario aplicado a las obreras de la fábrica "La hilacha", respecto a la edad, estado civil, número de hijos, experiencia, años de estudio, ingresos diarios, gastos en educación y ausencias al trabajo en el último mes, así como una calificación del desempeño otorgada por el supervisor. http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (8 de 10) [15/09/2002 7:41:19]
  • 23. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (9 de 10) [15/09/2002 7:41:19]
  • 24. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias Hacer las respectivas distribuciones de frecuencias, para cada una de las variables. ... ... http://tifon.unalmed.edu.co/~pagudel/3frecuencias.html (10 de 10) [15/09/2002 7:41:19]
  • 25. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias 3. Distribución de Frecuencias 3.2 DISTRIBUCIÓN DE FRECUENCIAS POR INTERVALOS Usualmente los valores de los datos no permiten un agrupamiento de ellos en una tabla de frecuencias simple, debido a que se encuentran distribuidos a través de todo el recorrido y el número de veces que se repite cada observación no es significativo en todos los casos, y en la mayoría de ellos su frecuencia es baja. Una tabla de frecuencias construida en estas condiciones, no presenta ninguna utilidad. Ilustraremos el caso a través de un ejemplo, para ello, supongamos que la fabrica de baldosas”De las casas”, con el objeto de ofrecer una garantía de su producto, desea hacer un estudio técnico de su producción, para lo cual extrae una muestra de 100 baldosas, cada una de las cuales se somete a una prueba de resistencia, destructiva cuyos datos expresados en Kg/ Cm2, se relacionan a continuación: Tabla No. 7 Resistencia en Kg/Cm2 de 100 Baldosas de La Fabrica “De Las Casas” La clasificación en una distribución de frecuencias simple daría como resultante un ordenamiento de por lo menos 80 items; la mayoría de ellos con frecuencia unitaria. Se hace necesario el agrupamiento en intervalos o clases que haga más compacta, manejable y presentable la información. http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (1 de 8) [15/09/2002 7:41:40]
  • 26. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias El número de clases y la amplitud de los intervalos los fija el investigador de acuerdo con el conocimiento que posea de la población, la necesidad de hacer comparación con otras investigaciones y la presentación de la información. Sin embargo, se recomienda que la información no sea demasiado compacta, lo cual le restaría precisión, ni demasiado dispersa, ya que no se tendría claridad. En términos generales, es usual que el número de intervalos no sea inferior a 5 ni superior a 15. Struges propone que el número de clases o intervalos sea determinado por la expresión m ≅1 + 3.3 log(n).* La amplitud debe ser igual para todos los intervalos y, en lo posible, no se debe trabajar con clases abiertas. 3.3 REGLAS EMPÍRICAS PARA LA CONSTRUCCIÓN DE INTERVALOS Cuando no se tiene experiencia en el manejo de la información es aconsejable seguir los pasos que se dan a continuación: 3.3.1 Determinar los datos de mayor y menor valor Xmax, Xmin. 3.3.2 Calcular el rango o recorrido 3.3.3 Determinar el número de intervalos (m) y la amplitud de clase (A): , Debe tenerse presente que m es un número natural. Luego se busca la amplitud A: , 3.3.4 Calcular el rango ampliado: 3.3.5 Establecer la diferencia , es decir la cantidad en que ha sido alterado el recorrido, la cual no debe ser superior a la amplitud. (“a”) También puede ser definida como la cantidad positiva más pequeña que le hace falta al rango o recorrido para ser divisible exactamente por la amplitud 3.3.6 Distribuir adecuadamente la cantidad “a” de la siguiente manera: http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (2 de 8) [15/09/2002 7:41:40]
  • 27. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias Al valor X min se le resta aproximadamente y la parte restante se le suma a X max, obteniendo el límite inferior del primer intervalo y el límite superior del último, respectivamente. 3.3.7 Construir los intervalos, calcular los puntos medios o marcas de clase y hacer el agrupamiento de frecuencias. Distribución Teórica de Frecuencias por Intervalos de n Observaciones n: Número de observaciones LIPI: Límite inferior del primer intervalo http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (3 de 8) [15/09/2002 7:41:40]
  • 28. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias LSUI: Límite superior del último interval Xi: Punto medio del intervalo, o marca de clase * Con el fin de prever dobles conteos, quien clasifica deberá especificar si los intervalos son abiertos a la derecha o abiertos a la izquierda, en estas notas, trabajaremos con intervalos abiertos a la derecha; es decir, del tipo , donde el límite superior no está incluido dentro de la clase. Retomemos el ejercicio de la Tabla No. 7 y construyamos una distribución de frecuencia por intervalos. 3.3.1 , . . 3.3.2 Rango , .... . . . . 3.3.3 Número de intervalos , , No es lógico tener 7.6 intervalos, por lo tanto se procede a aproximar el número de intervalos a un número natural cercano. Aproximemos, , y busquemos la amplitud. , Ya terminado el número de clases en m=7 encontramos que la amplitud debe ser mayor que 94. Fijémosla, entonces, en A = 100, que hace más manejable y presentable la tabla con la información. 3.3.4 Rango ampliado , . 3.3.5 Hemos alterado el rango original , cambiándolo por el rango ampliado http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (4 de 8) [15/09/2002 7:41:40]
  • 29. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias . La diferencia está representada por o sea 3.3.6 Tenemos por tanto, que distribuir adecuadamente la diferencia entre los rangos Como se dijo antes, no estamos hablando de restar o sumar estrictamente sino una cantidad aproximada que brinde una buena presentación. 3.3.7 Construcción de los intervalos. Tabla No. 8 Construcción de los Intervalos para la Resistencia de las Baldosas Se puede desde luego, proceder a agrupar la información en los respectivos intervalos, haciendo la salvedad de que ninguno de los límites superiores de clase son considerados dentro de los intervalos. Tabla No. 9 Distribución de Frecuencias por Intervalos de la Resistencia de 100 Baldosas de la Fabrica “de las Casas” http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (5 de 8) [15/09/2002 7:41:40]
  • 30. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias Conclusiones: q El 72% de las baldosas tiene una resistencia entre 300 y 600 Kg/Cm 2. q El 86% de las baldosas resiste menos de 600 Kg/Cm2. q Sólo el 5% resiste 700 o más Kg/Cm2. CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. ¿Por qué se recurre al agrupamiento en distribuciones de frecuencias por intervalos? 2. ¿Cómo se determina el número de intervalos y la amplitud de ellos? 3. ¿Qué es una marca de clase? 4. Consumo de agua, en m3de 184 familias n un barrio residencial de una ciudad durante el mes de octubre: http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (6 de 8) [15/09/2002 7:41:40]
  • 31. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias Construir una distribución de frecuencias por intervalos. 4.1 Asumiendo el número de intervalos m = 8 4.2 Asumiendo el número de intervalos m = 9 4.3 Comparar las dos distribuciones y las conclusiones que de ellas se deriven. 5. Calificaciones Obtenidas por 130 Estudiantes en un Examen de Estadística: http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (7 de 8) [15/09/2002 7:41:40]
  • 32. ESTADÍSTICA APLICADA 3 Distribución de Frecuencias Construir una distribución de frecuencias por intervalos y resaltar cuatro (4) conclusiones. ______________________________ * Ver Apéndice No. 2 ... ... http://tifon.unalmed.edu.co/~pagudel/32frecuencias.html (8 de 8) [15/09/2002 7:41:40]
  • 33. ESTADÍSTICA APLICADA 4. Representación Gráfica 4. Representación Gráfica A pesar de la gran ayuda que prestan las tablas y cuadros con información organizada, no todos los públicos alcanzan a comprenderla o no disponen del tiempo suficiente para analizarla. Es por ello que la mayoría de los investigadores acostumbran a reforzar la descripción a través de dibujos, generalmente con formas geométricas, que ayudan a visualizar el comportamiento de las variables tratadas. 4.1 DEFINICIÓN Una gráfica o diagrama es un dibujo complementario a una tabla o cuadro, que permite observar las tendencias de un fenómeno en estudio y facilita el análisis estadístico de las variables allí relacionadas. 4.2 COMPONENTES DE UNA GRÁFICA Una gráfica, al igual que un cuadro o una tabla, debe constar de: 4.2.1 Título adecuado: El cual debe ser claro y conciso, que responda a las preguntas: Qué relaciona, cuándo y dónde se hicieron las observaciones. 4.2.2 El cuerpo: o gráfico en sí, cuya elección debe considerar el o los tipos variables a relacionar, el público a quien va dirigido y el diseño artístico del gráfico. 4.2.3 Notas de pie de gráfico: Donde se presentan aclaraciones respecto al gráfico, las escalas de los ejes, o se otorgan los créditos a las fuentes respectivas. Es de anotar que por medio de gráficos tendenciosos se pueden deformar o resaltar situaciones o estados, que presentados en un gráfico apropiado, mostrarían un comportamiento normal. Generalmente una información es distorsionada por algunas de las siguientes causas: 4.2.1.1 La relación entre los ejes no es la mas apropiada ( ver gráficos No.1 y No.2. 4.2.1.2 Gráficos con escalas desproporcionadas, o mala elección del punto de origen ( ver gráfico No.3). http://tifon.unalmed.edu.co/~pagudel/4grafica.html (1 de 12) [15/09/2002 7:41:55]
  • 34. ESTADÍSTICA APLICADA 4. Representación Gráfica Variación de La Inflación en Colombia 1995-2000 Gráfico No. 1 Gráfico No. 2 http://tifon.unalmed.edu.co/~pagudel/4grafica.html (2 de 12) [15/09/2002 7:41:55]
  • 35. ESTADÍSTICA APLICADA 4. Representación Gráfica Gráfico No. 3 Como se puede observar, el gráfico No.1 “realza” el decrecimiento de la variable inflación, mientras que el No.2 intenta mostrar una estabilización o decrecimiento parsimonioso. Los dos dibujos son incorrectos debido a que no conservan una proporción adecuada entre sus ejes. Sin embargo, el gráfico No. 3 tiene una buena proporción entre los ejes. Pero, la distorsión se debe a la mala numeración en el eje “Y” pues, el punto de origen O ha sido eliminado y asignado un valor arbitrario, la escala es inadecuada para resaltar el decrecimiento inflacionario de los dos últimos periodos. Ambas situaciones son erróneas o tendenciosas y se deben corregir asignando escalas apropiadas a los ejes y utilizando la siguiente regla: Donde: Lx: Longitud del eje horizontal Ly: Longitud del eje vertical “La longitud del eje vertical es igual a tres cuartos de la longitud del eje horizontal”. 4.3 PRINCIPALES TIPOS DE GRÁFICOS http://tifon.unalmed.edu.co/~pagudel/4grafica.html (3 de 12) [15/09/2002 7:41:55]
  • 36. ESTADÍSTICA APLICADA 4. Representación Gráfica Existe una gran cantidad de gráficos para la representación de datos estadísticos, ya que de ellos depende el diseño artístico de quien los elabora, así como de su imaginación al combinar varios tipos de ellos, como forma de presentar una información. Entre los gráficos más comunes tenemos: 4.3.1 Gráfico de Líneas: Usado básicamente para mostrar el comportamiento de una variable cuantitativa a través del tiempo. El gráfico de líneas consiste en segmentos rectilíneos unidos entre sí, los cuales resaltan las variaciones de la variable por unidad de tiempo. Para su construcción ha de procederse de la siguiente manera: en el eje de las ordenadas se marcan los puntos de acuerdo con la escala que se esté utilizando. En el caso de una escala aritmética, distancias iguales en el eje, representan distancias iguales en la variable. Variación de la Inflación en Colombia 1995 -2000 El eje de la variable X se divide en unidades de tiempo iguales, teniendo presente el número de ítems que ha de presentarse, así como la longitud del eje. Es de anotar la conveniencia de mostrar la interrupción y acercamiento del eje a su origen cuando esto haya ocurrido. 4.3.2 Gráfico de Líneas Compuesto: Cuando se tienen varias variables a representar, con el fin de establecer comparaciones entre ellas (siempre que su unidad de medida sea la misma); se utiliza plasmarlos en un sólo gráfico, el cual es el resultado de representar varias variables en un mismo plano. Variación de la Inflación y el Salario de la Hilacha http://tifon.unalmed.edu.co/~pagudel/4grafica.html (4 de 12) [15/09/2002 7:41:55]
  • 37. ESTADÍSTICA APLICADA 4. Representación Gráfica 4.3.3 Gráfico de Barras: El gráfico de barras, como su nombre lo indica, está constituido por barras rectangulares de igual ancho, conservando la misma distancia de separación entre sí. Se utiliza básicamente para mostrar y comparar frecuencias de variables cualitativas o comportamientos en el tiempo, cuando el número de ítems es reducido. Número de Hijos de 50 Obreras en "La Hilacha" Éstos gráficos suelen ser de barras verticales, aunque se pueden utilizar de forma horizontal. 4.3.4 Gráfico de Barras Compuesto Preferencias de Partido Según Sexo . . ... . .. http://tifon.unalmed.edu.co/~pagudel/4grafica.html (5 de 12) [15/09/2002 7:41:55]
  • 38. ESTADÍSTICA APLICADA 4. Representación Gráfica . . 4.3.5 Gráfico de Sectores Circulares Usualmente llamado gráfico de pastel, debido a su forma característica de una circunferencia dividida en cascos, por medio de radios que dan la sensación de un pastel tajado en porciones. Se usa para representar variables cualitativas en porcentajes o cifras absolutas cuando el número de ítems no es superior a 5 y se quiere resaltar uno de ellos. Para su construcción se procede de la siguiente forma: La circunferencia tiene en su interior 360 grados, los cuales hacemos corresponder al total de la información, es decir al 100%; luego, para determinar el número de grados correspondiente a cada componente se multiplica el porcentaje respectivo por 360 y se divide por 100, los cuales se miden con la ayuda de un transportador para formar los casquetes de los diferentes ítems. Estado Civil de 50 Operarias de "La Hilacha" 4.3.6 Histograma de Frecuencias: Para la construcción de un histograma de frecuencias de http://tifon.unalmed.edu.co/~pagudel/4grafica.html (6 de 12) [15/09/2002 7:41:55]
  • 39. ESTADÍSTICA APLICADA 4. Representación Gráfica fácil interpretación y que no falsee la información, debe disponerse de una distribución de frecuencias por intervalos con amplitud igual para cada clase o intervalo. En el eje de las abscisas procedemos a representar los intervalos de la variable, y en el eje de las ordenadas las frecuencias de cada clase. El histograma se construye dibujando barras contiguas que tienen como base la amplitud de cada intervalo y como alturas las frecuencias respectivas. Histograma de Frecuencias de la Resistencia de 100 Baldosas 4.3.7 Polígono de Frecuencias Resistencia de 100 Baldosas http://tifon.unalmed.edu.co/~pagudel/4grafica.html (7 de 12) [15/09/2002 7:41:55]
  • 40. ESTADÍSTICA APLICADA 4. Representación Gráfica Para la construcción de un polígono de frecuencias, se marcan los puntos medios de cada uno los intervalos en la parte superior de cada barra del histograma de frecuencias, los cuales se unen con segmentos de recta. 4.3.8 Histograma de Frecuencias Acumuladas El histograma de frecuencias acumuladas también es obtenido a partir de una distribución de frecuencias, tomando en el eje horizontal las clases de la variable, y en el eje vertical las frecuencias acumuladas correspondientes a cada intervalo Resistencia de 100 Baldosas http://tifon.unalmed.edu.co/~pagudel/4grafica.html (8 de 12) [15/09/2002 7:41:55]
  • 41. ESTADÍSTICA APLICADA 4. Representación Gráfica Resistencia de 100 Baldosas CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. ¿Cuál es el objetivo de un gráfico? 2. Describa los componentes de una gráfica . 3. ¿Cuáles son las principales causas de distorsión de la información de un gráfico? 4. ¿ Cuál debe de ser la proporción entre los ejes del plano cartesiano para la construcción de un gráfico? 5. Para los ejercicios 4 y 5 del capitulo 3, numeral 3.2 construir: 5.1 Un histograma de frecuencias 5.2 Un polígono de frecuencias. 5.3 Un histograma de frecuencias acumuladas 5.4 Un polígono de frecuencias acumuladas 6. Costo Promedio del Consumo de Energía de la Fábrica de Confecciones "La Hilacha". http://tifon.unalmed.edu.co/~pagudel/4grafica.html (9 de 12) [15/09/2002 7:41:55]
  • 42. ESTADÍSTICA APLICADA 4. Representación Gráfica Construir un gráfico de líneas para esta información. 7. Índice de Precios al Consumidor 1999-2001 http://tifon.unalmed.edu.co/~pagudel/4grafica.html (10 de 12) [15/09/2002 7:41:55]
  • 43. ESTADÍSTICA APLICADA 4. Representación Gráfica Graficar : El valor del índice, la variación mensual y la variación anual, en función del tiempo. 8. Resultados electorales en Colombia, en la elección de presidente de la república para el período 1986-1990: Liberal 58% Conservador 36% Otros 6% http://tifon.unalmed.edu.co/~pagudel/4grafica.html (11 de 12) [15/09/2002 7:41:55]
  • 44. ESTADÍSTICA APLICADA 4. Representación Gráfica Construir un gráfico apropiado para esta información. ... ... http://tifon.unalmed.edu.co/~pagudel/4grafica.html (12 de 12) [15/09/2002 7:41:55]
  • 45. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central 5. Medidas de Tendencia Central En los capítulos anteriores, nos referimos a la clasificación, ordenación y presentación de datos estadísticos, limitando el análisis de la información a la interpretación porcentual de las distribuciones de frecuencia. El análisis estadístico propiamente dicho, parte de la búsqueda de parámetros sobre los cuales pueda recaer la representación de toda la información. Las medidas de tendencia central, llamadas así porque tienden a localizarse en el centro de la información, son de gran importancia en el manejo de las técnicas estadísticas, sin embargo, su interpretación no debe hacerse aisladamente de las medidas de dispersión, ya que la representabilidad de ellas está asociada con el grado de concentración de la información. Las principales medidas de tendencia central son: 5.1 Media aritmética. 5.2 Mediana 5.3 Moda. 5.1 MEDIA ARITMÉTICA Cotidiana e inconscientemente estamos utilizando la media aritmética. Cuando por ejemplo, decimos que un determinado fumador consume una cajetilla de cigarrillos diaria, no aseguramos que diariamente deba consumir exactamente los 20 cigarrillos que contiene un paquete sino que es el resultado de la observación, es decir, dicho sujeto puede consumir 18, un día; 19 otro; 20, 21, 22; pero según nuestro criterio, el número de unidades estará alrededor de 20. Matemáticamente, la media aritmética se define como la suma de los valores observados dividida entre el número de observaciones. : Media aritmética de la variable X : Valores de la variable X n: Número de observaciones http://tifon.unalmed.edu.co/~pagudel/5medidas.html (1 de 13) [15/09/2002 7:42:38]
  • 46. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central : Signo de sumatoria, indica que se debe sumar Ejemplo: Cantidad de cigarrillos consumidos por un fumador en una semana. . . . Lunes: 18 Martes: 21 Miércoles: 22 Jueves: 21 Viernes: 20 Sábado: 19 Domingo: 19 Entonces la media aritmética es. El fumador consume en promedio 20 cigarrillos diarios. Cuando la variable está agrupada en una distribución de frecuencias, la media aritmética se calcula por la fórmula: Ejemplo: http://tifon.unalmed.edu.co/~pagudel/5medidas.html (2 de 13) [15/09/2002 7:42:38]
  • 47. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central Cantidad de Cigarrillos Consumidos por un Fumador en una Semana Dada: Ejemplo: Calculo de La Media Aritmética. El Salario/día de 50 Operarias http://tifon.unalmed.edu.co/~pagudel/5medidas.html (3 de 13) [15/09/2002 7:42:38]
  • 48. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central = 54.100 pesos/día Si la información está relacionada en una distribución de frecuencias por intervalos, se toman como valores de la variable las marcas de clase de los intervalos, entiéndase por marca de clase el punto medio entre los límites de cada clase o intervalo. Ejemplo: Cálculo de La Media Aritmética de la Resistencia de 100 Baldosas http://tifon.unalmed.edu.co/~pagudel/5medidas.html (4 de 13) [15/09/2002 7:42:38]
  • 49. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central La resistencia promedio de las 100 baldosas es de 448 Kg/Cm². 5.1.1 Propiedades de la Media Aritmética 5.1.1.1 La suma de las diferencias de los datos con respecto a la media aritmética es igual cero. Demostración: pero http://tifon.unalmed.edu.co/~pagudel/5medidas.html (5 de 13) [15/09/2002 7:42:38]
  • 50. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central Como Ejemplo de Comprobación: En el Ejercicio del Fumador Cuya Media Aritmética es de 20 Cigarrillos / día: Para una distribución de frecuencias: Salario/día de 50 Operarias en . La Fábrica de Confecciones "La Hilacha" . ..... . (Miles De Pesos) . . http://tifon.unalmed.edu.co/~pagudel/5medidas.html (6 de 13) [15/09/2002 7:42:38]
  • 51. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central 5.1.1.2 La suma de las diferencias cuadráticas de los datos, con respecto a la Media Aritmética, es mínima. Quiere decir esta propiedad que cualquier otro parámetro p, diferente a la media aritmética hace mayor la expresión: que Para Demostración: Debemos, entonces, probar que: http://tifon.unalmed.edu.co/~pagudel/5medidas.html (7 de 13) [15/09/2002 7:42:38]
  • 52. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central veamos: pero (propiedad a.) entonces: como luego http://tifon.unalmed.edu.co/~pagudel/5medidas.html (8 de 13) [15/09/2002 7:42:38]
  • 53. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central 5.1.1.3 Si a cada uno de los resultados le sumamos o le restamos una constante C , la Media Aritmética queda alterada en esa constante. Demostración: Tenemos los datos x1,x2,.... ....xn . Cuya media aritmética es sea La media aritmética de la nueva variable es: entonces En el ejemplo de las baldosas, , a cada uno de los datos restémosle una constante . http://tifon.unalmed.edu.co/~pagudel/5medidas.html (9 de 13) [15/09/2002 7:42:38]
  • 54. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central 5.1.1.4 Si cada uno de los datos se multiplica por una constante k, entonces la media aritmética queda multiplicada por esa constante: Tenemos los datos x1,x2,.... ....xn cuya media aritmética es sea , Si multiplicamos cada una de las resistencias de las 100 baldosas por una constante tenemos: http://tifon.unalmed.edu.co/~pagudel/5medidas.html (10 de 13) [15/09/2002 7:42:38]
  • 55. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central 5.1.2 Media Aritmética con Cambio de Origen y de Escala En estadística es usual la transformación de variables utilizando las dos últimas propiedades: C = un valor de tendencia central (media, mediana, moda o cualquier otro parámetro. k = generalmente la desviación standar, desviación media, la amplitud etc. Sea ..... para nuestro ejemplo C = 450, k = 100 http://tifon.unalmed.edu.co/~pagudel/5medidas.html (11 de 13) [15/09/2002 7:42:38]
  • 56. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central A la nueva variable “Y” le calculamos la media aritmética. 5.1.3 Media Aritmética Ponderada Hemos visto que la Media Aritmética se calcula con base a la magnitud de los datos, otorgándoles igual importancia a cada uno de ellos. Sin embargo en muchas ocasiones la magnitud del dato esta ponderada con un determinado peso que lo afecta relativamente. La Media Aritmética ponderada tiene en cuenta la importancia relativa de cada uno de los datos, para lo cual la definimos con la siguiente expresión: donde : Media aritmética ponderada http://tifon.unalmed.edu.co/~pagudel/5medidas.html (12 de 13) [15/09/2002 7:42:38]
  • 57. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central xi: Valor de la variable X wi: Ponderación del ítem xi Ejemplo: Las calificaciones de un estudiante están conformadas por los siguientes factores: Un examen cuyo valor es 40% en el cual obtuvo una nota de 4.5, un trabajo de consulta con ponderación del 10% y calificación de 1.0, una exposición equivalente al 15% con nota de 2.0, y por último una investigación con valor del 35% calificada con 3.5. entonces la nota definitiva es: ... ... http://tifon.unalmed.edu.co/~pagudel/5medidas.html (13 de 13) [15/09/2002 7:42:38]
  • 58. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central 5. Medidas de Tendencia Central 5.2 LA MEDIANA Otra medida de tendencia central, utilizada principalmente en estadística no paramétrica, es la mediana, la cual no se basa en la magnitud de los datos, como la media aritmética, sino en la posición central que ocupa en el orden de su magnitud, dividiendo la información en dos partes iguales, dejando igual número de datos por encima y por debajo de ella. 5.2.1 La Mediana Cuando los datos no están Agrupados en Intervalos. Partiendo de la información bruta, ordenamos los datos ascendente o descendentemente: se define Mediana = , si n es impar ó Mediana = , si n es par En el ejercicio de los cigarrillos, consumidos por un fumador tenemos lunes 18, martes 21, miércoles 22, jueves 21, viernes 20, sábado 19, y domingo 19. Ordenando ascendentemente : n, es impar, entonces Veamos cuando n es par: http://tifon.unalmed.edu.co/~pagudel/52medidas.html (1 de 4) [15/09/2002 7:42:50]
  • 59. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central Consumo mensual de agua, en m3, por la fábrica de confecciones “la hilacha”. Enero= 10,. . . . Mayo= 14, . . . . Septiembre= 18, Febrero= 12, Junio= 19, Octubre= 22, Marzo= 15, Julio= 17, Noviembre= 15, Abril= 18, Agosto= 18, Diciembre= 13 Mediana= . . Como se puede observar, en este caso la mediana no es un ..... . dato perteneciente a la información, es un parámetro que . divide la información dejando el 50% por encima y el 50% . por debajo de ella. 5.2.2 La Mediana Cuando la Información se Encuentra Agrupada en Intervalos Si la información esta agrupada en intervalos iguales, entonces la mediana se calcula según la siguiente expresión: Me: Mediana LI: Límite inferior del intervalo donde se encuentra la mediana (intervalo mediano), el cual se determina observando en que clase se encuentra la posición n/2.) http://tifon.unalmed.edu.co/~pagudel/52medidas.html (2 de 4) [15/09/2002 7:42:50]
  • 60. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central n: Número de observaciones : Frecuencia acumulada anterior al intervalo mediano : Frecuencia del intervalo mediano A: Amplitud del intervalo Ejemplo: Resistencia de 100 Baldosas de la Fabrica “De Las Casas” en la columna de frecuencia acumulada advertimos que la observación número 50 se halla en el cuarto intervalo 4. Se concluye que el 50% de las baldosas resiste menos de 445.45 Kg/Cm2 y el 50% resiste mas de 445.45 Kg/Cm2. http://tifon.unalmed.edu.co/~pagudel/52medidas.html (3 de 4) [15/09/2002 7:42:50]
  • 61. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central ... ... http://tifon.unalmed.edu.co/~pagudel/52medidas.html (4 de 4) [15/09/2002 7:42:50]
  • 62. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central 5. Medidas de Tendencia Central 5.3 LA MODA La moda, como su nombre lo indica, es el valor más común (de mayor frecuencia dentro de una distribución. Una información puede tener una moda y se llama unimodal, dos modas y se llama bimodal, o varias modas y llamarse multimodal. Sin embargo puede ocurrir que la información no posea moda. 5.3.1 La Moda Cuando los datos no están Agrupados en Intervalos Salario de 50 Operarias de la Fabrica de Confecciones "La Hilacha" El valor que más veces se repite es 54 con una frecuencia de 12, entonces decimos que la moda es Mo = 54.000.00 pesos diarios. http://tifon.unalmed.edu.co/~pagudel/53medidas.html (1 de 4) [15/09/2002 7:42:59]
  • 63. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central Cantidad de Cigarrillos Consumidos por un Fumador en una Semana Dada: Los valores de mayor frecuencia corresponden a 19 y 21, por lo tanto se trata de una distribución bimodal con Mo1=19 y Mo2=21 5.3.2 Cálculo de la Moda Cuando la Información está Agrupada en Intervalos Cuando la información se encuentra agrupada en intervalos de igual tamaño la moda se calcula con la siguiente expresión. . , donde: . ..... . . . Mo: Moda LI: Límite inferior del intervalo modal fm: Frecuencia de la clase modal f(m-1) : Frecuencia de la clase premodal f(m+1) : Frecuencia de la clase posmodal A : Amplitud de los intervalos Ejemplo: Resistencia de 100 Baldosas http://tifon.unalmed.edu.co/~pagudel/53medidas.html (2 de 4) [15/09/2002 7:42:59]
  • 64. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central A pesar que el valor 444.44 no es un dato real de la información asumimos ese parámetro como el de mayor ocurrencia. CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. ¿Que es una medida de tendencia central? 2. ¿Cuales son las principales medidas de tendencia central? 3. Defina : media aritmética mediana y moda. 4. ¿Cuándo se utiliza la media aritmética ponderada? 5. Enuncie las propiedades de la media aritmética 6. Para cada información de los ejercicios del capitulo 3, calcular e interpretar la media aritmética, la mediana y la moda. 7. La tripulación de un avión, en su itinerario compra los siguientes galones de gasolina: Ciudad X 200 galones a 4000 pesos el galón http://tifon.unalmed.edu.co/~pagudel/53medidas.html (3 de 4) [15/09/2002 7:42:59]
  • 65. ESTADÍSTICA APLICADA 5. Medidas de Tendencia Central Ciudad Y 250 galones a 3500 pesos el galón Ciudad Z 300 galones a 3000 pesos el galón ¿Cuál es el costo promedio de la gasolina comprada? ... ... http://tifon.unalmed.edu.co/~pagudel/53medidas.html (4 de 4) [15/09/2002 7:42:59]
  • 66. ESTADÍSTICA APLICADA 6. Medidas de Posición 6. Medidas de Posición (Percentiles) En el Capitulo anterior, vimos lo referente a las medidas de tendencia central, las cuales, a su vez, son también medidas de posición ya que, de todas maneras ocupan un lugar dentro de la información. Nos ocuparemos ahora de ciertos parámetros posicionales muy útiles en la interpretación porcentual de la información. 6.1 CUARTILES Las cuartillas o cuartiles son valores posicionales que dividen la información en cuatro partes iguales, el primer cuartil deja el 25% de la información por debajo de él, y el 75% por encima, el segundo cuartil, al igual que la mediana, divide la información en dos partes iguales, y por último el tercer cuartil deja el 75% por debajo de sí, y el 25% por encima. Gráficamente: Se necesita, entonces calcular tres cuartillas ya que la cuarta queda automáticamente determinada. , donde: k: Oden del cuartil k = 1,2,3 LI:.......... Límite inferior del intervalo que contiene el cuartil fa(i-1): Frecuencia acumulada hasta el intervalo anterior al que contiene el cuartil fi : Frecuencia del intervalo que contiene el cuartil n: Número de observaciones http://tifon.unalmed.edu.co/~pagudel/6Percentiles.html (1 de 6) [15/09/2002 7:43:16]
  • 67. ESTADÍSTICA APLICADA 6. Medidas de Posición A: Amplitud de los intervalos Ejemplo: Resistencia de 100 Baldosas de la Fabrica "De Las Casas" Primer cuartil: posición que debe ser ubicada en la frecuencia acumulada, para determinar que clase contiene este cuartil. El 25% de las baldosas resiste menos de 352.38 Kg/Cm2 y el 75% tiene una resistencia superior. Como el segundo cuartil es lo mismo que la mediana: Me=Q2=445.45Kg/Cm2 Calculemos la tercera cuartilla k=3 http://tifon.unalmed.edu.co/~pagudel/6Percentiles.html (2 de 6) [15/09/2002 7:43:16]
  • 68. ESTADÍSTICA APLICADA 6. Medidas de Posición El 75% de las baldosas tiene una resistencia inferior a 538..88 Kg/Cm2 y el 25% una resistencia superior. 6.2 QUINTILES Los quintiles o quintillas dividen la información en cinco partes iguales, agrupándolas en porcentajes de 20, 40, 60, y 80 por ciento, en consecuencia debemos calcular cuatro parámetros: Gráficamente: . . .... . ..... . . calculemos por ejemplo la segunda quintilla para el ejercicio que traemos: k=2, El 40% de las baldosas resiste menos de 415.15kg/cm2 y el 60% resiste más. http://tifon.unalmed.edu.co/~pagudel/6Percentiles.html (3 de 6) [15/09/2002 7:43:16]
  • 69. ESTADÍSTICA APLICADA 6. Medidas de Posición 6.3 DECILES Similarmente, los deciles o decillas dividen la información en diez partes iguales, en cantidades porcentuales de 10 en 10. 6.4 CENTILES Obviamente los centiles dividen la información en 100 partes, lo cual facilita la interpretación porcentual de una distribución de frecuencias. 6.5 RESUMEN En general para calcular cualquier percentil: , donde: r: Número de partes en que se divide la información k: Orden del percentil k = 1,2,.....,r-1 http://tifon.unalmed.edu.co/~pagudel/6Percentiles.html (4 de 6) [15/09/2002 7:43:16]
  • 70. ESTADÍSTICA APLICADA 6. Medidas de Posición LI: Límite inferior del intervalo que contiene el percentil fa(i-1): Frecuencia acumulada hasta el intervalo anterior al que contiene el percentil fi: Frecuencia del intervalo que contiene el percentil n: Número de observaciones A: Amplitud de los intervalos En nuestro ejercicio, si el gerente de la fabrica de baldosas desea ofrecer un garantía de resistencia mínima. Basado en la muestra que se ha obtenido, si no quiere remplazar ninguna pieza, lógicamente debe afirmar que el producto resiste 100 o más Kg/Cm2. Pero si esta dispuesto a remplazar el 5% de su producción, entonces: Se debe dar una garantía de 210kg/cm2 de resistencia mínima. CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. ¿ Para qué se utilizan los percentiles ? 2. ¿ En cuantas partes se divide la información con: 2.1 Los cuartiles 2.2 Los quintiles 2.3 Los deciles 2.4 Los centiles 3. Para la información de los ejercicios 4 y 5 de la sección 3.2 calcular e interpretar ; 3.1 La primera y tercera cuartilla http://tifon.unalmed.edu.co/~pagudel/6Percentiles.html (5 de 6) [15/09/2002 7:43:16]
  • 71. ESTADÍSTICA APLICADA 6. Medidas de Posición 3.2 El segundo y cuarto quintil 3.3 ¿ Que porcentaje hay entre la primera y tercera quintilla ? 3.4 ¿ Que porcentaje hay entre la primera cuartilla y la segunda quintilla ? 3.5 ¿ Que porcentaje hay entre la tercera cuartilla y el noveno decil ? ... ... http://tifon.unalmed.edu.co/~pagudel/6Percentiles.html (6 de 6) [15/09/2002 7:43:16]
  • 72. ESTADÍSTICA APLICADA 7. Medidas de Dispersión 7. Medidas de Dispersión En el análisis estadístico no basta el cálculo e interpretación de las medidas de tendencia central o de posición, ya que, por ejemplo, cuando pretendemos representar toda una información con la media aritmética, no estamos siendo absolutamente fieles a la realidad, pues suelen existir datos extremos inferiores y superiores a la media aritmética, los cuales, en honor a la verdad, no están siendo bien representados por este parámetro. En dos informaciones con igual media aritmética, no significa este hecho, que las distribuciones sean exactamente iguales, por lo tanto, debemos analizar el grado de homogeneidad entre sus datos. Por ejemplo, los valores 5, 50, 95 tiene igual media aritmética, y mediana que los valores 49, 50,51; sin embargo, para la primera información la media aritmética , se encuentra muy alejada de los valores extremos 5 y 95, cosa que no ocurre con la segunda información que posee igual media aritmética y mediana, vemos entonces que la primera información es mas heterogénea o dispersa que la segunda. Para medir el grado de dispersión de una variable, se utilizan principalmente los siguientes indicadores: 7.1 Rango o recorrido 7.2 Desviación media 7.3 Varianza y desviación típica o estándar 7.4 Coeficiente de variabilidad. 7.1 RANGO O RECORRIDO Es la medida de dispersión mas sencilla ya que solo considera los dos valores extremos de una colección de datos, sin embargo, su mayor utilización está en el campo de la estadística no paramétrica. R = Xmax – Xmin Xmax, Xmin son el máximo y el mínimo valor de la variable X, respectivamente. En el ejemplo introductorio, vemos que el rango para la primera información es R1=95-5=90, mientras que R2=51-49=2, se hace pues manifiesta la gran dispersión de la primera información contra la homogeneidad de la segunda. http://tifon.unalmed.edu.co/~pagudel/7dispersion.html (1 de 6) [15/09/2002 7:43:27]
  • 73. ESTADÍSTICA APLICADA 7. Medidas de Dispersión 7.2 DESVIACIÓN MEDIA La desviación media, mide la distancia absoluta promedio entre cada uno de los datos, y el parámetro que caracteriza la información. Usualmente se considera la desviación media con respecto a la media aritmética: , donde DM : Desviación media xi : Diferentes valores de la variable X fi : Número de veces que se repite la observación xi Media aritmética de la información n: Tamaño de la muestra. m: Número de agrupamientos o intervalos Ejemplo: Salario de 50 Operarias de la Fabrica de Confecciones “La Hilacha” http://tifon.unalmed.edu.co/~pagudel/7dispersion.html (2 de 6) [15/09/2002 7:43:27]
  • 74. ESTADÍSTICA APLICADA 7. Medidas de Dispersión 1.400.00 es el error promedio que se comete al remplazar los ingresos diarios de cada una de las 50 obreras por 54.100 pesos. 7.3 VARIANZA El problema de los signos en la desviación media, es eludido tomando los valores absolutos de las diferencias de los datos con respecto a la media aritmética. Ahora bien, la varianza obvia los signos elevando las diferencias al cuadrado, lo cual resulta ser más elegante, aparte de que es supremamente útil en el ajuste de modelos estadísticos que generalmente conllevan formas cuadráticas. La varianza es uno de los parámetros más importantes en estadística paramétrica, se puede decir que, teniendo conocimiento de la varianza de una población, se ha avanzado mucho en el conocimiento de la población misma. Numéricamente definimos la varianza, como desviación cuadrática media de los datos con respecto a la media aritmética: , donde: S2 : Varianza . xi : Valor de la variable X . : Media aritmética de la información .... . fi : Frecuencia absoluta de la observación xi . . n: Tamaño de la muestra. . m: Número de agrupamientos o intervalos Salario/dia de 50 Operarias en la Fábrica de Confecciones “La Hilacha” (Miles de Pesos) http://tifon.unalmed.edu.co/~pagudel/7dispersion.html (3 de 6) [15/09/2002 7:43:27]
  • 75. ESTADÍSTICA APLICADA 7. Medidas de Dispersión Como los datos están expresados en miles de pesos y la varianza se encuentra en forma cuadrática obtenemos una varianza de 3’210.000 pesos. Sin embargo para una mejor comprensión debemos recurrir a la desviación típica o estándar definida como la raíz cuadrada de la varianza: El error estándar es de 1.791 pesos/diarios. En el ejemplo de las baldosas: Resistencia de 100 Baldosas de La Fábrica “De Las Casas” http://tifon.unalmed.edu.co/~pagudel/7dispersion.html (4 de 6) [15/09/2002 7:43:27]
  • 76. ESTADÍSTICA APLICADA 7. Medidas de Dispersión 7.4 COEFICIENTE DE VARIABILIDAD Generalmente interesa establecer comparaciones de la dispersión, entre diferentes muestras que posean distintas magnitudes o unidades de medida. El coeficiente de variabilidad tiene en cuenta el valor de la media aritmética, para establecer un número relativo, que hace comparable el grado de dispersión entre dos o mas variables, y se define como: Comparemos la homogeneidad de las dos informaciones anteriores, las cuales tienen diferente unidad de medida. para el salario: para la resistencia http://tifon.unalmed.edu.co/~pagudel/7dispersion.html (5 de 6) [15/09/2002 7:43:27]
  • 77. ESTADÍSTICA APLICADA 7. Medidas de Dispersión Concluimos que es mucho más dispersa la información correspondiente a la resistencia de las baldosas. CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. ¿ Cuál es la utilidad de las medidas de dispersión? 2. ¿ Cuales son las principales medidas de dispersión? 3. ¿ Cuál es la medida adecuada para comparar la dispersión entre varias variables que posean diferente magnitud o diferente unidad de medida? 4. Para cada una de las informaciones de los ejercicios de los capítulos anteriores, calcular e interpretar: 4.1 Rango 4.2 Desviación media 4.3 Coeficiente de variabilidad ... ... http://tifon.unalmed.edu.co/~pagudel/7dispersion.html (6 de 6) [15/09/2002 7:43:27]
  • 78. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal 8. Regresión y Correlación Lineal Hasta ahora hemos hecho la tabulación y el análisis para una sola variable. Pero los investigadores, además de analizar una información en forma individual, generalmente se interesan en establecer cruces y buscar relaciones entre diferentes variables. 8.1 TABLAS DE DOBLE ENTRADA Para la presentación bidimensional de las variables "X, Y" se procede de la siguiente manera: q Se ordenan las variables "X, Y" respectivamente qSe tabulan los valores X horizontalmente, y los valores Y verticalmente. q Se buscan las frecuencias para cada par ordenado (xi,yj). q Se suma horizontalmente para obtener las frecuencias de “Y” fyj, y verticalmente para obtener las frecuencias de “X” fxi . xi : Valores de la variable X, i=1,2,....m yj : Valores de la variable Y, j=1,2,... k fxi : Frecuencia de la observación xi fyj : Frecuencia de la observación yj fij : Frecuencia conjunta de los valores (xi,yj) fa0xi : Frecuencia acumulada de la variable “X”, en el item i fayj : Frecuencia acumulada de la variable “Y”, en el item j frxi : Frecuencia relativa para la variable “X”, en el item i fryj : Frecuencia relativa para la variable “Y”, en el item j fraxi : Frecuencia relativa acumulada para la variable “X” frayj : Frecuencia relativa acumulada para la variable “Y”. http://tifon.unalmed.edu.co/~pagudel/8regresion.html (1 de 11) [15/09/2002 7:44:09]
  • 79. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal Tabla de Doble Entrada para la Representación de dos Variables “X, Y” Como se puede advertir en la disposición de las frecuencias, la interpretación de la variable “Y”, puede hacerse analizando los relativos propios en forma horizontal, en tanto que el análisis de la variable “X” se hace en forma vertical. Experiencia Laboral y Salario Diario de 50 Obreras de la Fábrica de Confecciones “La Hilacha”. “X” : Experiencia en Años, “Y”: Salario Miles de Pesos http://tifon.unalmed.edu.co/~pagudel/8regresion.html (2 de 11) [15/09/2002 7:44:09]
  • 80. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal Analizando los relativos para cada una de las variables podemos sacar, entre otras, las siguientes conclusiones: q El 64% tiene una experiencia igual o inferior a 6 años. q El 68% tiene una experiencia entre 5 y 7 años incluyendo sus extremos. q El 60% gana 54.000 pesos diarios o menos. q El 62% gana entre 53.000 y 55.000 pesos incluyendo sus extremos. Las tablas de doble entrada también pueden usarse para variables cualitativas, o combinarse variables cualitativas con cuantitativas. Estado Civil y Número de Hijos de 50 Obreras de la Fabrica “La Hilacha" X: Estado Civil, Y : Número De Hijos. Se deja al lector la interpretación y análisis de esta tabla. 8.2 CORRELACIÓN En el análisis conjunto para dos o más variables es básica la búsqueda del tipo y grado de la relación que pueda existir entre ellas, o si por el contrario, las variables sean independientes entre sí y la relación que puedan mostrar se debe únicamente al azar, o a través de terceras variables. El sondeo del tipo y grado de la correlación, parte desde la misma presunción del investigador, teniendo presente que la búsqueda de relaciones entre variables debe ser lógica, es decir relacionar lo que sea razonable y no datos cuya asociación sea desde cualquier punto de vista absurda. http://tifon.unalmed.edu.co/~pagudel/8regresion.html (3 de 11) [15/09/2002 7:44:09]
  • 81. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal Veamos algunas variables susceptibles de relacionar: q El peso y estatura de un grupo de adultos. q Edad y peso de un grupo de niños. q Ingresos y gastos de arrendamiento de un grupo de familias. q Escolaridad e ingreso mensual de un grupo de empleados. q Ventas y utilidades de un almacén de variedades. En el cuestionario aplicado a las obreras de la "Hilacha", parece que se indaga por ciertas variables que puedan explicar el salario devengado por ellas; como podría ser, los años de experiencia, los años de estudio, las ausencias al trabajo, la evaluación del desempeño por parte de su supervisor, amén de otras variables que pueden tener influencia en la asignación salarial. Para fortalecer el indicio de correlación inicial, se grafica cada uno de los pares ordenados de las variables (xi,yj) en un plano cartesiano, para observar la “nube de puntos” o diagrama de dispersión, donde se advierte la tendencia o no, de la información representada. http://tifon.unalmed.edu.co/~pagudel/8regresion.html (4 de 11) [15/09/2002 7:44:09]
  • 82. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal A pesar de la ilustración visual que ofrecen las gráficas, solo podemos percibir la tendencia, mas no el grado o fortaleza de la relación, entre la variable independiente “X” y la variable dependiente “Y”. Para cuantificar la calidad de la dependencia, entre las dos variables, el indicador mas acostumbrado es el Coeficiente de correlación, definido como: , donde: r : Coeficiente de correlación entre “X” y “Y” Sx: Desviación típica de “X” Sy: Desciacion típica de “Y” Sx,y : Covarianza entre “X” y “Y” http://tifon.unalmed.edu.co/~pagudel/8regresion.html (5 de 11) [15/09/2002 7:44:09]
  • 83. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal . . .... . . . . http://tifon.unalmed.edu.co/~pagudel/8regresion.html (6 de 11) [15/09/2002 7:44:09]
  • 84. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal En la práctica, cuando no tenemos la información agrupada en una tabla de doble entrada, asumimos que cada observación bivariada tiene frecuencia unitaria, entonces r se convierte en: Tabla de Trabajo para el Calculo de L Coeficiente de Correlacion http://tifon.unalmed.edu.co/~pagudel/8regresion.html (7 de 11) [15/09/2002 7:44:09]
  • 85. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal El coeficiente de correlación, es un indicador del grado de la relación entre las dos variables, el cual oscila en el intervalo cerrado , es decir, . Cuando r toma un valor extremo, ya sea r=1 ó r=-1 existe una correlación perfecta positiva o negativa según el signo, como lo podemos corroborar en el siguiente ejemplo: Aspiración Salarial, de Acuerdo a La Experiencia de las Obreras de la Fabrica de Confecciones “La Hilacha” , Correlación perfecta positiva Sin embargo, no todas las relaciones son tan ideales, en el común de los casos –1< r <1. Empíricamente se afirma que: 1. Si Correlación perfecta 2. Si ó Correlación excelente 3. Si ó Correlación buena 4. Si ó Correlación regular 5. Si ó Correlación mala 6. Si No hay correlación http://tifon.unalmed.edu.co/~pagudel/8regresion.html (8 de 11) [15/09/2002 7:44:09]
  • 86. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal Existen desde luego, pruebas estadísticas que miden la bondad de un coeficiente de correlación con un determinado nivel de confiafilidad, pero no son tema de este curso. Salario Actual y Años de Experiencia de 50 Obreras de la Fabrica “La Hilacha” Exp Mil/dia Exp Mil/dia Años X Y XYX2 Y2 Años X Y XY X2 Y2 4 52 208 16 2704 8 57 456 64 3249 5 54 270 25 2916 6 54 324 36 2916 7 55 385 49 3025 6 55 330 36 3025 6 54 324 36 2916 5 53 265 25 2809 5 53 265 25 2809 7 55 385 49 3025 7 56 392 49 3136 8 56 448 64 3136 5 54 270 25 2916 5 53 265 25 2809 9 58 522 81 3364 9 57 513 81 3249 3 51 153 9 2601 6 54 324 36 2916 6 54 324 36 2916 5 53 265 25 2809 7 54 378 49 2916 2 50 100 4 2500 3 51 153 9 2601 6 55 330 36 3025 6 54 324 36 2916 4 52 208 16 2704 7 55 385 49 3025 5 53 265 25 2809 6 54 324 36 2916 6 54 324 36 2916 http://tifon.unalmed.edu.co/~pagudel/8regresion.html (9 de 11) [15/09/2002 7:44:09]
  • 87. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal 8 56 448 64 3136 4 52 208 16 2704 4 52 208 16 2704 8 57 456 64 3249 6 54 324 36 2916 7 56 392 49 3136 5 53 265 25 2809 3 51 153 9 2601 7 55 385 49 3025 8 58 464 64 3364 7 55 385 49 3025 6 55 330 36 3025 7 55 385 49 3025 5 53 265 25 2809 4 52 208 16 2704 6 54 324 36 2916 7 55 385 49 3025 6 53 318 36 2809 5 53 265 25 2809 7 56 392 49 3136 TOTAL 294 2705 160391850146501 Se vislumbra una relación positiva, con coeficiente de correlación: Entre la experiencia y el salario actual hay una excelente correlación positiva. Si escudriñamos en la magnitud de las relaciones entre las diferentes variables cuantitativas, que se han indagado a las obreras de “LA HILACHA” encontramos los siguientes coeficientes de correlación: http://tifon.unalmed.edu.co/~pagudel/8regresion.html (10 de 11) [15/09/2002 7:44:09]
  • 88. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal En el problema que nos ocupa, la variable salario/día tiene una excelente correlación positiva, con los años de experiencia, y una buena correlación directa con la calificación y la escolaridad, empero hay una buena relación inversa, con la variable ausencias al trabajo. ... ... http://tifon.unalmed.edu.co/~pagudel/8regresion.html (11 de 11) [15/09/2002 7:44:09]
  • 89. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal 8. Regresión y Correlación Lineal 8.3 REGRESIÓN LINEAL Teniendo ya conocimiento de la intensidad de la correlación entre las variables, manifestada a través del diagrama de dispersión, y el coeficiente de correlación, podemos ensayar el ajuste de un modelo estadístico que se adapte mejor a las n observaciones; lo que lleva por nombre regresión. Uno de los procedimientos muy comunes en el ajuste regresivo es el método de los mínimos cuadrados, que produce estimaciones con menor error cuadrático promedio 8.3.1 Ajuste Rectilíneo (Método de los Mínimos Cuadrados) La forma general de una ecuación de línea recta es: con: X: Variable independiente Y: Variable dependiente a : Término independiente o intercepto b: Coeficiente de X Debemos establecer los parámetro “a” y “b” de la ecuación para poder expresar los valores de la variable Y en función de los valores de la variable X, esto es: multipliquemos cada una de estas ecuaciones por su respectivo valor de X http://tifon.unalmed.edu.co/~pagudel/83regresion.html (1 de 17) [15/09/2002 7:45:13]
  • 90. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal Las ecuaciones (1) y (2) son llamadas ecuaciones normales de la línea recta, de donde se pueden despejar los parámetros a, b en función de los datos originales. De (1) tenemos: Remplazando (3) en (2): http://tifon.unalmed.edu.co/~pagudel/83regresion.html (2 de 17) [15/09/2002 7:45:13]
  • 91. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal Las estimaciones para los parámetros son: El gorrito “ ^ ” colocado sobre el parámetro indica estimaciones fundamentadas, en los datos muestrales. Para ajustar el modelo rectilíneo a los ingresos diarios actuales explicados por los años de experiencia, en la “Hilacha”, aprovechamos los totales ya calculados en el coeficiente de correlación: Como quiera que los items de la variable salario están en unidades de mil pesos, la ecuación de pronóstico definitiva es: http://tifon.unalmed.edu.co/~pagudel/83regresion.html (3 de 17) [15/09/2002 7:45:13]
  • 92. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal Salario Real y Estimado Vs. Experiencia Insistimos en la existencia de pruebas estadísticas, que miden la bondad de los parámetros estimados y del modelo en sí, a estas alturas de nuestro documento no tenemos las herramientas para aplicarlas, sin embargo en el mercado hay software estadístico, que calcula los parámetros, ajusta los modelos y efectúa las respectivas pruebas, sin exigir al usuario grandes conocimientos de estadística matemática. Se debe tener cuidado, eso sí, en la interpretación adecuada de los resultados. El siguiente es el reporte parcial producido por el programa de computador Statgraphics plus : http://tifon.unalmed.edu.co/~pagudel/83regresion.html (4 de 17) [15/09/2002 7:45:14]
  • 93. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal El programa calcula: y y consecuentemente el modelo , el paquete hace también las pruebas t student para la hipótesis nula H0 : a=0 vs la hipótesis alternativa H1 : y H0 : b = 0 vs H1 : , dado que el valor “p” para ambos casos p= 0.0000, con una confiabilidad superior al 99% se rechazan ambas hipótesis de nulidad, a favor de las hipótesis alternativas. En cuanto al valor p = 0.0000 (para la prueba F) en la tabla de análisis de varianza, también se interpreta la validez del modelo con un nivel de confiabilidad superior al 99%. De otro lado corrobora una correlación positiva excelente r=0.957578 y un coeficiente de determinación R-cuadrado, de 91.6956% que indica el porcentaje de la variable salario explicado por la variable experiencia. El coficiente de determinación R2 viene expresado como: http://tifon.unalmed.edu.co/~pagudel/83regresion.html (5 de 17) [15/09/2002 7:45:14]
  • 94. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal Aprovechemos este pequeño paréntesis, para decir que hoy la tecnología informática ha hecho posible la formulación y solución de complejos modelos multivariados, que constan de cientos de variables, que en años recientes solo se podían teorizar. En la búsqueda de las variables que explican la variable salario, en la fabrica “La Hilacha” obtenemos el siguiente reporte del programa Statgraphics plus: http://tifon.unalmed.edu.co/~pagudel/83regresion.html (6 de 17) [15/09/2002 7:45:14]
  • 95. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal El software, analiza los diferentes valores “p” y descalifica la variable edad, al nivel del 90% de confidencialidad, debido a que p=0.1451 hace que el coeficiente de esta variable no sea significante dentro del modelo. http://tifon.unalmed.edu.co/~pagudel/83regresion.html (7 de 17) [15/09/2002 7:45:14]
  • 96. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal . . ... . .. . . Eliminada la variable edad, encontramos un modelo válido con un nivel de confianza superior al 99% cuyos coeficientes son admitidos con una confiabilidad superior al 95%. R-cuadrado para este modelo es 95.58% , es decir el porcentaje del salario que está siendo explicado por las variables independientes, es ligeramente menor al R-cuadrado anterior (95.8%), sacrificio insignificante cuando se trata de reducir la complejidad del modelo. Veamos las estimaciones producidas por la ecuación http://tifon.unalmed.edu.co/~pagudel/83regresion.html (8 de 17) [15/09/2002 7:45:14]
  • 97. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal Miles estim hijosExpEsco- GastauseCalif Error $/dia salario 2 4 5 52 5 3 1 52.51 0.51 2 5 5 54 6 2 1 53.23 - 0.77 3 7 4 55 8 1 4 55.25 0.25 3 6 4 54 9 1 3 54.36 0.36 1 5 3 53 3 2 2 52.91 - 0.09 0 7 8 56 1 1 4 55.84 - 0.16 1 5 3 54 2 2 3 53.26 - 0.74 0 9 9 58 0 0 5 57.79 - 0.21 3 3 3 51 10 3 1 51.35 0.35 3 6 3 54 9 2 2 53.59 - 0.41 1 7 6 54 3 2 3 54.98 0.98 2 3 3 51 6 5 1 50.82 - 0.18 0 6 7 54 1 1 2 54.55 0.55 0 7 7 55 1 1 3 55.34 0.34 0 6 5 54 2 2 3 53.93 - 0.07 0 8 8 56 3 1 4 56.18 0.18 1 4 3 52 2 3 2 52.20 0.20 2 6 4 54 5 2 2 53.87 - 0.13 http://tifon.unalmed.edu.co/~pagudel/83regresion.html (9 de 17) [15/09/2002 7:45:14]
  • 98. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal 2 5 4 53 5 3 2 53.05 0.05 0 7 9 55 4 2 3 55.26 0.26 0 7 8 55 4 1 3 55.29 0.29 1 7 6 55 4 2 3 54.89 - 0.11 2 4 3 52 7 3 1 51.82 - 0.18 1 7 6 55 3 1 3 55.26 0.26 3 5 3 53 7 2 2 53.25 0.25 0 8 9 57 3 1 5 56.67 - 0.33 4 6 5 54 13 2 3 54.30 0.30 3 6 5 55 8 2 3 54.43 - 0.57 3 5 4 53 8 2 2 53.40 0.40 3 7 4 55 9 0 3 55.18 0.18 1 8 6 56 4 0 4 56.23 0.23 2 5 4 53 6 2 2 53.23 0.23 0 9 8 57 2 0 4 57.10 0.10 1 6 5 54 3 1 3 54.47 0.47 2 5 3 53 6 2 3 53.23 0.23 2 2 3 50 7 5 1 50.18 0.18 2 6 5 55 6 0 3 54.82 - 0.18 2 4 3 52 6 4 1 51.64 - 0.36 2 5 4 53 8 3 1 52.50 - 0.50 http://tifon.unalmed.edu.co/~pagudel/83regresion.html (10 de 17) [15/09/2002 7:45:14]
  • 99. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal 2 6 4 54 8 1 2 53.85 - 0.15 3 4 3 52 11 4 1 51.51 - 0.49 1 8 9 57 3 0 4 57.07 0.07 0 7 8 56 5 0 4 55.72 - 0.28 2 3 3 51 6 4 1 51.10 0.10 1 8 9 58 3 0 4 57.07 - 0.93 2 6 5 55 4 0 2 54.77 - 0.23 1 5 5 53 2 4 1 52.71 - 0.29 2 6 4 54 3 1 1 54.10 0.10 2 6 5 53 7 3 1 53.39 0.39 1 7 6 56 3 0 3 55.54 - 0.46 8.3.2 Ajuste Parabólico (Método Mínimos Cuadrados) Suele suceder que al dibujar la nube de puntos correspondiente a n observaciones bivariante, se observa una tendencia no rectilínea, pero a la cual se le puede ajustar un modelo teórico conocido. Dentro de la familia de modelos, es de aplicación común el ajuste regresivo polinomial de grado s “ ”. Similarmente con el procedimiento seguido en el ajuste rectilíneo, vamos a encontrar las ecuaciones normales par una parábola, de forma general es decir , , ......., . Si cada una de estas ecuaciones la multiplicamos por su respectivo valor de x, y repetimos la acción tenemos: http://tifon.unalmed.edu.co/~pagudel/83regresion.html (11 de 17) [15/09/2002 7:45:14]
  • 100. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal sumando se obtienen las siguientes ecuaciones normales (1) (2) (3) De donde se pueden estimar los parámetros de la parábola “ ”. Ejemplo: En un experimento agropecuario, se toma una muestra de 15 unidades de una variedad de árbol frutal, se observa el rendimiento en frutos de acuerdo con la cantidad de fertilizante utilizado: Resolviendo se obtienen las siguientes estimaciones de los parámetros: , , http://tifon.unalmed.edu.co/~pagudel/83regresion.html (12 de 17) [15/09/2002 7:45:14]
  • 101. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal El programa Statgraphics produce el siguiente reporte: http://tifon.unalmed.edu.co/~pagudel/83regresion.html (13 de 17) [15/09/2002 7:45:14]
  • 102. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal http://tifon.unalmed.edu.co/~pagudel/83regresion.html (14 de 17) [15/09/2002 7:45:14]
  • 103. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal Parábola Ajustada CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. Ingresos y Gastos en Arrendamiento de un Grupo de Familias; en Miles de Pesos. http://tifon.unalmed.edu.co/~pagudel/83regresion.html (15 de 17) [15/09/2002 7:45:14]
  • 104. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal 1.1 Calcular el coeficiente de correlación e interpretarlo. 1.2 Ajustar el modelo adecuado para esta información. 1.3 ¿ Cuánto se estima, debe pagar una familia con ingreso mensual de 270.000 pesos? 2. ¿ Que es un coeficiente de correlación ? 3. Cuando hay correlación: 3.1 Perfecta 3.2 Excelente 3.3 Buena http://tifon.unalmed.edu.co/~pagudel/83regresion.html (16 de 17) [15/09/2002 7:45:14]
  • 105. ESTADÍSTICA APLICADA 8. Regresión y Correlación Lineal 4. ¿ Cuales son las ecuaciones normales de la línea recta ? ... ... http://tifon.unalmed.edu.co/~pagudel/83regresion.html (17 de 17) [15/09/2002 7:45:14]
  • 106. ESTADÍSTICA APLICADA 9. Tasas e Índices 9. Tasas e Índices Como ya se dijo, el análisis de un fenómeno basado en las cifras absolutas, ofrece una idea general de su tendencia o comportamiento; pero para efectos de establecer comparaciones adecuadas del mismo fenómeno con otra región, o su ocurrencia a través del tiempo, se utilizan ciertos indicadores denominados tasas e índices 9.1 TASA Una tasa es la resultante de una fracción, en donde el numerador está contenido dentro del denominador: Ejemplos: D: Tasa de deserción escolar. R: Número de retiros durante el año. M: Número total de matriculados durante el año. TE: Tasa de empleo. PEAO: Población económicamente activa ocupada. PEA : Población económicamente activa. Valga anotar que a las tasas se les debe multiplicar por una constante k, la cual generalmente es 100, 1000 o múltiplos de ellos, con el fin de convertirlos en porcentajes, por millares etc. En demografía, las tasas son de uso frecuente, entre otras, mencionaremos las siguientes: Donde: http://tifon.unalmed.edu.co/~pagudel/9tasas.html (1 de 10) [15/09/2002 7:45:36]
  • 107. ESTADÍSTICA APLICADA 9. Tasas e Índices TM : Tasa de mortalidad. D : Número de defunciones en un periodo y área dada. P : Población total en esa área a mitad del periodo. Donde TN : Tasa de natalidad N : Número de nacidos vivos ocurridos en un periodo y área dada P : Población total del área a mitad del periodo. Donde: TC : Tasa de nupcialidad. M : Número de matrimonios efectuados en un periodo y área dada. P : Total de la población a mitad del periodo. El siguiente cuadro muestra la evolución de la tasa de desempleo en Colombia, resultados obtenidos de la encuesta nacional de hogares para los periodos comprendidos entre los años 1.990 –2.000 Tasas de Desempleo en Colombia 1.990-2.000 http://tifon.unalmed.edu.co/~pagudel/9tasas.html (2 de 10) [15/09/2002 7:45:36]
  • 108. ESTADÍSTICA APLICADA 9. Tasas e Índices 9.2 ÍNDICE Un número índice, como comúnmente se le llama, es un indicador de los cambios relativos de una o más variables a través del tiempo. Entre las principales aplicaciones de los números índice, está la de establecer comparaciones entre los indicadores de las diferentes zonas geográficas, profesiones , grupos étnicos etc. Para la construcción de un número índice, se procede ante todo, a fijar el periodo de referencia o "periodo base" de la serie temporal, teniendo presente que debe ser un periodo normal, esto es, que no se hayan presentado situaciones fortuitas (guerras, terremotos, incendios u otro tipo de imprevisto), que incidan en el valor de la variable para ese periodo. Además debe considerarse un periodo reciente que haga comparables los diferentes valores de las variables consideradas. http://tifon.unalmed.edu.co/~pagudel/9tasas.html (3 de 10) [15/09/2002 7:45:36]
  • 109. ESTADÍSTICA APLICADA 9. Tasas e Índices 9.2.1 Índice Simple Un número índice simple, es aquel que se calcula para una sola variable, dividiendo cada uno de los valores de la serie cronológica, por el valor correspondiente al "periodo base" previamente definido. 9.2.1.1 Índice de Base Fija , si la variable se refiere a precios , si la variable se refiere a cantidades Ip : Índice de precios Pn: Precio del artículo en el periodo n P0 : Precio del artículo en el periodo base Iq : Índice de cantidades qn : Cantidad del articulo en el periodo n q0 : Cantidad del articulo en el periodo bas Precio Promedio del Kilovatio/Hora 1995-2001 Pagado por la Fabrica de Confecciones “La Hilacha” Consumo Promedio de Energía en La Fabrica de Confecciones “La Hilacha” http://tifon.unalmed.edu.co/~pagudel/9tasas.html (4 de 10) [15/09/2002 7:45:36]
  • 110. ESTADÍSTICA APLICADA 9. Tasas e Índices En la primera tabla hemos calculado los índices de precios simples, con base en 1995 y 1998 respectivamente, pero no se han tenido en cuenta las cantidades, mientras que en la segunda tabla se han calculado los índices de cantidades sin considerar los precios. Calculemos, ahora los índices del valor relativo, que considere tanto los . precios como las cantidades: . ..... . . . Precio y Consumo Promedio de Energía en La Fabrica de Confecciones “La Hilacha” 9.2.1.2 Índice de Base Móvil http://tifon.unalmed.edu.co/~pagudel/9tasas.html (5 de 10) [15/09/2002 7:45:36]
  • 111. ESTADÍSTICA APLICADA 9. Tasas e Índices Solo hemos considerado, los índices simples de base fija, esto es, con un periodo base determinado. Es común que interese comparar un índice con el índice del periodo inmediatamente anterior, en consecuencia se debe fijar el periodo base en el periodo anterior al referenciado, y así sucesivamente hasta completar la serie, al cual se le nombra índice de base móvil. Variaciones del Salario Promedio Diario en La Fabrica de Confecciones “La Hilacha” 9.2.2 Índices Compuestos (Globales) Un número índice compuesto, muestra los cambios de un conjunto de variables, auque sus unidades de medidas, cantidades y precios, en el tiempo, sean diferentes entre sí. Cuando hablamos por ejemplo de los índices indicadores del costo de la canasta familiar, se toman en cuenta muchos artículos cuyos consumos inciden en el costo de vida, con una ponderación o importancia diferente en cada caso. Colectivamente no es lo mismo un cambio en el precio de la carne, huevos o leche, que un cambio en el precio de los perfumes, joyas o cualquier otro artículo suntuoso. 9.2.2.1 Índice de Laspeyres Este índice asume como ponderaciones, en el cálculo del índice global, las cantidades de los artículos en el periodo base. Donde: http://tifon.unalmed.edu.co/~pagudel/9tasas.html (6 de 10) [15/09/2002 7:45:36]
  • 112. ESTADÍSTICA APLICADA 9. Tasas e Índices PL : Índice de precios global (Laspeyres). q0 : Cantidad del periodo base. p0 : Precio del artículo en el periodo base pn : Precio del artículo en el periodo n Índice de Precios de Cuatro Artículos 9.2.2.2 Índice de Paasche El estadístico Paasche, sugiere que las ponderaciones sean las cantidades utilizadas en el periodo n. Se obtiene entonces el siguiente indicador: Este índice, es poco utilizado debido al dinamismo de qn , necesitando nuevas ponderaciones cada vez que se cambia de periodo. 9.2.2.3 Índice ideal de Fisher Se propone el promedio geométrico entre los dos índices anteriores: Una de las principales aplicaciones de los índices de precios, es la de medir la deflación e inflación, que es la variación que existe en el poder adquisitivo http://tifon.unalmed.edu.co/~pagudel/9tasas.html (7 de 10) [15/09/2002 7:45:36]
  • 113. ESTADÍSTICA APLICADA 9. Tasas e Índices del dinero. También podemos utilizar, los índices de precios al consumidor para determinar el salario real de un grupo de personas. Salario Promedio Nominal y Real en la Fabrica “La Hilacha” Dado el deterioro del salario real en los dos últimos años debería considerarse un generoso aumento. CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. ¿Qué es una tasa? 2. ¿Qué es un índice? 3. ¿Para qué se utilizan los números índices? 4. ¿Cómo se construye un número índice simple? 5. ¿Cómo se construye un número índice compuesto? 6. Los precios y las cantidades de un articulo X vienen dados en la siguiente tabla: http://tifon.unalmed.edu.co/~pagudel/9tasas.html (8 de 10) [15/09/2002 7:45:36]
  • 114. ESTADÍSTICA APLICADA 9. Tasas e Índices Tomando como año base 1995, calcular para los otros años: 6.1 Los índices de precios. 6.2 Los índices de cantidades. 6.3 Los índices de valores. 7. A continuación se relacionan los precios y las cantidades del año base, de cuatro artículos diferentes: Calcular el índice de Laspeyres 8. Salario Mínimo Legal Diario en Colombia e Índice de Precios al Consumidor para el Año 2.000-2001 (Periodo Base Diciembre de 1998). http://tifon.unalmed.edu.co/~pagudel/9tasas.html (9 de 10) [15/09/2002 7:45:36]
  • 115. ESTADÍSTICA APLICADA 9. Tasas e Índices Calcular el salario real para cada uno de los meses. ... ... http://tifon.unalmed.edu.co/~pagudel/9tasas.html (10 de 10) [15/09/2002 7:45:36]
  • 116. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) 10. Nociones de Probabilidad (Eventos) “Los planes corresponden al hombre, las probabilidades a Dios.” Proverbio chino Todo experimento debe ser susceptible de repeticiones conservando las mismas condiciones con las cuales se realizó su antecesor. Esto es, el investigador debe fijar esas condiciones, bajo las cuales se realizarán las sucesivas repeticiones del experimento y conservarlas en cada una de las réplicas, de tal manera que sus inferencias resulten lo más fiables posible. Sin embargo, aun así no siempre se obtienen los mismos resultados, pues a veces participan factores incontrolables que aparentemente no obedecen a ninguna causa natural, ni intervención humana intencionada y que denominamos Azar o casualidad. Desde el punto de vista de la presencia o no de la contingencia en los resultados, si definimos experimentos determinísticos y experimentos aleatorios: Experimento determinístico es aquel en el cual, bajo las mismas condiciones experimentales, las repeticiones del experimento absolutamente todas, siempre producen el mismo resultado. El experimento Aleatorio, conservando las mismas condiciones experimentales, los resultados no se pueden predecir, con exactitud, para ninguna repetición. Sí, por ejemplo lanzamos una moneda al aire para observar de cual lado cae, no podemos pronosticar con certeza, si se presenta sello o se presenta cara. Tenemos entonces presente el componente del azar y por consiguiente un experimento aleatorio. No ocurriría igual si la moneda estuviese diseñada igual por ambos lados y por consiguiente sería un experimento determinístico: Todos los posibles resultados de un experimento aleatorio, conforman el espacio muestral que representaremos por “S”, a cualquier subconjunto del espacio muestral se le denomina suceso o evento aleatorio y lo denotaremos con “E”. . Cada uno de los elementos del espacio muestral se denomina evento elemental “e”: Definiciones sobre Sucesos: q El evento ocurre cuando se verifica uno de los dos, o ambos sucesos. http://tifon.unalmed.edu.co/~pagudel/10Probabilidad.html (1 de 6) [15/09/2002 7:46:03]
  • 117. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) q El evento se presenta cuando ocurren los dos simultáneamente. Evento o suceso elemental Evento o suceso seguro Siempre se presenta en un experimento: S Evento o suceso imposible nunca ocurre dentro un experimento: • Eventos incompatibles Dos o más sucesos son incompatibles o excluyentes cuando la ocurrencia de uno impide la presencia de los otros. Si E1, E2 excluyentes entonces Sucesos complementarios o contrarios Dos sucesos son complementarios cuando son mutuamente excluyentes y su unión conforma: el espacio muestral: son complementarios . . Si E es un evento seguro, entonces E=S En general, los sucesos o eventos, tienen las mismas propiedades de los conjuntos. Propiedades de los eventos: http://tifon.unalmed.edu.co/~pagudel/10Probabilidad.html (2 de 6) [15/09/2002 7:46:03]
  • 118. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) q El complemento de la unión de dos sucesos es la intersección de sus complementos: . q El complemento de la intersección de dos sucesos es la unión de sus complementos: . ..... . . . Ejemplo: Lanzamos una moneda para observar, si cae del lado de cara o del lado de sello: q Espacio muestral q Eventos elementales , q Evento seguro q Evento imposible q E1 y E2 son eventos excluyentes. Ejemplo: Lanzar un par de dados, marcados c/u con los números 1,2,3,4,5 y 6 Espacio muestral http://tifon.unalmed.edu.co/~pagudel/10Probabilidad.html (3 de 6) [15/09/2002 7:46:03]
  • 119. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) E1: (suma igual a 2): suceso elemental E2: (suma igual a 3): E3: (suma igual a 4): E4: (suma igual a 5): E5: (suma igual a 6): E6: (suma igual a 7): E7: (suma igual a 8): E8: (suma igual a 9): E9: (suma igual a 10): E10: (suma igual a 11): E11: (suma igual a 12): suceso elemental Con la unión e intersección de dos o mas eventos, se generan nuevos sucesos. Ejemplo: En una mesa hay un juego (28 fichas) de dominó, se voltea una ficha para observar sus números: Espacio muestral http://tifon.unalmed.edu.co/~pagudel/10Probabilidad.html (4 de 6) [15/09/2002 7:46:03]
  • 120. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) E1: La diferencia absoluta entre sus componentes sea igual a0 E2: La diferencia absoluta entre sus componentes sea igual a1 E3: La diferencia absoluta entre sus componentes sea igual a2 E4: La diferencia absoluta entre sus componentes sea igual a3 E5: La diferencia absoluta entre sus componentes sea igual a4 E6: La diferencia absoluta entre sus componentes sea igual a5 E7: La diferencia absoluta entre sus componentes sea igual a6 http://tifon.unalmed.edu.co/~pagudel/10Probabilidad.html (5 de 6) [15/09/2002 7:46:03]
  • 121. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) ... ... http://tifon.unalmed.edu.co/~pagudel/10Probabilidad.html (6 de 6) [15/09/2002 7:46:03]
  • 122. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) 10. Nociones de Probabilidad (Eventos) 10.1 NOCIONES DE CONTEO 10.1.1 Principio Fundamental 1 Si un suceso A puede ocurrir de n maneras y otro suceso B puede ocurrir m maneras, entonces el suceso A ó B (Sucede el evento A ó sucede el evento B) puede ocurrir de formas, siempre y cuando los eventos no puedan suceder simultáneamente. Ejemplo: En el lanzamiento de un dado, de cuantas maneras se puede obtener un número inferior a 2 o mayor que 4? A: (número inferior a 2) sucede solo de una manera. B : (número superior a 4), sucede de dos maneras A ó B (número inferior a 2 o superior a 4) sucede de 1+2=3 maneras. 10.1.2 Principio Fundamental 2 Si un seceso A puede suceder de n maneras y un suceso B de m formas, entonces el suceso A y B (sucede el evento A y sucede el Evento B) puede ocurrir de n(m) modos. Ejemplo: De cuantas maneras distintas pueden caer 2 dados, lanzados simultáneamente: A: (dado 1) puede caer de 6 maneras. http://tifon.unalmed.edu.co/~pagudel/101probabilidad.html (1 de 5) [15/09/2002 7:46:15]
  • 123. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) B : (dado 2) puede caer de 6 maneras A y B (dado 1 y dado 2 ) sucede de 6(6) =36 maneras 10.1.3 Permutaciones Se le llama permutacion a cada uno de los arreglos de n elementos, cuya diferenciación mutua se debe al orden en que están colocados sus elementos. Al total de permutaciones obtenidas con n elementos se le representa por: 1 Ejemplo: Cuantas palabras diferentes se pueden formar con las letras n, l, o, e; así no tengan sentido? nloe, nleo, nelo, neol, nole noel, lnoe, lneo, leno, leon, lone, loen, elon, elno, enlo, enol, eoln, eonl, olne, olen, oeln, oenl, onle, onel. 10.1.4 Variaciones A cada uno de los arreglos de r elementos obtenidos de un grupo de n elementos , cuya diferenciación mutua se deba a los elementos ó el orden de colocación, se le denomina variación. El número total de variaciones se representa por: Ejemplo: Cuantos números de tres cifras se pueden construir con los dígitos 1,2,3,4,5,6,7,8,9,0 si ninguno se puede repetir 10.1.5 Combinaciones http://tifon.unalmed.edu.co/~pagudel/101probabilidad.html (2 de 5) [15/09/2002 7:46:15]
  • 124. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) A cada uno de los arreglos de r elementos obtenidos de un grupo de n elementos , cuya diferenciación mutua se deba a los elementos sin importar el orden de colocación de . ellos, se le denomina combinación. El número total de combinaciones se representa por: . ..... . . . Ejemplo: De cuantas maneras se puede escoger un comité de 4 hombres de un grupo de 8? 10.1.6 Permutaciones con Repetición En el caso de las permutaciones, si el elmento1 se repite r1 veces, el elemento 2 se repite r2 veces, etc. Y el elemento k se repite rk, se le llama permutaciones con repetición y se calcula con: Ejemplo: Cuantas palabras diferentes, aun sin significado, se pueden formar con las letras de la palabra amorosos? 10.1.7 Variaciones con Repetición En el caso de las variaciones si los elementos se pueden repetir hasta r veces se les denomina variaciones con repetición y se obtienen por: Ejemplo: ¿Cuantos números de cuatro cifras existen? http://tifon.unalmed.edu.co/~pagudel/101probabilidad.html (3 de 5) [15/09/2002 7:46:15]
  • 125. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) EJERCICIOS PROPUESTOS 1. ¿De cuántas maneras se pueden colocar dos anillos diferentes en la misma mano, de modo que no estén en el mismo dedo? 2. Al lanzar cinco dados de distintos colores ¿cuántos resultados podemos obtener? 3. Con los números 1,2,3,4,5 y 6: 3.1 ¿Cuántos números distintos de siete cifras podríamos formar? 3.2 ¿Podremos numerar a los 3224564 habitantes de una ciudad con esos números? 4. Se lanzan al aire uno tras otro cinco dados equilibrados de seis caras. ¿Cuál es el número de casos posibles? 5. ¿Cuántos números de seis cifras existen que estén formados por cuatro números dos y por dos números tres? 6. Lola tiene 25 bolitas (10 rojas, 8 azules y 7 blancas) para hacerse un collar. En- garzando las 25 bolitas en un hilo, ¿cuántos collares distintos podrá realizar? 7. ¿Cuántas palabras distintas, con o sin sentido, podremos formar con las letras de la palabra educación? ¿y con la palabra vacaciones? 8. Un grupo de amigos formado por Raúl, Sonia, Ricardo y Carmen organizan una fiesta, acuerdan que dos de ellos se encargarán de comprar la comida y las bebidas ¿De cuántas formas posibles puede estar compuesta la pareja encargada de dicha misión? 9. Una fábrica de helados dispone de cinco sabores distintos (vainilla, chocolate, nata, fresa y cola) y quiere hacer helados de dos sabores ¿Cuántos tipos de helado podrán fabricar? 10. Un grupo de amigos y amigas se encuentran y se dan un beso para saludarse. Si se han dado en total 21 besos, ¿cuántas personas había? 11. En una carrera de 500 metros participan doce corredores ¿De cuántas maneras pueden adjudicarse las medallas de oro, plata, bronce? 12. ¿De cuántas formas pueden cubrirse los cargos de presidente, vicepresidente, secretario y tesorero de un club deportivo sabiendo que hay 14 candidatos? http://tifon.unalmed.edu.co/~pagudel/101probabilidad.html (4 de 5) [15/09/2002 7:46:15]
  • 126. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) ______________________________ 1 A n! se le denomina factorial de n ... ... http://tifon.unalmed.edu.co/~pagudel/101probabilidad.html (5 de 5) [15/09/2002 7:46:15]
  • 127. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) 10. Nociones de Probabilidad (Eventos) 10.2 DEFINICIÓN DE PROBABILIDAD Los eventos aleatorios no son predecibles con absoluta certeza, no obstante podemos medir el grado de confianza con que se hace un pronóstico, sobre la ocurrencia o no de un determinado suceso. 10.2.1 Probabilidad Clásica o "a priori" Si un evento puede ocurrir de n maneras, equiprobables y mutuamente excluyentes, de las cuales m maneras son favorables al suceso A; se define probabilidad del suceso A como: Ejemplo: En el lanzamiento de un dado de seis caras una vez, si 10.2.2 Probabilidad "a posteriori" o de Frecuencia Relativa Si un experimento se repite n veces , de las cuales m veces se presenta el suceso A, entonces es de esperarse que: http://tifon.unalmed.edu.co/~pagudel/102probabilidad.html (1 de 6) [15/09/2002 7:46:40]
  • 128. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) La proporción de veces que se presenta el suceso A tiende a estabilizarse en un número entre 0 y 1 llamado probabilidad de A. Si por ejemplo, lanzamos un dado cien veces y observamos la presencia del número “2” en 16 veces, en tal caso 10.2.3 Probabilidad Subjetiva En la probabilidad subjetiva intervienen preferencias y emociones del analista que en general, son diferentes para cada caso. Por ejemplo, un apostador puede preferir el número “3” porque su horóscopo se lo recomienda. 10.3 AXIOMAS DE LA TEORÍA DE PROBABILIDADES Para todo experimento, la probabilidad de ocurrencia de un evento A, p(A), es una función que cumple con los siguientes axiomas: 10.3.1 10.3.2 10.3.3 Si dos o más sucesos son incompatibles entre sí, entonces la probabilidad de la unión de ellos, es igual a la suma de sus probabilidades respectivas http://tifon.unalmed.edu.co/~pagudel/102probabilidad.html (2 de 6) [15/09/2002 7:46:40]
  • 129. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) De estos tres axiomas podemos, fácilmente, deducir que: 10.3.3.1 La Probabilidad de un evento imposible es igual a cero. 10.3.3.2 La probabilidad de un evento es igual a la unidad menos la probabilidad de su complemento. 10.3.3.3 Toda probabilidad está definida entre la probabilidad del suceso imposible y la probabilidad del evento seguro. 10.3.3.4 . 10.3.3.5 Si dos eventos son compatibles, la probabilidad de su unión es igual a la suma de sus probabilidades menos la probabilidad de su intersección. . . ..... . . . http://tifon.unalmed.edu.co/~pagudel/102probabilidad.html (3 de 6) [15/09/2002 7:46:40]
  • 130. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) En el ejemplo del lanzamiento de dos dados si: A : (suma sea mayor que 5 pero menor que 10) B : (la suma sea mayor que 8) 10.4 PROBABILIDAD CONDICIONAL E INDEPENDENCIA ESTADÍSTICA Si tenemos los sucesos A, B en un experimento aleatorio, con p(B)>0, se llama probabilidad condicional a: p(A/B) La probabilidad de ocurrencia del evento “A” dado que http://tifon.unalmed.edu.co/~pagudel/102probabilidad.html (4 de 6) [15/09/2002 7:46:40]
  • 131. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) ya se ha presentado el suceso “B”. Ejemplo: a un grupo de personas se le pregunta sobre la intención de voto para las próximas elecciones. p(vote dado que es masculino)= p(vote dado que es femenino)= Independencia Estadística Por ejemplo la probabilidad de obtener un número impar en el segundo lanzamiento de un dado, no depende de si en el primer lanzamiento se http://tifon.unalmed.edu.co/~pagudel/102probabilidad.html (5 de 6) [15/09/2002 7:46:40]
  • 132. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) obtuvo un número impar. CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. Defina: 1.1 Experimento aleatorio, y experimento determinístico 1.2 Evento elemental, suceso seguro, suceso imposible, eventos excluyentes y eventos independientes. 2. Para cada uno de los eventos definidos en el lanzamiento de dos dados, calcular su respectiva probabilidad de ocurrencia. 3. En el experimento de seleccionar una ficha de dominó, determinar las probabilidades para todos sus eventos elementales. 4. Para el ejemplo de la intención de voto según el sexo, calcular la probabilidad de no votante dado que es de sexo masculino. ... ... http://tifon.unalmed.edu.co/~pagudel/102probabilidad.html (6 de 6) [15/09/2002 7:46:40]
  • 133. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) 10. Nociones de Probabilidad (Eventos) 10.5 VARIABLE ALEATORIA En el cálculo de probabilidades, generalmente, es más sencillo identificar los eventos numéricamente, y no con la simple descripción del suceso que pueda ocurrir, es más, en muchas ocasiones no podemos registrar todos los sucesos inmersos en el espacio muestral del experimento. Debemos recurrir a cuantificar esos símbolos iniciales en números reales que se puedan operar matemáticamente. Definición: Una variable aleatoria es una función definida sobre un espacio muestral a los números reales. Si ese espacio muestral especificado como dominio es numerable, decimos que la variable es de tipo discreto, en caso contrario diremos que es de tipo continuo. En el experimento de lanzar una moneda, una vez, definimos la variable aleatoria X: el número de sellos obtenido. X(c) = 0 X(s) = 1 En la tirada de dos dados si X es la suma obtenida: http://tifon.unalmed.edu.co/~pagudel/105probabilidad.html (1 de 7) [15/09/2002 7:47:02]
  • 134. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) 10.6 FUNCIÓN DE PROBABILIDAD Las variables aleatorias, transforman eventos del espacio muestral en eventos numéricos, los cuales desde luego, tienen asociada una probabilidad de ocurrencia. 10.6.1 Función de Probabilidad f(x)=p(X=x) : Es una función definida sobre una variable aleatoria a los reales en el intervalo que cumple con los axiomas de la teoría de la probabilidad. 10.6.2 Función de Distribución F(x)=p(X=x) http://tifon.unalmed.edu.co/~pagudel/105probabilidad.html (2 de 7) [15/09/2002 7:47:02]
  • 135. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) Es la acumulada de una función de probabilidad. -∞ : Limite inferior de la variable X Ejemplo: En el Lanzamiento de una Moneda, X: Número de Sellos Ejemplo: X es la Suma Obtenida en el Lanzamiento de dos Dados: http://tifon.unalmed.edu.co/~pagudel/105probabilidad.html (3 de 7) [15/09/2002 7:47:02]
  • 136. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) . . ..... . . . Ejemplo: Si X: Diferencia en Valor Absoluto, Entre los dos Sectores de una Ficha de Dominó: Hemos creado 3 ejemplos de funciones de probabilidad para variables aleatorias discretas con sus respectivas funciones de distribución, que nos permiten calcular las probabilidades para cualquier tipo de evento. Calculemos algunas para el lanzamiento del par de dados, donde X es la suma obtenida: Consultando directamente en la función de distribución de esta variable discreta, F(x)=p(X≤x) tenemos: http://tifon.unalmed.edu.co/~pagudel/105probabilidad.html (4 de 7) [15/09/2002 7:47:02]
  • 137. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) Para el caso continuo, supongamos que un practicante de tiro al blanco siempre acierta indistintamente, en un círculo de 20 centímetros de radio. http://tifon.unalmed.edu.co/~pagudel/105probabilidad.html (5 de 7) [15/09/2002 7:47:02]
  • 138. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) La distancia que hay entre el punto “a=0” (centro) y cualquier punto de la circunferencia “b=20” es . ¿ Cuál es la probabilidad que un disparo impacte a menos de 15 cm del centro? ¿ a más de 9 centímetros? ¿Entre 7 y 14 centímetros? Para toda variable continua: http://tifon.unalmed.edu.co/~pagudel/105probabilidad.html (6 de 7) [15/09/2002 7:47:02]
  • 139. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. Defina: Variable aleatoria, variable aleatoria discreta, variable aleatoria continua, función de probabilidad y función de distribución. 2. En el ejercicio de la ficha de dominó, si X representa la diferencia absoluta entre los dos números, representar y calcular la probabilidad de ocurrencia de los siguientes eventos: 2.1 La diferencia sea menor o igual a 5 2.2 La diferencia sea mayor que 2 2.3 La diferencia sea mayor que 2 pero menor o igual 5 2.4 La diferencia sea mayor que 5 ó menor que 3 ... ... http://tifon.unalmed.edu.co/~pagudel/105probabilidad.html (7 de 7) [15/09/2002 7:47:02]
  • 140. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) 10. Nociones de Probabilidad (Eventos) 10.7 VALOR ESPERADO (ESPERANZA MATEMÁTICA) 10.7.1 Media Aritmética Poblacional En el tratamiento de las medidas de tendencia central, resaltamos la importancia de la media aritmética de una variable, como parámetro representativo de una muestra. En el análisis poblacional, la media aritmética o valor esperado de una variable aleatoria, se define como el promedio ponderado de los diferentes valores que puede asumir la variable X, usando como ponderaciones las probabilidades respectivas de ocurrencia. si X es discreta ó si X es continua -∞ : límite inferior de la variable ∞: límite superior de la variable Ejemplo: X es la Suma Obtenida en el Lanzamiento de Dos Dados http://tifon.unalmed.edu.co/~pagudel/107probabilidad.html (1 de 3) [15/09/2002 7:47:10]
  • 141. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) . . ..... . . . En promedio la suma obtenida en N tiradas es de “7”. Si pagaramos en pesos la suma obtenida en cada lanzamiento, deberíamos cobrar más de 7 pesos para obtener utilidad en el juego. En la variable X, distancia del centro al punto de impacto del tirador, el valor esperado es: 10.7.2 Varianza Poblacional Similarmente a la definición de la media aritmética poblacional, la varianza se define como: ó CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. Calcular el valor esperado para la variable diferencia en el ejemplo del dominó. http://tifon.unalmed.edu.co/~pagudel/107probabilidad.html (2 de 3) [15/09/2002 7:47:10]
  • 142. ESTADÍSTICA APLICADA 10. Nociones de Probabilidad (Eventos) 2. Si usted juega chance, calcule su valor real de acuerdo con los premios que espera obtener y compárelo con lo que realmente paga. 3. Tome un billete de lotería y calcule su precio equitativo. 4. Un contrabandista se enfrenta al siguiente dilema: Introducir o no, mercancía por valor de 5'000.000 obteniendo una utilidad de 1'000.000. El riesgo de ser detectado y castigado con el decomiso de la mercancía es del 17%. ¿Que le aconseja usted.? ... ... http://tifon.unalmed.edu.co/~pagudel/107probabilidad.html (3 de 3) [15/09/2002 7:47:10]
  • 143. ESTADÍSTICA APLICADA 11. Distribuciones Especiales 11. Distribuciones Especiales En el capítulo anterior desarrollamos modelos probabilísticos a partir de abstracciones de los experimentos previamente descritos, a los cuales se les crea una función de probabilidad, que describa las posibilidades de esa realidad experimental. Muchos de los acontecimientos cotidianos, pueden ser asimilados a funciones probabilísticas teóricas, que son de gran ayuda en la toma de decisiones bajo condiciones de incertidumbre. Eminentes estudiosos de la estadística han planteado modelos probabilísticos que han contribuido al desarrollo de la ciencia. Veamos algunos de ellos: 11.1 DISTRIBUCIÓN DE BERNOULLI Se puede afirmar que el experimento de Bernoulli, describe el modelo aleatorio más sencillo, el cual tiene las siguientes características: q En el experimento sólo se hace un ensayo. q En el experimento sólo se admiten dos resultados incompatibles, que llamaremos éxito y fracaso. q La probabilidad de un éxito es p(E)=p. q La probabilidad de un fracaso es p(F)=1-p = q q X : es el número de éxitos x = 0,1. http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (1 de 13) [15/09/2002 7:47:48]
  • 144. ESTADÍSTICA APLICADA 11. Distribuciones Especiales Es el caso cuando se lanza una moneda una vez y se observa de cual lado cae o se analiza un artículo para ver si está defectuoso o no, se obtiene o no un trabajo etc. 11.2 DISTRIBUCIÓN BINOMIAL La distribución binomial se obtiene haciendo n pruebas de Bernoulli independientes entre sí, en tal caso tiene las siguientes características: q n : número de repeticiones independientes del experimento de Bernoulli. q Todas las pruebas deben tener una probabilidad constante de éxito “p” y una probabilidad constante de fracaso “q”=1-p. q X : es el número de éxitos en las n pruebas, entonces; n-X : número de fracasos. Analicemos el experimento con tres repeticiones: . (1) http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (2 de 13) [15/09/2002 7:47:48]
  • 145. ESTADÍSTICA APLICADA 11. Distribuciones Especiales (1) se puede expresar como: (2) se puede expresar como: (3) se puede expresar como: (4) se puede expresar como: entonces para n=3, tenemos que: http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (3 de 13) [15/09/2002 7:47:48]
  • 146. ESTADÍSTICA APLICADA 11. Distribuciones Especiales En general la función de probabilidad binomial tiene la siguiente forma: y la función de distribución: La media aritmética de una variable aleatoria con distribución binomial es , y varianza . Con los parámetros n, y p se tipifica la distribución binomial y la representamos como: . La distribución binomial es simétrica cuando p=0.5, en caso contrario es asimétrica a la izquierda o a la derecha, según el valor de p sea inferior o superior a 0.5. Ver gráfico: http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (4 de 13) [15/09/2002 7:47:48]
  • 147. ESTADÍSTICA APLICADA 11. Distribuciones Especiales Tablas Binomiales http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (5 de 13) [15/09/2002 7:47:48]
  • 148. ESTADÍSTICA APLICADA 11. Distribuciones Especiales . . ..... . . . http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (6 de 13) [15/09/2002 7:47:48]
  • 149. ESTADÍSTICA APLICADA 11. Distribuciones Especiales http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (7 de 13) [15/09/2002 7:47:48]
  • 150. ESTADÍSTICA APLICADA 11. Distribuciones Especiales http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (8 de 13) [15/09/2002 7:47:48]
  • 151. ESTADÍSTICA APLICADA 11. Distribuciones Especiales http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (9 de 13) [15/09/2002 7:47:48]
  • 152. ESTADÍSTICA APLICADA 11. Distribuciones Especiales http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (10 de 13) [15/09/2002 7:47:48]
  • 153. ESTADÍSTICA APLICADA 11. Distribuciones Especiales http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (11 de 13) [15/09/2002 7:47:48]
  • 154. ESTADÍSTICA APLICADA 11. Distribuciones Especiales Ejemplo: Se sabe que el 20% de la cartera de una empresa está vencida, se toma una muestra al azar de 15 cuentas. ¿Cuál es la probabilidad de que: 1. Haya cuatro ó menos cuentas vencidas? 2. Haya menos de cuatro cuentas vencidas? 3. Haya más de dos cuentas vencidas. 4. Haya más de dos pero menos de cinco cuentas vencidas? 5. Haya exactamente 3 cuentas vencidas? 6. No haya cuentas vencidas? 7. Cuál es valor esperado de cuentas vencidas? 8. Cuál es la desviación estándar para el número de cuentas vencidas? Solución: X: número de cuentas vencidas. Éxito: Cuenta vencida. Probabilidad de éxito : p=0.2 Número de pruebas n=15 http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (12 de 13) [15/09/2002 7:47:48]
  • 155. ESTADÍSTICA APLICADA 11. Distribuciones Especiales 1. En las tablas de distribuciones binomiales, , en la intersección x=4 y p=0.2, consultamos . 2. 3. 4. 5. 6. 7. 8. ... ... http://tifon.unalmed.edu.co/~pagudel/11distribuciones.html (13 de 13) [15/09/2002 7:47:48]
  • 156. ESTADÍSTICA APLICADA 11. Distribuciones Especiales 11. Distribuciones Especiales 11.3 DISTRIBUCIÓN DE POISSON La distribución de Poisson es de gran utilidad cuando tenemos variables distribuidas a través del tiempo ó del espacio. Es el caso del número de llamadas que entran a una central telefónica en una unidad de tiempo, la cantidad de personas que atiende un cajero en una hora, los baches por kilómetro en una autopista, los artículos defectuosos que hay en un lote de producción; amén de su utilización como aproximación binomial cuando p es muy cercano a cero, o n superior a 30. (p<0.1 , n>30). La función de probabilidad de Poisson es: Donde: : es decir, la media aritmética es igual a la varianza. : (la base de los logaritmos naturales). X: número de éxitos en la unidad de tiempo o de espacio considerado. Ejemplo: Un cajero de un banco atiende en promedio 7 personas por hora, cual es la probabilidad de que un una hora determinada: 1. Atienda menos de 5 personas 2. Atienda más de 8 personas 3. Atienda más de 5 pero menos de 8 personas http://tifon.unalmed.edu.co/~pagudel/113distribuciones.html (1 de 5) [15/09/2002 7:48:05]
  • 157. ESTADÍSTICA APLICADA 11. Distribuciones Especiales 4. Atienda exactamente 7 personas Consultando la tabla para la distribución de Poisson: 1. 2. 3. 4. Ejemplo: En cierto núcleo poblacional, el 0.5% es portador del V.I.H. En una muestra de 80 personas, cual es la probabilidad: 1. De que haya alguna persona portadora. 2. No haya personas portadoras. Solución: 1. 2. Probabilidades de Poisson Acumuladas http://tifon.unalmed.edu.co/~pagudel/113distribuciones.html (2 de 5) [15/09/2002 7:48:05]
  • 158. ESTADÍSTICA APLICADA 11. Distribuciones Especiales . . ..... . . . 11.4 DISTRIBUCIÓN NORMAL Dada la caracterización propia de este modelo continuo, donde coinciden las medidas de tendencia central, media, moda y mediana; la simetría respecto a estos parámetros y la facilidad de su aplicación hacen de la distribución normal, una herramienta de uso común, máxime que la mayoría de las variables económicas y sociales se ajustan a una función normal. La distribución normal, también es útil como aproximación de los modelos binomial y poisson expuestos anteriormente, y yendo un poco más adelante, sustentados en el teorema del “límite central” podemos afirmar que, cuando el tamaño de la muestra es lo suficientemente grande, podemos asumir el supuesto de normalidad para una suma de http://tifon.unalmed.edu.co/~pagudel/113distribuciones.html (3 de 5) [15/09/2002 7:48:05]
  • 159. ESTADÍSTICA APLICADA 11. Distribuciones Especiales variables. La forma acampanada de la variable normal, resalta la perfección de esta curva definida por los parámetros se representa como: La aparente complejidad de la distribución normal no debe preocupar al lector, donde: X : Variable aleatoria distribuida normalmente Media aritmética de la variable Varianza de la variable e 2.71828 constante (base de los logaritmos naturales) 3.1416 constante Sin embargo, existen infinitas distribuciones normales, ya que por cada media aritmética ó varianza diferente se describe una función también diferente: Normal Diferente Media Igual Varianza Normal Diferente Varianza Igual Media http://tifon.unalmed.edu.co/~pagudel/113distribuciones.html (4 de 5) [15/09/2002 7:48:05]
  • 160. ESTADÍSTICA APLICADA 11. Distribuciones Especiales ... ... http://tifon.unalmed.edu.co/~pagudel/113distribuciones.html (5 de 5) [15/09/2002 7:48:05]
  • 161. ESTADÍSTICA APLICADA 11. Distribuciones Especiales 11. Distribuciones Especiales 11.5 DISTRIBUCIÓN NORMAL ESTANDAR Con el sinnúmero de diferentes distribuciones normales que se generarían con cada media o varianza diferente, se hace necesario efectuar un cambio de origen y de escala en la variable original, para estandarizarla y obtener una nueva variable cuya manipulación es más fácil: con , la nueva variable Z se distribuye normalmente con media aritmética y varianza Dado que la distribución normal es una variable continua Ejemplo: Si asumimos que la resistencia de las baldosas se distribuye normalmente con y Resistencia de 100 Baldosas http://tifon.unalmed.edu.co/~pagudel/115distribuciones.html (1 de 7) [15/09/2002 7:48:33]
  • 162. ESTADÍSTICA APLICADA 11. Distribuciones Especiales Si extraemos una baldosa al azar : Cual es la probabilidad de que: 1. Resista menos de 448 Kg/cm2? 2. Resista más de 588 Kg/cm2 ? 3. Resista entre 308 y 588 Kg/cm2 ? 4. Resista entre 168 y 728 Kg/cm2 ? 5. Resista más de 600 Kg/cm2 ? 6. Resista menos de 200 ó más de 700 Kg/cm2 ? Con la ayuda de los valores tabulados: http://tifon.unalmed.edu.co/~pagudel/115distribuciones.html (2 de 7) [15/09/2002 7:48:33]
  • 163. ESTADÍSTICA APLICADA 11. Distribuciones Especiales http://tifon.unalmed.edu.co/~pagudel/115distribuciones.html (3 de 7) [15/09/2002 7:48:33]
  • 164. ESTADÍSTICA APLICADA 11. Distribuciones Especiales . . .... . . . . http://tifon.unalmed.edu.co/~pagudel/115distribuciones.html (4 de 7) [15/09/2002 7:48:33]
  • 165. ESTADÍSTICA APLICADA 11. Distribuciones Especiales http://tifon.unalmed.edu.co/~pagudel/115distribuciones.html (5 de 7) [15/09/2002 7:48:33]
  • 166. ESTADÍSTICA APLICADA 11. Distribuciones Especiales CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. La probabilidad de que un visitante efectúe una compra en un almacén, durante un día dado es 0.8. Si al negocio entran 20 clientes, ¿cuál es la probabilidad de que el almacén realice: 1.1 Exactamente 16 ventas? 1.2 Menos de 17 ventas? 1.3 Más de 14 ventas? 1.4 Exactamente 5 ventas? 1.5 ¿Cuál es el número esperado de ventas? 2. Si un almacén tiene en promedio 5 ventas por hora. ¿Cual es la probabilidad de que en una hora determinada: 2.1 Haya exactamente 4 ventas? 2.2 Haya más de 3 ventas? 2.3 No se efectúen ventas? http://tifon.unalmed.edu.co/~pagudel/115distribuciones.html (6 de 7) [15/09/2002 7:48:33]
  • 167. ESTADÍSTICA APLICADA 11. Distribuciones Especiales 3. Una de cada 10 personas mayores de 40 años de una comunidad, sufren de hipertensión. Se toma una muestra de 50 personas mayores de 40 años. Utilizando primero la distribución binomial y luego la aproximación a la distribución de Poisson, responder y comparar los resultados: 3.1 ¿Cuál es la probabilidad que haya más de 4 hipertensos? 3.2 ¿Cuál es la probabilidad que haya exactamente 5 hipertensos? 4. Un lote de arandelas tiene un diámetro normal con media 10 milímetros y desviación típica 0.5 milímetros. Se toma una arandela al azar. ¿Cuál es la probabilidad de que tenga un diámetro: 4.1 Superior a 10.5 milímetros? 4.2 Entre 9 y 11 milímetros? 4.3 Menos de 9 milímetros? ... ... http://tifon.unalmed.edu.co/~pagudel/115distribuciones.html (7 de 7) [15/09/2002 7:48:33]
  • 168. ESTADÍSTICA APLICADA 11. Distribuciones Especiales 11. Distribuciones Especiales 11.6 EL TAMAÑO DE LA MUESTRA El teorema del limite central, sustenta la aproximación a la normalidad para muchas distribuciones discretas. Cuando el tamaño de la muestra es grande, y dicha muestra es tomada de cualquier distribución con media •, finita y varianza σ2 finita, entonces la media aritmética muestral tiene una distribución normal con media y varianza Podemos entonces establecer intervalos de confianza para , α : es denominado el nivel de significancia , si la significancia es por ejemplo, α=0.05 entonces la confiabilidad es del 0.95. http://tifon.unalmed.edu.co/~pagudel/116distribuciones.html (1 de 6) [15/09/2002 7:49:11]
  • 169. ESTADÍSTICA APLICADA 11. Distribuciones Especiales Si entonces el 95% de las muestras se encontrarán en el intervalo , ahora bien , como los parámetros poblacional • y σ son desconocidos, para muestras grandes (n>30) la varianza muestral S2 es un buen estimador de la varianza poblacional σ2 , podemos afirmar con una confiabilidad predeterminada que la media aritmética poblacional • se halla en el intervalo estamos admitiendo que la diferencia máxima entre • y es de: esto es: entonces el tamaño de muestra mínimo es donde : : Valor crítico obtenido de la tabla normal, para una confiabilidad de S2: Varianza muestral e: Error máximo admitido Sin embargo, n está en función de la varianza, la cual en la práctica es desconocida, ante lo cual debemos hacer un muestreo piloto para estimar la varianza y proceder a reajustar el tamaño de la muestra mínimo. http://tifon.unalmed.edu.co/~pagudel/116distribuciones.html (2 de 6) [15/09/2002 7:49:11]
  • 170. ESTADÍSTICA APLICADA 11. Distribuciones Especiales Ejemplo: Se desea realizar una investigación para analizar, cual es la resistencia promedio de una producción de baldosas. Si admitimos un error máximo 25 Kg/Cm2, cual debe ser el tamaño de muestra mínimo si exigimos una confiabilidad del 95%, y en una muestra piloto obtuvimos una desviación típica de 140 Kg/Cm2? Con una confiabilidad del 90% se quiere estimar la proporción de ciudadanos que votará en las próximas elecciones. Cual debe ser el tamaño de la muestra, si admitimos un error del 3% y se sabe que en las pasadas elecciones hubo una abstención del 70%? Dado que X es una distribución binomial con •x= np y Entonces . . ..... . . . por consiguiente http://tifon.unalmed.edu.co/~pagudel/116distribuciones.html (3 de 6) [15/09/2002 7:49:11]
  • 171. ESTADÍSTICA APLICADA 11. Distribuciones Especiales http://tifon.unalmed.edu.co/~pagudel/116distribuciones.html (4 de 6) [15/09/2002 7:49:11]
  • 172. ESTADÍSTICA APLICADA 11. Distribuciones Especiales http://tifon.unalmed.edu.co/~pagudel/116distribuciones.html (5 de 6) [15/09/2002 7:49:11]
  • 173. ESTADÍSTICA APLICADA 11. Distribuciones Especiales ... ... http://tifon.unalmed.edu.co/~pagudel/116distribuciones.html (6 de 6) [15/09/2002 7:49:11]
  • 174. ESTADÍSTICA APLICADA Apéndice No. 1 Apéndice No. 1 Una expresión general para cualquier media particular es la siguiente: Si consideramos que todos los datos tiene frecuencia igual a la unidad, es decir: La fórmula general queda: Donde: M (t): Media Σx: Suma de todos los datos. n: Número de datos t: Un valor arbitrario - < t < Como se puede observar; dándole valores a t, se obtienen medias particulares. Las más comunes son: Para t = 1, http://tifon.unalmed.edu.co/~pagudel/apendice1.html (1 de 3) [15/09/2002 7:49:22]
  • 175. ESTADÍSTICA APLICADA Apéndice No. 1 Para t = -1, . La cual se denomina media armónica. . ..... . Nótese que la media armónica es el recíproco de la media aritmética de los recíprocos de . los datos. . Antiguamente la media armónica era llamada subcontraria. Para t = 2, Si t = 0, Para resolver la indeterminación presentada por: se procede de la siguiente forma: http://tifon.unalmed.edu.co/~pagudel/apendice1.html (2 de 3) [15/09/2002 7:49:22]
  • 176. ESTADÍSTICA APLICADA Apéndice No. 1 ... ... http://tifon.unalmed.edu.co/~pagudel/apendice1.html (3 de 3) [15/09/2002 7:49:22]
  • 177. ESTADÍSTICA APLICADA Apéndice No. 2 Apéndice No. 2 Para obtener la fórmula m se deben hacer los siguientes supuestos: 1. El mínimo de datos que amerita clasificación en intervalos es 16. 2. El número de intervalos no debe ser inferior a (5). 3. Cada vez que se duplique la información se incrementa en uno (1) el número de intervalos. Así las cosas, se obtiene la siguiente correspondencia: . . ..... . . . Se llega a la siguiente igualdad: n = 2m –1 Tomando logaritmo a ambos lados de la ecuación http://tifon.unalmed.edu.co/~pagudel/apendice2.html (1 de 2) [15/09/2002 7:49:28]
  • 178. ESTADÍSTICA APLICADA Apéndice No. 2 ... ... http://tifon.unalmed.edu.co/~pagudel/apendice2.html (2 de 2) [15/09/2002 7:49:28]
  • 179. ESTADÍSTICA APLICADA Apéndice No. 3 Apéndice No. 3 Ejercicio general de aplicación. Número de Personas por Familia y Consumo Diario de Arroz, Según Encuesta a 50 Familias de Quibdó Como puede observarse, la variable X (número de personas por familia) es de tipo discreto, cuyos ítems no necesitan agruparse en intervalos; sin embargo, la variable Y (gramos de arroz diarios consumidos por familia) es una variable de tipo continuo y sus valores tienen poca frecuencia; en consecuencia, se hace necesario la agrupación en clases o intervalos: http://tifon.unalmed.edu.co/~pagudel/apendice3.html (1 de 7) [15/09/2002 7:49:52]
  • 180. ESTADÍSTICA APLICADA Apéndice No. 3 1. 2. 3. 4. 5. 6. 7. Construcción de los intervalos: Así las cosas, se procede a construir una tabla de doble entrada, con las variables X, Y para efectuar el conteo respectivo. Numero de Personas por Familia y Consumo Diario de Arroz, en un Grupo de 50 Familias http://tifon.unalmed.edu.co/~pagudel/apendice3.html (2 de 7) [15/09/2002 7:49:52]
  • 181. ESTADÍSTICA APLICADA Apéndice No. 3 De la anterior tabla se pueden obtener, entre otras, las siguientes conclusiones: q El 62 % de las familias las conforman entre 5 y 7 personas. q El 62 % de las familias tienen 6 personas o menos. q El 64 % de las familias consume entre 400 y 800 gramos de arroz, diariamente. q El 84 % de las familias consume menos de 1000 gramos diarios de arroz. Calculemos ahora las medidas de tendencia central y dispersión más importantes, a través de la siguiente tabla: Tabla de Trabajo para el Cálculo de . http://tifon.unalmed.edu.co/~pagudel/apendice3.html (3 de 7) [15/09/2002 7:49:52]
  • 182. ESTADÍSTICA APLICADA Apéndice No. 3 . . . .. . . . . Luego, es más dispersa la variable y: Consumo de arroz. Búsqueda de la correlación entre las dos variables. 1. Diagrama de Dispersión Se vislumbra una correlación positiva y una tendencia rectilínea. 2. Cálculo del Coeficiente de Correlación. Tabla de Trabajo para el Cálculo de Coeficiente de Correlacion http://tifon.unalmed.edu.co/~pagudel/apendice3.html (4 de 7) [15/09/2002 7:49:52]
  • 183. ESTADÍSTICA APLICADA Apéndice No. 3 Debido a que los datos están agrupados en frecuencias, debemos hacer los cálculos teniendo en cuenta las veces que cada par de observaciones se repite. Entre el número de personas por familia y el consumo de arroz, existe una correlación positiva excelente. Se pueden utilizar los mismos totales para efectos de calcular los parámetros a y b de la recta de regresión. http://tifon.unalmed.edu.co/~pagudel/apendice3.html (5 de 7) [15/09/2002 7:49:52]
  • 184. ESTADÍSTICA APLICADA Apéndice No. 3 El modelo lineal queda por consiguiente: Modelo que predice el consumo de arroz, en función del número de personas por familia: Para finalizar, veamos el comportamiento gráfico del modelo rectilíneo entre el número de personas por familia y el consumo de arroz. Recta de Regresión http://tifon.unalmed.edu.co/~pagudel/apendice3.html (6 de 7) [15/09/2002 7:49:52]
  • 185. ESTADÍSTICA APLICADA Apéndice No. 3 ... ... http://tifon.unalmed.edu.co/~pagudel/apendice3.html (7 de 7) [15/09/2002 7:49:52]
  • 186. ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos Solución a Algunos Ejercicios Propuestos 3.1-6 3.1-7 Edad 3.1-7 Estado Civil http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (1 de 12) [15/09/2002 7:50:20]
  • 187. ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos 3.1-7 Número de Hijos 3.1-7 Experiencia Laboral 3.1-7 Escolaridad http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (2 de 12) [15/09/2002 7:50:20]
  • 188. ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos 3.1-7 Gastos en Educación 3.1-7 Ausencias 3.2-4 http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (3 de 12) [15/09/2002 7:50:20]
  • 189. ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos 3.1-7 Calificación 3.2-4 3.1-7 Calificación http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (4 de 12) [15/09/2002 7:50:20]
  • 190. ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos 4-5 Histograma 4-5 Polígono 4-5 Histograma Acumulado http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (5 de 12) [15/09/2002 7:50:20]
  • 191. ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos . . .... . . . . 4-5 Polígono de Frecuencias Acumuladas 4-8 http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (6 de 12) [15/09/2002 7:50:20]
  • 192. ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos 5-6 7-4 8-1 http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (7 de 12) [15/09/2002 7:50:20]
  • 193. ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos 9-7 http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (8 de 12) [15/09/2002 7:50:20]
  • 194. ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos 9-8 10.1-1 Si se usa el pulgar: 10.1-2 Variaciones con repetición http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (9 de 12) [15/09/2002 7:50:20]
  • 195. ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos 10.1-5 Permutaciones con repetición 10.1-8 Combinaciones 10.1-10 Combinaciones 10.4-4 10.6-2.1 10.6-2.2 http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (10 de 12) [15/09/2002 7:50:20]
  • 196. ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos 10.6-2.3 10.6-2.4 10.5-4.1 10.5-4.2 10.5-4.3 http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (11 de 12) [15/09/2002 7:50:20]
  • 197. ESTADÍSTICA APLICADA Solución a Algunos Ejercicios Propuestos ... ... http://tifon.unalmed.edu.co/~pagudel/ejercicios.html (12 de 12) [15/09/2002 7:50:21]
  • 198. ESTADÍSTICA APLICADA Enlaces Enlaces Librería Virtual Elaleph www.elaleph.com/ Universidad Nacional de Colombia sede Medellín www.unalmed.edu.co/ El Portal de las Matemáticas www.matematicas.net/ Libros y Software Gratis www.recursosgratis.com/ DANE Colombia www.dane.gov.co/ Planeación Nacional Colombia N.N.P. www.dnp.gov.co/ Ministerio de Desarrollo Colombia www.mindesa.gov.co/ Web Estadístico de Navarra www.lander.es/ Bioestadística: Métodos y Aplicaciones ftp.medprev.uma.es/libro Aula Fácil ..... ..... www.aulafacil.org/ Probabilidad y Estadística w3.mor.itesm.mx/ Diseño de Experimentos y Teoria de Muestras http://tifon.unalmed.edu.co/~pagudel/enlaces.html (1 de 2) [15/09/2002 7:50:24]
  • 199. ESTADÍSTICA APLICADA Enlaces libros.netstoreusa.com/ Distribuciones Estadísticas www.sisweb.com/ Probabilidad thales.cica.es/ Distribución de Poisson www.ual.es/ Tratamiento de la Incertidumbre www.dc.fi.udc.es/ Universidad de Antioquia extension.udea.edu.co/ Estadística Lejarza www.uv.es/ ... ... http://tifon.unalmed.edu.co/~pagudel/enlaces.html (2 de 2) [15/09/2002 7:50:24]
  • 200. ESTADÍSTICA APLICADA Referencias Bibliográficas Referencias Bibliográficas Alatorre, et al., Introducción a los métodos estadísticos, México, UPN. Azorín, Poch. Francisco. Curso de muestreo y aplicaciones, Aguilar, 1969. Barahoma, Abel y otro. Metodología de trabajos científicos, Ipler, 1979. Bencardino M., Ciro. Estadística, Apuntes y 600 Problemas Resueltos, 2a Edición, Ecoe, 1982. Castillo, Juana, Estadística inferencial básica, México, CCH, UNAM. CHAO. Lincoln L. Estadística para Ciencias Administrativas, 2a Edición, MCGRAW- HILL, 1980. Dixon, Wilfrid J y otro. Introducción al Análisis Estadístico, 2a Edición, MCGRAW- HILL, 1965. Doms, Fernan P. La Estadística Qué Sencilla, 2a Edición, Paraninfo, 1969. Downie, N. M. y otro. Métodos Estadísticos Aplicados. Harper Row Publishers Inc., 1970. Giardina, Basilio. Manual de Estadística, 3 Edición, 1972. Haber, Audrey. Estadística General, Fondo Educativo Interamericano, 1973. Hoel, Paul G. Estadística elemental, México, CECSA. Johnson, Robert, Estadística elemental, Buenos Aires, Grupo Editorial Iberoamericana. ... ..... Kazmier, Leonard J. Estadística Aplicada a la Administración y la Economía, .. MCGRAW-HILL, 1978. Leitold Louis. El Cálculo con Geometría Analítica, 2a Edición, Harla S.A., 1973. Levin Yack. Fundamentos de Estadística en la Investigación Social, 2a Edición, Harla S., 1977. Llerena, León, Ricardo y otro. Curso de Estadística General, U. de A., 1981. http://tifon.unalmed.edu.co/~pagudel/bibliografica.html (1 de 2) [15/09/2002 7:50:28]
  • 201. ESTADÍSTICA APLICADA Referencias Bibliográficas Mejía V., William. Bioestadística General, Escuela Nal. De Salud Pública, U. de A., 1980. National Council of Teachers. Of. Mathematics USA. Recopilación, Organización e interpretación de Datos, Trilla, 1970. Portilla, Ch. Enrique. Estadística, Primer Curso. Interamericano, 1980. Richards, Larry E. Y otro. Estadística en los Negocios. ¿porqué y cuándo?, MCGRAW-HILL,1978. Seymour, Lipschutz, Teoría y problemas de probabilidad, México, McGraw-Hill. Shao, Stephen P. Estadística para Economistas y Administradores de Empresas, 15a Edición, 1979. Spiegel, Murray R. Estadística, MCGRAW-HILL, 1970. Spiegel, Murray, Teoría y problemas de estadística, México, McGraw-Hill. Stevenson, William, Estadística, México, Harla. Yamane, Taro, Estadística, México, Harla. ... ... http://tifon.unalmed.edu.co/~pagudel/bibliografica.html (2 de 2) [15/09/2002 7:50:28]
  • 202. ESTADÍSTICA APLICADA Norbeto Guarín Salazar NORBERTO GUARÍN SALAZAR Estadístico Universidad de Medellín M.Sc. Estadística Universidad Nacional de Colombia Profesor Asociado Universidad del Chocó ..... ..... ... ... http://tifon.unalmed.edu.co/~pagudel/nguarin.html [15/09/2002 7:50:30]