SlideShare una empresa de Scribd logo
CEP-2 Lic. Manuel Jesús Mendives Laura FACILITADOR IPAE, 08 de Enero del 2011 Bases Estadísticas y Principales Conceptos para el Control Estadístico de Procesos
DESARROLLO DEL SYLLABUS INTRODUCCIÓN A LA PROBABILIDAD CONCEPTOS ESTADÍSTICOS FUNDAMENTALES Población estadística  La Distribución de Frecuencias  MÉTRICA EN EL ESPACIO ESTADÍSTICO Medidas de tendencia central  Medidas de Dispersión  Media y Varianza de una Muestra  Muestreo Aleatorio  FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES Generalidades  La Distribución Normal  La Distribución Normal Standard  La Distribución T de Student  Distribución de Promedios Muestrales  Distribución binomial  Distribución de Poisson   DÍA 1 : 08 de enero del 2011
DESARROLLO DEL SYLLABUS CONTROL DE PROCESO Control de proceso  Control Estadístico de Proceso (C.E.P.)  Gráficos C.E.P. Generalidades  Variables y atributos  Eficacia estadística de los gráficos de control  Subgrupos racionales  Ventajas de los gráficos de control  GRÁFICOS DE CONTROL POR VARIABLES Introducción.  Gráficos de control (, R)  Gráfico basado en estudio inicial  Gráficos basados en valores Standard  Gráficos de control para valores individuales  Gráficos de control de media móvil (desgaste de herramientas)  Recogida de datos e interpretación  Establecimiento de límites del Proceso   DÍA 2 : 15 de enero del 2011
DESARROLLO DEL SYLLABUS (Continuación) Líneas generales para el diseño del gráfico (  , R)  Interpretación de los gráficos (  , R)  Eficacia de los gráficos (  , R)  Gráficos de control (  , S)  Gráficos de control de sumas acumuladas (CUSUM)  Otros gráficos de control  Gráfico de control de media móvil  Gráficos de Control Multidimensional  CAPACIDAD DEL PROCESO Introducción  Análisis de la capacidad del proceso  Análisis de la capacidad del proceso usando histogramas  Análisis de la capacidad del proceso usando gráficos de control  DÍA 3 : 22 de enero del 2011
DESARROLLO DEL SYLLABUS GRAFICOS DE CONTROL POR ATRIBUTOS Introducción  Gráfico “p” para porcentajes defectuosos  Operativa del gráfico de control “p”  Diseño del gráfico “p”  Gráfico “np” para unidades defectuosas  Gráficos “C” para tamaño de muestra constante  Análisis de defectos  Gráfico “U” LINEAS GENERALES PARA IMPLANTAR GRAFICOS DE CONTROL DÍA 4 : 29 de enero del 2011
Cada vez que realizamos un cálculo matemático para resolver un problema físico, estamos aplicando un modelo matemático a un fenómeno de la realidad. Este fenómeno puede ser, por ejemplo, la caída de un objeto desde cierta altura, y en este caso utilizamos un modelo que es la Ley de Gravedad. ¿Qué es un modelo? Al enfrentar un problema de física, química, ingeniería, etc., estamos analizando e investigando una parte o aspecto de la realidad material que nos rodea. Para resolver el problema, necesitamos modelar esa realidad, es decir, construir una representación en la mente de cómo ocurren los hechos, junto con ecuaciones matemáticas que permitan calcular los efectos de los mismos. En ningún caso se debe confundir modelo con realidad. Un modelo es sólo una representación de la realidad, utilizado para estudiar y analizar dicha realidad. Hay modelos matemáticos que nos permiten obtener un resultado numérico preciso, por ejemplo, que la velocidad de un automóvil es de 175,5 Km/Hora. O que la corriente eléctrica que circula por un cable es de 5,7 Amperios. Este tipo de  modelos matemáticos  se denominan  Determinísticos . INTRODUCCIÓN A LA PROBABILIDAD
Existen también fenómenos que necesitan otro tipo de modelos matemáticos, denominados no determinísticos, probabilísticos o estocásticos. Ejemplo :  supongamos que se ha previsto la realización de unas pruebas balísticas para las que se necesita saber la cantidad de lluvia que va a caer en un próximo periodo de tiempo, antes de decidir la forma de llevar a cabo los ensayos. El Técnico responsable podrá informarse en el servicio meteorológico en relación con la presión barométrica, la temperatura, velocidad del viento y otros datos meteorológicos, sin embargo, no hay una ecuación que con todos esos datos le permita calcular de forma precisa los milímetros de lluvia que van a caer durante el periodo de tiempo que le interesa. De la misma forma, ningún operador puede calcular cuanto va a subir la Bolsa, ni si va a subir o bajar, aún cuando conozca todas las variables económicas disponibles. Este tipo de fenómenos no admiten un modelo determinístico, sino un modelo probabilístico, que como resultado nos dice la  probabilidad  de que llueva una cierta cantidad, o la probabilidad de que la Bolsa suba un cierto porcentaje. El resultado no es un valor determinado, sino la probabilidad de un valor. Veamos algunos ejemplos de fenómenos para los cuales es apropiado utilizar un modelo probabilístico: INTRODUCCIÓN A LA PROBABILIDAD
Experimento 1:   Se lanza un dado y se anota el número que aparece en la cara superior: Espacio Muestral = S 1  =  1, 2, 3, 4, 5, 6 Experimento 2:   Se arroja una moneda cuatro veces y se anota la sucesión de caras y cruces obtenidas.  Espacio Muestral: S 2  =  (Cara v Cruz), (Cara v Cruz), (Cara v Cruz), (Cara v Cruz) ESPACIO MUESTRAL .-  Conjunto de todos los resultados posibles (S) que pueden producirse al realizar un experimento . INTRODUCCIÓN A LA PROBABILIDAD
SUCESO .- Un Suceso, respecto a un espacio muestral S asociado con determinado experimento, es un subconjunto de resultados del Espacio Muestral. El conjunto vacío, el formado por un solo elemento y el formado por todos los elementos del Espacio Muestral son también sucesos. Entonces, dado un experimento aleatorio cualquiera, hay un espacio muestral asociado cuyos elementos son todos los resultados que se pueden obtener de la experiencia. Un subgrupo o subconjunto de resultados es un suceso. Ahora, ¿cómo podemos saber si la posibilidad de que ocurra un suceso es grande o pequeña? Por ejemplo, si arrojamos un dado, ¿cómo podemos calcular la probabilidad de que salga un 2?   INTRODUCCIÓN A LA PROBABILIDAD
Para esto necesitamos un número asociado con cada suceso, al cual se lo denomina probabilidad del suceso. Entonces, la probabilidad P de un suceso es un número entre 0 y 1, que nos dice en que medida es posible que ocurra el suceso. Si la probabilidad es 1 significa que el suceso ocurrirá con toda certeza. Si la probabilidad es 0,5 significa que un suceso puede ocurrir o puede no ocurrir con la misma probabilidad. Probabilidad 0 quiere decir que el suceso es imposible que ocurra. ¿Cómo podemos calcular la Probabilidad de un suceso? La respuesta a esta pregunta no siempre es sencilla y depende del experimento y de su espacio muestral asociado. Hay casos simples en los que el cálculo es relativamente sencillo: Primero, supondremos que se trata de un experimento cuyo espacio muestral es finito y tiene un número pequeño de resultados posibles. Segundo, supondremos que todos los resultados que integran el espacio muestral (sucesos elementales) tienen la misma probabilidad de ocurrir.   INTRODUCCIÓN A LA PROBABILIDAD
Con estas dos hipótesis, la fórmula para calcular la probabilidad es muy sencilla. Supongamos que se trata de un experimento cualquiera cuyo Espacio Muestral S tiene N elementos (N resultados posibles). Deseamos calcular la probabilidad de un suceso H (Un subconjunto H del espacio muestral S) que tiene m-elementos. De acuerdo a lo explicado, el número N tiene que ser pequeño y la probabilidad de cada suceso elemental tiene que ser la misma. Entonces la probabilidad P de que ocurra el suceso H es: P = m/N INTRODUCCIÓN A LA PROBABILIDAD
Ejemplos: Supongamos que se arroja un dado sobre una mesa y apostamos a que salga un número igual o menor que 4. Sabemos que son igualmente posibles los números: {1, 2, 3, 4, 5 y 6} (Espacio muestral con 6 elementos). Pero los números favorables a nuestra  apuesta  son: {1, 2, 3 y 4} (Suceso con 4 elementos). Entonces, la probabilidad de que ganemos es  P = 4/6 = 0,666… Es decir que tenemos a nuestro favor una probabilidad de 0,666… (o  sea aproximadamente del 67 %) de que el evento ocurra. Si apostamos a un sólo número (sacar un As), la probabilidad de ganar sería P = 1/6 = 0,1666… Repitiendo, la probabilidad es un número entre 0 y 1, que nos dice en que medida es posible que ocurra un suceso. INTRODUCCIÓN A LA PROBABILIDAD
EJERCICIOS ¿Cuál es la probabilidad de que al producir 18 bancos de madera de los cuales 3 son de color rojo, 15 son blancos, al menos 2 salgan defectuosos? Recibo 679 Televisores LG de un embarque reciente ¿Cuál es la probabilidad de que al menos cuatro resulten defectuosos? INTRODUCCIÓN A LA PROBABILIDAD
CONCEPTOS ESTADÍSTICOS FUNDAMENTALES   Hasta ahora hemos visto el caso de fenómenos o experimentos cuyo espacio muestral asociado tiene un número pequeño de elementos. Ello nos ha servido para introducir la noción de probabilidad, Pero en muchos casos es necesario trabajar con experiencias o procesos que generan un número muy grande de datos o resultados numéricos, es decir, espacios muestrales con un número infinito o muy grande de elementos. Cuando tenemos un conjunto muy grande de datos numéricos para analizar decimos que tenemos un Universo o Población de observaciones.
Cada dato numérico es un elemento de la población o universo. Una Muestra es un subconjunto pequeño de observaciones extraídas de un universo o población. La Estadística trabaja con poblaciones de datos y con muestras extraídas de las mismas. Los conceptos de población y muestra a veces resultan ambiguos en su aplicación práctica.  CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
CONCEPTOS ESTADÍSTICOS FUNDAMENTALES   EJEMPLO .- Supongamos que en una empresa se fabrica un lote de 10 toneladas de un producto químico, y un técnico debe controlar la calidad del mismo. El técnico toma una pequeña porción, por ejemplo, 100 gramos y dirá que tomó una muestra del producto para analizar en el laboratorio. Hasta el momento, la muestra no fue analizada y por lo tanto no tenemos ningún dato numérico.
Cuando el laboratorio efectúa algún ensayo en la muestra y obtiene un resultado numérico, dicho dato podría ser analizado desde el punto de vista estadístico. Vamos a suponer hipotéticamente que el técnico continúa sacando otras muestras del producto, hasta agotar el lote y cada una es ensayada en el laboratorio, que nos da los resultados.   Como teníamos 10 toneladas de producto y las muestras son aproximadamente de 100 gramos, el técnico seguramente extraerá alrededor de 100000 muestras y el laboratorio nos entregará alrededor de 100000 resultados. Este conjunto de datos numéricos es nuestro universo o población de datos. CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
Como teníamos 10 toneladas de producto y las muestras son aproximadamente de 100 gramos, el técnico seguramente extraerá alrededor de 100000 muestras y el laboratorio nos entregará alrededor de 100000 resultados. Este conjunto de datos numéricos es nuestro universo o población de datos. Si tomamos al azar 10 de esos resultados, podemos decir que tenemos una muestra de 10 elementos de ese universo o población. No debemos confundir esta muestra (Desde el punto de vista estadístico) con la muestra de material que extrajo el técnico para ser analizada en el laboratorio. Supongamos que el técnico toma solamente 5 muestras y las envía para analizar al laboratorio. El laboratorio nos enviará sólo 5 resultados, y nosotros diremos que tenemos una muestra de datos extraída del universo o población de datos total. Y estamos pensando en el universo o población que tendríamos si se hubieran extraído y analizado las 100000 muestras de material .   CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
OTRO EJEMPLO : Muchas veces resulta difícil imaginarse cual es el universo del cual extrajimos los datos: Supongamos que tenemos una máquina que produce piezas de plástico en serie y un técnico toma 5 piezas sucesivas y les mide la altura con un calibre. Tenemos, entonces, 5 resultados, es decir una muestra de 5 elementos. ¿Cuál es el universo al cual pertenece esa muestra de datos? Debemos imaginar lo siguiente: Si la máquina continuara trabajando en las mismas condiciones (Es decir, a la misma velocidad, con las mismas materias primas, a la misma temperatura, manejada por el mismo operario, etc.)... y a cada pieza que produce se le mide la altura tendríamos un conjunto muy grande de resultados numéricos. Ese conjunto muy grande de resultados numéricos que no existe, pero que podría obtenerse en esas condiciones es el universo o población del cual extrajimos la muestra de 5 observaciones . CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
PERO: ¿Qué representa una Población de datos? El análisis estadístico de una población o universo de datos tiene como objetivo final descubrir las características y propiedades de aquello que generó los datos. Por ejemplo, se tiene una población de escolares (Población física, población humana) y se les mide la altura. El conjunto de datos de altura constituye una población o universo estadístico. El análisis de estos datos de altura (Universo estadístico) sirve para caracterizar y estudiar a la población de estudiantes (Que no es una Población estadística). ALUMNOS DAR EJEMPLOS!!! CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
EJEMPLO : Un ingeniero controla un proceso industrial, que genera a diario muchos lotes de un producto (Población de lotes). Para cada lote se mide una característica de calidad, obteniéndose una gran cantidad de resultados numéricos (Población de datos). El ingeniero realiza esta tarea porque a través de los datos numéricos obtenidos se puede evaluar el comportamiento del proceso, que es lo que realmente le interesa.  CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
IMPORTANTE :  Detrás de un universo o población de datos se encuentra una población física, formada por elementos de la realidad que nos rodea, de la cual, a través de algún tipo de medición, se obtuvieron los datos numéricos. Es esa población física subyacente (Elementos de la realidad, seres humanos, lotes de material, etc.) la que deseamos estudiar y caracterizar por medio del análisis estadístico de los datos obtenidos. La población estadística está representando, entonces, una población física o natural formada por elementos de la realidad, con respecto a una característica o propiedad de esa población física. Al utilizar métodos estadísticos, no confundir la población física, formada por elementos de la realidad que estamos estudiando, con la población o universo de datos generados a partir de la primera. Cuando se utilice los términos “población” o “universo”  sin otro adjetivo  nos estamos refiriendo a población o universo de datos numéricos (También llamados observaciones, mediciones o valores). CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
Una Población o Universo de datos es un conjunto muy grande de números. Estos números pueden estar en un gran listado o puede ser un conjunto hipotético, es decir, podemos imaginar los números pero no los tenemos realmente. Una gran tabla de números ordenados al azar prácticamente no nos muestra información acerca de la población de datos. Suponiendo que disponemos de los datos del universo, ¿cómo podemos clasificar y ordenar los números para obtener más información acerca de ese universo de datos? Una forma sería escribir los números desde el menor hasta el mayor y colocar encima de cada uno tantas cruces o cuadraditos como veces que figure repetido en la población. El número de veces que aparece repetido cada dato es la frecuencia de dicho valor. La representación gráfica que hemos visto se denomina  Distribución de Frecuencias de la población . La Distribución de Frecuencias
La representación gráfica permite ver información que antes no aparecía tan evidente. Por ejemplo, sin hacer ningún cálculo nos damos cuenta donde está aproximadamente el promedio de la población. También nos muestra cuales son los valores máximo y mínimo de la población, es decir, el rango o recorrido .  La Distribución de Frecuencias
En el caso anterior, los datos de la población son números enteros. Cuando los números no son enteros o cuando tenemos un número muy grande de datos, se divide el rango total en subintervalos y se cuenta el número de valores que cae dentro de cada subintervalo. Vamos a suponer, ahora, que tenemos una cierta población de N = 500 datos, por ejemplo el peso de varones adultos de 40 años. Una manera de caracterizar esta población es construir una distribución de frecuencias o gráfico de frecuencias. Para ello seguimos los pasos siguientes: 1) Tomamos nota del valor máximo y el valor mínimo de la serie de datos que estamos considerando. 2) Subdividimos el intervalo entre el máximo y el mínimo en algún número de intervalos (15 ó 20) más pequeños iguales entre sí. 3) Contamos el número de datos que encontramos dentro de cada intervalo (Frecuencia). Por ejemplo, supongamos que en el intervalo i hay ni observaciones (S*ni = N). 4) Para construir el gráfico, colocamos en el eje de abscisas (Horizontal) los intervalos y levantamos en cada intervalo un rectángulo de altura proporcional al número ni de datos dentro del mismo. Si hacemos el área del rectángulo levantado sobre el intervalo i-ésimo igual a la frecuencia relativa ni/N, el área total bajo el histograma será igual a la unidad: La Distribución de Frecuencias
Obtenemos así un histograma que nos muestra la distribución de frecuencias de la población: Esta distribución de frecuencias nos muestra si hay resultados que son mas frecuentes que otros; si los valores están ubicados alrededor de un valor central, si están muy dispersos o poco dispersos. Podemos observar que fracción de todas las mediciones cae por ejemplo, entre 70 y 80 Kg.   La Distribución de Frecuencias
Si elegimos una persona del grupo y la pesamos, el resultado es un dato que pertenece a la población de datos representada en el gráfico. Decimos, entonces, que estamos extrayendo un dato de la población de datos. Pero hay distintas maneras de elegir la persona, es decir, distintas maneras de realizar la extracción del dato. Si nos paramos frente al grupo y elegimos una persona, estaremos seleccionando al más gordo, al más flaco o al más alto (y por lo tanto pesa más que otros), de acuerdo a criterios subjetivos que no podemos evitar. En cambio, si escribimos los nombres de todas las personas en una etiqueta, metemos todas las etiquetas en una caja y luego le pedimos a alguien que retire una etiqueta, la selección no estará influida por nuestra subjetividad. En este caso, decimos que la extracción es aleatoria. Una extracción aleatoria es aquella en que cada miembro de la población tiene la misma posibilidad de ser elegido.   La Distribución de Frecuencias
Medidas de Tendencia Central Una característica importante de cualquier población es su posición, es decir, donde está situada con respecto al eje de abscisas (Eje horizontal). En nuestro caso, es importante saber si los datos se agrupan alrededor de 60 Kg. o de 90 Kg. o alrededor de 12 Kg. Una manera de obtener un dato numérico que nos dé idea de la posición de nuestra población es calcular el Promedio o Media de todas las observaciones: METRICA EN EL ESPACIO ESTADÍSTICO
Este importante parámetro nos permite efectuar comparaciones entre distintas poblaciones. Por ejemplo, si tuviéramos una población formada por mediciones del peso de mujeres de 30 años, otra de peso de varones de 40 años y una tercera de peso de niños de 8 años, es indudable que los promedios van a ser diferentes. El promedio, entonces, nos está diciendo que las tres poblaciones son diferentes y también en que medida difieren. Ahora, si tuviéramos una población de varones con peso promedio 70 Kg. y otra población de varones con el mismo promedio, ¿se puede afirmar que ambas poblaciones son equivalentes? Para responder esta pregunta necesitamos tener medidas de la dispersión de la población de datos   METRICA EN EL ESPACIO ESTADÍSTICO
Medidas de Dispersión La otra característica muy importante de una población es el grado de dispersión de las observaciones. No es lo mismo si en nuestra población encontramos que todos los valores están entre 75 y 90 Kg. que si están entre 60 y 105 Kg., aunque el promedio sea el mismo. Es necesario agregar alguna idea de la dispersión de los valores. Una manera es a través del Rango de las observaciones, es decir, el valor Máximo y el valor Mínimo de los datos de la población. Entonces, una descripción mas realista acerca de los seres humanos sería decir que pesan en promedio 70 Kg. y que el rango es de 40 a 120 Kg. (Estos valores son supuestos). Una manera más precisa de dar idea de la dispersión de valores de una población es a través de la Varianza o su raíz cuadrada, que es la Desviación Standard.   METRICA EN EL ESPACIO ESTADÍSTICO
Vamos a calcular la varianza y la desviación Standard de un número pequeño de datos (Una muestra) para ilustrar el cálculo. Supongamos que se midió la altura de 10 personas adultas y de sexo femenino, y se obtuvieron los valores siguientes (en cm.): 165 ; 163 ; 171 ; 156 ; 162 ; 159 ; 162 ; 168 : 159 ; 167 METRICA EN EL ESPACIO ESTADÍSTICO
METRICA EN EL ESPACIO ESTADÍSTICO   El promedio de estas observaciones es:   = 163, 2 cm.  Si a cada una de las observaciones le restamos el promedio, obtenemos los Residuos: Los residuos también nos dan una idea de la dispersión de las observaciones individuales alrededor del promedio. Si el valor absoluto (El valor numérico sin el signo) de los residuos es grande, es porque los valores están muy dispersos. Si el valor absoluto de los residuos es pequeño, significa que las observaciones individuales están muy cerca del promedio, y por lo tanto, hay poca dispersión.
LA VARIANZA :  Es un número que nos permite comparar poblaciones. Cuando la dispersión de las observaciones es grande (Datos que se alejan mucho por encima y por debajo del promedio), el valor de los residuos (distancia entre cada dato y el promedio) será grande. Entonces aumenta la suma de cuadrados de los residuos y por lo tanto la varianza. También se utiliza la raíz cuadrada de la varianza: Por lo tanto:   La desviación Standard o desviación típica tiene las mismas unidades que la variable con la que estamos trabajando, en nuestro caso el centímetro. Tanto la varianza como la desviación Standard nos permiten comparar el grado de dispersión de distintas poblaciones . METRICA EN EL ESPACIO ESTADÍSTICO
Media y Varianza de una Muestra Cuando tenemos una muestra (Subconjunto de algunos datos extraídos de una población), también podemos calcular su media, su varianza y su desviación Standard. Es muy importante distinguir entre la media, varianza y desviación Standard poblacional, de la media, varianza y desviación Standard muestral. La media, varianza y desviación Standard de una población o universo se denominan parámetros de la población y en general se designan con letras griegas: m para la Media, s 2  para la Varianza y s para la Desviación Standard poblacionales. En el caso de una muestra, la media, varianza y desviación standard se denominan estadísticos y se utilizan letras de nuestro alfabeto:   para la Media s 2       para la Varianza s      para la Desviación Standard muestral   METRICA EN EL ESPACIO ESTADÍSTICO
El cálculo de la varianza y la desviación standard de una muestra de n observaciones se realiza con una fórmula levemente diferente que la ya vista para la varianza y desviación standard de una población: METRICA EN EL ESPACIO ESTADÍSTICO
MUESTREO ALEATORIO En general, no es posible disponer de todas las observaciones de un universo o población, ya sea porque es un universo hipotético o porque la disposición de todos los datos resulta una tarea excesiva para nuestras posibilidades. Normalmente se dispone de una muestra de datos extraídos de un universo, y lo que se pretende es estimar (conocer de manera aproximada) los parámetros del universo por medio de cálculos realizados sobre la muestra. En este sentido decimos que la media muestral es una estimación de la media del universo, y que la varianza y desviación standard muestrales son estimaciones de la varianza y desviación standard poblacionales respectivamente. METRICA EN EL ESPACIO ESTADÍSTICO
EJEMPLO: Supongamos que un partido político necesita averiguar la cantidad de personas que están dispuestas a votar por su candidato y encarga para ello a una empresa la realización de una encuesta un día previo a las elecciones. El encargado de la encuesta podría pensar en consultar la intención de voto de toda la población de votantes (más de 26 millones). Esto, obviamente, es una tarea excesiva que por distintas razones no se puede realizar. Entonces, el camino que resta es tomar una muestra representativa de esa población de personas y consultar la intención de voto en esa muestra. Los resultados que se obtengan son solamente una estimación del resultado que se hubiera obtenido si la consulta se hubiera efectuado sobre toda la población de votantes. Pero: ¿cómo se obtiene una muestra representativa? METRICA EN EL ESPACIO ESTADÍSTICO
Trabajemos con una población de muy pocos datos. Supongamos que nuestra población son 10 bolas con los siguientes números 2, 5 y 9 y una frecuencia según la tabla adjunta: El promedio de la población es 4. Supongamos que queremos obtener una muestra de 5 elementos de esa población. Hay varias formas de hacerlo. Supongamos que puedo ver los números y elijo 2, 2, 2, 2 y 5. El promedio de estos 5 números extraídos de la población es 2,6 que difiere sustancialmente del promedio de la población. METRICA EN EL ESPACIO ESTADÍSTICO
Es evidente que dicha muestra no es representativa de la población de la que fue extraída. No se mantiene la misma proporción de cada número que existe en la población. Una muestra de 5 elementos en la que hay la misma proporción de cada dígito debería tener 3 dos, 1 cinco y 1 nueve, y su promedio es 4, el mismo de la población: En una población de muchos datos, no es posible obtener una muestra eligiendo cada elemento para que figure en la misma proporción que en la población, porque para ello deberíamos disponer de todos los datos de la misma, y en ese caso no sería necesario sacar una muestra. Si a cada elemento de la población se le da la misma oportunidad de ser elegido, entonces se supone que cada número estará en la muestra en un número proporcional a la cantidad de veces que está en la población. Por ejemplo, el 2 va a estar en la muestra mas veces que el 5, porque en la población hay 6 dos y sólo 2 cincos. METRICA EN EL ESPACIO ESTADÍSTICO
Si introducimos las diez bolas en una bolsa y las mezclamos suficientemente, la probabilidad que tiene una bola individual de ser extraída es la misma para cualquiera de las bolas. En esas condiciones, si extraemos cinco bolas sucesivas, mezclándolas previamente en cada oportunidad, es razonable pensar que vamos a sacar el 2 en más oportunidades que el 5 ó el 9.Esta forma de obtener la muestra es lo que se conoce como Muestreo Aleatorio.   METRICA EN EL ESPACIO ESTADÍSTICO
El muestreo aleatorio no garantiza que la muestra va a ser representativa de la población, pero al eliminar toda influencia externa en el acto de extraer un elemento de la población, la proporción de cada uno estará influida sólo por la cantidad de veces que está presente en la población de la cual se extrae la muestra Entonces, realizando el muestreo en forma aleatoria (al azar), la probabilidad de obtener una muestra representativa de la población es mayor que si en la elección de los elementos de la muestra interviene la voluntad del que efectúa la operación o algún otro factor de influencia . METRICA EN EL ESPACIO ESTADÍSTICO
A medida que aumentamos la cantidad de observaciones que tomamos de la población, podemos construir nuestro gráfico con un número mayor de intervalos, aunque de menor amplitud (El rango total cubierto por la población es el mismo). Si continuamos este proceso, con intervalos cada vez más estrechos y numerosos, los altibajos en el gráfico de la distribución de frecuencias tienden a desaparecer. En el límite, el ancho del intervalo tiende a cero y la población puede representarse por una distribución de probabilidad continua. Cuando, para representar esta distribución de probabilidad continua se utiliza una función matemática, esta se denomina  Función de Densidad de Probabilidad. FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES
La forma de la curva en el gráfico de la función de distribución es característica de la población de observaciones asociada con la misma, y depende de variables internas del proceso que generó los datos de la población. Existen distintas funciones de distribución teóricas, cada una de las cuales está basada en un modelo de comportamiento del proceso que generó el universo de observaciones.   FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES
La aplicación de una de estas distribuciones teóricas a una población particular está justificada si las hipótesis (suposiciones) del modelo de comportamiento del proceso que generó la población se cumplen. Dicho de otro modo, si conocemos el proceso, es decir, el conjunto de fenómenos que dieron lugar a nuestra población de mediciones u observaciones, y además estamos seguros de que el mismo se ajusta a un modelo de comportamiento determinado, entonces podemos decir que la distribución de probabilidades de nuestra población es la que corresponde al modelo. En la práctica, se sabe que ciertos procesos y fenómenos generan resultados numéricos cuya distribución de probabilidades se puede ajustar a determinados modelos teóricos. Por ejemplo, el número de partículas alfa emitidas por un material radiactivo sigue una distribución de Poisson. Existen muchas otras distribuciones teóricas, como la Binomial, la Exponencial, la de Weisbull, etc. Cada una de ellas tiene su propio campo de aplicación, que se sostiene en un determinado comportamiento de los fenómenos, y al aplicarla se está haciendo en forma implícita la suposición de que se cumplen las suposiciones del modelo subyacente.   FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES
La Distribución Normal Una distribución muy importante es la Distribución Normal o de Gauss. La ecuación matemática de la función de Gauss es la siguiente: FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES
La distribución normal es una curva con forma de campana, con eje de simetría en el punto correspondiente al promedio del universo m. La distancia entre el eje de simetría de la campana y el punto de inflexión de la curva es igual a s, la desviación standard de la población. El área total debajo de la curva es igual a 1. El área debajo de la curva comprendida entre m - s y m + s es aproximadamente igual a 0,68 del área total; entre m - 2s y m + 2s es aproximadamente igual a 0,95 del área total.   Es importante ver que los únicos parámetros necesarios para dibujar el gráfico de la distribución normal son y (Media y desviación standard de la población). Con estos dos parámetros sabemos donde situar la campana de Gauss (En el punto correspondiente a la media) y cual es su ancho (Determinado por la desviación standard). Cuando nos encontramos con una población de observaciones, si podemos afirmar que la distribución correspondiente es normal, sólo hace falta estimar la media y la desviación standard para tener toda la información necesaria acerca de dicha población. FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES
Esta es la fórmula de la Distribución Normal Standard o Tipificada. Como podemos observar, en ella hay un sólo parámetro, Z, que incluye al promedio y la desviación Standard de la población. Esta función está tabulada. Al calcular Z, lo que estamos haciendo, en realidad, es un cambio de variable por el cual movemos la campana de Gauss centrándola en el 0 del eje X, y modificamos el ancho para que la desviación Standard sea 1. La Distribución Normal Standard Podemos escribir la fórmula de la distribución normal de la siguiente manera: FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES   con
De esta manera tenemos tabulada una función de Gauss que no depende de cual sea el promedio y la desviación standard de nuestra población real. El cambio de variable hace que se conserve la forma de la función y que sirva para cualquier población, siempre y cuando esa población tenga una distribución normal. FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES
donde S es la desviación standard muestral, calculada con n-1 grados de libertad. Cuando queremos calcular las probabilidades para una población real, calculamos Z y entramos en la tabla de la función normal Standard.   La Distribución T de Student En la generalidad de los casos, no disponemos de la desviación standard de la población, sino de una estimación calculada a partir de una muestra extraída de la misma y por lo tanto no podemos calcular Z.  En estos casos calculamos el estadístico T: FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES   con
FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES

Más contenido relacionado

PPT
Ce ps 2-08.01.2011
PPS
Introducción a la Probabilidad
PDF
Teoriade probabilidades Osward Montes Ing Industrial
PDF
Teoria de probabilidades
PDF
Teoria de probabiloidad pdf
PPTX
Variables aleatorias1
DOCX
definicion clasica de probabilidad
PDF
Ce ps 2-08.01.2011
Introducción a la Probabilidad
Teoriade probabilidades Osward Montes Ing Industrial
Teoria de probabilidades
Teoria de probabiloidad pdf
Variables aleatorias1
definicion clasica de probabilidad

La actualidad más candente (20)

PDF
Unidad-3-analisis-de-series-de-tiempo
PDF
SERIES DE TIEMPO
PDF
Ensayo de estadistica
PPTX
Teoria de probabilidadades
PDF
Enfoques de la probabilidad
PPTX
Mic sesión 9
PPTX
Mic sesión 5
PDF
Teoría de la Probabilidad
DOCX
Procesos industriales área manufactura
DOCX
TIPOS DE DISTRIBUCIONES
DOCX
Procesos industriales área manufactura
PPTX
Introducción a la econometría
PDF
15 probabilidad
PDF
Estadística aplicada ing civil
PPTX
Teoria de probabilidadades
PDF
Teoría de la probabilidad estadistica
DOCX
Teoria de la probabilidad
PDF
Inferencia Estadística, conceptos básicos
PPTX
Mic sesión 7
PPTX
Clase 3 gir
Unidad-3-analisis-de-series-de-tiempo
SERIES DE TIEMPO
Ensayo de estadistica
Teoria de probabilidadades
Enfoques de la probabilidad
Mic sesión 9
Mic sesión 5
Teoría de la Probabilidad
Procesos industriales área manufactura
TIPOS DE DISTRIBUCIONES
Procesos industriales área manufactura
Introducción a la econometría
15 probabilidad
Estadística aplicada ing civil
Teoria de probabilidadades
Teoría de la probabilidad estadistica
Teoria de la probabilidad
Inferencia Estadística, conceptos básicos
Mic sesión 7
Clase 3 gir
Publicidad

Similar a Ce ps 2-08.01.2011 (20)

PPT
Ce ps 2-08.01.2011
PPT
Introduccion
PPT
Control estadistico de procesos modulo inicial
PPT
Introducción a la probabilidad
PPT
Ce ps 2-08.01.2011 parte ii
PDF
Introduccion a las probabilidades (Estadística Inferencial)
PPTX
Teoria de la probabilidad
PDF
Probabilidad y estadística
PDF
Probabilidad y estadística
PDF
Probabilidad y estadística
PDF
Probabilidad y Estadística 1
PDF
Teoria de la probabilidad
PPTX
Tema 5,INTRODUCCION A LA PROBABILIDAD
PDF
Trabajo de estadistica 3 corte
PDF
2024 Módulo TeorÃ_a de la Probabilidad.pdf
PDF
Teoria de la probabilidad estadistica. primer 20% 3er corte. (3)
PPT
Introduccion a la_probabilidad (1)
PPTX
probabildad estadistica
PPT
Probabilidad Antecedentes
PPTX
1 teoria de la probabilidad
Ce ps 2-08.01.2011
Introduccion
Control estadistico de procesos modulo inicial
Introducción a la probabilidad
Ce ps 2-08.01.2011 parte ii
Introduccion a las probabilidades (Estadística Inferencial)
Teoria de la probabilidad
Probabilidad y estadística
Probabilidad y estadística
Probabilidad y estadística
Probabilidad y Estadística 1
Teoria de la probabilidad
Tema 5,INTRODUCCION A LA PROBABILIDAD
Trabajo de estadistica 3 corte
2024 Módulo TeorÃ_a de la Probabilidad.pdf
Teoria de la probabilidad estadistica. primer 20% 3er corte. (3)
Introduccion a la_probabilidad (1)
probabildad estadistica
Probabilidad Antecedentes
1 teoria de la probabilidad
Publicidad

Más de Pahola Salas la Torre (20)

XLS
Cuadro de funciones iii
XLS
Cuadro de funciones ii
XLS
2 da practica de la seccion 4 22 01-11
XLS
Practica reforzamiento 4
XLS
Sesión 04 funciones i
PPT
Ce ps 2-08.01.2011-parte xi
PPT
Ce ps 2-08.01.2011-parte x
PPT
Ce ps 2-08.01.2011-parte ix
PPT
Ce ps 2-08.01.2011- parte viii
PPT
Ce ps 2-08.01.2011-parte vii
PPT
Ce ps 2-08.01.2011- parte vi
PPT
Ce ps 2-08.01.2011-parte v
PPT
Ce ps 2-08.01.2011-parte iv
PPT
Ce ps 2-08.01.2011-parte iv
PPT
Ce ps 2-08.01.2011-parte iii
XLS
Clase 15 01-11-(2)
XLS
DOC
Proyecto de turismo rural
DOC
Proyecto de turismo rural
XLS
Practica de excel 08 01-2011
Cuadro de funciones iii
Cuadro de funciones ii
2 da practica de la seccion 4 22 01-11
Practica reforzamiento 4
Sesión 04 funciones i
Ce ps 2-08.01.2011-parte xi
Ce ps 2-08.01.2011-parte x
Ce ps 2-08.01.2011-parte ix
Ce ps 2-08.01.2011- parte viii
Ce ps 2-08.01.2011-parte vii
Ce ps 2-08.01.2011- parte vi
Ce ps 2-08.01.2011-parte v
Ce ps 2-08.01.2011-parte iv
Ce ps 2-08.01.2011-parte iv
Ce ps 2-08.01.2011-parte iii
Clase 15 01-11-(2)
Proyecto de turismo rural
Proyecto de turismo rural
Practica de excel 08 01-2011

Último (20)

PDF
Esc. Sab. Lección 7. El pan y el agua de vida.pdf
PDF
Teologia-Sistematica-Por-Lewis-Sperry-Chafer_060044.pdf
PDF
Como usar el Cerebro en las Aulas SG2 NARCEA Ccesa007.pdf
PDF
Aumente su Autoestima - Lair Ribeiro Ccesa007.pdf
PDF
Cronograma de clases de Práctica Profesional 2 2025 UDE.pdf
PDF
Iniciación Al Aprendizaje Basado En Proyectos ABP Ccesa007.pdf
PDF
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE_COM.pdf
PDF
Telos 127 Generacion Al fa Beta - fundaciontelefonica
PDF
2.0 Introduccion a processing, y como obtenerlo
DOCX
PLAN DE AREA DE CIENCIAS SOCIALES TODOS LOS GRUPOS
DOCX
Programa_Sintetico_Fase_4.docx 3° Y 4°..
PDF
IPERC...................................
DOCX
PLANES DE área ciencias naturales y aplicadas
PDF
Tomo 1 de biologia gratis ultra plusenmas
PPTX
Clase 3 del silabo-gestion y control financiero
PPTX
TEMA 1ORGANIZACIÓN FUNCIONAL DEL CUERPO, MEDIO INTERNO Y HOMEOSTASIS (3) [Aut...
PDF
Los hombres son de Marte - Las mujeres de Venus Ccesa007.pdf
PDF
informe tipos de Informatica perfiles profesionales _pdf
DOCX
PLAN DE CASTELLANO 2021 actualizado a la normativa
PDF
Texto Digital Los Miserables - Victor Hugo Ccesa007.pdf
Esc. Sab. Lección 7. El pan y el agua de vida.pdf
Teologia-Sistematica-Por-Lewis-Sperry-Chafer_060044.pdf
Como usar el Cerebro en las Aulas SG2 NARCEA Ccesa007.pdf
Aumente su Autoestima - Lair Ribeiro Ccesa007.pdf
Cronograma de clases de Práctica Profesional 2 2025 UDE.pdf
Iniciación Al Aprendizaje Basado En Proyectos ABP Ccesa007.pdf
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE_COM.pdf
Telos 127 Generacion Al fa Beta - fundaciontelefonica
2.0 Introduccion a processing, y como obtenerlo
PLAN DE AREA DE CIENCIAS SOCIALES TODOS LOS GRUPOS
Programa_Sintetico_Fase_4.docx 3° Y 4°..
IPERC...................................
PLANES DE área ciencias naturales y aplicadas
Tomo 1 de biologia gratis ultra plusenmas
Clase 3 del silabo-gestion y control financiero
TEMA 1ORGANIZACIÓN FUNCIONAL DEL CUERPO, MEDIO INTERNO Y HOMEOSTASIS (3) [Aut...
Los hombres son de Marte - Las mujeres de Venus Ccesa007.pdf
informe tipos de Informatica perfiles profesionales _pdf
PLAN DE CASTELLANO 2021 actualizado a la normativa
Texto Digital Los Miserables - Victor Hugo Ccesa007.pdf

Ce ps 2-08.01.2011

  • 1. CEP-2 Lic. Manuel Jesús Mendives Laura FACILITADOR IPAE, 08 de Enero del 2011 Bases Estadísticas y Principales Conceptos para el Control Estadístico de Procesos
  • 2. DESARROLLO DEL SYLLABUS INTRODUCCIÓN A LA PROBABILIDAD CONCEPTOS ESTADÍSTICOS FUNDAMENTALES Población estadística La Distribución de Frecuencias MÉTRICA EN EL ESPACIO ESTADÍSTICO Medidas de tendencia central Medidas de Dispersión Media y Varianza de una Muestra Muestreo Aleatorio FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES Generalidades La Distribución Normal La Distribución Normal Standard La Distribución T de Student Distribución de Promedios Muestrales Distribución binomial Distribución de Poisson DÍA 1 : 08 de enero del 2011
  • 3. DESARROLLO DEL SYLLABUS CONTROL DE PROCESO Control de proceso Control Estadístico de Proceso (C.E.P.) Gráficos C.E.P. Generalidades Variables y atributos Eficacia estadística de los gráficos de control Subgrupos racionales Ventajas de los gráficos de control GRÁFICOS DE CONTROL POR VARIABLES Introducción. Gráficos de control (, R) Gráfico basado en estudio inicial Gráficos basados en valores Standard Gráficos de control para valores individuales Gráficos de control de media móvil (desgaste de herramientas) Recogida de datos e interpretación Establecimiento de límites del Proceso DÍA 2 : 15 de enero del 2011
  • 4. DESARROLLO DEL SYLLABUS (Continuación) Líneas generales para el diseño del gráfico ( , R) Interpretación de los gráficos ( , R) Eficacia de los gráficos ( , R) Gráficos de control ( , S) Gráficos de control de sumas acumuladas (CUSUM) Otros gráficos de control Gráfico de control de media móvil Gráficos de Control Multidimensional CAPACIDAD DEL PROCESO Introducción Análisis de la capacidad del proceso Análisis de la capacidad del proceso usando histogramas Análisis de la capacidad del proceso usando gráficos de control DÍA 3 : 22 de enero del 2011
  • 5. DESARROLLO DEL SYLLABUS GRAFICOS DE CONTROL POR ATRIBUTOS Introducción Gráfico “p” para porcentajes defectuosos Operativa del gráfico de control “p” Diseño del gráfico “p” Gráfico “np” para unidades defectuosas Gráficos “C” para tamaño de muestra constante Análisis de defectos Gráfico “U” LINEAS GENERALES PARA IMPLANTAR GRAFICOS DE CONTROL DÍA 4 : 29 de enero del 2011
  • 6. Cada vez que realizamos un cálculo matemático para resolver un problema físico, estamos aplicando un modelo matemático a un fenómeno de la realidad. Este fenómeno puede ser, por ejemplo, la caída de un objeto desde cierta altura, y en este caso utilizamos un modelo que es la Ley de Gravedad. ¿Qué es un modelo? Al enfrentar un problema de física, química, ingeniería, etc., estamos analizando e investigando una parte o aspecto de la realidad material que nos rodea. Para resolver el problema, necesitamos modelar esa realidad, es decir, construir una representación en la mente de cómo ocurren los hechos, junto con ecuaciones matemáticas que permitan calcular los efectos de los mismos. En ningún caso se debe confundir modelo con realidad. Un modelo es sólo una representación de la realidad, utilizado para estudiar y analizar dicha realidad. Hay modelos matemáticos que nos permiten obtener un resultado numérico preciso, por ejemplo, que la velocidad de un automóvil es de 175,5 Km/Hora. O que la corriente eléctrica que circula por un cable es de 5,7 Amperios. Este tipo de modelos matemáticos se denominan Determinísticos . INTRODUCCIÓN A LA PROBABILIDAD
  • 7. Existen también fenómenos que necesitan otro tipo de modelos matemáticos, denominados no determinísticos, probabilísticos o estocásticos. Ejemplo : supongamos que se ha previsto la realización de unas pruebas balísticas para las que se necesita saber la cantidad de lluvia que va a caer en un próximo periodo de tiempo, antes de decidir la forma de llevar a cabo los ensayos. El Técnico responsable podrá informarse en el servicio meteorológico en relación con la presión barométrica, la temperatura, velocidad del viento y otros datos meteorológicos, sin embargo, no hay una ecuación que con todos esos datos le permita calcular de forma precisa los milímetros de lluvia que van a caer durante el periodo de tiempo que le interesa. De la misma forma, ningún operador puede calcular cuanto va a subir la Bolsa, ni si va a subir o bajar, aún cuando conozca todas las variables económicas disponibles. Este tipo de fenómenos no admiten un modelo determinístico, sino un modelo probabilístico, que como resultado nos dice la probabilidad de que llueva una cierta cantidad, o la probabilidad de que la Bolsa suba un cierto porcentaje. El resultado no es un valor determinado, sino la probabilidad de un valor. Veamos algunos ejemplos de fenómenos para los cuales es apropiado utilizar un modelo probabilístico: INTRODUCCIÓN A LA PROBABILIDAD
  • 8. Experimento 1: Se lanza un dado y se anota el número que aparece en la cara superior: Espacio Muestral = S 1 = 1, 2, 3, 4, 5, 6 Experimento 2: Se arroja una moneda cuatro veces y se anota la sucesión de caras y cruces obtenidas. Espacio Muestral: S 2 = (Cara v Cruz), (Cara v Cruz), (Cara v Cruz), (Cara v Cruz) ESPACIO MUESTRAL .- Conjunto de todos los resultados posibles (S) que pueden producirse al realizar un experimento . INTRODUCCIÓN A LA PROBABILIDAD
  • 9. SUCESO .- Un Suceso, respecto a un espacio muestral S asociado con determinado experimento, es un subconjunto de resultados del Espacio Muestral. El conjunto vacío, el formado por un solo elemento y el formado por todos los elementos del Espacio Muestral son también sucesos. Entonces, dado un experimento aleatorio cualquiera, hay un espacio muestral asociado cuyos elementos son todos los resultados que se pueden obtener de la experiencia. Un subgrupo o subconjunto de resultados es un suceso. Ahora, ¿cómo podemos saber si la posibilidad de que ocurra un suceso es grande o pequeña? Por ejemplo, si arrojamos un dado, ¿cómo podemos calcular la probabilidad de que salga un 2? INTRODUCCIÓN A LA PROBABILIDAD
  • 10. Para esto necesitamos un número asociado con cada suceso, al cual se lo denomina probabilidad del suceso. Entonces, la probabilidad P de un suceso es un número entre 0 y 1, que nos dice en que medida es posible que ocurra el suceso. Si la probabilidad es 1 significa que el suceso ocurrirá con toda certeza. Si la probabilidad es 0,5 significa que un suceso puede ocurrir o puede no ocurrir con la misma probabilidad. Probabilidad 0 quiere decir que el suceso es imposible que ocurra. ¿Cómo podemos calcular la Probabilidad de un suceso? La respuesta a esta pregunta no siempre es sencilla y depende del experimento y de su espacio muestral asociado. Hay casos simples en los que el cálculo es relativamente sencillo: Primero, supondremos que se trata de un experimento cuyo espacio muestral es finito y tiene un número pequeño de resultados posibles. Segundo, supondremos que todos los resultados que integran el espacio muestral (sucesos elementales) tienen la misma probabilidad de ocurrir. INTRODUCCIÓN A LA PROBABILIDAD
  • 11. Con estas dos hipótesis, la fórmula para calcular la probabilidad es muy sencilla. Supongamos que se trata de un experimento cualquiera cuyo Espacio Muestral S tiene N elementos (N resultados posibles). Deseamos calcular la probabilidad de un suceso H (Un subconjunto H del espacio muestral S) que tiene m-elementos. De acuerdo a lo explicado, el número N tiene que ser pequeño y la probabilidad de cada suceso elemental tiene que ser la misma. Entonces la probabilidad P de que ocurra el suceso H es: P = m/N INTRODUCCIÓN A LA PROBABILIDAD
  • 12. Ejemplos: Supongamos que se arroja un dado sobre una mesa y apostamos a que salga un número igual o menor que 4. Sabemos que son igualmente posibles los números: {1, 2, 3, 4, 5 y 6} (Espacio muestral con 6 elementos). Pero los números favorables a nuestra apuesta son: {1, 2, 3 y 4} (Suceso con 4 elementos). Entonces, la probabilidad de que ganemos es P = 4/6 = 0,666… Es decir que tenemos a nuestro favor una probabilidad de 0,666… (o sea aproximadamente del 67 %) de que el evento ocurra. Si apostamos a un sólo número (sacar un As), la probabilidad de ganar sería P = 1/6 = 0,1666… Repitiendo, la probabilidad es un número entre 0 y 1, que nos dice en que medida es posible que ocurra un suceso. INTRODUCCIÓN A LA PROBABILIDAD
  • 13. EJERCICIOS ¿Cuál es la probabilidad de que al producir 18 bancos de madera de los cuales 3 son de color rojo, 15 son blancos, al menos 2 salgan defectuosos? Recibo 679 Televisores LG de un embarque reciente ¿Cuál es la probabilidad de que al menos cuatro resulten defectuosos? INTRODUCCIÓN A LA PROBABILIDAD
  • 14. CONCEPTOS ESTADÍSTICOS FUNDAMENTALES Hasta ahora hemos visto el caso de fenómenos o experimentos cuyo espacio muestral asociado tiene un número pequeño de elementos. Ello nos ha servido para introducir la noción de probabilidad, Pero en muchos casos es necesario trabajar con experiencias o procesos que generan un número muy grande de datos o resultados numéricos, es decir, espacios muestrales con un número infinito o muy grande de elementos. Cuando tenemos un conjunto muy grande de datos numéricos para analizar decimos que tenemos un Universo o Población de observaciones.
  • 15. Cada dato numérico es un elemento de la población o universo. Una Muestra es un subconjunto pequeño de observaciones extraídas de un universo o población. La Estadística trabaja con poblaciones de datos y con muestras extraídas de las mismas. Los conceptos de población y muestra a veces resultan ambiguos en su aplicación práctica. CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
  • 16. CONCEPTOS ESTADÍSTICOS FUNDAMENTALES EJEMPLO .- Supongamos que en una empresa se fabrica un lote de 10 toneladas de un producto químico, y un técnico debe controlar la calidad del mismo. El técnico toma una pequeña porción, por ejemplo, 100 gramos y dirá que tomó una muestra del producto para analizar en el laboratorio. Hasta el momento, la muestra no fue analizada y por lo tanto no tenemos ningún dato numérico.
  • 17. Cuando el laboratorio efectúa algún ensayo en la muestra y obtiene un resultado numérico, dicho dato podría ser analizado desde el punto de vista estadístico. Vamos a suponer hipotéticamente que el técnico continúa sacando otras muestras del producto, hasta agotar el lote y cada una es ensayada en el laboratorio, que nos da los resultados. Como teníamos 10 toneladas de producto y las muestras son aproximadamente de 100 gramos, el técnico seguramente extraerá alrededor de 100000 muestras y el laboratorio nos entregará alrededor de 100000 resultados. Este conjunto de datos numéricos es nuestro universo o población de datos. CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
  • 18. Como teníamos 10 toneladas de producto y las muestras son aproximadamente de 100 gramos, el técnico seguramente extraerá alrededor de 100000 muestras y el laboratorio nos entregará alrededor de 100000 resultados. Este conjunto de datos numéricos es nuestro universo o población de datos. Si tomamos al azar 10 de esos resultados, podemos decir que tenemos una muestra de 10 elementos de ese universo o población. No debemos confundir esta muestra (Desde el punto de vista estadístico) con la muestra de material que extrajo el técnico para ser analizada en el laboratorio. Supongamos que el técnico toma solamente 5 muestras y las envía para analizar al laboratorio. El laboratorio nos enviará sólo 5 resultados, y nosotros diremos que tenemos una muestra de datos extraída del universo o población de datos total. Y estamos pensando en el universo o población que tendríamos si se hubieran extraído y analizado las 100000 muestras de material . CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
  • 19. OTRO EJEMPLO : Muchas veces resulta difícil imaginarse cual es el universo del cual extrajimos los datos: Supongamos que tenemos una máquina que produce piezas de plástico en serie y un técnico toma 5 piezas sucesivas y les mide la altura con un calibre. Tenemos, entonces, 5 resultados, es decir una muestra de 5 elementos. ¿Cuál es el universo al cual pertenece esa muestra de datos? Debemos imaginar lo siguiente: Si la máquina continuara trabajando en las mismas condiciones (Es decir, a la misma velocidad, con las mismas materias primas, a la misma temperatura, manejada por el mismo operario, etc.)... y a cada pieza que produce se le mide la altura tendríamos un conjunto muy grande de resultados numéricos. Ese conjunto muy grande de resultados numéricos que no existe, pero que podría obtenerse en esas condiciones es el universo o población del cual extrajimos la muestra de 5 observaciones . CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
  • 20. PERO: ¿Qué representa una Población de datos? El análisis estadístico de una población o universo de datos tiene como objetivo final descubrir las características y propiedades de aquello que generó los datos. Por ejemplo, se tiene una población de escolares (Población física, población humana) y se les mide la altura. El conjunto de datos de altura constituye una población o universo estadístico. El análisis de estos datos de altura (Universo estadístico) sirve para caracterizar y estudiar a la población de estudiantes (Que no es una Población estadística). ALUMNOS DAR EJEMPLOS!!! CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
  • 21. EJEMPLO : Un ingeniero controla un proceso industrial, que genera a diario muchos lotes de un producto (Población de lotes). Para cada lote se mide una característica de calidad, obteniéndose una gran cantidad de resultados numéricos (Población de datos). El ingeniero realiza esta tarea porque a través de los datos numéricos obtenidos se puede evaluar el comportamiento del proceso, que es lo que realmente le interesa. CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
  • 22. IMPORTANTE : Detrás de un universo o población de datos se encuentra una población física, formada por elementos de la realidad que nos rodea, de la cual, a través de algún tipo de medición, se obtuvieron los datos numéricos. Es esa población física subyacente (Elementos de la realidad, seres humanos, lotes de material, etc.) la que deseamos estudiar y caracterizar por medio del análisis estadístico de los datos obtenidos. La población estadística está representando, entonces, una población física o natural formada por elementos de la realidad, con respecto a una característica o propiedad de esa población física. Al utilizar métodos estadísticos, no confundir la población física, formada por elementos de la realidad que estamos estudiando, con la población o universo de datos generados a partir de la primera. Cuando se utilice los términos “población” o “universo” sin otro adjetivo nos estamos refiriendo a población o universo de datos numéricos (También llamados observaciones, mediciones o valores). CONCEPTOS ESTADÍSTICOS FUNDAMENTALES
  • 23. Una Población o Universo de datos es un conjunto muy grande de números. Estos números pueden estar en un gran listado o puede ser un conjunto hipotético, es decir, podemos imaginar los números pero no los tenemos realmente. Una gran tabla de números ordenados al azar prácticamente no nos muestra información acerca de la población de datos. Suponiendo que disponemos de los datos del universo, ¿cómo podemos clasificar y ordenar los números para obtener más información acerca de ese universo de datos? Una forma sería escribir los números desde el menor hasta el mayor y colocar encima de cada uno tantas cruces o cuadraditos como veces que figure repetido en la población. El número de veces que aparece repetido cada dato es la frecuencia de dicho valor. La representación gráfica que hemos visto se denomina Distribución de Frecuencias de la población . La Distribución de Frecuencias
  • 24. La representación gráfica permite ver información que antes no aparecía tan evidente. Por ejemplo, sin hacer ningún cálculo nos damos cuenta donde está aproximadamente el promedio de la población. También nos muestra cuales son los valores máximo y mínimo de la población, es decir, el rango o recorrido . La Distribución de Frecuencias
  • 25. En el caso anterior, los datos de la población son números enteros. Cuando los números no son enteros o cuando tenemos un número muy grande de datos, se divide el rango total en subintervalos y se cuenta el número de valores que cae dentro de cada subintervalo. Vamos a suponer, ahora, que tenemos una cierta población de N = 500 datos, por ejemplo el peso de varones adultos de 40 años. Una manera de caracterizar esta población es construir una distribución de frecuencias o gráfico de frecuencias. Para ello seguimos los pasos siguientes: 1) Tomamos nota del valor máximo y el valor mínimo de la serie de datos que estamos considerando. 2) Subdividimos el intervalo entre el máximo y el mínimo en algún número de intervalos (15 ó 20) más pequeños iguales entre sí. 3) Contamos el número de datos que encontramos dentro de cada intervalo (Frecuencia). Por ejemplo, supongamos que en el intervalo i hay ni observaciones (S*ni = N). 4) Para construir el gráfico, colocamos en el eje de abscisas (Horizontal) los intervalos y levantamos en cada intervalo un rectángulo de altura proporcional al número ni de datos dentro del mismo. Si hacemos el área del rectángulo levantado sobre el intervalo i-ésimo igual a la frecuencia relativa ni/N, el área total bajo el histograma será igual a la unidad: La Distribución de Frecuencias
  • 26. Obtenemos así un histograma que nos muestra la distribución de frecuencias de la población: Esta distribución de frecuencias nos muestra si hay resultados que son mas frecuentes que otros; si los valores están ubicados alrededor de un valor central, si están muy dispersos o poco dispersos. Podemos observar que fracción de todas las mediciones cae por ejemplo, entre 70 y 80 Kg. La Distribución de Frecuencias
  • 27. Si elegimos una persona del grupo y la pesamos, el resultado es un dato que pertenece a la población de datos representada en el gráfico. Decimos, entonces, que estamos extrayendo un dato de la población de datos. Pero hay distintas maneras de elegir la persona, es decir, distintas maneras de realizar la extracción del dato. Si nos paramos frente al grupo y elegimos una persona, estaremos seleccionando al más gordo, al más flaco o al más alto (y por lo tanto pesa más que otros), de acuerdo a criterios subjetivos que no podemos evitar. En cambio, si escribimos los nombres de todas las personas en una etiqueta, metemos todas las etiquetas en una caja y luego le pedimos a alguien que retire una etiqueta, la selección no estará influida por nuestra subjetividad. En este caso, decimos que la extracción es aleatoria. Una extracción aleatoria es aquella en que cada miembro de la población tiene la misma posibilidad de ser elegido. La Distribución de Frecuencias
  • 28. Medidas de Tendencia Central Una característica importante de cualquier población es su posición, es decir, donde está situada con respecto al eje de abscisas (Eje horizontal). En nuestro caso, es importante saber si los datos se agrupan alrededor de 60 Kg. o de 90 Kg. o alrededor de 12 Kg. Una manera de obtener un dato numérico que nos dé idea de la posición de nuestra población es calcular el Promedio o Media de todas las observaciones: METRICA EN EL ESPACIO ESTADÍSTICO
  • 29. Este importante parámetro nos permite efectuar comparaciones entre distintas poblaciones. Por ejemplo, si tuviéramos una población formada por mediciones del peso de mujeres de 30 años, otra de peso de varones de 40 años y una tercera de peso de niños de 8 años, es indudable que los promedios van a ser diferentes. El promedio, entonces, nos está diciendo que las tres poblaciones son diferentes y también en que medida difieren. Ahora, si tuviéramos una población de varones con peso promedio 70 Kg. y otra población de varones con el mismo promedio, ¿se puede afirmar que ambas poblaciones son equivalentes? Para responder esta pregunta necesitamos tener medidas de la dispersión de la población de datos METRICA EN EL ESPACIO ESTADÍSTICO
  • 30. Medidas de Dispersión La otra característica muy importante de una población es el grado de dispersión de las observaciones. No es lo mismo si en nuestra población encontramos que todos los valores están entre 75 y 90 Kg. que si están entre 60 y 105 Kg., aunque el promedio sea el mismo. Es necesario agregar alguna idea de la dispersión de los valores. Una manera es a través del Rango de las observaciones, es decir, el valor Máximo y el valor Mínimo de los datos de la población. Entonces, una descripción mas realista acerca de los seres humanos sería decir que pesan en promedio 70 Kg. y que el rango es de 40 a 120 Kg. (Estos valores son supuestos). Una manera más precisa de dar idea de la dispersión de valores de una población es a través de la Varianza o su raíz cuadrada, que es la Desviación Standard. METRICA EN EL ESPACIO ESTADÍSTICO
  • 31. Vamos a calcular la varianza y la desviación Standard de un número pequeño de datos (Una muestra) para ilustrar el cálculo. Supongamos que se midió la altura de 10 personas adultas y de sexo femenino, y se obtuvieron los valores siguientes (en cm.): 165 ; 163 ; 171 ; 156 ; 162 ; 159 ; 162 ; 168 : 159 ; 167 METRICA EN EL ESPACIO ESTADÍSTICO
  • 32. METRICA EN EL ESPACIO ESTADÍSTICO El promedio de estas observaciones es: = 163, 2 cm. Si a cada una de las observaciones le restamos el promedio, obtenemos los Residuos: Los residuos también nos dan una idea de la dispersión de las observaciones individuales alrededor del promedio. Si el valor absoluto (El valor numérico sin el signo) de los residuos es grande, es porque los valores están muy dispersos. Si el valor absoluto de los residuos es pequeño, significa que las observaciones individuales están muy cerca del promedio, y por lo tanto, hay poca dispersión.
  • 33. LA VARIANZA : Es un número que nos permite comparar poblaciones. Cuando la dispersión de las observaciones es grande (Datos que se alejan mucho por encima y por debajo del promedio), el valor de los residuos (distancia entre cada dato y el promedio) será grande. Entonces aumenta la suma de cuadrados de los residuos y por lo tanto la varianza. También se utiliza la raíz cuadrada de la varianza: Por lo tanto: La desviación Standard o desviación típica tiene las mismas unidades que la variable con la que estamos trabajando, en nuestro caso el centímetro. Tanto la varianza como la desviación Standard nos permiten comparar el grado de dispersión de distintas poblaciones . METRICA EN EL ESPACIO ESTADÍSTICO
  • 34. Media y Varianza de una Muestra Cuando tenemos una muestra (Subconjunto de algunos datos extraídos de una población), también podemos calcular su media, su varianza y su desviación Standard. Es muy importante distinguir entre la media, varianza y desviación Standard poblacional, de la media, varianza y desviación Standard muestral. La media, varianza y desviación Standard de una población o universo se denominan parámetros de la población y en general se designan con letras griegas: m para la Media, s 2 para la Varianza y s para la Desviación Standard poblacionales. En el caso de una muestra, la media, varianza y desviación standard se denominan estadísticos y se utilizan letras de nuestro alfabeto: para la Media s 2      para la Varianza s      para la Desviación Standard muestral METRICA EN EL ESPACIO ESTADÍSTICO
  • 35. El cálculo de la varianza y la desviación standard de una muestra de n observaciones se realiza con una fórmula levemente diferente que la ya vista para la varianza y desviación standard de una población: METRICA EN EL ESPACIO ESTADÍSTICO
  • 36. MUESTREO ALEATORIO En general, no es posible disponer de todas las observaciones de un universo o población, ya sea porque es un universo hipotético o porque la disposición de todos los datos resulta una tarea excesiva para nuestras posibilidades. Normalmente se dispone de una muestra de datos extraídos de un universo, y lo que se pretende es estimar (conocer de manera aproximada) los parámetros del universo por medio de cálculos realizados sobre la muestra. En este sentido decimos que la media muestral es una estimación de la media del universo, y que la varianza y desviación standard muestrales son estimaciones de la varianza y desviación standard poblacionales respectivamente. METRICA EN EL ESPACIO ESTADÍSTICO
  • 37. EJEMPLO: Supongamos que un partido político necesita averiguar la cantidad de personas que están dispuestas a votar por su candidato y encarga para ello a una empresa la realización de una encuesta un día previo a las elecciones. El encargado de la encuesta podría pensar en consultar la intención de voto de toda la población de votantes (más de 26 millones). Esto, obviamente, es una tarea excesiva que por distintas razones no se puede realizar. Entonces, el camino que resta es tomar una muestra representativa de esa población de personas y consultar la intención de voto en esa muestra. Los resultados que se obtengan son solamente una estimación del resultado que se hubiera obtenido si la consulta se hubiera efectuado sobre toda la población de votantes. Pero: ¿cómo se obtiene una muestra representativa? METRICA EN EL ESPACIO ESTADÍSTICO
  • 38. Trabajemos con una población de muy pocos datos. Supongamos que nuestra población son 10 bolas con los siguientes números 2, 5 y 9 y una frecuencia según la tabla adjunta: El promedio de la población es 4. Supongamos que queremos obtener una muestra de 5 elementos de esa población. Hay varias formas de hacerlo. Supongamos que puedo ver los números y elijo 2, 2, 2, 2 y 5. El promedio de estos 5 números extraídos de la población es 2,6 que difiere sustancialmente del promedio de la población. METRICA EN EL ESPACIO ESTADÍSTICO
  • 39. Es evidente que dicha muestra no es representativa de la población de la que fue extraída. No se mantiene la misma proporción de cada número que existe en la población. Una muestra de 5 elementos en la que hay la misma proporción de cada dígito debería tener 3 dos, 1 cinco y 1 nueve, y su promedio es 4, el mismo de la población: En una población de muchos datos, no es posible obtener una muestra eligiendo cada elemento para que figure en la misma proporción que en la población, porque para ello deberíamos disponer de todos los datos de la misma, y en ese caso no sería necesario sacar una muestra. Si a cada elemento de la población se le da la misma oportunidad de ser elegido, entonces se supone que cada número estará en la muestra en un número proporcional a la cantidad de veces que está en la población. Por ejemplo, el 2 va a estar en la muestra mas veces que el 5, porque en la población hay 6 dos y sólo 2 cincos. METRICA EN EL ESPACIO ESTADÍSTICO
  • 40. Si introducimos las diez bolas en una bolsa y las mezclamos suficientemente, la probabilidad que tiene una bola individual de ser extraída es la misma para cualquiera de las bolas. En esas condiciones, si extraemos cinco bolas sucesivas, mezclándolas previamente en cada oportunidad, es razonable pensar que vamos a sacar el 2 en más oportunidades que el 5 ó el 9.Esta forma de obtener la muestra es lo que se conoce como Muestreo Aleatorio. METRICA EN EL ESPACIO ESTADÍSTICO
  • 41. El muestreo aleatorio no garantiza que la muestra va a ser representativa de la población, pero al eliminar toda influencia externa en el acto de extraer un elemento de la población, la proporción de cada uno estará influida sólo por la cantidad de veces que está presente en la población de la cual se extrae la muestra Entonces, realizando el muestreo en forma aleatoria (al azar), la probabilidad de obtener una muestra representativa de la población es mayor que si en la elección de los elementos de la muestra interviene la voluntad del que efectúa la operación o algún otro factor de influencia . METRICA EN EL ESPACIO ESTADÍSTICO
  • 42. A medida que aumentamos la cantidad de observaciones que tomamos de la población, podemos construir nuestro gráfico con un número mayor de intervalos, aunque de menor amplitud (El rango total cubierto por la población es el mismo). Si continuamos este proceso, con intervalos cada vez más estrechos y numerosos, los altibajos en el gráfico de la distribución de frecuencias tienden a desaparecer. En el límite, el ancho del intervalo tiende a cero y la población puede representarse por una distribución de probabilidad continua. Cuando, para representar esta distribución de probabilidad continua se utiliza una función matemática, esta se denomina Función de Densidad de Probabilidad. FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES
  • 43. La forma de la curva en el gráfico de la función de distribución es característica de la población de observaciones asociada con la misma, y depende de variables internas del proceso que generó los datos de la población. Existen distintas funciones de distribución teóricas, cada una de las cuales está basada en un modelo de comportamiento del proceso que generó el universo de observaciones. FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES
  • 44. La aplicación de una de estas distribuciones teóricas a una población particular está justificada si las hipótesis (suposiciones) del modelo de comportamiento del proceso que generó la población se cumplen. Dicho de otro modo, si conocemos el proceso, es decir, el conjunto de fenómenos que dieron lugar a nuestra población de mediciones u observaciones, y además estamos seguros de que el mismo se ajusta a un modelo de comportamiento determinado, entonces podemos decir que la distribución de probabilidades de nuestra población es la que corresponde al modelo. En la práctica, se sabe que ciertos procesos y fenómenos generan resultados numéricos cuya distribución de probabilidades se puede ajustar a determinados modelos teóricos. Por ejemplo, el número de partículas alfa emitidas por un material radiactivo sigue una distribución de Poisson. Existen muchas otras distribuciones teóricas, como la Binomial, la Exponencial, la de Weisbull, etc. Cada una de ellas tiene su propio campo de aplicación, que se sostiene en un determinado comportamiento de los fenómenos, y al aplicarla se está haciendo en forma implícita la suposición de que se cumplen las suposiciones del modelo subyacente. FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES
  • 45. La Distribución Normal Una distribución muy importante es la Distribución Normal o de Gauss. La ecuación matemática de la función de Gauss es la siguiente: FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES
  • 46. La distribución normal es una curva con forma de campana, con eje de simetría en el punto correspondiente al promedio del universo m. La distancia entre el eje de simetría de la campana y el punto de inflexión de la curva es igual a s, la desviación standard de la población. El área total debajo de la curva es igual a 1. El área debajo de la curva comprendida entre m - s y m + s es aproximadamente igual a 0,68 del área total; entre m - 2s y m + 2s es aproximadamente igual a 0,95 del área total.   Es importante ver que los únicos parámetros necesarios para dibujar el gráfico de la distribución normal son y (Media y desviación standard de la población). Con estos dos parámetros sabemos donde situar la campana de Gauss (En el punto correspondiente a la media) y cual es su ancho (Determinado por la desviación standard). Cuando nos encontramos con una población de observaciones, si podemos afirmar que la distribución correspondiente es normal, sólo hace falta estimar la media y la desviación standard para tener toda la información necesaria acerca de dicha población. FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES
  • 47. Esta es la fórmula de la Distribución Normal Standard o Tipificada. Como podemos observar, en ella hay un sólo parámetro, Z, que incluye al promedio y la desviación Standard de la población. Esta función está tabulada. Al calcular Z, lo que estamos haciendo, en realidad, es un cambio de variable por el cual movemos la campana de Gauss centrándola en el 0 del eje X, y modificamos el ancho para que la desviación Standard sea 1. La Distribución Normal Standard Podemos escribir la fórmula de la distribución normal de la siguiente manera: FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES con
  • 48. De esta manera tenemos tabulada una función de Gauss que no depende de cual sea el promedio y la desviación standard de nuestra población real. El cambio de variable hace que se conserve la forma de la función y que sirva para cualquier población, siempre y cuando esa población tenga una distribución normal. FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES
  • 49. donde S es la desviación standard muestral, calculada con n-1 grados de libertad. Cuando queremos calcular las probabilidades para una población real, calculamos Z y entramos en la tabla de la función normal Standard.   La Distribución T de Student En la generalidad de los casos, no disponemos de la desviación standard de la población, sino de una estimación calculada a partir de una muestra extraída de la misma y por lo tanto no podemos calcular Z. En estos casos calculamos el estadístico T: FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES con
  • 50. FUNCIONES DE DISTRIBUCIÓN DE PROBABILIDADES