SlideShare una empresa de Scribd logo
CONCEPTOS BASICOS ESTADISTICA DESCRIPTIVA PROBABILIDAD MUESTREO INTERNA PATRICIA VARGAS CHANG
LA ESTADISTICA La  estadística  es una ciencia con base matemática referente a la recolección, análisis e interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo aleatorio
ESTADISTICA DESCRIPTIVA La  estadística descriptiva  es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.
VARIABLES Tipos Variables cualitativas o atributos : no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas : tienen valor numérico (edad, precio de un producto, ingresos anuales).
VARIABLES Variables unidimensionales Sólo recogen información sobre una característica (por ejemplo: edad de los alunmos de una clase). Variables bidimensionales Recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales Recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).
VARIABLES CUANTITATIVAS Discretas Sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45). Continuas Pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.
Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos: Individuo Cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo. Población   Conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeo que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad. Muestra Subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.
DISTRIBUCION DE FRECUENCIAS La  distribución de frecuencia   Es la representación estructurada, en forma de tabla, de toda la información que se ha recogido sobre la variable que se estudia.
EJEMPLO Medimos la altura de los niños de una clase y obtenemos los siguientes resultados (cm):
Con la información brindada podemos armar la siguiente tabla de frecuencias
MEDIDAS DE POSICION  Nos facilitan información sobre la serie de datos que estamos analizando  Clases a) Medidas de posición central : informan sobre los valores medios de la serie de datos. b) Medidas de posición no centrales : informan de como se distribuye el resto de los valores de la serie.
MEDIA Es el valor medio ponderado de la serie de datos.  Lo más positivo de la media es que en su cálculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna información.  Su valor (tanto en el caso de la media aritmética como geométrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie, perdiendo ésta representatividad. Se pueden calcular diversos tipos de media
MEDIA Media aritmética Se calcula multiplicando cada valor por el número de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra
MEDIA Media geométrica:   Se eleva cada valor al número de veces que se ha repetido. Se multiplican todo estos resultados y al producto final se le calcula la raíz "n" (siendo "n" el total de datos de la muestra). La media geométrica se suele utilizar en series de datos como tipos de interés anuales, inflación, etc., donde el valor de cada año tiene un efecto multiplicativo sobre el de los años anteriores
MEDIANA Es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores). No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).
COMO CALCULAR LA MEDIANA Datos sin agrupar   Considerando X1, X2,X3….Xn  los datos de una muestra  ordenada en orden creciente  y designando la mediana como  Me , distinguimos dos casos: Si  n es impar La mediana es el valor que ocupa la posición  (n+1)/2   una vez que los datos han sido ordenados (en orden creciente o decreciente), porque éste es el valor central. Por ejemplo:  x 1 = 3,  x 2 = 6,  x 3 = 7,  x 4 = 8,  x 5 = 9                    
Si  n es par   La mediana es la media aritmética de las dos observaciones centrales  n/2  y  (n/2)+1.   Por ejemplo x1 = 3,  x 2 = 6,  x 3 = 7,  x 4 = 8,  x 5 = 9,  x 6 = 10                        .                                       .
MODA Es el valor que más se repite en la muestra
EJEMPLOS
La media Aritmética La Media Geométrica
La Mediana  Es 1,26 cm, ya que por debajo está el 50% de los valores y por arriba el otro 50%. Esto se puede ver al analizar la columna de frecuencias relativas acumuladas. La Moda Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo tanto esta seria cuenta con 3 modas
Medidas de posición no centrales Permiten conocer otros puntos característicos de la distribución que no son los valores centrales.  Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales: Cuartiles : son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. Deciles : son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Percentiles : son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.
Vamos a calcular los cuartiles de la serie de datos referidos a la estatura de un grupo de alumnos  Los deciles y centiles se calculan de igual manera, aunque haría falta distribuciones con mayor número de datos .
1º cuartil:  es el valor 1,22 cm, ya que por debajo suya se situa el 25% de la frecuencia (tal como se puede ver en la columna de la frecuencia relativa acumulada). 2º cuartil:  es el valor 1,26 cm, ya que entre este valor y el 1º cuartil se situa otro 25% de la frecuencia. 3º cuartil:  es el valor 1,28 cm, ya que entre este valor y el 2º cuartil se sitúa otro 25% de la frecuencia. Además, por encima suya queda el restante 25% de la frecuencia. Atención : cuando un cuartil recae en un valor que se ha repetido más de una vez (como ocurre en el ejemplo en los tres cuartiles) la medida de posición no central sería realmente una de las repeticiones.
Medidas de Dispersión Estudia la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos. Existen diversas  medidas de dispersión Rango Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo. Varianza Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las difrencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.
La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están. Desviación típica Se calcula como raíz cuadrada de la varianza. Coeficiente de varización de Pearson Se calcula como cociente entre la desviación típica y la media.
EJEMPLOS
Rango Diferencia entre el mayor valor de la muestra (1,30) y el menor valor (1,20). El rango de esta muestra es 10 cm. Varianza: Recordemos que la media de esta muestra es 1,253. Luego, aplicamos la fórmula:
Desviación típica Es la raíz cuadrada de la varianza.  Coeficiente de variación de Pearson Se calcula como cociente entre la desviación típica y la media de la muestra.
El coeficiente de variación es un porcentaje que permite comparar el nivel de dispersión de dos muestras. Esto no ocurre con la desviación típica, ya que viene expresada en las mismas unidas que los datos de la serie. Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las desviaciones típicas (una viene  expresada en cm y la otra en kg). En cambio, sus coeficientes de variación son ambos porcentajes, por lo que sí se pueden comparar.
PROBABILIDAD
PROBABILIDAD La  probabilidad  mide la frecuencia con la que aparece un resultado determinado cuando se realiza un experimento. Ejemplo : tiramos un dado al aire y queremos saber cual es la probabilidad de que salga un 2, o que salga un número par, o que salga un número menor que 4. El experimento tiene que ser aleatorio , es decir, que pueden presentarse diversos resultados, dentro de un conjunto posible de soluciones, y esto aún realizando el experimento en las mismas condiciones.
Probabilidad: Conceptos Suceso elemental H ace referencia a cada una de las posibles soluciones que se pueden presentar. Ejemplo : al lanzar una moneda al aire, los sucesos elementales son la cara y la cruz. Al lanzar un dado, los sucesos elementales son el 1, el 2, .., hasta el 6. Suceso compuesto Subconjunto de sucesos elementales. Ejemplo : lanzamos un dado y queremos que salga un número par. El suceso "numero par" es un suceso compuesto, integrado por 3 sucesos elementales: el 2, el 4 y el 6
Espacio muestral Al conjunto de todos los posibles sucesos elementales. Cada experimento aleatorio tiene definido su espacio muestral (es decir, un conjunto con todas las soluciones posibles). Ejemplo :  si tiramos una moneda al aíre una sola vez, el espacio muestral será cara o cruz.
Probabilidad: Relación entre sucesos  Un suceso puede estar contenido en otro Ejemplo : lanzamos un dado y analizamos dos sucesos: a) que salga el número 6, y b) que salga un número par. Vemos que el suceso a) está contenido en el suceso b). Siempre que se da el suceso a) se da el suceso b), pero no al contrario. Por ejemplo, si el resultado fuera el 2, se cumpliría el suceso b), pero no el el a). Dos sucesos pueden ser iguales Ejemplo : lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par, y b) que salga múltiplo de 2. Vemos que las soluciones coinciden en ambos casos.
Unión de dos o más sucesos Ejemplo:  lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par y b) que el resultado sea mayor que 3. El suceso unión estaría formado por los siguientes resultados: el 2, el 4, el 5 y el 6 Intersección de sucesos Ejemplo : lanzamos un dado al aire, y analizamos dos sucesos: a) que salga número par, y b) que sea mayor que 4. La intersección de estos dos sucesos tiene un sólo elemento, el número 6 (es el único resultado común a ambos sucesos: es mayor que 4 y es número par).
Sucesos incompatibles Ejemplo : lanzamos un dado al aire y analizamos dos sucesos: a) que salga un número menor que 3, y b) que salga el número 6. Es evidente que ambos no se pueden dar al mismo tiempo. Sucesos complementarios Ejemplo : lanzamos un dado al aire y analizamos dos sucesos: a) que salga un número par, y b) que salga un número impar. Vemos que si no se da el primero se tiene que dar el segundo (y viceversa).
Cálculo de probabilidades  La probabilidad toma valores entre 0 y 1 (o expresados en tanto por ciento, entre 0% y 100%): El valor cero corresponde al suceso imposible :  Lanzamos un dado al aire y la probabilidad de que salga el número 7 es cero. El valor uno corresponde al suceso seguro Lanzamos un dado al aire y la probabilidad de que salga cualquier número del 1 al 6 es igual a uno (100%). El resto de sucesos tendrá probabilidades entre cero y uno Que será tanto mayor cuanto más probable sea que dicho suceso tenga lugar.
¿Cómo se mide la probabilidad? Uno de los métodos más utilizados es aplicando la  Regla de Laplace:  Define la probabilidad de un suceso como el cociente entre casos favorables y casos posibles. P(A) = Casos favorables / casos posibles Probabilidad de que al lanzar un dado salga un número par : en este caso los casos favorables son tres (que salga el dos, el cuatro o el seis), mientras que los casos posibles siguen siendo seis. Por lo tanto: P(A) = 3 / 6 = 0,50 (o lo que es lo mismo, 50%)
a) El número de resultados posibles (sucesos) tiene que ser finito.  Si hubiera infinitos resultados, al aplicar la regla "casos favorables / casos posibles" el cociente siempre sería cero. b) Todos los sucesos tienen que tener la misma probabilidad.  Si al lanzar un dado, algunas caras tuvieran mayor probabilidad de salir que otras, no podríamos aplicar esta regla.
Combinaciones Determina el número de subgrupos de 1, 2, 3, etc. elementos que se pueden formar con los "n" elementos de una muestra.  Cada subgrupo se diferencia del resto en los elementos que lo componen, sin que influya el orden. Por ejemplo , calcular las posibles combinaciones de 2 elementos que se pueden formar con los números 1, 2 y 3. Se pueden establecer 3 parejas diferentes: (1,2), (1,3) y (2,3). En el cálculo de combinaciones las parejas (1,2) y (2,1) se consideran idénticas, por lo que sólo se cuentan una vez .
Variaciones Calcula el número de subgrupos de 1, 2, 3, etc. elementos que se pueden establecer con los "n" elementos de una muestra. Cada subgrupo se diferencia del resto en los elementos que lo componen o en el orden de dichos elementos (es lo que le diferencia de las combinaciones). Por ejemplo , calcular las posibles variaciones de 2 elementos que se pueden establecer con los número 1, 2 y 3. Ahora tendríamos 6 posibles parejas: (1,2), (1,3), (2,1), (2,3), (3,1) y (3,3). En este caso los subgrupos (1,2) y (2,1) se consideran distintos.
Permutaciones Calcula las posibles agrupaciones que se pueden establecer con todos los elementos de un grupo, por lo tanto, lo que diferencia a cada subgrupo del resto es el orden de los elementos. Por ejemplo , calcular las posibles formas en que se pueden ordenar los número 1, 2 y 3. Hay 6 posibles agrupaciones: (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2) y (3, 2, 1)
MUESTREO
CONCEPTOS BASICOS Elemento/Unidad Cada uno de los componentes de la muestra Marco Muestral Enumeración exhaustiva de toda la población o unidades muestrales Parámetro Valor de la variable calculada sobre la población
CONCEPTOS BASICOS Error aleatorio del muestreo Diferencia entre los resultados obtenidos de una muestra y los obtenidos sobre un censo, habiendo utilizado procedimientos idénticos para obtener la información Error sistemático, ajeno al muestreo o no muestral Se trata de errores que no tienen que ver con el hecho de seleccionar una muestra Puede ser consecuencia de la naturaleza del diseño del estudio y de las imperfecciones en su ejecución
 
Muestreos probabilísticos
MUESTREO ALEATORIO SIMPLE O CON REPOSICIÓN Se toma un elemento al azar, se analiza y se devuelve antes de extraer el siguiente Todos los elementos tienen la misma probabilidad de ser extraídos Las extracciones son independientes EJEMPLOS: Urna con reposición (p. finita) Máquina produce piezas (p. infinita) Una m.a.s. de tamaño n (X1, ..., Xn) donde todas las Xi: Son independientes Tienen la misma distribución Su distribución coincide con la de población
MUESTREO ALEATORIO SIN REPOSICIÓN Se toma un elemento al azar, se analiza y no se devuelve para próximas extracciones No todos los elementos tienen la misma probabilidad de ser extraídos Las extracciones NO son independientes EJEMPLOS:  Urna sin reposición (p. finita) Una m.a. sin reposición de tamaño n (X1, ..., Xn) donde todas las Xi: Son dependientes Tienen la misma distribución Su distribución coincide con la de población
MUESTREO SISTEMÁTICO Para tomar una muestra de tamaño n: Numerar las unidades de la población de 1 hasta N. Dividir la población en n bloques de k elementos cada uno k = N / n Tomar un elemento al azar del primer bloque (elemento h: 1≤h≤k). Repetir de forma sistemática La muestra queda formada por los elementos: h + i•k i = 0,..., n-1 EJEMPLO: Elección de jurados
MUESTREO ESTRATIFICADO Dividir la población en L estratos (subgrupos) Elementos homogéneos dentro del estrato Estratos heterogéneos entre sí Muestra total = Unión de las muestras de cada estrato. Cada submuestra independiente del resto. Ventajas: Permite aplicar técnicas de selección diferentes dentro de cada estrato Permite obtener estimaciones separadas en cada estrato Consigue mayor precisión Disminuye el tamaño de la muestra Para seleccionar el tamaño de cada submuestra: Afijación uniforme Afijación proporcional (más usado) Afijación de mínima varianza Afijación óptima (costes asociados al muestreo) EJEMPLO: Estudios de mercado
MUESTREO POR CONGLOMERADOS Sustituir los elementos de la población por grupos Cada unidad es ahora un grupo: conglomerado Se seleccionan los conglomerados y dentro de ellos se realiza el estudio EJEMPLO
Muestreos no probabilísticos
MUESTREO DE CONVENIENCIA La muestra estará formada por unidades accesibles o favorables Se suele utilizar cuando se realiza una prueba de un cuestionario o en un estudio exploratorio Es un método de reducido coste Los estimadores no coincidirán con los parámetros
MUESTREO DE JUICIOS Consiste en acudir a expertos para que nos ayuden a determinar una muestra Representativa
Construye una muestra a escala de la población objeto de estudio fijándose las condiciones que deben cumplir los elementos muestrales Conlleva una muy buena planificación del trabajo de campo Pueden conseguirse resultados próximos a un muestreo estratificado MUESTREO POR CUOTAS
MUESTREO DE BOLA DE NIEVE Se elige una submuestra por alguno de los métodos anteriores Se pide a sus componentes que elijan a otros a partir de unas condiciones
Calculo del tamaño de la muestra Fórmula para el cálculo del tamaño de la muestra cuando lo que se estiman son medias: z  = % de fiabilidad deseado para la media muestral  (valor estandarizado) e  = error máximo permitido para la media muestral s2 = varianza de la población. N  = Tamaño de la población.
GRACIAS

Más contenido relacionado

PDF
Transformaciones lineales
DOCX
Tarea 17 de probabilidad y estadistica con respuestas
 
PPTX
Medidas de tendencia central, posición y dispersion
PDF
Estadistica parametrica y no parametrica
PPT
PPT
1.1. Conceptos BáSicos De Estadistica
PPTX
Distribucion de Frecuecia
PPTX
DISTRIBUCION DE FRECUENCIAS
Transformaciones lineales
Tarea 17 de probabilidad y estadistica con respuestas
 
Medidas de tendencia central, posición y dispersion
Estadistica parametrica y no parametrica
1.1. Conceptos BáSicos De Estadistica
Distribucion de Frecuecia
DISTRIBUCION DE FRECUENCIAS

La actualidad más candente (20)

PPTX
Organizacion de datos
DOCX
P. final algebra lineal victoria silva
PPTX
Coeficiente de Correlación de Pearson
DOCX
Datos agrupados y datos no agrupados
PDF
Metodos No Parametricos Parte I. Est ind clase11
PPT
Analisis De Regresion Y Correlacion
PPT
Pruebas No Parametricas
PDF
Análisis de Correlacion Lineal
PDF
El Coeficiente de Correlación y la Recta de Mínimos Cuadrados
PPTX
Prueba de hipotesis estadistica aplicada a la ingenieria
DOCX
Eventos mutuamente excluyentes y no excluyentes
 
PPSX
Variables Estadisticas
DOCX
Estadistica descriptiva
DOCX
Conclusiones de unidad 2 organización de los datos
PDF
Estadistica y probabilidad
PPT
Regla sturges
PPTX
Metodo parametrico y no parametrico
PDF
1.2 Recurso Muestreo Unidad 1, Tron y Mendoza
PPT
Muestreo
PPT
Estadística descriptiva e inferencial
Organizacion de datos
P. final algebra lineal victoria silva
Coeficiente de Correlación de Pearson
Datos agrupados y datos no agrupados
Metodos No Parametricos Parte I. Est ind clase11
Analisis De Regresion Y Correlacion
Pruebas No Parametricas
Análisis de Correlacion Lineal
El Coeficiente de Correlación y la Recta de Mínimos Cuadrados
Prueba de hipotesis estadistica aplicada a la ingenieria
Eventos mutuamente excluyentes y no excluyentes
 
Variables Estadisticas
Estadistica descriptiva
Conclusiones de unidad 2 organización de los datos
Estadistica y probabilidad
Regla sturges
Metodo parametrico y no parametrico
1.2 Recurso Muestreo Unidad 1, Tron y Mendoza
Muestreo
Estadística descriptiva e inferencial
Publicidad

Similar a B Ioestadistica Conceptos Basicos (20)

PPT
Esta Di Stica Descriptiva
PPT
Ucn Fundamentos De Estadadistica
PPTX
Probabilidad y Estadística
DOCX
Lecciones de estadistica descriptiva
PPT
Estadistica
PPTX
Estadística descriptiva
PPTX
Estadística. Medidas de tendencia central.
PPTX
Presentación estadistica adolfo bravo medidas de tendencia central
PPTX
Presentacion diapositivas estadisticas
PPTX
Presentacion diapositivas estadisticas
PPTX
Medidas de tendencia central, posición y dispersión
PPTX
estadistica descriptiva
PPTX
DIAPOSITIVAS DE ESTADISTICAS DESCRIPTIVAS
PPT
Esta di stica descriptiva
PPT
Medidas de Tendencia Central
PPTX
Medidas de tendencia central
PPT
Presentacion medidas de tendencua central
ODP
Estadistica Univariada
ODP
Estadistica Univariada
DOCX
Estadistica descriptiva
Esta Di Stica Descriptiva
Ucn Fundamentos De Estadadistica
Probabilidad y Estadística
Lecciones de estadistica descriptiva
Estadistica
Estadística descriptiva
Estadística. Medidas de tendencia central.
Presentación estadistica adolfo bravo medidas de tendencia central
Presentacion diapositivas estadisticas
Presentacion diapositivas estadisticas
Medidas de tendencia central, posición y dispersión
estadistica descriptiva
DIAPOSITIVAS DE ESTADISTICAS DESCRIPTIVAS
Esta di stica descriptiva
Medidas de Tendencia Central
Medidas de tendencia central
Presentacion medidas de tendencua central
Estadistica Univariada
Estadistica Univariada
Estadistica descriptiva
Publicidad

Más de centroperalvillo (20)

DOCX
Revision De Informe De Asistencia Del Personal
DOC
Plan De Campaña de Invierno 2009
DOCX
Informe Del Registro De Gestantes, Partos Y PuéRperas Abril 2009
DOCX
Informe De Reunion Con Promotoras De Salud
DOCX
Informe De Reunion Con Dirigentes Del Vaso Del Leche
DOCX
Informe De Asistencia De Profesionales No Medicos
DOCX
Informe Control De Peso Y Talla
XLS
Cuadro De Brotes De 2009
XLS
Cantidad De Referencias S.I.S. Demanda 2009(2)
PPT
Produccion SIS C.S Peralvillo
PPT
Indicadores Operacionales
PPT
Casos de IRA C.S Peralvillo
PPTX
Casos de EDA C.S Peralvillo
PPT
Casos Febriles Abril 2009
PPT
Informe Asistencia Mensual Lic. Mirna Ortiz
PPTX
Informe Cuaderno Asistencia
PPT
Mediciones Epidemiologicas
PPT
Planificacion , Organizacion, Direccion Y Coordinacion
PPT
Sistemas De Salud Pps
Revision De Informe De Asistencia Del Personal
Plan De Campaña de Invierno 2009
Informe Del Registro De Gestantes, Partos Y PuéRperas Abril 2009
Informe De Reunion Con Promotoras De Salud
Informe De Reunion Con Dirigentes Del Vaso Del Leche
Informe De Asistencia De Profesionales No Medicos
Informe Control De Peso Y Talla
Cuadro De Brotes De 2009
Cantidad De Referencias S.I.S. Demanda 2009(2)
Produccion SIS C.S Peralvillo
Indicadores Operacionales
Casos de IRA C.S Peralvillo
Casos de EDA C.S Peralvillo
Casos Febriles Abril 2009
Informe Asistencia Mensual Lic. Mirna Ortiz
Informe Cuaderno Asistencia
Mediciones Epidemiologicas
Planificacion , Organizacion, Direccion Y Coordinacion
Sistemas De Salud Pps

B Ioestadistica Conceptos Basicos

  • 1. CONCEPTOS BASICOS ESTADISTICA DESCRIPTIVA PROBABILIDAD MUESTREO INTERNA PATRICIA VARGAS CHANG
  • 2. LA ESTADISTICA La estadística es una ciencia con base matemática referente a la recolección, análisis e interpretación de datos, que busca explicar condiciones regulares en fenómenos de tipo aleatorio
  • 3. ESTADISTICA DESCRIPTIVA La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.
  • 4. VARIABLES Tipos Variables cualitativas o atributos : no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas : tienen valor numérico (edad, precio de un producto, ingresos anuales).
  • 5. VARIABLES Variables unidimensionales Sólo recogen información sobre una característica (por ejemplo: edad de los alunmos de una clase). Variables bidimensionales Recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase). Variables pluridimensionales Recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).
  • 6. VARIABLES CUANTITATIVAS Discretas Sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45). Continuas Pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.
  • 7. Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos: Individuo Cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo. Población Conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeo que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad. Muestra Subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.
  • 8. DISTRIBUCION DE FRECUENCIAS La distribución de frecuencia Es la representación estructurada, en forma de tabla, de toda la información que se ha recogido sobre la variable que se estudia.
  • 9. EJEMPLO Medimos la altura de los niños de una clase y obtenemos los siguientes resultados (cm):
  • 10. Con la información brindada podemos armar la siguiente tabla de frecuencias
  • 11. MEDIDAS DE POSICION Nos facilitan información sobre la serie de datos que estamos analizando Clases a) Medidas de posición central : informan sobre los valores medios de la serie de datos. b) Medidas de posición no centrales : informan de como se distribuye el resto de los valores de la serie.
  • 12. MEDIA Es el valor medio ponderado de la serie de datos. Lo más positivo de la media es que en su cálculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna información. Su valor (tanto en el caso de la media aritmética como geométrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie, perdiendo ésta representatividad. Se pueden calcular diversos tipos de media
  • 13. MEDIA Media aritmética Se calcula multiplicando cada valor por el número de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra
  • 14. MEDIA Media geométrica: Se eleva cada valor al número de veces que se ha repetido. Se multiplican todo estos resultados y al producto final se le calcula la raíz "n" (siendo "n" el total de datos de la muestra). La media geométrica se suele utilizar en series de datos como tipos de interés anuales, inflación, etc., donde el valor de cada año tiene un efecto multiplicativo sobre el de los años anteriores
  • 15. MEDIANA Es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores). No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).
  • 16. COMO CALCULAR LA MEDIANA Datos sin agrupar Considerando X1, X2,X3….Xn los datos de una muestra ordenada en orden creciente y designando la mediana como Me , distinguimos dos casos: Si n es impar La mediana es el valor que ocupa la posición (n+1)/2 una vez que los datos han sido ordenados (en orden creciente o decreciente), porque éste es el valor central. Por ejemplo: x 1 = 3, x 2 = 6, x 3 = 7, x 4 = 8, x 5 = 9                   
  • 17. Si n es par La mediana es la media aritmética de las dos observaciones centrales n/2 y (n/2)+1. Por ejemplo x1 = 3, x 2 = 6, x 3 = 7, x 4 = 8, x 5 = 9, x 6 = 10                       .                                      .
  • 18. MODA Es el valor que más se repite en la muestra
  • 20. La media Aritmética La Media Geométrica
  • 21. La Mediana Es 1,26 cm, ya que por debajo está el 50% de los valores y por arriba el otro 50%. Esto se puede ver al analizar la columna de frecuencias relativas acumuladas. La Moda Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo tanto esta seria cuenta con 3 modas
  • 22. Medidas de posición no centrales Permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales: Cuartiles : son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. Deciles : son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Percentiles : son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.
  • 23. Vamos a calcular los cuartiles de la serie de datos referidos a la estatura de un grupo de alumnos Los deciles y centiles se calculan de igual manera, aunque haría falta distribuciones con mayor número de datos .
  • 24. 1º cuartil: es el valor 1,22 cm, ya que por debajo suya se situa el 25% de la frecuencia (tal como se puede ver en la columna de la frecuencia relativa acumulada). 2º cuartil: es el valor 1,26 cm, ya que entre este valor y el 1º cuartil se situa otro 25% de la frecuencia. 3º cuartil: es el valor 1,28 cm, ya que entre este valor y el 2º cuartil se sitúa otro 25% de la frecuencia. Además, por encima suya queda el restante 25% de la frecuencia. Atención : cuando un cuartil recae en un valor que se ha repetido más de una vez (como ocurre en el ejemplo en los tres cuartiles) la medida de posición no central sería realmente una de las repeticiones.
  • 25. Medidas de Dispersión Estudia la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos. Existen diversas medidas de dispersión Rango Mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo. Varianza Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las difrencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.
  • 26. La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están. Desviación típica Se calcula como raíz cuadrada de la varianza. Coeficiente de varización de Pearson Se calcula como cociente entre la desviación típica y la media.
  • 28. Rango Diferencia entre el mayor valor de la muestra (1,30) y el menor valor (1,20). El rango de esta muestra es 10 cm. Varianza: Recordemos que la media de esta muestra es 1,253. Luego, aplicamos la fórmula:
  • 29. Desviación típica Es la raíz cuadrada de la varianza. Coeficiente de variación de Pearson Se calcula como cociente entre la desviación típica y la media de la muestra.
  • 30. El coeficiente de variación es un porcentaje que permite comparar el nivel de dispersión de dos muestras. Esto no ocurre con la desviación típica, ya que viene expresada en las mismas unidas que los datos de la serie. Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la altura de los alumnos de una clase y otra serie con el peso de dichos alumnos, no se puede utilizar las desviaciones típicas (una viene expresada en cm y la otra en kg). En cambio, sus coeficientes de variación son ambos porcentajes, por lo que sí se pueden comparar.
  • 32. PROBABILIDAD La probabilidad mide la frecuencia con la que aparece un resultado determinado cuando se realiza un experimento. Ejemplo : tiramos un dado al aire y queremos saber cual es la probabilidad de que salga un 2, o que salga un número par, o que salga un número menor que 4. El experimento tiene que ser aleatorio , es decir, que pueden presentarse diversos resultados, dentro de un conjunto posible de soluciones, y esto aún realizando el experimento en las mismas condiciones.
  • 33. Probabilidad: Conceptos Suceso elemental H ace referencia a cada una de las posibles soluciones que se pueden presentar. Ejemplo : al lanzar una moneda al aire, los sucesos elementales son la cara y la cruz. Al lanzar un dado, los sucesos elementales son el 1, el 2, .., hasta el 6. Suceso compuesto Subconjunto de sucesos elementales. Ejemplo : lanzamos un dado y queremos que salga un número par. El suceso "numero par" es un suceso compuesto, integrado por 3 sucesos elementales: el 2, el 4 y el 6
  • 34. Espacio muestral Al conjunto de todos los posibles sucesos elementales. Cada experimento aleatorio tiene definido su espacio muestral (es decir, un conjunto con todas las soluciones posibles). Ejemplo : si tiramos una moneda al aíre una sola vez, el espacio muestral será cara o cruz.
  • 35. Probabilidad: Relación entre sucesos Un suceso puede estar contenido en otro Ejemplo : lanzamos un dado y analizamos dos sucesos: a) que salga el número 6, y b) que salga un número par. Vemos que el suceso a) está contenido en el suceso b). Siempre que se da el suceso a) se da el suceso b), pero no al contrario. Por ejemplo, si el resultado fuera el 2, se cumpliría el suceso b), pero no el el a). Dos sucesos pueden ser iguales Ejemplo : lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par, y b) que salga múltiplo de 2. Vemos que las soluciones coinciden en ambos casos.
  • 36. Unión de dos o más sucesos Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga número par y b) que el resultado sea mayor que 3. El suceso unión estaría formado por los siguientes resultados: el 2, el 4, el 5 y el 6 Intersección de sucesos Ejemplo : lanzamos un dado al aire, y analizamos dos sucesos: a) que salga número par, y b) que sea mayor que 4. La intersección de estos dos sucesos tiene un sólo elemento, el número 6 (es el único resultado común a ambos sucesos: es mayor que 4 y es número par).
  • 37. Sucesos incompatibles Ejemplo : lanzamos un dado al aire y analizamos dos sucesos: a) que salga un número menor que 3, y b) que salga el número 6. Es evidente que ambos no se pueden dar al mismo tiempo. Sucesos complementarios Ejemplo : lanzamos un dado al aire y analizamos dos sucesos: a) que salga un número par, y b) que salga un número impar. Vemos que si no se da el primero se tiene que dar el segundo (y viceversa).
  • 38. Cálculo de probabilidades  La probabilidad toma valores entre 0 y 1 (o expresados en tanto por ciento, entre 0% y 100%): El valor cero corresponde al suceso imposible : Lanzamos un dado al aire y la probabilidad de que salga el número 7 es cero. El valor uno corresponde al suceso seguro Lanzamos un dado al aire y la probabilidad de que salga cualquier número del 1 al 6 es igual a uno (100%). El resto de sucesos tendrá probabilidades entre cero y uno Que será tanto mayor cuanto más probable sea que dicho suceso tenga lugar.
  • 39. ¿Cómo se mide la probabilidad? Uno de los métodos más utilizados es aplicando la Regla de Laplace: Define la probabilidad de un suceso como el cociente entre casos favorables y casos posibles. P(A) = Casos favorables / casos posibles Probabilidad de que al lanzar un dado salga un número par : en este caso los casos favorables son tres (que salga el dos, el cuatro o el seis), mientras que los casos posibles siguen siendo seis. Por lo tanto: P(A) = 3 / 6 = 0,50 (o lo que es lo mismo, 50%)
  • 40. a) El número de resultados posibles (sucesos) tiene que ser finito. Si hubiera infinitos resultados, al aplicar la regla "casos favorables / casos posibles" el cociente siempre sería cero. b) Todos los sucesos tienen que tener la misma probabilidad. Si al lanzar un dado, algunas caras tuvieran mayor probabilidad de salir que otras, no podríamos aplicar esta regla.
  • 41. Combinaciones Determina el número de subgrupos de 1, 2, 3, etc. elementos que se pueden formar con los "n" elementos de una muestra. Cada subgrupo se diferencia del resto en los elementos que lo componen, sin que influya el orden. Por ejemplo , calcular las posibles combinaciones de 2 elementos que se pueden formar con los números 1, 2 y 3. Se pueden establecer 3 parejas diferentes: (1,2), (1,3) y (2,3). En el cálculo de combinaciones las parejas (1,2) y (2,1) se consideran idénticas, por lo que sólo se cuentan una vez .
  • 42. Variaciones Calcula el número de subgrupos de 1, 2, 3, etc. elementos que se pueden establecer con los "n" elementos de una muestra. Cada subgrupo se diferencia del resto en los elementos que lo componen o en el orden de dichos elementos (es lo que le diferencia de las combinaciones). Por ejemplo , calcular las posibles variaciones de 2 elementos que se pueden establecer con los número 1, 2 y 3. Ahora tendríamos 6 posibles parejas: (1,2), (1,3), (2,1), (2,3), (3,1) y (3,3). En este caso los subgrupos (1,2) y (2,1) se consideran distintos.
  • 43. Permutaciones Calcula las posibles agrupaciones que se pueden establecer con todos los elementos de un grupo, por lo tanto, lo que diferencia a cada subgrupo del resto es el orden de los elementos. Por ejemplo , calcular las posibles formas en que se pueden ordenar los número 1, 2 y 3. Hay 6 posibles agrupaciones: (1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2) y (3, 2, 1)
  • 45. CONCEPTOS BASICOS Elemento/Unidad Cada uno de los componentes de la muestra Marco Muestral Enumeración exhaustiva de toda la población o unidades muestrales Parámetro Valor de la variable calculada sobre la población
  • 46. CONCEPTOS BASICOS Error aleatorio del muestreo Diferencia entre los resultados obtenidos de una muestra y los obtenidos sobre un censo, habiendo utilizado procedimientos idénticos para obtener la información Error sistemático, ajeno al muestreo o no muestral Se trata de errores que no tienen que ver con el hecho de seleccionar una muestra Puede ser consecuencia de la naturaleza del diseño del estudio y de las imperfecciones en su ejecución
  • 47.  
  • 49. MUESTREO ALEATORIO SIMPLE O CON REPOSICIÓN Se toma un elemento al azar, se analiza y se devuelve antes de extraer el siguiente Todos los elementos tienen la misma probabilidad de ser extraídos Las extracciones son independientes EJEMPLOS: Urna con reposición (p. finita) Máquina produce piezas (p. infinita) Una m.a.s. de tamaño n (X1, ..., Xn) donde todas las Xi: Son independientes Tienen la misma distribución Su distribución coincide con la de población
  • 50. MUESTREO ALEATORIO SIN REPOSICIÓN Se toma un elemento al azar, se analiza y no se devuelve para próximas extracciones No todos los elementos tienen la misma probabilidad de ser extraídos Las extracciones NO son independientes EJEMPLOS: Urna sin reposición (p. finita) Una m.a. sin reposición de tamaño n (X1, ..., Xn) donde todas las Xi: Son dependientes Tienen la misma distribución Su distribución coincide con la de población
  • 51. MUESTREO SISTEMÁTICO Para tomar una muestra de tamaño n: Numerar las unidades de la población de 1 hasta N. Dividir la población en n bloques de k elementos cada uno k = N / n Tomar un elemento al azar del primer bloque (elemento h: 1≤h≤k). Repetir de forma sistemática La muestra queda formada por los elementos: h + i•k i = 0,..., n-1 EJEMPLO: Elección de jurados
  • 52. MUESTREO ESTRATIFICADO Dividir la población en L estratos (subgrupos) Elementos homogéneos dentro del estrato Estratos heterogéneos entre sí Muestra total = Unión de las muestras de cada estrato. Cada submuestra independiente del resto. Ventajas: Permite aplicar técnicas de selección diferentes dentro de cada estrato Permite obtener estimaciones separadas en cada estrato Consigue mayor precisión Disminuye el tamaño de la muestra Para seleccionar el tamaño de cada submuestra: Afijación uniforme Afijación proporcional (más usado) Afijación de mínima varianza Afijación óptima (costes asociados al muestreo) EJEMPLO: Estudios de mercado
  • 53. MUESTREO POR CONGLOMERADOS Sustituir los elementos de la población por grupos Cada unidad es ahora un grupo: conglomerado Se seleccionan los conglomerados y dentro de ellos se realiza el estudio EJEMPLO
  • 55. MUESTREO DE CONVENIENCIA La muestra estará formada por unidades accesibles o favorables Se suele utilizar cuando se realiza una prueba de un cuestionario o en un estudio exploratorio Es un método de reducido coste Los estimadores no coincidirán con los parámetros
  • 56. MUESTREO DE JUICIOS Consiste en acudir a expertos para que nos ayuden a determinar una muestra Representativa
  • 57. Construye una muestra a escala de la población objeto de estudio fijándose las condiciones que deben cumplir los elementos muestrales Conlleva una muy buena planificación del trabajo de campo Pueden conseguirse resultados próximos a un muestreo estratificado MUESTREO POR CUOTAS
  • 58. MUESTREO DE BOLA DE NIEVE Se elige una submuestra por alguno de los métodos anteriores Se pide a sus componentes que elijan a otros a partir de unas condiciones
  • 59. Calculo del tamaño de la muestra Fórmula para el cálculo del tamaño de la muestra cuando lo que se estiman son medias: z = % de fiabilidad deseado para la media muestral (valor estandarizado) e = error máximo permitido para la media muestral s2 = varianza de la población. N = Tamaño de la población.