SlideShare una empresa de Scribd logo
Explorando Datos Multivariados1POP Psicología de la Educación
Estructura y Representación de los Datos MultivariadosGráficos de distribución de los datosDatos perdidos y/o extremos	2.1. Medias Restringidas	2.2. Medias Semirestringidas2
Estructura y Representación de los DatosObservar los datos gráficamente nos permite ver cómo se distribuyen, si se cumplen los criterios para la aplicación de una determinada prueba paramétrica.. Etc… Una vez obtenidos los datos. Observarlos graficándolos de distintas maneras.Observar los datos nos permite ahorrar tiempo en los análisis paramétricos. Seleccionando la prueba adecuada.3
Estructura y Representación de los DatosTipos de gráficos:Histograma de Frecuencia:Nos permite intuir la distribución de probabilidad de los datos, normalidad, simetría, etc.Diagrama de Tallos y HojasÚtil para muestra de datos pequeñas. Nos da la información del histograma pero observando los valores de la variable.Cajas y bigotesPermite estudiar la simetría de los datos, y detectar valore atípicos.Gráfico de Normalidad P-PNos permite comprobar si unos datos se ajustan a la distribución normal.Gráfico de dispersiónUtilizados para ver la distribución conjunta de dos variables o más.4
Sentencia Explore5
OutliersSe define como aquel valor que está entre 1,5 y 3 IQR (amplitud intercuartílica P75-P25Como inspeccionamos los outliers:Haciendo un gráfico de cajas y bigotes (boxplot)Observando los datos tipificados de la variable (puntuaciones-z) sentencia RANK (p.e. RANK ci / NORMAL)Una vez identificados los outliers ¿Qué hacemos con ellos?Quitar el casoCambiar el dato (p.e. media grupo, media condición, media sujeto, etc.)Transformación de los datos (esto se hace en cualquier caso cuando la distribución de los datos es asimétrica)6
OutliersTipos de transformaciones…Tranformaciones logaritmicas (Log (Xi)). En este caso hay que tener en cuenta que si los datos están muy próximos a cero o son negativos hay que previamente transformarlos sumando una constante. Tranformación con la raíz cuadradaTranformación recíproca (1/Xi). En este caso los valores altos se convertirán en valores próximos a cero, y los valores bajos serán los más altos. Lo que hacemos es utilizar la fórmula 1/Xmayor-Xi)Todas estas tranformaciones se utilizan para tranformar distribuciones asimétricas tanto positivas como negativas..Una familia de transformaciones especialmente útiles es la “escalera de potencias” de Tukey7
Corrigen asimetría negativaCorrigen asimetría positivaOutliersEscalera de potencias de Tukey8
OutliersSi la transformación falla, podemos reemplazar el dato… ¿cómo?por el valor más alto mas unoReemplazarlo por el valor que tiene en 3 desviaciones típicasUna variación del anterior es cambiar el valor por el que corresponde a 2 desviaciones típicasLo mejor es transformar los datos, en lugar de quitar o sustituir, cuando tenemos outliers. Si transformamos una variable porque su distribución es asimétrica, tenemos que hacer lo mismo con todas las demás. 9
Ejemplo. Datos de TR de un participanteNo sólo que hay algunas puntuaciones atípicas a ambos lados, sino que hay una clara asimetría positiva.
Ejemplo. Datos (transformados; raiz cuadrad) de TR de un participante (cont.)HEMOS EFECTUADO LA RAIZ PARA HACER MÁS SIMETRICA LA DISTRIBUCIÓN.No sólo que aún queda algo de asimetría positiva. Con el logaritmo, podremos reducir más la asimetría positiva, es lo que haremos ahora
Ejemplo. Datos (transformados; logaritmo) de TR de un participante (cont.)Nota: Si algún valor fuera 0, emplear log(1+x)En este caso no sólo que la asimetría positiva ha desaparecido (si acaso hay cierta asimetría negativa causada por unas pocas puntuaciones atípicas).
Ejemplo. Datos (transformados; cuadrado) de TR de un participante (cont.)Nota: Emplear el cuadrado no se debe hacer para corregir la asimetría positiva...sólo la negativa! Lo que hemos hecho es aumentar la asimetría positiva y eso no es lo que queríamos...(y si empleamos el cubo, aún peor para nuestros fines).
Transformación de VariablesEsta familia de transformaciones (“escalera de Tukey”) tiene importantes propiedades:Preservan el orden de los valores; es decir, los valores mayores de la escala original seguirán siendo los valores mayores en la escala transformada.2. Modifican la distancia entre los valores. Con potencias p<1 (raíz x o log x) se comprimen los datos en la parte superior de la distribución en relación a los valores menores; Con potencias p>1 (como el cuadrado de x) se tiene el efecto contrario.3. El efecto sobre la forma de la distribución cambia sistemáticamente con p. Si raíz x hace menos pronunciada la asimetría positiva de una distribución, el log x provocará que la distribución resultante sea aún menos asimétrica positiva (en relación a raíz x).14
Transformación de VariablesEn definitiva, las transformaciones de potencia pueden hacer que la variable transformada tenga menos asimetría. ¿Por qué es eso importante?– Las distribuciones que muestran una clara asimetría son difíciles de estudiar. – Los valores originales aparentemente atípicos se encontrarán más cercanos al grueso de los datos.– Los métodos estadísticos suelen emplear la media aritmética; pero la media de una distribución asimétrica no es un buen índice del grueso de los datos.15
Estructura y Representación de los DatosEstadísticos (Estimadores) robustos (ESTADÍSTICA INFERENCIAL): Son aquellos estadísticos (estimadores) que funcionan bien para varios tipos distintos de distribuciones teóricas, aunque pueden no ser el mejor estimador para ningún tipo concreto de distribución. Es decir, son el “mejor compromiso”.La media no es un estimador robusto.La mediana es un estimador más robusto que la media, si bien hay otros estimadores más robustos que veremos en el punto siguiente del temario.16
Medidas robustas de tendencia central1. Medias RecortadasConsiste en calcular la media aritmética sobre un subconjunto central del conjunto de datos, no considerándose una determinada proporción p por cada extremo. (p se expresa normalmente como porcentaje).Por ejemplo, una media recortada al 40% en una secuencia de 10 datos implica no tener en cuenta ni los 4 valores menores ni los 4 valores mayores.Observar que la media recortada al 0% es la media aritmética.A la media recortada al 25% se la denomina centrimedia.17
Medidas robustas de tendencia central1. Medias Recortadas (cont)Calculamos la media recortada al 10%  de los siguientes datos:3, 4, 4, 5, 5, 6, 7, 8, 9, 11El valor es 6Calcula la centrimediaEl valor es 5.818
Medidas robustas de tendencia central2. Media WinsorizadaEs análogo a las medias recortadas excepto en que las puntuaciones eliminadas, ya no lo son sino que se sustituyen por los valores menor y mayor que quedan para el cómputo de la media winsorizada.Así, en la media recortada a nivel 2 implicaría eliminar las dos puntuaciones mayores y las 2 menores:3, 4, 4, 5, 5, 6, 7, 8, 9, 11Y quedan los datos: 4, 5, 5, 6, 7, 8 y se calcula la media de los mismosEn la media winsorizada, los datos 3 y 4 (los dos menores) y el 9 y 11 (los dos mayores) se sustituyen por 4 y 8 respectivamente. Es decir,4, 4, 4, 5, 5, 6, 7, 8, 8, 8 y se calcula la media de los mismos, que será la media winsorizada a nivel 2 (debe de dar 5.9)19
Medidas robustas de tendencia central3. Otros tipos de media en la que se recortan datosEn muchas ocasiones lo que se hace es emplear un valor mínimo y uno máximo más allá del cual se eliminan los datos que sobrepasen tales valores.Por ejemplo, en experimentos de tiempo de reacción para discriminar palabras/pseudopalabras se pueden eliminar datos menores de 200 ms y mayores de 1500 ms. (Menos de 200 ms es demasiado rápido; más de 1500 ms es demasiado lento.)De esta manera, si todos los datos están en el rango 200-1500 ms no se elimina ningún dato20
Medidas robustas de tendencia central4. TrimediaEs un índice de tendencia central que consiste en calcular una media aritmética ponderada de tres medidas, la Mediana (con peso doble) y el primer y tercer cuartil.Pensemos que en un conjunto de datos, el primer cuartil es 51, la mediana es 55 y el tercer cuartil es 63. La trimedia es:21
Medidas robustas de tendencia central5. Otras medidas robustasEl estimador-M de Huber, el estimador biponderado de Tukey, el estimador M-redescendente de Hampel y el estimador en onda de Andrew. Estos estimadores se diferencian entre sí por el tipo de ponderación aplicada sobre los datos.Por ejemplo, en el Estimador-M de Huber (Estimador M de posición): Las puntuaciones típicas que sean menores que una constante, reciben un peso de 1. Los casos que tienen los mayores valores absolutos tienen pesos tanto más pequeños cuanto mayor es su distancia respecto a cero. La constante es 1.339. Cálculo: lo da el SPSS.22
Sentencia ExploreNos permite obtener una serie de datos tanto numéricos como gráficos sobre nuestros datos. (hay otras sentencias para estudiar desde un punto de vista descriptivo los datos. ES BUENO PRACTICAR!!!)23
Glastonburyfestival.sav24
Sentencia Explore25
Sentencia Explore26
Sentencia Explore27
Sentencia Explore28
Sentencia Explore29
Sentencia Explore30

Más contenido relacionado

PDF
Modelos empiricos
PDF
Tablas distribuciones
PPTX
Historia de la estadistica
PPTX
Teoría de la Estimación
PDF
Problemas unidad 3.new
PPT
TECNICAS DE CONTEO
DOCX
Informe trabajo final estadistica inferencial
PPTX
LEY SAFCO 1178 OJO_c241323c92de228507343ca7e2ea0472.pptx
Modelos empiricos
Tablas distribuciones
Historia de la estadistica
Teoría de la Estimación
Problemas unidad 3.new
TECNICAS DE CONTEO
Informe trabajo final estadistica inferencial
LEY SAFCO 1178 OJO_c241323c92de228507343ca7e2ea0472.pptx

La actualidad más candente (20)

PDF
Diagrama de flujo de caja
PPTX
Medidas de Tendencia Central, Medidas de Dispersión, Histograma y la campana ...
PDF
Estadistica tema 2. muestreo parte 2
PPT
Ciclo de vida del emprendedor
PDF
Interes simple (1)
DOCX
Ejercicios sobre muestreo
PDF
Señales y sistemas
PDF
Boletin 4 intervalos y contrastes
PPT
Minimos Cuadrados
DOCX
Anualidades vencidas anualidades anticipadas.
PPTX
Cuartiles deciles y percentiles
PDF
AUDITORIA FINANCIERA
PDF
Tabla fisher
PDF
T studentdoscolas
PDF
Formulas de anualidades: Matemáticas Financieras
PDF
Distrib.binomial
PDF
39603951 aseveraciones-de-auditoria
PDF
Econometria 2a ed (2000) alfonso novales - mcgraw-hill (1)
DOCX
Diagrama de bode
PDF
Ejercicios resueltos
Diagrama de flujo de caja
Medidas de Tendencia Central, Medidas de Dispersión, Histograma y la campana ...
Estadistica tema 2. muestreo parte 2
Ciclo de vida del emprendedor
Interes simple (1)
Ejercicios sobre muestreo
Señales y sistemas
Boletin 4 intervalos y contrastes
Minimos Cuadrados
Anualidades vencidas anualidades anticipadas.
Cuartiles deciles y percentiles
AUDITORIA FINANCIERA
Tabla fisher
T studentdoscolas
Formulas de anualidades: Matemáticas Financieras
Distrib.binomial
39603951 aseveraciones-de-auditoria
Econometria 2a ed (2000) alfonso novales - mcgraw-hill (1)
Diagrama de bode
Ejercicios resueltos
Publicidad

Destacado (8)

PPT
gpc eda presentación bogota
PPTX
Bioestadística ANOVA 1, TUKEY,ENDODONCIA
PPTX
Significancia estadistica – relevancia clinica
PPTX
Diseño Experimental
PDF
Gpc 08complet eda diarrea
PPTX
ANOVA Prueba de tukey
PPTX
Prueba de tukey
PPTX
Conceptos de diseño experimental
gpc eda presentación bogota
Bioestadística ANOVA 1, TUKEY,ENDODONCIA
Significancia estadistica – relevancia clinica
Diseño Experimental
Gpc 08complet eda diarrea
ANOVA Prueba de tukey
Prueba de tukey
Conceptos de diseño experimental
Publicidad

Similar a EDA (20)

PDF
Biometria clase 1_2a
PDF
Biometria clase 3
PDF
Biometria clase 3
PPT
Estadistica
PPT
Esta Di Stica Descriptiva
PPT
Esta di stica descriptiva
PPT
Esta Di Stica Descriptiva
PPT
Estadística Descriptiva
PPT
Estadistica descriptiva
PPT
BioestadíStica Y EpidemiologíA
RTF
Practica de laboratorio de fisica "incetidumbres#
PDF
Clase2
PDF
Asimetra
PDF
Introduccion a la estadística_parte2.pdf
ODP
Estadisticamandu2
PPTX
Present 3 graficos_medidas_tendencia_central-upg
PPTX
Power point presentacion, medidas tendenciales 456
PPTX
Medidas de tendencia central
PPT
Ucn Fundamentos De Estadadistica
PDF
Universidad fermin toro
Biometria clase 1_2a
Biometria clase 3
Biometria clase 3
Estadistica
Esta Di Stica Descriptiva
Esta di stica descriptiva
Esta Di Stica Descriptiva
Estadística Descriptiva
Estadistica descriptiva
BioestadíStica Y EpidemiologíA
Practica de laboratorio de fisica "incetidumbres#
Clase2
Asimetra
Introduccion a la estadística_parte2.pdf
Estadisticamandu2
Present 3 graficos_medidas_tendencia_central-upg
Power point presentacion, medidas tendenciales 456
Medidas de tendencia central
Ucn Fundamentos De Estadadistica
Universidad fermin toro

Más de Moises Betancort (18)

PDF
Carta a los padres y madres
PPT
Probabilidad 1
PPT
Probabilidad 3
PPT
Probabilidad 2
PDF
Diseños de investigacion en logopedia mb
PDF
Manova mb
PDF
Discriminante mb
PDF
Modelos mixed
PPT
AF Master Educacion
PPTX
PPTX
PPTX
PPTX
Introduccion al SPSS
PPTX
Tema 2 Organización de los datos
PPTX
Tema 3 Medidas De Tendencia Central
PPTX
Tema 3 Medidas De Dispersión
PPTX
Tema 3 Medidas De Posición
PPTX
Tema 1 Conceptos Basicos
Carta a los padres y madres
Probabilidad 1
Probabilidad 3
Probabilidad 2
Diseños de investigacion en logopedia mb
Manova mb
Discriminante mb
Modelos mixed
AF Master Educacion
Introduccion al SPSS
Tema 2 Organización de los datos
Tema 3 Medidas De Tendencia Central
Tema 3 Medidas De Dispersión
Tema 3 Medidas De Posición
Tema 1 Conceptos Basicos

Último (20)

PDF
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE.pdf
PDF
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE_COM.pdf
PDF
Texto Digital Los Miserables - Victor Hugo Ccesa007.pdf
PDF
Introduccion a la Investigacion Cualitativa FLICK Ccesa007.pdf
DOCX
PLAN DE AREA DE CIENCIAS SOCIALES TODOS LOS GRUPOS
PDF
Como usar el Cerebro en las Aulas SG2 NARCEA Ccesa007.pdf
PDF
Esc. Sab. Lección 7. El pan y el agua de vida.pdf
PDF
Iniciación Al Aprendizaje Basado En Proyectos ABP Ccesa007.pdf
PDF
Aqui No Hay Reglas Hastings-Meyer Ccesa007.pdf
PPTX
LAS MIGRACIONES E INVASIONES Y EL INICIO EDAD MEDIA
PDF
Tomo 1 de biologia gratis ultra plusenmas
DOC
4°_GRADO_-_SESIONES_DEL_11_AL_15_DE_AGOSTO.doc
PDF
La Inteligencia Emocional - Fabian Goleman TE4 Ccesa007.pdf
PDF
ACERTIJO EL CONJURO DEL CAZAFANTASMAS MATEMÁTICO. Por JAVIER SOLIS NOYOLA
PDF
Escuelas Desarmando una mirada subjetiva a la educación
PDF
RM2025 - FUNDAMENTOS TEÓRICOS - PEDIATRÍA.pdf
PDF
La Formacion Universitaria en Nuevos Escenarios Ccesa007.pdf
DOCX
PLAN DE CASTELLANO 2021 actualizado a la normativa
PDF
Mi Primer Millon - Poissant - Godefroy Ccesa007.pdf
PDF
Los10 Mandamientos de la Actitud Mental Positiva Ccesa007.pdf
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE.pdf
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE_COM.pdf
Texto Digital Los Miserables - Victor Hugo Ccesa007.pdf
Introduccion a la Investigacion Cualitativa FLICK Ccesa007.pdf
PLAN DE AREA DE CIENCIAS SOCIALES TODOS LOS GRUPOS
Como usar el Cerebro en las Aulas SG2 NARCEA Ccesa007.pdf
Esc. Sab. Lección 7. El pan y el agua de vida.pdf
Iniciación Al Aprendizaje Basado En Proyectos ABP Ccesa007.pdf
Aqui No Hay Reglas Hastings-Meyer Ccesa007.pdf
LAS MIGRACIONES E INVASIONES Y EL INICIO EDAD MEDIA
Tomo 1 de biologia gratis ultra plusenmas
4°_GRADO_-_SESIONES_DEL_11_AL_15_DE_AGOSTO.doc
La Inteligencia Emocional - Fabian Goleman TE4 Ccesa007.pdf
ACERTIJO EL CONJURO DEL CAZAFANTASMAS MATEMÁTICO. Por JAVIER SOLIS NOYOLA
Escuelas Desarmando una mirada subjetiva a la educación
RM2025 - FUNDAMENTOS TEÓRICOS - PEDIATRÍA.pdf
La Formacion Universitaria en Nuevos Escenarios Ccesa007.pdf
PLAN DE CASTELLANO 2021 actualizado a la normativa
Mi Primer Millon - Poissant - Godefroy Ccesa007.pdf
Los10 Mandamientos de la Actitud Mental Positiva Ccesa007.pdf

EDA

  • 1. Explorando Datos Multivariados1POP Psicología de la Educación
  • 2. Estructura y Representación de los Datos MultivariadosGráficos de distribución de los datosDatos perdidos y/o extremos 2.1. Medias Restringidas 2.2. Medias Semirestringidas2
  • 3. Estructura y Representación de los DatosObservar los datos gráficamente nos permite ver cómo se distribuyen, si se cumplen los criterios para la aplicación de una determinada prueba paramétrica.. Etc… Una vez obtenidos los datos. Observarlos graficándolos de distintas maneras.Observar los datos nos permite ahorrar tiempo en los análisis paramétricos. Seleccionando la prueba adecuada.3
  • 4. Estructura y Representación de los DatosTipos de gráficos:Histograma de Frecuencia:Nos permite intuir la distribución de probabilidad de los datos, normalidad, simetría, etc.Diagrama de Tallos y HojasÚtil para muestra de datos pequeñas. Nos da la información del histograma pero observando los valores de la variable.Cajas y bigotesPermite estudiar la simetría de los datos, y detectar valore atípicos.Gráfico de Normalidad P-PNos permite comprobar si unos datos se ajustan a la distribución normal.Gráfico de dispersiónUtilizados para ver la distribución conjunta de dos variables o más.4
  • 6. OutliersSe define como aquel valor que está entre 1,5 y 3 IQR (amplitud intercuartílica P75-P25Como inspeccionamos los outliers:Haciendo un gráfico de cajas y bigotes (boxplot)Observando los datos tipificados de la variable (puntuaciones-z) sentencia RANK (p.e. RANK ci / NORMAL)Una vez identificados los outliers ¿Qué hacemos con ellos?Quitar el casoCambiar el dato (p.e. media grupo, media condición, media sujeto, etc.)Transformación de los datos (esto se hace en cualquier caso cuando la distribución de los datos es asimétrica)6
  • 7. OutliersTipos de transformaciones…Tranformaciones logaritmicas (Log (Xi)). En este caso hay que tener en cuenta que si los datos están muy próximos a cero o son negativos hay que previamente transformarlos sumando una constante. Tranformación con la raíz cuadradaTranformación recíproca (1/Xi). En este caso los valores altos se convertirán en valores próximos a cero, y los valores bajos serán los más altos. Lo que hacemos es utilizar la fórmula 1/Xmayor-Xi)Todas estas tranformaciones se utilizan para tranformar distribuciones asimétricas tanto positivas como negativas..Una familia de transformaciones especialmente útiles es la “escalera de potencias” de Tukey7
  • 8. Corrigen asimetría negativaCorrigen asimetría positivaOutliersEscalera de potencias de Tukey8
  • 9. OutliersSi la transformación falla, podemos reemplazar el dato… ¿cómo?por el valor más alto mas unoReemplazarlo por el valor que tiene en 3 desviaciones típicasUna variación del anterior es cambiar el valor por el que corresponde a 2 desviaciones típicasLo mejor es transformar los datos, en lugar de quitar o sustituir, cuando tenemos outliers. Si transformamos una variable porque su distribución es asimétrica, tenemos que hacer lo mismo con todas las demás. 9
  • 10. Ejemplo. Datos de TR de un participanteNo sólo que hay algunas puntuaciones atípicas a ambos lados, sino que hay una clara asimetría positiva.
  • 11. Ejemplo. Datos (transformados; raiz cuadrad) de TR de un participante (cont.)HEMOS EFECTUADO LA RAIZ PARA HACER MÁS SIMETRICA LA DISTRIBUCIÓN.No sólo que aún queda algo de asimetría positiva. Con el logaritmo, podremos reducir más la asimetría positiva, es lo que haremos ahora
  • 12. Ejemplo. Datos (transformados; logaritmo) de TR de un participante (cont.)Nota: Si algún valor fuera 0, emplear log(1+x)En este caso no sólo que la asimetría positiva ha desaparecido (si acaso hay cierta asimetría negativa causada por unas pocas puntuaciones atípicas).
  • 13. Ejemplo. Datos (transformados; cuadrado) de TR de un participante (cont.)Nota: Emplear el cuadrado no se debe hacer para corregir la asimetría positiva...sólo la negativa! Lo que hemos hecho es aumentar la asimetría positiva y eso no es lo que queríamos...(y si empleamos el cubo, aún peor para nuestros fines).
  • 14. Transformación de VariablesEsta familia de transformaciones (“escalera de Tukey”) tiene importantes propiedades:Preservan el orden de los valores; es decir, los valores mayores de la escala original seguirán siendo los valores mayores en la escala transformada.2. Modifican la distancia entre los valores. Con potencias p<1 (raíz x o log x) se comprimen los datos en la parte superior de la distribución en relación a los valores menores; Con potencias p>1 (como el cuadrado de x) se tiene el efecto contrario.3. El efecto sobre la forma de la distribución cambia sistemáticamente con p. Si raíz x hace menos pronunciada la asimetría positiva de una distribución, el log x provocará que la distribución resultante sea aún menos asimétrica positiva (en relación a raíz x).14
  • 15. Transformación de VariablesEn definitiva, las transformaciones de potencia pueden hacer que la variable transformada tenga menos asimetría. ¿Por qué es eso importante?– Las distribuciones que muestran una clara asimetría son difíciles de estudiar. – Los valores originales aparentemente atípicos se encontrarán más cercanos al grueso de los datos.– Los métodos estadísticos suelen emplear la media aritmética; pero la media de una distribución asimétrica no es un buen índice del grueso de los datos.15
  • 16. Estructura y Representación de los DatosEstadísticos (Estimadores) robustos (ESTADÍSTICA INFERENCIAL): Son aquellos estadísticos (estimadores) que funcionan bien para varios tipos distintos de distribuciones teóricas, aunque pueden no ser el mejor estimador para ningún tipo concreto de distribución. Es decir, son el “mejor compromiso”.La media no es un estimador robusto.La mediana es un estimador más robusto que la media, si bien hay otros estimadores más robustos que veremos en el punto siguiente del temario.16
  • 17. Medidas robustas de tendencia central1. Medias RecortadasConsiste en calcular la media aritmética sobre un subconjunto central del conjunto de datos, no considerándose una determinada proporción p por cada extremo. (p se expresa normalmente como porcentaje).Por ejemplo, una media recortada al 40% en una secuencia de 10 datos implica no tener en cuenta ni los 4 valores menores ni los 4 valores mayores.Observar que la media recortada al 0% es la media aritmética.A la media recortada al 25% se la denomina centrimedia.17
  • 18. Medidas robustas de tendencia central1. Medias Recortadas (cont)Calculamos la media recortada al 10% de los siguientes datos:3, 4, 4, 5, 5, 6, 7, 8, 9, 11El valor es 6Calcula la centrimediaEl valor es 5.818
  • 19. Medidas robustas de tendencia central2. Media WinsorizadaEs análogo a las medias recortadas excepto en que las puntuaciones eliminadas, ya no lo son sino que se sustituyen por los valores menor y mayor que quedan para el cómputo de la media winsorizada.Así, en la media recortada a nivel 2 implicaría eliminar las dos puntuaciones mayores y las 2 menores:3, 4, 4, 5, 5, 6, 7, 8, 9, 11Y quedan los datos: 4, 5, 5, 6, 7, 8 y se calcula la media de los mismosEn la media winsorizada, los datos 3 y 4 (los dos menores) y el 9 y 11 (los dos mayores) se sustituyen por 4 y 8 respectivamente. Es decir,4, 4, 4, 5, 5, 6, 7, 8, 8, 8 y se calcula la media de los mismos, que será la media winsorizada a nivel 2 (debe de dar 5.9)19
  • 20. Medidas robustas de tendencia central3. Otros tipos de media en la que se recortan datosEn muchas ocasiones lo que se hace es emplear un valor mínimo y uno máximo más allá del cual se eliminan los datos que sobrepasen tales valores.Por ejemplo, en experimentos de tiempo de reacción para discriminar palabras/pseudopalabras se pueden eliminar datos menores de 200 ms y mayores de 1500 ms. (Menos de 200 ms es demasiado rápido; más de 1500 ms es demasiado lento.)De esta manera, si todos los datos están en el rango 200-1500 ms no se elimina ningún dato20
  • 21. Medidas robustas de tendencia central4. TrimediaEs un índice de tendencia central que consiste en calcular una media aritmética ponderada de tres medidas, la Mediana (con peso doble) y el primer y tercer cuartil.Pensemos que en un conjunto de datos, el primer cuartil es 51, la mediana es 55 y el tercer cuartil es 63. La trimedia es:21
  • 22. Medidas robustas de tendencia central5. Otras medidas robustasEl estimador-M de Huber, el estimador biponderado de Tukey, el estimador M-redescendente de Hampel y el estimador en onda de Andrew. Estos estimadores se diferencian entre sí por el tipo de ponderación aplicada sobre los datos.Por ejemplo, en el Estimador-M de Huber (Estimador M de posición): Las puntuaciones típicas que sean menores que una constante, reciben un peso de 1. Los casos que tienen los mayores valores absolutos tienen pesos tanto más pequeños cuanto mayor es su distancia respecto a cero. La constante es 1.339. Cálculo: lo da el SPSS.22
  • 23. Sentencia ExploreNos permite obtener una serie de datos tanto numéricos como gráficos sobre nuestros datos. (hay otras sentencias para estudiar desde un punto de vista descriptivo los datos. ES BUENO PRACTICAR!!!)23