ANÁLISIS EXPLORATORIO
DE DATOS
Nadia Aguilar Pérez
Grupo A Subgrupo 1
(Macarena)
EJERCICIO 1: SELECCIONA DOS VARIABLES
CUALITATIVAS- FACTOR DEL FICHERO
“ACTIVOSSALUD.RDATA”, DESCRÍBELAS EN TABLAS
DE FRECUENCIA E INTERPRETA AL MENOS 3
ASPECTOS EN RELACIÓN A SUS DISTRIBUCIONES.
PRIMER PASO:
En primer lugar, cargamos la base de datos que nos proporciona el ejercicio
en R. Una vez cargada la base de datos, seleccionamos dos variables
cualitativas: “botellón” y “combinados”
Las tablas de frecuencias que obtenemos de cada variable
son las siguientes:
INTERPRETACIÓN DE LAS TABLAS:
- Podemos observar que los porcentajes de personas que nunca han
consumido combinados y que nunca han asistido a un botellón, son
muy semejantes: un 15% nunca han consumido combinados y un
17’89% tampoco ha asistido nunca a un botellón.
- Por otro lado, y como dato destacable, podemos observar en las tablas
de frecuencias que mientras tan solo un 0’35% de los encuestados
consume combinados en el intervalo de 2 o 3 veces por semana, son
un 2’11% los que sí asisten a un botellón dentro del mismo intervalo.
- Además, son casi más de un 10% los encuestados que consumen
combinados en los fines de semana con respecto a aquellos que
asisten en dicho período de tiempo al botellón.
EJERCICIO 2: SELECCIONA DOS VARIABLES
NUMÉRICAS Y MEDIANTE RESÚMENES NUMÉRICOS
DESCRIBE E INTERPRETA SUS DISTRIBUCIONES
PRIMER PASO:
En este caso vamos a seleccionar dos variables cuantitativas: “peso” y
“horapracticadeportiva”.
Resultado:
INTERPRETACIÓN:
- La muestra total estudiada en las horas de práctica deportiva ha sido de
290, de los cuales 1 persona no ha querido contestar. Por otro lado, la
muestra estudiada en el peso ha sido de 275, de los cuales 16 no han
contestado tampoco.
- La media obtenida en la variable hora de práctica deportiva es de 2’48h,
mientras que la media obtenida en la variable peso es de 62’75kg.
- La desviación típica de las horas de práctica deportiva es 3’14, y la del
peso es 12’66. Esto nos indica que la primera variable se trata de una
muestra homogénea (valores poco dispersos), mientras que la segunda
variable es una muestra heterogénea (valores dispersos).
- Por último, los quartiles nos informan de los máximos y mínimos
obtenidos en las muestras. En el caso de las horas de práctica deportiva, el
máximo serían 16 horas de práctica deportiva y el mínimo serían 0 horas.
En el caso del peso, su máximo sería 130 kg y su mínimo 38 kg.
EJERCICIO 3: DEBES REALIZAR AL MENOS UN
GRÁFICO DE CADA TIPO CON VARIABLES
ADECUADAMENTE SELECCIONADAS DEL FICHERO
Y DESCRIBIR E INTERPRETAR SUS
DISTRIBUCIONES
PRIMER GRÁFICO: GRÁFICO DE
SECTORES
Seleccionamos una variable
dicotómica
‒> Gracias a este tipo de
gráfico, se nos hace más
fácil interpretar los
resultados obtenidos.
En este caso observamos
como el número de
mujeres de la muestra es
mucho mayor que el
número de varones.
SEGUNDO GRÁFICO: GRÁFICO DE
BARRAS
Este tipo de gráfico
resulta muy útil
para las variables
cualitativas
‒> Podemos observar aquí
que la mayoría de
individuos nunca ha
utilizado la marcha atrás
como método
anticonceptivo, mientras
muy pocos admiten
realizarlo siempre como
método usual.
Los que ocupan el escalón
más reducido son los
individuos que nunca han
tenido relaciones sexuales.
TERCER GRÁFICO: HISTOGRAMA DE
FRECUENCIAS
Seleccionamos la opción
de Porcentajes para que
se nos sea más fácil la
interpretación del gráfico
‒> Los valores más
concentrados se encuentran
entre 10 y 20 horas dedicadas
al mantenimiento del hogar.
A simple vista observamos que
este gráfico sigue una
distribución normal.
CUARTO GRÁFICO: DIAGRAMA DE
CAJAS (BOXPLOT)
Variable
cuantitativa
Datos que obtenemos del
diagrama de cajas:
- Valor máximo: 10
- (Casi) el 50% de los individuos
dedican entre 0 y 4’5 horas a
la práctica deportiva.
- Existen 5 valores atípicos:
155, 230, 155, 276, 273.

Más contenido relacionado

PPTX
PPTX
Seminario 6
PPTX
Seminario 6 estadística
PPTX
Seminario 6
PPTX
Sem6ej3
PPTX
PPTX
Seminario 6
PPTX
Seminario 6 tics
Seminario 6
Seminario 6 estadística
Seminario 6
Sem6ej3
Seminario 6
Seminario 6 tics

La actualidad más candente (20)

PPTX
Seminario 6
PPTX
Seminario 6 tics
PDF
Tarea 5: Estadística descriptiva
PPTX
PPTX
Trabajo seminario 6
PPTX
ANÁLISIS BIVARIADO DE DOS VARIABLES CUANTITATIVAS
PPTX
Sem6ej1
PPTX
Variables, tablas de frecuencia y gráficas
PPTX
Tarea 6
PPTX
Ejercicio practica t de student
ODP
Análisis exploratorio de datos
PDF
Analisis variables cuantitativas
PPTX
Seminario 6
PPTX
PPTX
Informe 1 análisis descrptivo univarante.( seminario 6)
PDF
Estadistica bivariada
PPTX
Seminario 5 continuacion con los graficos
PPTX
SEMINARIO 7
PPTX
Seminario 6
PPTX
Seminario 5
Seminario 6
Seminario 6 tics
Tarea 5: Estadística descriptiva
Trabajo seminario 6
ANÁLISIS BIVARIADO DE DOS VARIABLES CUANTITATIVAS
Sem6ej1
Variables, tablas de frecuencia y gráficas
Tarea 6
Ejercicio practica t de student
Análisis exploratorio de datos
Analisis variables cuantitativas
Seminario 6
Informe 1 análisis descrptivo univarante.( seminario 6)
Estadistica bivariada
Seminario 5 continuacion con los graficos
SEMINARIO 7
Seminario 6
Seminario 5
Publicidad

Destacado (15)

PPTX
Tarea seminario 3
PPTX
Tarea seminario 2
PPTX
Análisis bivariado con variables cuantitativas
PPTX
Análisis bivariado con variables cualitativas
PPTX
Calcular nuevas variables
PPTX
Análisis exploratorio de datos
DOCX
ARTÍCULO 2
PPTX
Análisis exploratorio de datos
PDF
Seminario 6: Análisis exploratorio de datos, tablas de frecuencias, resúmenes...
ODP
Análisis exploratorio de datos R Commander
PPTX
ANÁLISIS EXPLORATORIO DE DATOS
PPTX
Análisis exploratorio de datos
PPT
Power Point: Analisis Exploratorio de Datos
PPTX
NNNconsult. Elaborado por María José González Moreno (Dpto Enfermería, Univer...
PPT
Analisis exploratorio de datos
Tarea seminario 3
Tarea seminario 2
Análisis bivariado con variables cuantitativas
Análisis bivariado con variables cualitativas
Calcular nuevas variables
Análisis exploratorio de datos
ARTÍCULO 2
Análisis exploratorio de datos
Seminario 6: Análisis exploratorio de datos, tablas de frecuencias, resúmenes...
Análisis exploratorio de datos R Commander
ANÁLISIS EXPLORATORIO DE DATOS
Análisis exploratorio de datos
Power Point: Analisis Exploratorio de Datos
NNNconsult. Elaborado por María José González Moreno (Dpto Enfermería, Univer...
Analisis exploratorio de datos
Publicidad

Similar a Análisis exploratorio de datos (20)

PPTX
Seminario6
PPTX
Informe estadístico seminarios de estadística descriptiva realizado por alici...
PPTX
Informe estadístico seminarios de estadística descriptiva realizado
PPTX
Seminario 6: Análisis exploratorio de datos.
DOCX
Seminario 6
PPTX
Tarea 6
PPTX
Presentacion seminario 6
PPTX
Seminario 6
PPTX
Informe estadístico correspondiente a los seminarios de estadística descriptiva
DOCX
Tabla 1
ODP
Seminario 6
PPTX
PPTX
PDF
Seminario 6 estadistica
PPTX
Tarea 6
PPTX
Seminario 6
PPTX
Seminario 5
DOCX
Estadistica informe
PPTX
Seminario 6, tarea 1
Seminario6
Informe estadístico seminarios de estadística descriptiva realizado por alici...
Informe estadístico seminarios de estadística descriptiva realizado
Seminario 6: Análisis exploratorio de datos.
Seminario 6
Tarea 6
Presentacion seminario 6
Seminario 6
Informe estadístico correspondiente a los seminarios de estadística descriptiva
Tabla 1
Seminario 6
Seminario 6 estadistica
Tarea 6
Seminario 6
Seminario 5
Estadistica informe
Seminario 6, tarea 1

Último (20)

PDF
Presentación Enfermedad por Reflujo Gastroesofágico
PPTX
899250856-Valoracion-del-paciente-en-estado-critico.pptx
PDF
Camps, Victoria 2014 Manual de civismo.pdf
PPTX
Estrategia Sanitaria de Cáncer de Colon y Próstata
PPTX
Ciudades_sostenibles._Francia_v2_jul_2017.pptx
PPTX
INSTRUMENTACION Y MATERIAL QUIRÚRGICO ACTUAL
PPTX
transformacion de la proteccion civil.pptx
PPTX
TRABAJO PPT RUTH GONZALEZ ´´´jjjoooooo´´..pptx
PPTX
Manejo de la insuficiência cardíaca congestiva
PPTX
CARACTERISTICAS - ATENCION INTEGRAL.pptx
PPTX
TAQUIARRITMIAS EN EL PACIENTE PEDIATRICO
PPT
Taberna |Zzx\zz\zzx\zx\z\zx\xzx\x\x\2.ppt
PPTX
Tecidos do corpo humano - Introdução inicial
PDF
Signos y síntomas de paro cardiorespiratorio
PPTX
La intervención social y psicosocial.pptx
PDF
Primeros auxilios ante Mordeduras y picaduras
PPTX
solicitudde acciones responsables en el vivir
PPTX
Sistema Óseo del cuerpo humano 2025.pptx
PPTX
Trabajo ECICEP (1).pptxTrabajo ECICEP (1).pptx
PDF
Microbiologia_Medica_de_Murray_7ma_Edici.pdf
Presentación Enfermedad por Reflujo Gastroesofágico
899250856-Valoracion-del-paciente-en-estado-critico.pptx
Camps, Victoria 2014 Manual de civismo.pdf
Estrategia Sanitaria de Cáncer de Colon y Próstata
Ciudades_sostenibles._Francia_v2_jul_2017.pptx
INSTRUMENTACION Y MATERIAL QUIRÚRGICO ACTUAL
transformacion de la proteccion civil.pptx
TRABAJO PPT RUTH GONZALEZ ´´´jjjoooooo´´..pptx
Manejo de la insuficiência cardíaca congestiva
CARACTERISTICAS - ATENCION INTEGRAL.pptx
TAQUIARRITMIAS EN EL PACIENTE PEDIATRICO
Taberna |Zzx\zz\zzx\zx\z\zx\xzx\x\x\2.ppt
Tecidos do corpo humano - Introdução inicial
Signos y síntomas de paro cardiorespiratorio
La intervención social y psicosocial.pptx
Primeros auxilios ante Mordeduras y picaduras
solicitudde acciones responsables en el vivir
Sistema Óseo del cuerpo humano 2025.pptx
Trabajo ECICEP (1).pptxTrabajo ECICEP (1).pptx
Microbiologia_Medica_de_Murray_7ma_Edici.pdf

Análisis exploratorio de datos

  • 1. ANÁLISIS EXPLORATORIO DE DATOS Nadia Aguilar Pérez Grupo A Subgrupo 1 (Macarena)
  • 2. EJERCICIO 1: SELECCIONA DOS VARIABLES CUALITATIVAS- FACTOR DEL FICHERO “ACTIVOSSALUD.RDATA”, DESCRÍBELAS EN TABLAS DE FRECUENCIA E INTERPRETA AL MENOS 3 ASPECTOS EN RELACIÓN A SUS DISTRIBUCIONES.
  • 3. PRIMER PASO: En primer lugar, cargamos la base de datos que nos proporciona el ejercicio en R. Una vez cargada la base de datos, seleccionamos dos variables cualitativas: “botellón” y “combinados”
  • 4. Las tablas de frecuencias que obtenemos de cada variable son las siguientes:
  • 5. INTERPRETACIÓN DE LAS TABLAS: - Podemos observar que los porcentajes de personas que nunca han consumido combinados y que nunca han asistido a un botellón, son muy semejantes: un 15% nunca han consumido combinados y un 17’89% tampoco ha asistido nunca a un botellón. - Por otro lado, y como dato destacable, podemos observar en las tablas de frecuencias que mientras tan solo un 0’35% de los encuestados consume combinados en el intervalo de 2 o 3 veces por semana, son un 2’11% los que sí asisten a un botellón dentro del mismo intervalo. - Además, son casi más de un 10% los encuestados que consumen combinados en los fines de semana con respecto a aquellos que asisten en dicho período de tiempo al botellón.
  • 6. EJERCICIO 2: SELECCIONA DOS VARIABLES NUMÉRICAS Y MEDIANTE RESÚMENES NUMÉRICOS DESCRIBE E INTERPRETA SUS DISTRIBUCIONES
  • 7. PRIMER PASO: En este caso vamos a seleccionar dos variables cuantitativas: “peso” y “horapracticadeportiva”.
  • 9. INTERPRETACIÓN: - La muestra total estudiada en las horas de práctica deportiva ha sido de 290, de los cuales 1 persona no ha querido contestar. Por otro lado, la muestra estudiada en el peso ha sido de 275, de los cuales 16 no han contestado tampoco. - La media obtenida en la variable hora de práctica deportiva es de 2’48h, mientras que la media obtenida en la variable peso es de 62’75kg. - La desviación típica de las horas de práctica deportiva es 3’14, y la del peso es 12’66. Esto nos indica que la primera variable se trata de una muestra homogénea (valores poco dispersos), mientras que la segunda variable es una muestra heterogénea (valores dispersos). - Por último, los quartiles nos informan de los máximos y mínimos obtenidos en las muestras. En el caso de las horas de práctica deportiva, el máximo serían 16 horas de práctica deportiva y el mínimo serían 0 horas. En el caso del peso, su máximo sería 130 kg y su mínimo 38 kg.
  • 10. EJERCICIO 3: DEBES REALIZAR AL MENOS UN GRÁFICO DE CADA TIPO CON VARIABLES ADECUADAMENTE SELECCIONADAS DEL FICHERO Y DESCRIBIR E INTERPRETAR SUS DISTRIBUCIONES
  • 11. PRIMER GRÁFICO: GRÁFICO DE SECTORES Seleccionamos una variable dicotómica
  • 12. ‒> Gracias a este tipo de gráfico, se nos hace más fácil interpretar los resultados obtenidos. En este caso observamos como el número de mujeres de la muestra es mucho mayor que el número de varones.
  • 13. SEGUNDO GRÁFICO: GRÁFICO DE BARRAS Este tipo de gráfico resulta muy útil para las variables cualitativas
  • 14. ‒> Podemos observar aquí que la mayoría de individuos nunca ha utilizado la marcha atrás como método anticonceptivo, mientras muy pocos admiten realizarlo siempre como método usual. Los que ocupan el escalón más reducido son los individuos que nunca han tenido relaciones sexuales.
  • 15. TERCER GRÁFICO: HISTOGRAMA DE FRECUENCIAS Seleccionamos la opción de Porcentajes para que se nos sea más fácil la interpretación del gráfico
  • 16. ‒> Los valores más concentrados se encuentran entre 10 y 20 horas dedicadas al mantenimiento del hogar. A simple vista observamos que este gráfico sigue una distribución normal.
  • 17. CUARTO GRÁFICO: DIAGRAMA DE CAJAS (BOXPLOT) Variable cuantitativa
  • 18. Datos que obtenemos del diagrama de cajas: - Valor máximo: 10 - (Casi) el 50% de los individuos dedican entre 0 y 4’5 horas a la práctica deportiva. - Existen 5 valores atípicos: 155, 230, 155, 276, 273.