SlideShare una empresa de Scribd logo
Análisis exploratorio de datos
Tarea Seminario 6
Nieves Domínguez López
Grupo 13 Virgen del Rocío
Para comenzar, desde R- commander seleccionamos
cargar conjunto de datos, ya que el archivo está en
formato R
Se añade el archivo de activos en salud 2
El primer ejercicio es: seleccionar dos variables cualitativas-
factor del fichero “activossalud.RData”, describirlas en tablas
de frecuencias e interpretar al menos 3 aspectos en relación
a la distribución de las mismas.
Las variables a elegir serán:
 Dulces y edad
Para elegir las variables, seleccionamos “estadísticos”,
“resúmenes”, “distribución de frecuencias” y pasamos a
seleccionar la variable
Se presenta la variable “dulces”
De los datos, sacamos las siguientes conclusiones:
 El 85% de la muestra, la cual contiene 290
individuos, realiza la ingesta de dulces.
 El 14,48% de los individuos nunca comen dulces.
 El porcentaje más alto 31,72%, representa a los
individuos que comen dulces menos de una vez en
semana.
La siguiente variable es “edad”
Las conclusiones que podemos sacar de esta variable:
 Nuestra muestra contiene a 289 individuos.
 Destaca que el 38,41% de la población tenga 18
años, por lo que son 111 personas.
 Más de 25 años lo tienen pocos individuos
exactamente 10,03% de la muestra, 29 individuos.
El segundo ejercicio consiste en: seleccionar dos
variables numéricas del fichero y mediante resúmenes
numéricos decribir e interpretar la distribución de las mismas.
Las variables elegidas son:
 Peso y comunicación familiar
Volvemos a repetir los pasos para la elección de otra variable:
“estadísticos”, “resúmenes”, “resúmenes numéricos” y elección
de la variable.
La primera variable “peso”
Las conclusiones de la tabla de datos son:
 Esta variable tiene una media de 62.75571 y una
desviación típica de 12.65981. Esto dará lugar una gráfica
ancha y algo más dispersa.
 Hay 16 casos no disponibles por una razón cualquiera.
 La mediana es 60 y coincide con el 50% de los datos y
con el segundo cuartil (Q2).
 La media y la mediana presentan valores parecidos y muy
cercanos, por lo que la distribución es simétrica.
Se vuelve a repetir el procedimiento con la variable
“comunicacionfamiliar”
Las conclusiones del estudio de esta variable:
 Esta variable tiene una media de 7.829932 y una
desviación típica de 2.824487. La gráfica de esta variable
será más estrecha porque la desviación típica es menor.
 Hay 144 casos no disponibles debido a una razón
desconocida.
 La mediana posee un valor de 7 que coincide con Q2.
 La mediana y a media son parecidas por lo que la
distribución será simétrica.
Como último ejercicio: realizar al menos un gráfico de cada tipo
con variables adecuadamente seleccionadas del fichero,
describe e interpreta la distribución los mismos.
Encontraremos distintos gráficos:
 Gráficos de barras
 Gráfico de sectores
 Histogramas
 Diagrama de cajas
Gráficas de barras: variable cualitativa “embutidos”
Con esta gráfica podemos ver que
sigue en gran medida una
distribución normal.
Casi las mismas personas comen y
no comen embutidos, y la gran
Gráfico de sectores : variable cualitativa “fruta”
Se representa claramente en el
diagrama que la mayoría de la
gente come fruta a diario,
seguidamente le siguen las que
Histograma: variable cuantitativa “altura”
Se refleja que en la
muestra destacan
aquellas personas que
miden entre 1,60 y
1,65.
Muy pocas personas
Diagrama de cajas: variable cualitativa “peso”
En este diagrama se
observa como el rango
itercuartílico es
pequeño, la mediana
no se encuentra justo
en el centro, y los
valores extemos e
dispersan bastante de
los centrales.

Más contenido relacionado

PPTX
Presentacion seminario 6
PPTX
Seminario 6
ODP
Análisis exploratorio de datos R Commander
PDF
Presentación tarea seminario 6
PPTX
Seminario 6
PPT
PPTX
Seminario 6 estadística
PPTX
Seminario 6, tarea 1
Presentacion seminario 6
Seminario 6
Análisis exploratorio de datos R Commander
Presentación tarea seminario 6
Seminario 6
Seminario 6 estadística
Seminario 6, tarea 1

La actualidad más candente (20)

PPTX
Seminario 6, tarea 1
PPTX
Seminario 6
PPTX
Seminario 6
PPTX
Seminario 6, tarea 1
PPTX
PPTX
Estadistica descriptiva
PPTX
Análisis exploratorio de datos
PPTX
Seminario vi
PPTX
Seminario 6
PDF
Tarea seminario 6
PPTX
Trabajo seminario 6
PPTX
Tarea 5
PDF
Informe estadistica descriptiva
PDF
PPTX
DOCX
Tarea 6 del seminario de tics (word)
PPTX
Seminario 6, tarea 1
Seminario 6
Seminario 6
Seminario 6, tarea 1
Estadistica descriptiva
Análisis exploratorio de datos
Seminario vi
Seminario 6
Tarea seminario 6
Trabajo seminario 6
Tarea 5
Informe estadistica descriptiva
Tarea 6 del seminario de tics (word)
Publicidad

Destacado (8)

PPTX
Análisis exploratorio de datos
DOCX
ARTÍCULO 2
PPTX
Análisis exploratorio de datos
PDF
Seminario 6: Análisis exploratorio de datos, tablas de frecuencias, resúmenes...
PPTX
ANÁLISIS EXPLORATORIO DE DATOS
PPTX
Análisis exploratorio de datos
PPT
Power Point: Analisis Exploratorio de Datos
PPT
Analisis exploratorio de datos
Análisis exploratorio de datos
ARTÍCULO 2
Análisis exploratorio de datos
Seminario 6: Análisis exploratorio de datos, tablas de frecuencias, resúmenes...
ANÁLISIS EXPLORATORIO DE DATOS
Análisis exploratorio de datos
Power Point: Analisis Exploratorio de Datos
Analisis exploratorio de datos
Publicidad

Similar a Análisis exploratorio de datos (20)

PPTX
PPTX
Seminario 6
PPTX
Seminario 6
PDF
Informe de estadística descriptiva.
PPTX
Seminario 6 trabajo blog
DOCX
Seminario 6
PPTX
Ejercicio para el seminario 6
ODP
Seminario 6
PPTX
Seminario estadística 6 IRG
PPTX
Seminario estadística 6 IRG.
PPTX
Informe correspondiente a la estadística descriptiva
PPTX
PPTX
Estadistica 1
PPTX
Seminario 6: Análisis exploratorio de datos.
PDF
Presdatos
PPTX
Tarea 6
PPTX
Seminario 6
PPTX
Informe 1 análisis descrptivo univarante.( seminario 6)
RTF
Estadística Descriptiva
Seminario 6
Seminario 6
Informe de estadística descriptiva.
Seminario 6 trabajo blog
Seminario 6
Ejercicio para el seminario 6
Seminario 6
Seminario estadística 6 IRG
Seminario estadística 6 IRG.
Informe correspondiente a la estadística descriptiva
Estadistica 1
Seminario 6: Análisis exploratorio de datos.
Presdatos
Tarea 6
Seminario 6
Informe 1 análisis descrptivo univarante.( seminario 6)
Estadística Descriptiva

Más de Nieves Domínguez López (7)

PPTX
Pp caso envejecimiento semi
ODP
ODP
Análisis Bivariado de variables cuantitativas y cualitativas
ODP
Análisis Bivariado de variables cuantitativas y cualitativas
ODP
Análisis bivariado con variables cuantitativas
ODP
Actividad en R-commander
ODP
Artículo científico original
Pp caso envejecimiento semi
Análisis Bivariado de variables cuantitativas y cualitativas
Análisis Bivariado de variables cuantitativas y cualitativas
Análisis bivariado con variables cuantitativas
Actividad en R-commander
Artículo científico original

Último (15)

PPTX
Casa de Boyacá informe de actividades 2024
PDF
Estructura del Plan Estratégico Institucional del Ministerio Público de Perú_...
PDF
evaluacion de riesgos conceptos y herram
PPTX
Alta presión en productos de la carne de cerdo
PPTX
Proyectos de Inversión y sus requerimientos
PPTX
La-Problematica-de-la-Pobreza-a-Nivel-Mundial-Un-Desafio-Urgente.pptx
PDF
Las finanzas Bíblicas, dando un mejor resultado
PPTX
CONSOLIDADO DE AFECTACIONES POR LLUVIAS MAYO JUNIO 2025 BARINAS ACTUALIZADO.pptx
PPTX
Sectas Protestantes y la Iglesia que fundó Cristo
PPTX
NORMA 029 STPS INSTALACIONES ELECTRICAS.
PDF
La castidad nos hace libres para amar (Jovenes).pdf
PDF
HISTORIA DE LA ARQUITECTURA ANALIS DE CATEDRAL
PPTX
Teología 1 - Unidad 1. Introducción.pptx
PPTX
NOM 019 STPS Conformación de la comision mixta
PDF
2. Análisis Visión-Misión-Valores,OEI y PEND Ministerio Público.pdf
Casa de Boyacá informe de actividades 2024
Estructura del Plan Estratégico Institucional del Ministerio Público de Perú_...
evaluacion de riesgos conceptos y herram
Alta presión en productos de la carne de cerdo
Proyectos de Inversión y sus requerimientos
La-Problematica-de-la-Pobreza-a-Nivel-Mundial-Un-Desafio-Urgente.pptx
Las finanzas Bíblicas, dando un mejor resultado
CONSOLIDADO DE AFECTACIONES POR LLUVIAS MAYO JUNIO 2025 BARINAS ACTUALIZADO.pptx
Sectas Protestantes y la Iglesia que fundó Cristo
NORMA 029 STPS INSTALACIONES ELECTRICAS.
La castidad nos hace libres para amar (Jovenes).pdf
HISTORIA DE LA ARQUITECTURA ANALIS DE CATEDRAL
Teología 1 - Unidad 1. Introducción.pptx
NOM 019 STPS Conformación de la comision mixta
2. Análisis Visión-Misión-Valores,OEI y PEND Ministerio Público.pdf

Análisis exploratorio de datos

  • 1. Análisis exploratorio de datos Tarea Seminario 6 Nieves Domínguez López Grupo 13 Virgen del Rocío
  • 2. Para comenzar, desde R- commander seleccionamos cargar conjunto de datos, ya que el archivo está en formato R
  • 3. Se añade el archivo de activos en salud 2
  • 4. El primer ejercicio es: seleccionar dos variables cualitativas- factor del fichero “activossalud.RData”, describirlas en tablas de frecuencias e interpretar al menos 3 aspectos en relación a la distribución de las mismas. Las variables a elegir serán:  Dulces y edad
  • 5. Para elegir las variables, seleccionamos “estadísticos”, “resúmenes”, “distribución de frecuencias” y pasamos a seleccionar la variable
  • 6. Se presenta la variable “dulces”
  • 7. De los datos, sacamos las siguientes conclusiones:  El 85% de la muestra, la cual contiene 290 individuos, realiza la ingesta de dulces.  El 14,48% de los individuos nunca comen dulces.  El porcentaje más alto 31,72%, representa a los individuos que comen dulces menos de una vez en semana.
  • 8. La siguiente variable es “edad”
  • 9. Las conclusiones que podemos sacar de esta variable:  Nuestra muestra contiene a 289 individuos.  Destaca que el 38,41% de la población tenga 18 años, por lo que son 111 personas.  Más de 25 años lo tienen pocos individuos exactamente 10,03% de la muestra, 29 individuos.
  • 10. El segundo ejercicio consiste en: seleccionar dos variables numéricas del fichero y mediante resúmenes numéricos decribir e interpretar la distribución de las mismas. Las variables elegidas son:  Peso y comunicación familiar
  • 11. Volvemos a repetir los pasos para la elección de otra variable: “estadísticos”, “resúmenes”, “resúmenes numéricos” y elección de la variable.
  • 12. La primera variable “peso”
  • 13. Las conclusiones de la tabla de datos son:  Esta variable tiene una media de 62.75571 y una desviación típica de 12.65981. Esto dará lugar una gráfica ancha y algo más dispersa.  Hay 16 casos no disponibles por una razón cualquiera.  La mediana es 60 y coincide con el 50% de los datos y con el segundo cuartil (Q2).  La media y la mediana presentan valores parecidos y muy cercanos, por lo que la distribución es simétrica.
  • 14. Se vuelve a repetir el procedimiento con la variable “comunicacionfamiliar”
  • 15. Las conclusiones del estudio de esta variable:  Esta variable tiene una media de 7.829932 y una desviación típica de 2.824487. La gráfica de esta variable será más estrecha porque la desviación típica es menor.  Hay 144 casos no disponibles debido a una razón desconocida.  La mediana posee un valor de 7 que coincide con Q2.  La mediana y a media son parecidas por lo que la distribución será simétrica.
  • 16. Como último ejercicio: realizar al menos un gráfico de cada tipo con variables adecuadamente seleccionadas del fichero, describe e interpreta la distribución los mismos. Encontraremos distintos gráficos:  Gráficos de barras  Gráfico de sectores  Histogramas  Diagrama de cajas
  • 17. Gráficas de barras: variable cualitativa “embutidos” Con esta gráfica podemos ver que sigue en gran medida una distribución normal. Casi las mismas personas comen y no comen embutidos, y la gran
  • 18. Gráfico de sectores : variable cualitativa “fruta” Se representa claramente en el diagrama que la mayoría de la gente come fruta a diario, seguidamente le siguen las que
  • 19. Histograma: variable cuantitativa “altura” Se refleja que en la muestra destacan aquellas personas que miden entre 1,60 y 1,65. Muy pocas personas
  • 20. Diagrama de cajas: variable cualitativa “peso” En este diagrama se observa como el rango itercuartílico es pequeño, la mediana no se encuentra justo en el centro, y los valores extemos e dispersan bastante de los centrales.