SlideShare una empresa de Scribd logo
@abxda
Big data lead colmex
¿Qué es Big Data?
@abxda
¿Qué es Big Data?
http://datascience.berkeley.edu/what-is-big-data/
@abxda
¿Qué es Big Data?
@abxda
¿Qué es Big Data?
@abxda
Según Gartner:
Big data is high-volume, high-velocity
and high-variety information assets
that demand cost-effective,
innovative forms of information
processing for enhanced insight and
decision making.
http://www.ft.com/intl/cms/e91a32d0-2bac-11e3-bfe2-00144feab7de.pdf @abxda
¿Qué es Big Data?
Diciembre 2004
Octubre 2003
@abxda
¿Qué es Big Data?
2006
> 100,000 Artículos
2007
@abxda
Hadoop (2006 - 2008)
@abxda
Hadoop (2006 - 2008)
@abxda
¿Qué es Big Data? (2009 – 2016…)
@abxda
Matei Zaharia Ion Stoica
(2009 – 2016…)
@abxda
(2013)
@abxda
Big Data en las Oficinas Nacionales de
Estadística
http://www1.unece.org/stat/platform/download/attachments/58492100/Big+Data+HLG+Final.docx?version=1&modificationDate=1362939424184
Comisión Económica de las Naciones Unidas para Europa
@abxda
• It is clear that during the next two years there is
a need to identify a few pilot projects that will
serve as proof of concept.
• Statistical organisations are, therefore,
encouraged to address formally Big data issues
in their annual and multi-annual work
programmes by undertaking research and pilot
projects in selected areas and by allocating
appropriate resources for that purpose.
Big Data en las Oficinas Nacionales de
Estadística
@abxda
• 'new' exploration and analysis methods are
required: Visualization methods, Text mining, and
High Performance Computing.
• To use Big data, statisticians are needed with a
different mind-set and new skills. The
processing of more and more data for official
statistics requires statistically aware people with an
analytical mind-set, an affinity for IT (e.g.
programming skills)
Big Data en las Oficinas Nacionales de
Estadística
@abxda
@abxda
Experto en
computación y
desarrollo
avanzados
(Big Data)
Experto en
Modelado
Estadístico
Experto en
el dominio de
datos
Unicornio
Zona
peligrosa!
Investigación
tradicional
Machine
learning
CIENCIA
DE
DATOS
http://www.anlytcs.com/2014/01/data-science-venn-diagram-v20.html
@abxda
Equipo Big Data
• Expertos en el Dominio de los Datos, Especialistas en el área de
interés.(Economistas, Expertos en percepción remota, Psiquiatras,
etc…)
• Científicos de Datos, expertos en integracion de soluciones Big
Data (MapReduce, Scala, Machine Learning, Spark, R, Estadística).
• Estadisticos, expertos en modelado estadistico, enfoque en
aprendizaje estadístico (R).
• Desarrolladores de Software, expertos en desarrollo de software
(JavaScript, Arquitecturas de Software, Patrones de Diseño, Api’s
REST).
• Diseñadores Gráficos, expertos en presentación de información
(HTML5, CSS3, JavaScript, Twitter Bootstrap).
• Administradores de Sistemas, expertos en arquitecturas de
computo, infraestructura. Desde redes a clusters de computadoras
(Linux).
#sgvirtual
@abxda
Internet de las cosas
Internet de las personas
Internet de las ideas
Internet del todo
Datos
Crudos
hdfs://
Información
(Significado)
Tomar
Decisiones
Actuar
¿quién?
¿cuántos?
¿por qué?
¿qué?¿Dónde?
Análisis de Datos
Estadística Machine Learning
Estratificaciones
Análisis de Regresión
Muestreo
Mucho más…
Análisis de Redes (Grafos)
Minería de Datos
Volumen
Ciencia de Datos
(Transforma/Modela)
Cómputo Distribuido y Paralelo
Arquitectura
Big Data/Ciencia de Datos
@abxda
%Acceso a Internet, %Pc, %Telefono Celular, %Automovil
En la misma Pc de 4 Procesadores:
(2013)
Software Tiempo Manzanas
Big Data
(Spark)
8 Seg. 1’221,18
0
Tradicional
(R)
8 Seg. 2,666
https://spark.apache.org/
2013
@abxda
Twitter como fuente de Big Data (Primer
Proyecto Piloto)
Para medir el pulso emotivo de México
…y mucho más …
@abxda
Hydra
Octubre 2013
INEGI
@abxda
Visualización de la Base de Datos
200 Millones de Tuits
400 Gb
800 Mb Diarios
@abxda
Visualización de la Base de Datos
~100 Millones de Tuits
@abxda
Frecuencia de Tuiteo
# Tuits
Frecuencia por hora del día
~1,000,000 Tuiteros generaron
~ 100 Millones de Tuits
Movilidad de los Tuiteros
4’469,550 de desplazamientos inter-municipales
347,157 Tuiteros
@abxda
Equipo de Trabajo
Y el apoyo de:
Y en la parte de visualización:
@abxda
@abxda
DENUE & Twitter
@abxda
DENUE & Twitter
@abxda
DENUE & Twitter
@abxda
Horarios de Tuiteo cerca de algún sector
@abxda
4.9 M de Polígonos de Voronoi (DENUE)
@abxda
Big Spatial Join
(4.9 M DENUE +60 M Tweets)
@abxda
SpatialSpark (Nov. 2015)
@abxda
SpatialSpark: Open Source
@abxda
DENUE - Twitter
@abxda
Siguientes Pasos
• Colaboraciones Internacionales con ONU, para
explorar el uso de Big Data en el calculo de los
Indicadores de Desarrollo Sostenible.
• Ampliar los trabajos a mas Fuentes de Big Data:
Datos de Telefonía Móvil, Imágenes de Satélite, etc.
• Salud Mental en Adolescentes con Data2x y
Instituto Nacional de Psiquiatría
• Producto del Ánimo Tuitero en Tiempo Real
@abxda
Preguntas
@abxda
abel.coronado@inegi.org.mx
@abxda

Más contenido relacionado

PPTX
Taller de Big Data y Ciencia de Datos en COLMEX dia 1
PPTX
Explorando Big Data y Ciencia de Datos con GPUs
PPTX
Big data taller inegi sedesol
PPTX
PPTX
Big data big opportunities
PPTX
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
PPTX
Realidades y Sueños de Big Data en México
PPTX
¿Qué es big data?
Taller de Big Data y Ciencia de Datos en COLMEX dia 1
Explorando Big Data y Ciencia de Datos con GPUs
Big data taller inegi sedesol
Big data big opportunities
Ejemplos de Proyectos de Ciencia de Datos y Big Data en el INEGI
Realidades y Sueños de Big Data en México
¿Qué es big data?

La actualidad más candente (20)

PPTX
Catedra INEGI Big Data en IBERO
PPTX
Revelando los secretos de las redes sociales
PPTX
Taller de Big Data y Ciencia de Datos en COLMEX dia 2
PPTX
Geo Big Data 4 Datalab
PPTX
Revelando los secretos de twitter, Festival de Software Libre 2014
PPTX
Que es big data huejutla uaeh
PDF
Introducción al BigData con Hadoop
PDF
Machine learning usando Weka, en un entorno de cómputo distribuido
PDF
Introducción al Big Data
PPTX
Big data y la inteligencia de negocios
PPTX
GAB2018 Barcelona: Tooling de Azure para nuestros proyectos de data science
PDF
201807 gobcan jordanas datos abiertos
PDF
Datlas HackMTY - Choques y siniestros Agosto 2020
PPTX
Big data
PPTX
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
PPS
Big data
PDF
Expert Day 2013 - Trabaja al tope con tus datos BIG DATA
PDF
Big Data, Big Customer Value, Big Results
PDF
2016 ULL Cabildo KEEDIO - BigData
PDF
2016 ULL Cabildo KEEDIO - Como se empieza
Catedra INEGI Big Data en IBERO
Revelando los secretos de las redes sociales
Taller de Big Data y Ciencia de Datos en COLMEX dia 2
Geo Big Data 4 Datalab
Revelando los secretos de twitter, Festival de Software Libre 2014
Que es big data huejutla uaeh
Introducción al BigData con Hadoop
Machine learning usando Weka, en un entorno de cómputo distribuido
Introducción al Big Data
Big data y la inteligencia de negocios
GAB2018 Barcelona: Tooling de Azure para nuestros proyectos de data science
201807 gobcan jordanas datos abiertos
Datlas HackMTY - Choques y siniestros Agosto 2020
Big data
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Big data
Expert Day 2013 - Trabaja al tope con tus datos BIG DATA
Big Data, Big Customer Value, Big Results
2016 ULL Cabildo KEEDIO - BigData
2016 ULL Cabildo KEEDIO - Como se empieza
Publicidad

Destacado (8)

PPTX
Anatomía de un proyecto de Big Data
DOC
Robotica aplicada a la medicina
PPTX
INEGI ESS big data workshop
PPTX
Revelando los secretos de twitter en México sg virtual
PPTX
Revelando los secretos de las redes sociales, Universidad Autónoma de Aguasca...
PPTX
PresentacionParaINFOTEC
PPTX
Big Data, Revelando los secretos de twitter, CIMAT Zacatecas 2014
Anatomía de un proyecto de Big Data
Robotica aplicada a la medicina
INEGI ESS big data workshop
Revelando los secretos de twitter en México sg virtual
Revelando los secretos de las redes sociales, Universidad Autónoma de Aguasca...
PresentacionParaINFOTEC
Big Data, Revelando los secretos de twitter, CIMAT Zacatecas 2014
Publicidad

Similar a Big data lead colmex (20)

PDF
HIPI-III BIG DATA, ¿Qué es Big Data?,..
PDF
¿qué es el big data? (Habilidades digitales)
PDF
big data se refiere a conjuntos de datos extremadamente grandes .pdf
PDF
Presentación Big data analizado y bien informado
PPTX
Resumen del Microsoft Big Data Stack
PPTX
Que es el Big Data y sus orígenes y aplicaciones
PDF
Hablemos de Big data
PPTX
PPTX
PRESENTACION BIG DATA Y SU FUNCIONES.pptx
PPTX
BIG DATA .
PDF
Presentación Diapositivas Propuesta Proyecto Orgánico Marrón y Beige.pdf
PPTX
Introduccion a Big Data stack
PPTX
Trabajo de-big-data
PPT
Introduccion a la bigdata y su impacto en la sociedad
PDF
El big data
PPTX
PDF
BIG DATA - IESTP PISCO - VASQUEZ SOTO MARITZA.pdf
PDF
Big Data- Hipi 3, jessica medina barragan
PDF
Presentación Big Data...................
PPTX
¿Qué es el big data y para que sirve en el mundo?
HIPI-III BIG DATA, ¿Qué es Big Data?,..
¿qué es el big data? (Habilidades digitales)
big data se refiere a conjuntos de datos extremadamente grandes .pdf
Presentación Big data analizado y bien informado
Resumen del Microsoft Big Data Stack
Que es el Big Data y sus orígenes y aplicaciones
Hablemos de Big data
PRESENTACION BIG DATA Y SU FUNCIONES.pptx
BIG DATA .
Presentación Diapositivas Propuesta Proyecto Orgánico Marrón y Beige.pdf
Introduccion a Big Data stack
Trabajo de-big-data
Introduccion a la bigdata y su impacto en la sociedad
El big data
BIG DATA - IESTP PISCO - VASQUEZ SOTO MARITZA.pdf
Big Data- Hipi 3, jessica medina barragan
Presentación Big Data...................
¿Qué es el big data y para que sirve en el mundo?

Más de Abel Alejandro Coronado Iruegas (10)

PDF
Mobility Master Class.pdf
PPTX
Live UAEMex Cubo de Datos Geoespaciales de Mexico
PPTX
Cubo de datos uaemex
PPTX
Integrating eo with official statistics using machine learning in mexico geo ...
PPTX
Machine learning and Satellite Images
PPTX
El Cubo de Datos Geoespaciales de Mexico
PPTX
Cubo de Datos Geoespaciales de Mexico
PPTX
Congreso UAA 2018 Animo Tuitero 2 0
PPTX
Analisis del Sentimiento en el Estado de Animo de los Tuiteros en Mexico
Mobility Master Class.pdf
Live UAEMex Cubo de Datos Geoespaciales de Mexico
Cubo de datos uaemex
Integrating eo with official statistics using machine learning in mexico geo ...
Machine learning and Satellite Images
El Cubo de Datos Geoespaciales de Mexico
Cubo de Datos Geoespaciales de Mexico
Congreso UAA 2018 Animo Tuitero 2 0
Analisis del Sentimiento en el Estado de Animo de los Tuiteros en Mexico

Último (20)

PPTX
Propuesta BKP servidores con Acronis1.pptx
PPTX
Mecanismos-de-Propagacion de ondas electromagneticas
DOCX
TRABAJO GRUPAL (5) (1).docxsjjsjsksksksksk
PPTX
CLAASIFICACIÓN DE LOS ROBOTS POR UTILIDAD
PDF
MANUAL TECNOLOGÍA SER MINISTERIO EDUCACIÓN
PDF
Influencia-del-uso-de-redes-sociales.pdf
DOCX
Zarate Quispe Alex aldayir aplicaciones de internet .docx
PDF
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
PDF
PRESENTACIÓN GENERAL MIPIG - MODELO INTEGRADO DE PLANEACIÓN
PDF
capacitación de aire acondicionado Bgh r 410
PDF
TRABAJO DE TECNOLOGIA.pdf...........................
PDF
CyberOps Associate - Cisco Networking Academy
PDF
MANUAL de recursos humanos para ODOO.pdf
DOCX
Guía 5. Test de orientación Vocacional 2.docx
DOCX
TRABAJO GRUPAL (5) (1).docxsjsjskskksksksks
PDF
informe_fichas1y2_corregido.docx (2) (1).pdf
PPTX
Presentacion de Alba Curso Auditores Internos ISO 19011
PPTX
Historia Inteligencia Artificial Ana Romero.pptx
PPTX
historia_web de la creacion de un navegador_presentacion.pptx
PPTX
Sesion 1 de microsoft power point - Clase 1
Propuesta BKP servidores con Acronis1.pptx
Mecanismos-de-Propagacion de ondas electromagneticas
TRABAJO GRUPAL (5) (1).docxsjjsjsksksksksk
CLAASIFICACIÓN DE LOS ROBOTS POR UTILIDAD
MANUAL TECNOLOGÍA SER MINISTERIO EDUCACIÓN
Influencia-del-uso-de-redes-sociales.pdf
Zarate Quispe Alex aldayir aplicaciones de internet .docx
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
PRESENTACIÓN GENERAL MIPIG - MODELO INTEGRADO DE PLANEACIÓN
capacitación de aire acondicionado Bgh r 410
TRABAJO DE TECNOLOGIA.pdf...........................
CyberOps Associate - Cisco Networking Academy
MANUAL de recursos humanos para ODOO.pdf
Guía 5. Test de orientación Vocacional 2.docx
TRABAJO GRUPAL (5) (1).docxsjsjskskksksksks
informe_fichas1y2_corregido.docx (2) (1).pdf
Presentacion de Alba Curso Auditores Internos ISO 19011
Historia Inteligencia Artificial Ana Romero.pptx
historia_web de la creacion de un navegador_presentacion.pptx
Sesion 1 de microsoft power point - Clase 1

Big data lead colmex

  • 3. ¿Qué es Big Data? @abxda
  • 4. ¿Qué es Big Data? http://datascience.berkeley.edu/what-is-big-data/ @abxda
  • 5. ¿Qué es Big Data? @abxda
  • 6. ¿Qué es Big Data? @abxda
  • 7. Según Gartner: Big data is high-volume, high-velocity and high-variety information assets that demand cost-effective, innovative forms of information processing for enhanced insight and decision making. http://www.ft.com/intl/cms/e91a32d0-2bac-11e3-bfe2-00144feab7de.pdf @abxda
  • 8. ¿Qué es Big Data? Diciembre 2004 Octubre 2003 @abxda
  • 9. ¿Qué es Big Data? 2006 > 100,000 Artículos 2007 @abxda
  • 10. Hadoop (2006 - 2008) @abxda
  • 11. Hadoop (2006 - 2008) @abxda
  • 12. ¿Qué es Big Data? (2009 – 2016…) @abxda
  • 13. Matei Zaharia Ion Stoica (2009 – 2016…) @abxda
  • 15. Big Data en las Oficinas Nacionales de Estadística http://www1.unece.org/stat/platform/download/attachments/58492100/Big+Data+HLG+Final.docx?version=1&modificationDate=1362939424184 Comisión Económica de las Naciones Unidas para Europa @abxda
  • 16. • It is clear that during the next two years there is a need to identify a few pilot projects that will serve as proof of concept. • Statistical organisations are, therefore, encouraged to address formally Big data issues in their annual and multi-annual work programmes by undertaking research and pilot projects in selected areas and by allocating appropriate resources for that purpose. Big Data en las Oficinas Nacionales de Estadística @abxda
  • 17. • 'new' exploration and analysis methods are required: Visualization methods, Text mining, and High Performance Computing. • To use Big data, statisticians are needed with a different mind-set and new skills. The processing of more and more data for official statistics requires statistically aware people with an analytical mind-set, an affinity for IT (e.g. programming skills) Big Data en las Oficinas Nacionales de Estadística @abxda
  • 19. Experto en computación y desarrollo avanzados (Big Data) Experto en Modelado Estadístico Experto en el dominio de datos Unicornio Zona peligrosa! Investigación tradicional Machine learning CIENCIA DE DATOS http://www.anlytcs.com/2014/01/data-science-venn-diagram-v20.html @abxda
  • 20. Equipo Big Data • Expertos en el Dominio de los Datos, Especialistas en el área de interés.(Economistas, Expertos en percepción remota, Psiquiatras, etc…) • Científicos de Datos, expertos en integracion de soluciones Big Data (MapReduce, Scala, Machine Learning, Spark, R, Estadística). • Estadisticos, expertos en modelado estadistico, enfoque en aprendizaje estadístico (R). • Desarrolladores de Software, expertos en desarrollo de software (JavaScript, Arquitecturas de Software, Patrones de Diseño, Api’s REST). • Diseñadores Gráficos, expertos en presentación de información (HTML5, CSS3, JavaScript, Twitter Bootstrap). • Administradores de Sistemas, expertos en arquitecturas de computo, infraestructura. Desde redes a clusters de computadoras (Linux). #sgvirtual @abxda
  • 21. Internet de las cosas Internet de las personas Internet de las ideas Internet del todo Datos Crudos hdfs:// Información (Significado) Tomar Decisiones Actuar ¿quién? ¿cuántos? ¿por qué? ¿qué?¿Dónde? Análisis de Datos Estadística Machine Learning Estratificaciones Análisis de Regresión Muestreo Mucho más… Análisis de Redes (Grafos) Minería de Datos Volumen Ciencia de Datos (Transforma/Modela) Cómputo Distribuido y Paralelo Arquitectura Big Data/Ciencia de Datos @abxda
  • 22. %Acceso a Internet, %Pc, %Telefono Celular, %Automovil En la misma Pc de 4 Procesadores: (2013) Software Tiempo Manzanas Big Data (Spark) 8 Seg. 1’221,18 0 Tradicional (R) 8 Seg. 2,666 https://spark.apache.org/ 2013 @abxda
  • 23. Twitter como fuente de Big Data (Primer Proyecto Piloto) Para medir el pulso emotivo de México …y mucho más … @abxda
  • 25. Visualización de la Base de Datos 200 Millones de Tuits 400 Gb 800 Mb Diarios @abxda
  • 26. Visualización de la Base de Datos ~100 Millones de Tuits @abxda
  • 27. Frecuencia de Tuiteo # Tuits Frecuencia por hora del día ~1,000,000 Tuiteros generaron ~ 100 Millones de Tuits
  • 28. Movilidad de los Tuiteros 4’469,550 de desplazamientos inter-municipales 347,157 Tuiteros @abxda
  • 29. Equipo de Trabajo Y el apoyo de: Y en la parte de visualización: @abxda
  • 34. Horarios de Tuiteo cerca de algún sector @abxda
  • 35. 4.9 M de Polígonos de Voronoi (DENUE) @abxda
  • 36. Big Spatial Join (4.9 M DENUE +60 M Tweets) @abxda
  • 40. Siguientes Pasos • Colaboraciones Internacionales con ONU, para explorar el uso de Big Data en el calculo de los Indicadores de Desarrollo Sostenible. • Ampliar los trabajos a mas Fuentes de Big Data: Datos de Telefonía Móvil, Imágenes de Satélite, etc. • Salud Mental en Adolescentes con Data2x y Instituto Nacional de Psiquiatría • Producto del Ánimo Tuitero en Tiempo Real @abxda

Notas del editor

  • #4: Academia, Supercomputadoras, Ciencias Naturales, Aquí se proponen 2 ideas fundamentales de Big Data: que los algoritmos de procesamiento sean los que viajen (Computo Distribuido) y dividir los consuntos masivos en pedazos mas pequeños (Sistemas de Archivos Distribuidos). Que las maquinas que tienen los datos los procesen en lugar de transferir los datos para procesarlos en otro lugar, data locality.
  • #6: Doug Laney
  • #9: Modelo de programación de uso masivo.