SlideShare una empresa de Scribd logo
1
Big Data
Cristian González García v 1.1.1 Noviembre 2015
Índice
 Introducción
 Componentes
 Bibliografía
2
Introducción
3
Introducción
 ¿Qué está cambiando en la gestión del
conocimiento?
 ¿Porqué son necesarias nuevas herramientas
de gestión del conocimiento?
 ¿Qué está ocurriendo?
4
Nuevas tecnologías
 Dispositivos inteligentes (Smartphones)
 La nube (Cloud Computing)
 Las redes sociales, micro blogs,…
 Big Data
 Open Data (Datos abiertos)
 The Internet of Things (IoT)
 Sensores
 Smart Cities
 Smart Homes
 Microcontroladores (Arduino)
 Microordenadores (RaspberryPi)
 IPv6 (Internet Protocol version 6)
 RFID (Radio Frecuency IDentification)
 NFC (Near Field Communication)
 Bluetooth
 QR Code (Quick Response Code)
5
Todo acaba en la nube
 Sistemas incrustados
 Redes de sensores
 Dispositivos móviles
 Redes sociales
 Open Data
 Big Data
 Trabajo
6
La nube …
 Es el almacén permanente de la
información
 Su escalabilidad permite adaptarse a la
gran cantidad de información generada
por los objetos y por los humanos
 Su alta disponibilidad da confianza y
fiabilidad
 Bajos costes de mantenimiento
 Es una de las piezas clave de la gestión del
conocimiento
7
La nube - Proveedores
9
La nube –
Ventajas
 Costes reducidos
 No hay mantenimiento
 Pagamos por lo que usamos
 Flexibilidad de productos
 Actualización constante del HW
 Almacenamiento “infinito” y escalable
 Capacidad de procesamiento “infinita” y
escalable
 Accesible desde cualquier sitio
11
La nube –
Inconvenientes
 La legislación
 Asignatura de Aspectos Éticos y Legales de la
Web (Darío)
 Pérdida de control
 Puede que no se adapte exactamente
 Necesidad de aprender a usar “su” servicio
 Tal vez, excesiva modularización
 Seguridad, BDD, plugins, …
 ¿Conexión a Internet?
 Casos de quiebra por uso incorrecto
12
Componentes
13
Estadísticas de datosTipo Cantidad Comentario
Internet [1] 40% de la población lo utiliza =
2.880 millones
Somos 7.200 millones de personas
en 2015
Internet [2] 20 Exabytes (10^18) 1 Exabyte = 1.000.000 terabytes
Páginas Web [3] +1 Billones (10^12)
Tweets [2] 20 Mil millones (10^9) 50 millones de usuarios
Posts [2] 2.1 Mil millones (10^9) Foros, discusiones, …
Miembros de redes sociales [2] 2.1 Mil millones (10^9) Miembros de 115 sitios
Creadores de contenido social
[2]
600 Millones(10^6) 33% de los usuarios de Internet
Miembros de Facebook [4] 1490 Millones(10^6) 2015
Youtube [5] +Mil millones Usuarios (10^9), +
100 Mil Millones de Horas de
Video/Diario
Blogs [2] 70 Millones (10^6)
Otras publicaciones [2] 10,000 Periódicos y otros
14
Redes Sociales
 Constituyen un gran almacén de información
generada por los humanos
 Hábitos, gustos, actividades, …
 Nuestra información personal… ¡Gratis! ¡O por
jugar!
 Son un buen complemento de la información
recogida por sensores y objetos inteligentes
 Muchas aplicaciones son una combinación de
redes sociales, objetos inteligentes y la nube
 Sistemas de recomendación de libros, juegos,…
 Sistemas de asistencia en tráfico, viajes,…
15
Sensores
 Constituyen un gran almacén de información
generada por el medio ambiente o nosotros
 Actividad, sucesos, …
 Información del mundo real
 Permiten conectar el mundo real con el mundo
virtual
 Son un buen complemento de la información
recogida de las redes sociales
 Muchas aplicaciones realizan acciones en base
a los sucesos en el mundo real
 Automatismos, juegos, seguridad, …
16
Big Data I – Las 3 V
 ¿Cómo analizamos esta avalancha de
datos?
 Con herramientas de Big Data
 Se pueden construir herramientas de gestión
del conocimiento en tiempo real
 Big Data son los grandes conjuntos de datos
que se caracterizan por
 Su volumen y cantidad
 Su velocidad de creación y utilización
 Su variedad de tipos de fuentes
 (La veracidad de los datos)
17
Big Data II - Componentes
18
Big Data III – Tipos de datos
19
Herramientas
 Hadoop
 http://hadoop.apache.org/
 Software Open Source
 Permite trabajar con grandes cantidades de datos
 Implementa MapReduce
 Computación paralela
 mongoDB
 http://www.mongodb.org/
 BBDD NoSQL
 Cassandra
 http://cassandra.apache.org/
 BBDD NoSQL
 Amazon Big Data
 http://aws.amazon.com/es/big-data/
 Microsoft Azure
 http://azure.microsoft.com
 Cloudera
 http://www.cloudera.com/content/cloudera/en/home.html
 Distribuciones de Hadoop y soporte
 R
 https://www.r-project.org/
 Herramienta matemática para análisis de datos y estadísticas
20
Datos I
 http://catalog.data.gov/dataset
21
Datos II
 http://www.datos.gov.co/frm/buscador/frm
BusquedaAvanzada.aspx
22
Bibliografía
23
Bibliografía
24
Referencias
25
1. https://en.wikipedia.org/wiki/Internet
2. Big Data Application Architecture Q&A
3. http://www.internetlivestats.com/total-
number-of-websites/
4. https://norfipc.com/redes-
sociales/mapa-redes-sitios-sociales-
internet-2015.php
5. https://www.youtube.com/yt/press/es/st
atistics.html
26
Big Data
Cristian González García v 1.1.1 Noviembre 2015

Más contenido relacionado

PDF
Presentación del meetup IoT & Big Data Sofia2 Lab
PPTX
Big data
PPS
Big data
PDF
Infografia big data
PPTX
Big data y la inteligencia de negocios
DOCX
Big data kelly valencia
PPTX
1 big data y redes sociales
PDF
#AmoSM2016 - Conferencia Social Big Data por Juan Carlos Mejía Llano
Presentación del meetup IoT & Big Data Sofia2 Lab
Big data
Big data
Infografia big data
Big data y la inteligencia de negocios
Big data kelly valencia
1 big data y redes sociales
#AmoSM2016 - Conferencia Social Big Data por Juan Carlos Mejía Llano

La actualidad más candente (20)

DOCX
PPTX
big data
PPTX
Iniciación al BiG Data - español
PDF
Hablemos de Big data
PPTX
Big data para principiantes
PPTX
Big Data para analizar las redes sociales
PDF
Big Data - Bruno Cendón - TST
DOCX
Big data intelligence business
PDF
Big Data para Dummies
PPSX
Nuevas tecnologias power point pptx
PDF
¿Qué es el Big Data?
PDF
Educación y datos masivos (Big Data)
PDF
Big Data y Redes Sociales: Ejemplos y casos de éxito
DOCX
PPTX
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
PPTX
DOCX
Big data
DOCX
PPTX
Tedencias tecnologicas para el 2015
PPTX
Big data de luis cipamocha 11 2
big data
Iniciación al BiG Data - español
Hablemos de Big data
Big data para principiantes
Big Data para analizar las redes sociales
Big Data - Bruno Cendón - TST
Big data intelligence business
Big Data para Dummies
Nuevas tecnologias power point pptx
¿Qué es el Big Data?
Educación y datos masivos (Big Data)
Big Data y Redes Sociales: Ejemplos y casos de éxito
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Big data
Tedencias tecnologicas para el 2015
Big data de luis cipamocha 11 2
Publicidad

Destacado (16)

PPTX
Colegio gonzalo arango estructuras
PDF
MODELLING ANALYSIS & DESIGN OF DSP BASED NOVEL SPEED SENSORLESS VECTOR CONTRO...
PDF
Sun august investor presentation
PDF
IASGCON 2016 Coimbatore October 6th - 9th 2016
PDF
PARAMETER OPTIMIZATION IN VERTICAL MACHINING CENTER CNC FOR EN45 (STEEL ALLOY...
DOCX
Douglas Gauld3
PDF
Antitrust analyis in mergers and aquisitions - What are the DOJ and FTC up to...
PPT
Basic Emotions
PPTX
Evaluation question 2
PPTX
PPTX
TALLER CON DOCENTES DE JERICO BOYACA
DOCX
Histori
PDF
tugas modul pembelajaran
PPT
Los sindicatos
PPTX
Molecular biology
 
PPT
Colegio gonzalo arango estructuras
MODELLING ANALYSIS & DESIGN OF DSP BASED NOVEL SPEED SENSORLESS VECTOR CONTRO...
Sun august investor presentation
IASGCON 2016 Coimbatore October 6th - 9th 2016
PARAMETER OPTIMIZATION IN VERTICAL MACHINING CENTER CNC FOR EN45 (STEEL ALLOY...
Douglas Gauld3
Antitrust analyis in mergers and aquisitions - What are the DOJ and FTC up to...
Basic Emotions
Evaluation question 2
TALLER CON DOCENTES DE JERICO BOYACA
Histori
tugas modul pembelajaran
Los sindicatos
Molecular biology
 
Publicidad

Similar a 1. Introducción Big Data (20)

PDF
Meta-modelos y lenguajes de dominio específico en Internet de las cosas
PPTX
El Internet de las Cosas y las Personas con Internet
PPTX
2016 cloud summit_iot
PDF
Introducción a arquitecturas y herramientas de Big Data.pdf
PDF
BIGDATA NUEVAS FUENTES DE INFORMACION TRABAJO
PDF
Introducción a arquitecturas y herramientas de Big Data.pdf
PDF
E book industria-4.0
PPTX
Tendencias en Big Data (2015-2016)
PDF
Semana de la Ciencia 2014 (Martínez-Prieto)
PDF
IT-NOVA Tendencias TI 2024 Memorias Webinar
PDF
Tendencias de movilidad en el mercado masivo y empresarial
PDF
Clase 19 tendencias en la ingenieria de sistemas parte2
PDF
Megatendencias tecnologicas 2019
PDF
AWS IoT Raspberry Pi4: Obteniendo datos de un sensor de temperatura DHT 11 en...
PDF
Integración Bigdata: punto de entrada al IoT - LibreCon 2016
PPTX
Esta es la Introduccion para el Master.pptx
PPTX
Internet de las cosas
PPT
Qué vigilan las redes de sensores y cómo gestionar la información
PDF
Plataformas IoT Open Source
PPTX
Resumen del Microsoft Big Data Stack
Meta-modelos y lenguajes de dominio específico en Internet de las cosas
El Internet de las Cosas y las Personas con Internet
2016 cloud summit_iot
Introducción a arquitecturas y herramientas de Big Data.pdf
BIGDATA NUEVAS FUENTES DE INFORMACION TRABAJO
Introducción a arquitecturas y herramientas de Big Data.pdf
E book industria-4.0
Tendencias en Big Data (2015-2016)
Semana de la Ciencia 2014 (Martínez-Prieto)
IT-NOVA Tendencias TI 2024 Memorias Webinar
Tendencias de movilidad en el mercado masivo y empresarial
Clase 19 tendencias en la ingenieria de sistemas parte2
Megatendencias tecnologicas 2019
AWS IoT Raspberry Pi4: Obteniendo datos de un sensor de temperatura DHT 11 en...
Integración Bigdata: punto de entrada al IoT - LibreCon 2016
Esta es la Introduccion para el Master.pptx
Internet de las cosas
Qué vigilan las redes de sensores y cómo gestionar la información
Plataformas IoT Open Source
Resumen del Microsoft Big Data Stack

Más de Cristian González García (9)

PDF
4. Microsoft Azure
PDF
2. Amazon Web Services
PDF
4. CMS e-commerce
PDF
3. Modelos de negocio
PDF
1. Medios de pago

Último (20)

DOCX
PLAN DE AREA DE CIENCIAS SOCIALES TODOS LOS GRUPOS
PPTX
TEMA 1ORGANIZACIÓN FUNCIONAL DEL CUERPO, MEDIO INTERNO Y HOMEOSTASIS (3) [Aut...
PDF
ACERTIJO Súper Círculo y la clave contra el Malvado Señor de las Formas. Por ...
PDF
Esc. Sab. Lección 7. El pan y el agua de vida.pdf
PDF
2.0 Introduccion a processing, y como obtenerlo
PDF
Los hombres son de Marte - Las mujeres de Venus Ccesa007.pdf
PDF
La lluvia sabe por qué: una historia sobre amistad, resiliencia y esperanza e...
PDF
Modelo Educativo SUB 2023versión final.pdf
PDF
IPERC...................................
PDF
Como Potenciar las Emociones Positivas y Afrontar las Negativas Ccesa007.pdf
PDF
informe tipos de Informatica perfiles profesionales _pdf
PDF
Cronograma de clases de Práctica Profesional 2 2025 UDE.pdf
PDF
Ernst Cassirer - Antropologia Filosofica.pdf
DOC
4°_GRADO_-_SESIONES_DEL_11_AL_15_DE_AGOSTO.doc
PDF
1. Intrdoduccion y criterios de seleccion de Farm 2024.pdf
PDF
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE_COM.pdf
PDF
Introduccion a la Investigacion Cualitativa FLICK Ccesa007.pdf
PDF
Telos 127 Generacion Al fa Beta - fundaciontelefonica
PPTX
LAS MIGRACIONES E INVASIONES Y EL INICIO EDAD MEDIA
PPTX
Presentación de la Cetoacidosis diabetica.pptx
PLAN DE AREA DE CIENCIAS SOCIALES TODOS LOS GRUPOS
TEMA 1ORGANIZACIÓN FUNCIONAL DEL CUERPO, MEDIO INTERNO Y HOMEOSTASIS (3) [Aut...
ACERTIJO Súper Círculo y la clave contra el Malvado Señor de las Formas. Por ...
Esc. Sab. Lección 7. El pan y el agua de vida.pdf
2.0 Introduccion a processing, y como obtenerlo
Los hombres son de Marte - Las mujeres de Venus Ccesa007.pdf
La lluvia sabe por qué: una historia sobre amistad, resiliencia y esperanza e...
Modelo Educativo SUB 2023versión final.pdf
IPERC...................................
Como Potenciar las Emociones Positivas y Afrontar las Negativas Ccesa007.pdf
informe tipos de Informatica perfiles profesionales _pdf
Cronograma de clases de Práctica Profesional 2 2025 UDE.pdf
Ernst Cassirer - Antropologia Filosofica.pdf
4°_GRADO_-_SESIONES_DEL_11_AL_15_DE_AGOSTO.doc
1. Intrdoduccion y criterios de seleccion de Farm 2024.pdf
MATERIAL DIDÁCTICO 2023 SELECCIÓN 1_REFORZAMIENTO 1° BIMESTRE_COM.pdf
Introduccion a la Investigacion Cualitativa FLICK Ccesa007.pdf
Telos 127 Generacion Al fa Beta - fundaciontelefonica
LAS MIGRACIONES E INVASIONES Y EL INICIO EDAD MEDIA
Presentación de la Cetoacidosis diabetica.pptx

1. Introducción Big Data

  • 1. 1 Big Data Cristian González García v 1.1.1 Noviembre 2015
  • 4. Introducción  ¿Qué está cambiando en la gestión del conocimiento?  ¿Porqué son necesarias nuevas herramientas de gestión del conocimiento?  ¿Qué está ocurriendo? 4
  • 5. Nuevas tecnologías  Dispositivos inteligentes (Smartphones)  La nube (Cloud Computing)  Las redes sociales, micro blogs,…  Big Data  Open Data (Datos abiertos)  The Internet of Things (IoT)  Sensores  Smart Cities  Smart Homes  Microcontroladores (Arduino)  Microordenadores (RaspberryPi)  IPv6 (Internet Protocol version 6)  RFID (Radio Frecuency IDentification)  NFC (Near Field Communication)  Bluetooth  QR Code (Quick Response Code) 5
  • 6. Todo acaba en la nube  Sistemas incrustados  Redes de sensores  Dispositivos móviles  Redes sociales  Open Data  Big Data  Trabajo 6
  • 7. La nube …  Es el almacén permanente de la información  Su escalabilidad permite adaptarse a la gran cantidad de información generada por los objetos y por los humanos  Su alta disponibilidad da confianza y fiabilidad  Bajos costes de mantenimiento  Es una de las piezas clave de la gestión del conocimiento 7
  • 8. La nube - Proveedores 9
  • 9. La nube – Ventajas  Costes reducidos  No hay mantenimiento  Pagamos por lo que usamos  Flexibilidad de productos  Actualización constante del HW  Almacenamiento “infinito” y escalable  Capacidad de procesamiento “infinita” y escalable  Accesible desde cualquier sitio 11
  • 10. La nube – Inconvenientes  La legislación  Asignatura de Aspectos Éticos y Legales de la Web (Darío)  Pérdida de control  Puede que no se adapte exactamente  Necesidad de aprender a usar “su” servicio  Tal vez, excesiva modularización  Seguridad, BDD, plugins, …  ¿Conexión a Internet?  Casos de quiebra por uso incorrecto 12
  • 12. Estadísticas de datosTipo Cantidad Comentario Internet [1] 40% de la población lo utiliza = 2.880 millones Somos 7.200 millones de personas en 2015 Internet [2] 20 Exabytes (10^18) 1 Exabyte = 1.000.000 terabytes Páginas Web [3] +1 Billones (10^12) Tweets [2] 20 Mil millones (10^9) 50 millones de usuarios Posts [2] 2.1 Mil millones (10^9) Foros, discusiones, … Miembros de redes sociales [2] 2.1 Mil millones (10^9) Miembros de 115 sitios Creadores de contenido social [2] 600 Millones(10^6) 33% de los usuarios de Internet Miembros de Facebook [4] 1490 Millones(10^6) 2015 Youtube [5] +Mil millones Usuarios (10^9), + 100 Mil Millones de Horas de Video/Diario Blogs [2] 70 Millones (10^6) Otras publicaciones [2] 10,000 Periódicos y otros 14
  • 13. Redes Sociales  Constituyen un gran almacén de información generada por los humanos  Hábitos, gustos, actividades, …  Nuestra información personal… ¡Gratis! ¡O por jugar!  Son un buen complemento de la información recogida por sensores y objetos inteligentes  Muchas aplicaciones son una combinación de redes sociales, objetos inteligentes y la nube  Sistemas de recomendación de libros, juegos,…  Sistemas de asistencia en tráfico, viajes,… 15
  • 14. Sensores  Constituyen un gran almacén de información generada por el medio ambiente o nosotros  Actividad, sucesos, …  Información del mundo real  Permiten conectar el mundo real con el mundo virtual  Son un buen complemento de la información recogida de las redes sociales  Muchas aplicaciones realizan acciones en base a los sucesos en el mundo real  Automatismos, juegos, seguridad, … 16
  • 15. Big Data I – Las 3 V  ¿Cómo analizamos esta avalancha de datos?  Con herramientas de Big Data  Se pueden construir herramientas de gestión del conocimiento en tiempo real  Big Data son los grandes conjuntos de datos que se caracterizan por  Su volumen y cantidad  Su velocidad de creación y utilización  Su variedad de tipos de fuentes  (La veracidad de los datos) 17
  • 16. Big Data II - Componentes 18
  • 17. Big Data III – Tipos de datos 19
  • 18. Herramientas  Hadoop  http://hadoop.apache.org/  Software Open Source  Permite trabajar con grandes cantidades de datos  Implementa MapReduce  Computación paralela  mongoDB  http://www.mongodb.org/  BBDD NoSQL  Cassandra  http://cassandra.apache.org/  BBDD NoSQL  Amazon Big Data  http://aws.amazon.com/es/big-data/  Microsoft Azure  http://azure.microsoft.com  Cloudera  http://www.cloudera.com/content/cloudera/en/home.html  Distribuciones de Hadoop y soporte  R  https://www.r-project.org/  Herramienta matemática para análisis de datos y estadísticas 20
  • 23. Referencias 25 1. https://en.wikipedia.org/wiki/Internet 2. Big Data Application Architecture Q&A 3. http://www.internetlivestats.com/total- number-of-websites/ 4. https://norfipc.com/redes- sociales/mapa-redes-sitios-sociales- internet-2015.php 5. https://www.youtube.com/yt/press/es/st atistics.html
  • 24. 26 Big Data Cristian González García v 1.1.1 Noviembre 2015