SlideShare una empresa de Scribd logo
05/07/2013
1
Big Data y Hadoop
Agenda
1. Big Data
2. Hadoop
3. Personal especializado
4. Recomendaciones
Evolución de la Tecnología
BIG DATA
WEB
Petabytes
CRM
Terabytes
Gigabytes
ERP
Exabytes
Implementación de nuevas tecnologías
User Generated
Content
Mobile Web
SMS/MMS
Sentiment
External
Demographics
HD Video
Speech to Text
Product/
Service Logs
Social Network
Business Data
Feeds
User Click Stream
Web Logs
Offer History A/B Testing
Dynamic Pricing
Affiliate Networks
Search Marketing
Behavioral
Targeting
Dynamic Funnels
Payment
Record Support Contacts
Customer TouchesPurchase
Detail
Purchase
Record
Offer Details
Segmentation
05/07/2013
2
Carácterísticas
Volumen
2 a 100 Teras
Velocidad
ETL < 1 hora
In Memory
Variedad
No Estructurada
Múltiples fuentes
Necesidad Plataforma Unificada
Análisis con SAS, R, SQL, Java, C++, Python Visualization con BI, Mobile, Excel
Descubrir y Explorar
Datos no estructurados
Análisis datos
estructurados
Capturar y Refinar datos
Red
Social
SMS Textos Audio Video Imágenes ERP Logs CRM
Visualizar y
Compartir
Información
Hadoop
05/07/2013
3
Definicion
Apache Hadoop es un framework de software que
soporta aplicaciones distribuidas bajo una licencia
libre. Permite a las aplicaciones trabajar con miles
de nodos y petabytes de datos.
Hadoop se inspiró en los documentos Google para
MapReduce y Google File Systems (GFS).
Wikipedia
Diversas Fuentes de Informacion
• Perfiles redes sociales
• Influenciadores sociales
• Aplicaciones en la nube SaaS
• Informacion publica web
• Resultados Map Reduce
• Data warehouse appliances
• Bases de datos columnares NoSQL
• Video e imagines
• Logs y sensores
Granja de servidores
05/07/2013
4
Ecosistema
HDFS
HBase
Pig, Hive,
Mahout
Map Reduce
Sqoop Flume
Resource
Management
& Workflow
Yarn
Zookeeper
Apache Pivotal HD Added Value
Configure,
Deploy,
Monitor,
Manage
Command
Center
Hadoop Virtualization (HVE)
Data Loader
Pivotal HD
Enterprise
Xtension
Framework
Catalog
Services
Query
Optimizer
Dynamic Pipelining
ANSI SQL + Analytics
HAWQ– Advanced
Database Services
Pivotal HD Architecture
Uso de Hadoop
Conseguir Personal
Especializado BIG DATA
05/07/2013
5
Falta Personal Especializado
Las empresas van a tener que adecuar sus
organizaciones para poder manejar Big
Data:
• Quien debe ser el dueño de la Data ?
• Chief Analytics Officer ? Chief Big Data
Analytics Officer ?
• Las empresas van a necesitar areas de
Big Data Analytics
Falta Personal Especializado
• Demanda de Talento analítico
insatisfecha.
• Es difícil de ubicar Personal especializado
en Big Data, son muy escasos.
• Nuevos Talentos requeridos con nuevos
perfiles.
• Las Universidades tienen que crear
nuevas carreras que recien egresaran en
3 o 5 años.
Falta Personal Especializado
• Se van a generar más escuelas de
Analytics y Big Data.
• Se va a generar un nuevo ecosistema de
empresas que ofrecen estos servicios
como PowerData
• Data Scientist ? www.datascientist.net
05/07/2013
6
Recomendaciones
• No es el GRANDE en que
se come al chico
• Es el RAPIDO el que se
come al lento
• Si Usted no puede tomar
decisiones con rápidez,
cualquier acción que tome
no alcanzará la velocidad
adecuada.
Jason Jennings y Laurence Haughton
Big or Fast ?
1. Pensar con Rápidez
1. Prever
2. Detectar tendencias
3. Filtrar ideas
4. Dejar que gane la mejor
2. Decisiones rápidas
1. Reglas de negocios
2. Eliminar burocracia
3. Desatarlo todo
4. Intercambiar carteras
Como ser más Rápidos
3. Salir al mercado con mayor
rápidez
1. Lanzar una Cruzada
2. Ventaja competitiva
3. Que sea sencillo
4. Intercambiar carteras
4. Mantener la velocidad
1. Cuentas claras
2. Ser implacable con los recursos
3. Ser flexible en las finanzas
4. No engañarse
Jason Jennings y Laurence Haughton
05/07/2013
7
Como ser más Rápidos
¡MUCHAS GRACIAS!

Más contenido relacionado

PDF
"MDM: Cómo adquirir y retener más clientes" Master Data Management
PDF
Introducción PowerData
PPTX
El valor de los datos correctos
PDF
“Hacia un correcto gobierno de datos: cómo realizar un assessment de Data Gov...
PPTX
Data Masking
PDF
Diez claves para un proyecto MDM
PPTX
10 claves roi
PDF
AR-Proyecto enmascaramiento de Datos.
"MDM: Cómo adquirir y retener más clientes" Master Data Management
Introducción PowerData
El valor de los datos correctos
“Hacia un correcto gobierno de datos: cómo realizar un assessment de Data Gov...
Data Masking
Diez claves para un proyecto MDM
10 claves roi
AR-Proyecto enmascaramiento de Datos.

La actualidad más candente (19)

PDF
Migración de aplicaciones.... y mis datos.pptx
PPTX
Power data mdm
PDF
Una visión integrada para el estado de chile
PDF
"Protege los datos sensibles de tu compañía y cumple las normativas vigentes"
PPTX
Data integration
PDF
Un estado seguro para los datos
PDF
Power data introduccion
PPTX
Data Quality
PDF
Principales retos en la integración de informatica cloud con salesforce versi...
PDF
Olvide Big Data, Small Data es la verdadera revolución
PDF
El Gobierno de Datos está listo para mostrar su Atractivo [Data Governance is...
PDF
Consideraciones al construir una solución de Master Data Management (MDM)
PPTX
Estrategia de datos en las organizaciones
PPTX
Master Data Management
PDF
Powerdata “Gestiona tus metadatos correctamente y ayuda a IT y a negocios"
PDF
Gobierno de la Información - E-GISART, ISACA Buenos Aires Chapter
PPTX
Gobierno de Datos (Data Governance) Lighting Talks
PDF
Master Data Management - MDM - Pasos para implementar MDM
PPTX
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
Migración de aplicaciones.... y mis datos.pptx
Power data mdm
Una visión integrada para el estado de chile
"Protege los datos sensibles de tu compañía y cumple las normativas vigentes"
Data integration
Un estado seguro para los datos
Power data introduccion
Data Quality
Principales retos en la integración de informatica cloud con salesforce versi...
Olvide Big Data, Small Data es la verdadera revolución
El Gobierno de Datos está listo para mostrar su Atractivo [Data Governance is...
Consideraciones al construir una solución de Master Data Management (MDM)
Estrategia de datos en las organizaciones
Master Data Management
Powerdata “Gestiona tus metadatos correctamente y ayuda a IT y a negocios"
Gobierno de la Información - E-GISART, ISACA Buenos Aires Chapter
Gobierno de Datos (Data Governance) Lighting Talks
Master Data Management - MDM - Pasos para implementar MDM
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
Publicidad

Similar a Big data y hadoop (20)

PDF
BigDataSummitPeru - Big Data y Hadoop
PPTX
BIG DATA.pptx
PPS
Big Data Business
DOCX
Big data
PDF
BIG DATA - IESTP PISCO - VASQUEZ SOTO MARITZA.pdf
PDF
Big data
PDF
leccion-01dominando-el-big-data-fundamentos-y-aplicaciones-2023.pdf
DOCX
PDF
PPTX
Big data presentacion diapositiva
PPTX
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
PPTX
Historia y Evolucion.pptx
PDF
Que es big data
PPTX
SQL Saturday Bogota - Big Data HDInsight Server
PDF
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
PDF
Industria 4.0 y Big Data
PPTX
Big Data con Sql Server 2014 y la nube
PPTX
Introduccion a Big Data stack
PDF
Presentación Big Data...................
PDF
09. Big Data. Algoritmos, tecnología y aplicaciones (Presentación) autor José...
BigDataSummitPeru - Big Data y Hadoop
BIG DATA.pptx
Big Data Business
Big data
BIG DATA - IESTP PISCO - VASQUEZ SOTO MARITZA.pdf
Big data
leccion-01dominando-el-big-data-fundamentos-y-aplicaciones-2023.pdf
Big data presentacion diapositiva
Ponencia B2C Antonio Alonso. Big Data. Nuevas oportunidades de empleo
Historia y Evolucion.pptx
Que es big data
SQL Saturday Bogota - Big Data HDInsight Server
J. Verdura. Big Data: la nueva frontera de la revolución digital. Semanainfor...
Industria 4.0 y Big Data
Big Data con Sql Server 2014 y la nube
Introduccion a Big Data stack
Presentación Big Data...................
09. Big Data. Algoritmos, tecnología y aplicaciones (Presentación) autor José...
Publicidad

Más de PowerData (18)

PDF
WhitePaper PowerData - Informatica Intelligent Data Management Cloud
PPTX
White paper powerdata snowflake data cloud
PPTX
PowerData presenta su partnership con Snowflake
PDF
Powerdata: "la calidad de datos como motor de negocio"
PDF
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocio
PDF
Mejora la calidad de los datos de producto y lleva a tu negocio al siguiente ...
PDF
Transformación en una compañía DATA-DRIVEN - PowerData
PDF
AR-Proyecto enmascaramiento de datos.
PDF
AR-Un paso más allá en a seguridad de sus datos.
PDF
El matrimonio del cuidadano con el estado
PDF
El sueño fustrado
PDF
New platform, for new era
PDF
Emc powerdata
PDF
Del bit...al big data
PDF
Diez claves Proyecto MDM
PDF
Inteligencia de negocios, el camino a la empresa inteligente
PDF
Del bit al big data
PPTX
Obtenga una visión unificada de los datos de su organización (MDM)
WhitePaper PowerData - Informatica Intelligent Data Management Cloud
White paper powerdata snowflake data cloud
PowerData presenta su partnership con Snowflake
Powerdata: "la calidad de datos como motor de negocio"
Como la Buena Gestión de sus Metadatos Beneficia a las áreas de IT y de negocio
Mejora la calidad de los datos de producto y lleva a tu negocio al siguiente ...
Transformación en una compañía DATA-DRIVEN - PowerData
AR-Proyecto enmascaramiento de datos.
AR-Un paso más allá en a seguridad de sus datos.
El matrimonio del cuidadano con el estado
El sueño fustrado
New platform, for new era
Emc powerdata
Del bit...al big data
Diez claves Proyecto MDM
Inteligencia de negocios, el camino a la empresa inteligente
Del bit al big data
Obtenga una visión unificada de los datos de su organización (MDM)

Big data y hadoop

  • 1. 05/07/2013 1 Big Data y Hadoop Agenda 1. Big Data 2. Hadoop 3. Personal especializado 4. Recomendaciones Evolución de la Tecnología BIG DATA WEB Petabytes CRM Terabytes Gigabytes ERP Exabytes Implementación de nuevas tecnologías User Generated Content Mobile Web SMS/MMS Sentiment External Demographics HD Video Speech to Text Product/ Service Logs Social Network Business Data Feeds User Click Stream Web Logs Offer History A/B Testing Dynamic Pricing Affiliate Networks Search Marketing Behavioral Targeting Dynamic Funnels Payment Record Support Contacts Customer TouchesPurchase Detail Purchase Record Offer Details Segmentation
  • 2. 05/07/2013 2 Carácterísticas Volumen 2 a 100 Teras Velocidad ETL < 1 hora In Memory Variedad No Estructurada Múltiples fuentes Necesidad Plataforma Unificada Análisis con SAS, R, SQL, Java, C++, Python Visualization con BI, Mobile, Excel Descubrir y Explorar Datos no estructurados Análisis datos estructurados Capturar y Refinar datos Red Social SMS Textos Audio Video Imágenes ERP Logs CRM Visualizar y Compartir Información Hadoop
  • 3. 05/07/2013 3 Definicion Apache Hadoop es un framework de software que soporta aplicaciones distribuidas bajo una licencia libre. Permite a las aplicaciones trabajar con miles de nodos y petabytes de datos. Hadoop se inspiró en los documentos Google para MapReduce y Google File Systems (GFS). Wikipedia Diversas Fuentes de Informacion • Perfiles redes sociales • Influenciadores sociales • Aplicaciones en la nube SaaS • Informacion publica web • Resultados Map Reduce • Data warehouse appliances • Bases de datos columnares NoSQL • Video e imagines • Logs y sensores Granja de servidores
  • 4. 05/07/2013 4 Ecosistema HDFS HBase Pig, Hive, Mahout Map Reduce Sqoop Flume Resource Management & Workflow Yarn Zookeeper Apache Pivotal HD Added Value Configure, Deploy, Monitor, Manage Command Center Hadoop Virtualization (HVE) Data Loader Pivotal HD Enterprise Xtension Framework Catalog Services Query Optimizer Dynamic Pipelining ANSI SQL + Analytics HAWQ– Advanced Database Services Pivotal HD Architecture Uso de Hadoop Conseguir Personal Especializado BIG DATA
  • 5. 05/07/2013 5 Falta Personal Especializado Las empresas van a tener que adecuar sus organizaciones para poder manejar Big Data: • Quien debe ser el dueño de la Data ? • Chief Analytics Officer ? Chief Big Data Analytics Officer ? • Las empresas van a necesitar areas de Big Data Analytics Falta Personal Especializado • Demanda de Talento analítico insatisfecha. • Es difícil de ubicar Personal especializado en Big Data, son muy escasos. • Nuevos Talentos requeridos con nuevos perfiles. • Las Universidades tienen que crear nuevas carreras que recien egresaran en 3 o 5 años. Falta Personal Especializado • Se van a generar más escuelas de Analytics y Big Data. • Se va a generar un nuevo ecosistema de empresas que ofrecen estos servicios como PowerData • Data Scientist ? www.datascientist.net
  • 6. 05/07/2013 6 Recomendaciones • No es el GRANDE en que se come al chico • Es el RAPIDO el que se come al lento • Si Usted no puede tomar decisiones con rápidez, cualquier acción que tome no alcanzará la velocidad adecuada. Jason Jennings y Laurence Haughton Big or Fast ? 1. Pensar con Rápidez 1. Prever 2. Detectar tendencias 3. Filtrar ideas 4. Dejar que gane la mejor 2. Decisiones rápidas 1. Reglas de negocios 2. Eliminar burocracia 3. Desatarlo todo 4. Intercambiar carteras Como ser más Rápidos 3. Salir al mercado con mayor rápidez 1. Lanzar una Cruzada 2. Ventaja competitiva 3. Que sea sencillo 4. Intercambiar carteras 4. Mantener la velocidad 1. Cuentas claras 2. Ser implacable con los recursos 3. Ser flexible en las finanzas 4. No engañarse Jason Jennings y Laurence Haughton
  • 7. 05/07/2013 7 Como ser más Rápidos ¡MUCHAS GRACIAS!