SlideShare una empresa de Scribd logo
Visualización de BigData con PowerView
28 de Agosto (12 pm GMT -5)
Eduardo Castro
Resúmen:
En esta sesión veremos ejemplos,de como realizar
análisis de big data con PowerView integrato con
HDInsight y HortonWorks.
Próximos Eventos
Aprendamos DAX
10 de Septiembre
José Ahias López Portillo
Mejores prácticas de SQL Server
para implementar SharePoint
3 de Septiembre
David Sánchez
Indices columnares en SQL
Server 2014
10 de Septiembre
José L. Rivera
Está por comenzar:
Visualización de Big Data con Power View
27 Agosto 2014
Eduardo Castro
SQL Server MVP
PASS Regional Mentor
Comunidad Windows PASS Chapter
Objetivos de la sesión
Qué es Big data
Introducción a HDInsight
Autoservicio de Inteligencia de Negocios (BI):
 Excel 2013 PowerPivot
 Excel 2013 Power View
Características de BI de Excel 2013
Creación de un solución de BI con Big Data BI dentro de Excel 2013
Qué es Big Data?
Megabytes
Gigabytes
Terabytes
Petabytes
ERP
CRM
WEB
BIG DATA
Offer details
Support Contacts
Customer Touches
Segmentation
Web logs
Offer history
A/B testing
Dynamic Pricing
Affiliate Networks
Search Marketing
Behavioral Targeting
Dynamic Funnels
User Generated Content
Mobile Web
SMS/MMSSentiment
External Demographics
HD Video, Audio, Images
Speech to Text
Product/Service Logs
Social Interactions & Feeds
Business Data Feeds
User Click Stream
Sensors / RFID / Devices
Spatial & GPS Coordinates
Incremento de variedad y cantidad de datos
Transacciones +
Interacciones
= BIG DATA
Dominio Escenarios de grandes volúmenes datos comunes
Servicios financieros Modelado riesgo verdadero
Análisis de las amenazas y detección de fraude
Vigilancia Comercio
El puntaje de crédito y análisis
Medios y Entretenimiento Los motores de recomendación
Focalización Ad
Buscar calidad
Los abusos y detección de fraude de clics
Venta al por menor Punto de análisis de las transacciones de ventas
Análisis de la pérdida de clientes
El análisis de sentimientos (sentiment analysis)
Telecomunicaciones Cliente prevención del churn
La optimización del rendimiento de la red
Detalles de llamadas (CDR) y su análisis
Predicción de fallos de red
Gobierno Seguridad Cibernética (botnets, fraudes)
La congestión del tráfico y re-enrutamiento
Monitoreo Ambiental
Monitoreo Antisocial través de medios sociales
Salud La investigación del genoma
La investigación del cáncer
Pandemias detección temprana
Monitoreo de la calidad del aire
Procesamiento de datos y análisis: The Old Way
La naturaleza cambiante del Big Data
Volumen - La cantidad de datos que han creado las empresas
a través de
 La web
 Dispositivos móviles
 Infraestructura de TI
 y otras fuentes está creciendo exponencialmente cada año.
Principales fuentes de datos
Redes sociales y medios de comunicación
 700 millones de usuarios de Facebook, 250 millones de usuarios de
Twitter y 156 millones de blogs públicos
Dispositivos móviles
 Más de 5 mil millones de teléfonos móviles en uso en todo el mundo
Transacciones en Internet
 miles de millones de compras en línea, operaciones de bolsa y otras
transacciones ocurren todos los días
Dispositivos de red y sensores
Plataforma de Big Data Micrsooft
Integración con herramientas Microsoft
Integración con las
herramientas de
Análisis de Microsoft
APPLICATIONSDATASYSTEMS
Aplicaciones Microsoft
HORTONWORKS
DATA PLATFORM
For Windows
DATASOURCES
MOBILE
DATA
OLTP, POS
SYSTEMS
Fuentes tradicionales
(RDBMS, OLTP, OLAP)
Nuevas Fuentes
(web logs, email, sensor data, social media)
HADOOP PARA WINDOWS
HDP para Windows
Hortonworks
Data Platform (HDP)
For Windows
100% Open Source Enterprise Hadoop
HORTONWORKS
DATA PLATFORM (HDP)
For Windows
PLATFORM SERVICES
HADOOP CORE
Distributed
Storage & Processing
DATA
SERVICES
Store,
Process and
Access Data
OPERATIONAL
SERVICES
Manage &
Operate at
Scale
Manage &
Operate at
Scale
Store,
Process and
Access Data
Distributed
Storage & Processing
Enterprise Readiness
Visualización de big data con power view
Parallel Data Warehouse
HDP
Windows Azure
La distribución de Apache Hadoop distribución
desarrollado por Hortonworks y Microsoft
Integrado con Microsoft BI
Microsoft HDInsight
Big data + BI tradicional = BI Poderoso
grandes
cantidades
de datos
Microsoft
HDInsight
Tabular
OLAP
SQL
010101010101010101
1010101010101010
01010101010101
101010101010
Visualización
PDW +
Polibase
Microsoft Azure HDInsight
Cómo instalar un clúster HDInsight
Introducción a HDFS
Ejecución de una tarea de Map / Reduce
El procesamiento de los datos con Pig
Creación de tablas Hive
Cargando Tablas Datos en Hive
Consulta de Tablas con HiveQL
Windows Azure HDInsight Service
Query &
Metadata:
Data
Movement:
Workflow: Monitoring:
Windows Azure HDInsight Service
Creación de tablas Hive
• Utilice la sentencia CREATE TABLE HiveQL
• Define los metadatos del esquema que se establece sobre los datos
en una carpeta cuando se consulta la table
• Especifica el formato de archivo y ubicación
• Por defecto el formato es un archivo secuencial en la ruta
/hive/warehouse/<table_name>
• Crear tablas internas o tablas externas
Crear tabla externa
CREATE EXTERNAL TABLE table_name
({<column_definition>}[,..n ])
{WITH (
DATA_SOURCE = <data_source>,
FILE_FORMAT = <file_format>,
LOCATION =‘<file_path>’,
[REJECT_VALUE = <value>],
…)};
Hacer referencia a la fuente de datos
externa
1
Hacer referencia a formato de
archivo externo
2
Ruta de acceso del archivo / carpeta
Hadoop
3
(Opcional) Rechazar parámetros4
Cargando Datos en Hive
• Guarde los archivos de datos en los directories
para tablas
• Utilice la instrucción LOAD
• Mueve o copia los archivos al directorio correspondiente
• Utilice la sentencia INSERT
• Inserta datos de una tabla a otra
Crear origen de datos externo
CREATE EXTERNAL DATA SOURCE datasource_name
{WITH (
TYPE = <data_source>,
LOCATION =‘<location>’,
[JOB_TRACKER_LOCATION = ‘<jb_location>’]
};
Tipo de fuente de datos externa1
Lugar de origen de datos externos2
La activación o desactivación de la
generación de trabajo MapReduce
3
Consulta de Tablas con HiveQL
• Consultar datos utilizando la sentencia TSQL
SELECT
• Hive traduce la consulta en tareas de Map/Reduce
y aplica el esquema de la tabla a los archivos de
datos
HDInsight en Excel
Acceso a HDInsight desde Excel
Uso del proveedor Hive ODBC
Uso de las consultas con HDInsight
Acceder HDInsight desde Excel
• Driver Hive ODBC para HDInsight
• Soporta sintaxis similar a T-SQL para consultar las tablas
del clúster
• Requiere un clúster HDInsight activo
• PowerQuery
• Soporta la importación de datos desde cualquier archivo
en HDFS
• Se puede utilizar cuando el clúster HDInsight está
inactivo
Instalar el Hive ODBC Driver
1. Descargue e instale el driver Hive ODBC para
HDInsight
2. Crear un nombre de origen de datos (DSN) para
el clúster de HDInsight
3. Utilice el Asistente para la conexión de datos en
Excel para importar datos
Importación de datos Windows Azure Marketplace En Excel
• Puede importar datos de Windows Azure
Marketplace directamente en Excel usando:
• PowerQuery
• PowerPivot
• PowerView
28 |
Eduardo
Castro
ecastro@simsasys.com ecastrom.blogspot.com
edocastro
PREGUNTAS Y RESPUESTAS
Manténgase conectado a nosotros!
29
Visítenos en http://globalspanish.sqlpass.org
/SpanishPASSVC
lnkd.in/dtYBzev
/user/SpanishPASSVC
/SpanishPASSVC
PASS Community News
August 2014
Planning on attending PASS Summit 2014? Start saving
today!
• The world’s largest gathering of SQL Server & BI professionals
• Take your SQL Server skills to the next level by learning from the world’s SQL
Server experts, in 190+ technical sessions
• Over 5000 attendees, representing 2000 companies, from 52 countries,
ready to network & learn
Ask your Chapter Leader how to
save $150 off registration!
$1,895
UNTIL SEPTEMBER 26, 2014
PASS Virtual Chapters Listing
Check out the sqlpass.org for more information on all the Virtual Chapters:
• Application Development
• Big Data
• Book Readers
• Business Analytics
• Business Intelligence
• Cloud
• Data Architecture
• Database Administration
• DBA Fundamentals
• Excel BI
• Healthcare
• High Availability and Disaster Recovery
• InMemory
• Master DataData Quality
• Oracle SQL
• Performance
• Powershell
• Professional Development
• Security
• Virtualization
• Women in Technology
• Global Chinese
• Global French
• Global Hebrew
• Global Italian
• Global Portuguese
• Global Russian
• Global Spanish
Virtual Chapter Meetings – August
VIRTUAL CHAPTER MEETING TOPIC
DBA Fundamentals Aug 5 11:00– 12:00 CDT (UTC -05:00) Rolling Upgraders, The Easy Way
Presented by Argenis Fernandez
Global Spanish Aug 6 12:00-12:30 (UTC -05:00) Los Caso de Uso Para In-Memory OLTP
Presented by Warner Chaves
Global Hebrew Aug 10 17:30-18:30 JDT (UTC +02:00) Take Your SQL Server Development
Process Forward!
Presented by Itai Binyamin
Professional
Development
Aug 12 12:00-13:00 EDT (UTC -04:00) Bridging the Communication Gap
Between DBA and Developer
Presented by Robert Davis
High Availability and
Disaster Recovery
Aug 12 12:00-13:00 CDT (UTC -05:00) Mirroring Start to Finish
Presented by Ryan Adams
Virtual Chapter Meetings – August
VIRTUAL CHAPTER MEETING TOPIC
Global Spanish Aug 13 12:00-13:00 (UTC -05:00) Haciendo Preguntas Básicas en Power
BI
Presented by Andrei Garzon
Excel Business
Intelligence
Aug 14 11:00-12:00 EDT (UTC-04:00) Advanced Analytics: Excel Solver
Presented by Dan Fylstra
Business Intelligence Aug 14 11:00-12:00 EDT (UTC -04:00) Continuous Integration for Reporting
Services
Presented by Nat Sundar
DBA Fundamentals Aug 19 11:00-12:00 CDT (UTC -05:00) The Roadmap to Better Performance:
Reading Query Plans
Presented by Erin Stellato
Global Spanish Aug 20 12:00-12:30 (UTC -05:00) Fundamentos sobre lost indices end
SQL
Presented by Enrique Puig
Virtual Chapter Meetings – August
VIRTUAL CHAPTER MEETING TOPIC
Global Russian Aug 20 15:00-16:30 (UTC +03:00) SSIS - Повышение
производительности обработки
потоков данных
Global French Aug 21 20:00-21:00 RST (UTC +01:00) Power BI Hybride avec la Passerelle de
Gestion de Données
Presented by Jean-Pierre Riehl
Business Analytics Aug 21 12:00-13:00 CDT (UTC -05:00) Looking Through the Windshield:
Creating forward-looking Dashboards
and KPI’s
Presented by Brian Larson
Business Intelligence Aug 27 12:00-13:00 GMT (UTC-00:00) Intro to R
Presented by Stephanie Locke
Global Spanish Aug 27 12:00-13:00 (UTC-05:00) Visualización de Big Data Con Power
View
Presented by Eduardo Castro
Upcoming SQLSaturdays
Upcoming North America Events Upcoming International Events
• Aug 2 #324 Baton Rouge
• Aug 9 #304 Indianapolis
• Aug 23 #328 Birmingham
• Aug 23 #309 Oklahoma City
• Sep 6 #320 Raleigh
• Sep 13 #300 Kansas City
• Sep 20 #331 Denver
• Sept 20 # 340 San Diego
• Aug 30 #327 Johannesburg
• Aug 30 #317 Oslo
• Sep 6 #301 Cape Town
• Sep 13 # 323 Paris
• Sep 20 #290 Kiev
• Sep 20 #310 Dublin
• Sep 27 #325 Sao Paulo
Visit www.sqlsaturday.com to
register for an event near you!
37
Volunteering with PASS
Volunteer Today!
Now it’s easier than ever to volunteer with PASS.
Let us know your volunteer preferences by updating the
“myVolunteering” section of your myPASS profile.
PASS would not exist without our passionate, dedicated,
and hardworking volunteers from around the globe.
38
Outstanding Volunteer Award
Do you know a volunteer that has gone
above and beyond recently?
Nominate them for the monthly OVA.
VolunteerRecognition@sqlpass.org
Volunteering with PASS
PASSion Award
The highest of PASS accolades presented
yearly to a volunteer.
Nominations will open in August 2014.
Stay tuned!
Stay Involved!
• Sign up for a free membership today at sqlpass.org
• Linked In: http://www.sqlpass.org/linkedin
• Facebook: http://www.sqlpass.org/facebook
• Twitter: @SQLPASS
• PASS: http://www.sqlpass.org
Programa de Reconocimiento
Programa de Voluntario Sobresaliente
• PASS le invita a nominar a su voluntario favorito para ser “Voluntario Sobresaliente del Mes”
• Enviar nominaciones en todo momento a: VolunteerRecognition@sqlpass.org
Favor proveer:
• Información de contacto del nominado,
• una lista breve de los programas de PASS que a participado el nominado
• los años que lleva activo en la comunidad
• una corta descripción por el cual considera que esta persona debe ser reconocida
• Los nominados seleccionados serán anunciados en la edición del boletín PASS Connector y recibirán un
certificado de apreciación.
Mejores prácticas de SQL Server para
implementar sharepoint
3 de Septiembre (12 pm GMT -5)
David Sánchez
Resúmen:
En esta sesión tendremos la oportunidad de
conocer las mejores prácticas para una
implementación de SQL Server para la plataforma
de SharePoint Server.
Próximo Evento

Más contenido relacionado

PPTX
Visualización de Big Data con Power View
PPTX
Anatomía de un proyecto de Big Data
PDF
Data as a Service
PDF
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data
PDF
Inteligencia de Negocios con Microsoft
PPTX
Análisis de datos con HD Insight
PPTX
Microsoft Data & AI Experience LATAM 2018 - Azure Cosmos DB
PPTX
Cardinality estimator en sql server 2014. qué es y cómo nos beneficia
Visualización de Big Data con Power View
Anatomía de un proyecto de Big Data
Data as a Service
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data
Inteligencia de Negocios con Microsoft
Análisis de datos con HD Insight
Microsoft Data & AI Experience LATAM 2018 - Azure Cosmos DB
Cardinality estimator en sql server 2014. qué es y cómo nos beneficia

Similar a Visualización de big data con power view (20)

PDF
HD Insight Integracion con SQL Server Power-Pivot Excel
PPTX
Inteligencia de negocio en la nube, una realidad palpable!!!
PPTX
Big data, Hadoop, HDInsight
PPTX
Microsoft Business Analytics 2013
PPTX
Cuando los desarrolladores conocieron SSAS, Business Intelligence y Big Data
PPTX
Herramientas de Microsoft para el Científicos de Datos
PPTX
Fundamentos de Indices en SQL Server - Enrrique Puig
PPTX
Fundamentos sobre los indices en SQL Server
PDF
CloudCamp - Big Data – La revolución de los datos
PPTX
Big Data con Sql Server 2014 y la nube
PDF
Big Data Introducción
PPTX
SQL Saturday Bogota - Big Data HDInsight Server
PDF
"Casos de uso del Big Data" por Wolfram Rozas
PPTX
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
PPTX
Conociendo los servicios adicionales en big data
PPTX
Business intelligence (bi) y big data0
PPTX
Resumen del Microsoft Big Data Stack
PPTX
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
PPTX
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
PDF
Big Data: Presente o Futuro
HD Insight Integracion con SQL Server Power-Pivot Excel
Inteligencia de negocio en la nube, una realidad palpable!!!
Big data, Hadoop, HDInsight
Microsoft Business Analytics 2013
Cuando los desarrolladores conocieron SSAS, Business Intelligence y Big Data
Herramientas de Microsoft para el Científicos de Datos
Fundamentos de Indices en SQL Server - Enrrique Puig
Fundamentos sobre los indices en SQL Server
CloudCamp - Big Data – La revolución de los datos
Big Data con Sql Server 2014 y la nube
Big Data Introducción
SQL Saturday Bogota - Big Data HDInsight Server
"Casos de uso del Big Data" por Wolfram Rozas
Big Data, Almacenes de Datos Empresariales (EDW) y Windows Azure (SQL Databas...
Conociendo los servicios adicionales en big data
Business intelligence (bi) y big data0
Resumen del Microsoft Big Data Stack
Introducción a Big Data. HDInsight - Webcast Technet SolidQ
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Big Data: Presente o Futuro
Publicidad

Más de SpanishPASSVC (20)

PPTX
Creación de un modelo de análisis predictivo en la nube
PPTX
Analizando la performance del subsistema de IO
PPTX
AlwaysON Lecciones Aprendidas
PPTX
Data Science con Microsoft R Server y SQL Server 2016
PPTX
Mejoras de Rendimiento para Replicación Transaccional
PPTX
Como leer planes de ejecución
PPTX
AlwaysOn en SQL Server 2016
PPTX
VMs de alto rendimiento para SQL Server en AWS y Azure
PDF
Tecnicas avanzadas de monitoreo
PDF
Principios de diseño para procesos de ETL
PPTX
Planeando e implementando servicios de datos con Microsoft Azure
PPTX
Mejores prácticas para SQL Server en ambientes virtualizados
PPTX
Mejores prácticas de Data Warehouse con SQL Server
PPTX
La receta de la abuela para mejores cargas de datos
PPTX
Introducción a Azure Machine Learning
PDF
Cuadros de mando el todo es más que la suma de las partes
PPTX
Automatizando la generación de Datawarehouses a través de metadatos
PPTX
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
PPTX
Administrando soluciones de Power BI
PPTX
Vista 360 grados de DataZen - Juan Alvarado
Creación de un modelo de análisis predictivo en la nube
Analizando la performance del subsistema de IO
AlwaysON Lecciones Aprendidas
Data Science con Microsoft R Server y SQL Server 2016
Mejoras de Rendimiento para Replicación Transaccional
Como leer planes de ejecución
AlwaysOn en SQL Server 2016
VMs de alto rendimiento para SQL Server en AWS y Azure
Tecnicas avanzadas de monitoreo
Principios de diseño para procesos de ETL
Planeando e implementando servicios de datos con Microsoft Azure
Mejores prácticas para SQL Server en ambientes virtualizados
Mejores prácticas de Data Warehouse con SQL Server
La receta de la abuela para mejores cargas de datos
Introducción a Azure Machine Learning
Cuadros de mando el todo es más que la suma de las partes
Automatizando la generación de Datawarehouses a través de metadatos
Descubriendo el corazón de la optimización “Estadísticas más que un concepto”
Administrando soluciones de Power BI
Vista 360 grados de DataZen - Juan Alvarado
Publicidad

Último (20)

PDF
SAP Transportation Management para LSP, TM140 Col18
PPTX
sa-cs-82-powerpoint-hardware-y-software_ver_4.pptx
PDF
MÓDULO DE CALOR DE GRADO DE MEDIO DE FORMACIÓN PROFESIONAL
PPTX
RAP02 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
PPTX
IA de Cine - Como MuleSoft y los Agentes estan redefiniendo la realidad
PDF
Estrategia de apoyo tecnología miguel angel solis
PDF
Diapositiva proyecto de vida, materia catedra
PPTX
historia_web de la creacion de un navegador_presentacion.pptx
PDF
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
PPTX
Propuesta BKP servidores con Acronis1.pptx
PPTX
COMO AYUDAN LAS TIC EN LA EDUCACION SUPERIOR.pptx
PPTX
ANCASH-CRITERIOS DE EVALUACIÓN-FORMA-10-10 (2).pptx
PPTX
Presentación de Redes de Datos modelo osi
PDF
Maste clas de estructura metálica y arquitectura
PPT
Que son las redes de computadores y sus partes
PDF
5.1 Pinch y Bijker en libro Actos, actores y artefactos de Bunch Thomas (coor...
PPTX
RAP01 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
PDF
MANUAL TECNOLOGÍA SER MINISTERIO EDUCACIÓN
PPTX
Sesion 1 de microsoft power point - Clase 1
PPTX
REDES INFORMATICAS REDES INFORMATICAS.pptx
SAP Transportation Management para LSP, TM140 Col18
sa-cs-82-powerpoint-hardware-y-software_ver_4.pptx
MÓDULO DE CALOR DE GRADO DE MEDIO DE FORMACIÓN PROFESIONAL
RAP02 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
IA de Cine - Como MuleSoft y los Agentes estan redefiniendo la realidad
Estrategia de apoyo tecnología miguel angel solis
Diapositiva proyecto de vida, materia catedra
historia_web de la creacion de un navegador_presentacion.pptx
programa-de-estudios-2011-guc3ada-para-el-maestro-secundarias-tecnicas-tecnol...
Propuesta BKP servidores con Acronis1.pptx
COMO AYUDAN LAS TIC EN LA EDUCACION SUPERIOR.pptx
ANCASH-CRITERIOS DE EVALUACIÓN-FORMA-10-10 (2).pptx
Presentación de Redes de Datos modelo osi
Maste clas de estructura metálica y arquitectura
Que son las redes de computadores y sus partes
5.1 Pinch y Bijker en libro Actos, actores y artefactos de Bunch Thomas (coor...
RAP01 - TECNICO SISTEMAS TELEINFORMATICOS.pptx
MANUAL TECNOLOGÍA SER MINISTERIO EDUCACIÓN
Sesion 1 de microsoft power point - Clase 1
REDES INFORMATICAS REDES INFORMATICAS.pptx

Visualización de big data con power view

  • 1. Visualización de BigData con PowerView 28 de Agosto (12 pm GMT -5) Eduardo Castro Resúmen: En esta sesión veremos ejemplos,de como realizar análisis de big data con PowerView integrato con HDInsight y HortonWorks. Próximos Eventos Aprendamos DAX 10 de Septiembre José Ahias López Portillo Mejores prácticas de SQL Server para implementar SharePoint 3 de Septiembre David Sánchez Indices columnares en SQL Server 2014 10 de Septiembre José L. Rivera Está por comenzar:
  • 2. Visualización de Big Data con Power View 27 Agosto 2014 Eduardo Castro SQL Server MVP PASS Regional Mentor Comunidad Windows PASS Chapter
  • 3. Objetivos de la sesión Qué es Big data Introducción a HDInsight Autoservicio de Inteligencia de Negocios (BI):  Excel 2013 PowerPivot  Excel 2013 Power View Características de BI de Excel 2013 Creación de un solución de BI con Big Data BI dentro de Excel 2013
  • 4. Qué es Big Data? Megabytes Gigabytes Terabytes Petabytes ERP CRM WEB BIG DATA Offer details Support Contacts Customer Touches Segmentation Web logs Offer history A/B testing Dynamic Pricing Affiliate Networks Search Marketing Behavioral Targeting Dynamic Funnels User Generated Content Mobile Web SMS/MMSSentiment External Demographics HD Video, Audio, Images Speech to Text Product/Service Logs Social Interactions & Feeds Business Data Feeds User Click Stream Sensors / RFID / Devices Spatial & GPS Coordinates Incremento de variedad y cantidad de datos Transacciones + Interacciones = BIG DATA
  • 5. Dominio Escenarios de grandes volúmenes datos comunes Servicios financieros Modelado riesgo verdadero Análisis de las amenazas y detección de fraude Vigilancia Comercio El puntaje de crédito y análisis Medios y Entretenimiento Los motores de recomendación Focalización Ad Buscar calidad Los abusos y detección de fraude de clics Venta al por menor Punto de análisis de las transacciones de ventas Análisis de la pérdida de clientes El análisis de sentimientos (sentiment analysis) Telecomunicaciones Cliente prevención del churn La optimización del rendimiento de la red Detalles de llamadas (CDR) y su análisis Predicción de fallos de red Gobierno Seguridad Cibernética (botnets, fraudes) La congestión del tráfico y re-enrutamiento Monitoreo Ambiental Monitoreo Antisocial través de medios sociales Salud La investigación del genoma La investigación del cáncer Pandemias detección temprana Monitoreo de la calidad del aire
  • 6. Procesamiento de datos y análisis: The Old Way
  • 7. La naturaleza cambiante del Big Data Volumen - La cantidad de datos que han creado las empresas a través de  La web  Dispositivos móviles  Infraestructura de TI  y otras fuentes está creciendo exponencialmente cada año.
  • 8. Principales fuentes de datos Redes sociales y medios de comunicación  700 millones de usuarios de Facebook, 250 millones de usuarios de Twitter y 156 millones de blogs públicos Dispositivos móviles  Más de 5 mil millones de teléfonos móviles en uso en todo el mundo Transacciones en Internet  miles de millones de compras en línea, operaciones de bolsa y otras transacciones ocurren todos los días Dispositivos de red y sensores
  • 9. Plataforma de Big Data Micrsooft
  • 10. Integración con herramientas Microsoft Integración con las herramientas de Análisis de Microsoft APPLICATIONSDATASYSTEMS Aplicaciones Microsoft HORTONWORKS DATA PLATFORM For Windows DATASOURCES MOBILE DATA OLTP, POS SYSTEMS Fuentes tradicionales (RDBMS, OLTP, OLAP) Nuevas Fuentes (web logs, email, sensor data, social media)
  • 12. HDP para Windows Hortonworks Data Platform (HDP) For Windows 100% Open Source Enterprise Hadoop HORTONWORKS DATA PLATFORM (HDP) For Windows PLATFORM SERVICES HADOOP CORE Distributed Storage & Processing DATA SERVICES Store, Process and Access Data OPERATIONAL SERVICES Manage & Operate at Scale Manage & Operate at Scale Store, Process and Access Data Distributed Storage & Processing Enterprise Readiness
  • 14. Parallel Data Warehouse HDP Windows Azure La distribución de Apache Hadoop distribución desarrollado por Hortonworks y Microsoft Integrado con Microsoft BI Microsoft HDInsight
  • 15. Big data + BI tradicional = BI Poderoso grandes cantidades de datos Microsoft HDInsight Tabular OLAP SQL 010101010101010101 1010101010101010 01010101010101 101010101010 Visualización PDW + Polibase
  • 16. Microsoft Azure HDInsight Cómo instalar un clúster HDInsight Introducción a HDFS Ejecución de una tarea de Map / Reduce El procesamiento de los datos con Pig Creación de tablas Hive Cargando Tablas Datos en Hive Consulta de Tablas con HiveQL
  • 17. Windows Azure HDInsight Service Query & Metadata: Data Movement: Workflow: Monitoring:
  • 19. Creación de tablas Hive • Utilice la sentencia CREATE TABLE HiveQL • Define los metadatos del esquema que se establece sobre los datos en una carpeta cuando se consulta la table • Especifica el formato de archivo y ubicación • Por defecto el formato es un archivo secuencial en la ruta /hive/warehouse/<table_name> • Crear tablas internas o tablas externas
  • 20. Crear tabla externa CREATE EXTERNAL TABLE table_name ({<column_definition>}[,..n ]) {WITH ( DATA_SOURCE = <data_source>, FILE_FORMAT = <file_format>, LOCATION =‘<file_path>’, [REJECT_VALUE = <value>], …)}; Hacer referencia a la fuente de datos externa 1 Hacer referencia a formato de archivo externo 2 Ruta de acceso del archivo / carpeta Hadoop 3 (Opcional) Rechazar parámetros4
  • 21. Cargando Datos en Hive • Guarde los archivos de datos en los directories para tablas • Utilice la instrucción LOAD • Mueve o copia los archivos al directorio correspondiente • Utilice la sentencia INSERT • Inserta datos de una tabla a otra
  • 22. Crear origen de datos externo CREATE EXTERNAL DATA SOURCE datasource_name {WITH ( TYPE = <data_source>, LOCATION =‘<location>’, [JOB_TRACKER_LOCATION = ‘<jb_location>’] }; Tipo de fuente de datos externa1 Lugar de origen de datos externos2 La activación o desactivación de la generación de trabajo MapReduce 3
  • 23. Consulta de Tablas con HiveQL • Consultar datos utilizando la sentencia TSQL SELECT • Hive traduce la consulta en tareas de Map/Reduce y aplica el esquema de la tabla a los archivos de datos
  • 24. HDInsight en Excel Acceso a HDInsight desde Excel Uso del proveedor Hive ODBC Uso de las consultas con HDInsight
  • 25. Acceder HDInsight desde Excel • Driver Hive ODBC para HDInsight • Soporta sintaxis similar a T-SQL para consultar las tablas del clúster • Requiere un clúster HDInsight activo • PowerQuery • Soporta la importación de datos desde cualquier archivo en HDFS • Se puede utilizar cuando el clúster HDInsight está inactivo
  • 26. Instalar el Hive ODBC Driver 1. Descargue e instale el driver Hive ODBC para HDInsight 2. Crear un nombre de origen de datos (DSN) para el clúster de HDInsight 3. Utilice el Asistente para la conexión de datos en Excel para importar datos
  • 27. Importación de datos Windows Azure Marketplace En Excel • Puede importar datos de Windows Azure Marketplace directamente en Excel usando: • PowerQuery • PowerPivot • PowerView
  • 29. Manténgase conectado a nosotros! 29 Visítenos en http://globalspanish.sqlpass.org /SpanishPASSVC lnkd.in/dtYBzev /user/SpanishPASSVC /SpanishPASSVC
  • 31. Planning on attending PASS Summit 2014? Start saving today! • The world’s largest gathering of SQL Server & BI professionals • Take your SQL Server skills to the next level by learning from the world’s SQL Server experts, in 190+ technical sessions • Over 5000 attendees, representing 2000 companies, from 52 countries, ready to network & learn Ask your Chapter Leader how to save $150 off registration! $1,895 UNTIL SEPTEMBER 26, 2014
  • 32. PASS Virtual Chapters Listing Check out the sqlpass.org for more information on all the Virtual Chapters: • Application Development • Big Data • Book Readers • Business Analytics • Business Intelligence • Cloud • Data Architecture • Database Administration • DBA Fundamentals • Excel BI • Healthcare • High Availability and Disaster Recovery • InMemory • Master DataData Quality • Oracle SQL • Performance • Powershell • Professional Development • Security • Virtualization • Women in Technology • Global Chinese • Global French • Global Hebrew • Global Italian • Global Portuguese • Global Russian • Global Spanish
  • 33. Virtual Chapter Meetings – August VIRTUAL CHAPTER MEETING TOPIC DBA Fundamentals Aug 5 11:00– 12:00 CDT (UTC -05:00) Rolling Upgraders, The Easy Way Presented by Argenis Fernandez Global Spanish Aug 6 12:00-12:30 (UTC -05:00) Los Caso de Uso Para In-Memory OLTP Presented by Warner Chaves Global Hebrew Aug 10 17:30-18:30 JDT (UTC +02:00) Take Your SQL Server Development Process Forward! Presented by Itai Binyamin Professional Development Aug 12 12:00-13:00 EDT (UTC -04:00) Bridging the Communication Gap Between DBA and Developer Presented by Robert Davis High Availability and Disaster Recovery Aug 12 12:00-13:00 CDT (UTC -05:00) Mirroring Start to Finish Presented by Ryan Adams
  • 34. Virtual Chapter Meetings – August VIRTUAL CHAPTER MEETING TOPIC Global Spanish Aug 13 12:00-13:00 (UTC -05:00) Haciendo Preguntas Básicas en Power BI Presented by Andrei Garzon Excel Business Intelligence Aug 14 11:00-12:00 EDT (UTC-04:00) Advanced Analytics: Excel Solver Presented by Dan Fylstra Business Intelligence Aug 14 11:00-12:00 EDT (UTC -04:00) Continuous Integration for Reporting Services Presented by Nat Sundar DBA Fundamentals Aug 19 11:00-12:00 CDT (UTC -05:00) The Roadmap to Better Performance: Reading Query Plans Presented by Erin Stellato Global Spanish Aug 20 12:00-12:30 (UTC -05:00) Fundamentos sobre lost indices end SQL Presented by Enrique Puig
  • 35. Virtual Chapter Meetings – August VIRTUAL CHAPTER MEETING TOPIC Global Russian Aug 20 15:00-16:30 (UTC +03:00) SSIS - Повышение производительности обработки потоков данных Global French Aug 21 20:00-21:00 RST (UTC +01:00) Power BI Hybride avec la Passerelle de Gestion de Données Presented by Jean-Pierre Riehl Business Analytics Aug 21 12:00-13:00 CDT (UTC -05:00) Looking Through the Windshield: Creating forward-looking Dashboards and KPI’s Presented by Brian Larson Business Intelligence Aug 27 12:00-13:00 GMT (UTC-00:00) Intro to R Presented by Stephanie Locke Global Spanish Aug 27 12:00-13:00 (UTC-05:00) Visualización de Big Data Con Power View Presented by Eduardo Castro
  • 36. Upcoming SQLSaturdays Upcoming North America Events Upcoming International Events • Aug 2 #324 Baton Rouge • Aug 9 #304 Indianapolis • Aug 23 #328 Birmingham • Aug 23 #309 Oklahoma City • Sep 6 #320 Raleigh • Sep 13 #300 Kansas City • Sep 20 #331 Denver • Sept 20 # 340 San Diego • Aug 30 #327 Johannesburg • Aug 30 #317 Oslo • Sep 6 #301 Cape Town • Sep 13 # 323 Paris • Sep 20 #290 Kiev • Sep 20 #310 Dublin • Sep 27 #325 Sao Paulo Visit www.sqlsaturday.com to register for an event near you!
  • 37. 37 Volunteering with PASS Volunteer Today! Now it’s easier than ever to volunteer with PASS. Let us know your volunteer preferences by updating the “myVolunteering” section of your myPASS profile. PASS would not exist without our passionate, dedicated, and hardworking volunteers from around the globe.
  • 38. 38 Outstanding Volunteer Award Do you know a volunteer that has gone above and beyond recently? Nominate them for the monthly OVA. VolunteerRecognition@sqlpass.org Volunteering with PASS PASSion Award The highest of PASS accolades presented yearly to a volunteer. Nominations will open in August 2014. Stay tuned!
  • 39. Stay Involved! • Sign up for a free membership today at sqlpass.org • Linked In: http://www.sqlpass.org/linkedin • Facebook: http://www.sqlpass.org/facebook • Twitter: @SQLPASS • PASS: http://www.sqlpass.org
  • 40. Programa de Reconocimiento Programa de Voluntario Sobresaliente • PASS le invita a nominar a su voluntario favorito para ser “Voluntario Sobresaliente del Mes” • Enviar nominaciones en todo momento a: VolunteerRecognition@sqlpass.org Favor proveer: • Información de contacto del nominado, • una lista breve de los programas de PASS que a participado el nominado • los años que lleva activo en la comunidad • una corta descripción por el cual considera que esta persona debe ser reconocida • Los nominados seleccionados serán anunciados en la edición del boletín PASS Connector y recibirán un certificado de apreciación.
  • 41. Mejores prácticas de SQL Server para implementar sharepoint 3 de Septiembre (12 pm GMT -5) David Sánchez Resúmen: En esta sesión tendremos la oportunidad de conocer las mejores prácticas para una implementación de SQL Server para la plataforma de SharePoint Server. Próximo Evento