SlideShare una empresa de Scribd logo
Mayo 13, 2017
Bogotá, Colombia
#sqlsatBogota
 Raúl Saráchaga Díaz
Business Intelligence Consultant at Kaits
Database Administrator
MCSA SQL Server 2012/2014
MCSE Data Management and Analytics
MCSE Business Intelligence
Introducción a Azure Machine Learning
Email:raulsarachaga@hotmail.com
Blog personal: aprendebi.wordpress.com
Desarrollo del Contenido
 Ciencia de Datos
 Machine Learning
 Azure Machine Learning
 Demo sobre Azure Machine Learning
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia3 |
Ciencia de Datos
 Es un campo interdisciplinario que
involucra métodos científicos, procesos y
sistemas para extraer conocimiento y
obtener un mejor entendimiento de los
datos, estos podrían ser estructurados o
no estructurados.
 Así mismo, es el conjunto de campos tales
como: la estadística, la minería de datos,
el aprendizaje automático y la analítica
predictiva.
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia4 |
Científico de Datos
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia5 |
¿Qué tienen en común?
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia6 |
Machine Learning
 Es una rama de la informática en el cual
las computadoras “aprenden” a través de
los datos, y de esta forma poder luego
crear modelos predictivos.
 Detección de fraudes en tarjetas de créditos
 Recomendaciones para compras online
 Predicción de stock de artículos para campaña
del día de la madre
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia7 |
Machine Learning
 Para empezar a trabajar con los datos se
deben tener en cuenta algunas
consideraciones:
 RELEVANTES
 CONECTADOS
 PRECISOS
 SUFICIENTES
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia8 |
Relevantes
 Para predecir el porcentaje de
contaminación no encuentro datos
relevantes:
 Para predecir el porcentaje de
contaminación si encuentro datos
relevantes:
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia9 |
Conectados
 Datos No Conectados  Datos Conectados
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia10 |
Automotores Ton/año %
contaminación
9270.6 84.0
511 1.7
18.4 0.2
164 1286.6 11.7
Automotores Ton/año %
contaminación
4449 9270.6 84.0
511 187.4 1.7
396 18.4 0.2
164 1286.6 11.7
Precisos
 No Precisos  Precisos
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia11 |
Suficientes
 Insuficientes, esto va muy relacionada con
el tamaño de data histórica que se tiene
para entrenar y testear el modelo
 Suficientes
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia12 |
Tipos de Aprendizaje
 Aprendizaje Supervisado
 Predicción.
 Se dispone de los valores de los datos.
 Modelo entrenado para predecir datos.
 Aprendizaje No Supervisado
 Identificar clúster de datos.
 Encontrar el valor de los datos.
 Obtener clúster de datos del modelo.
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia13 |
Tipos de Algoritmos
 Clasificación
 Detección de anomalías
 Regresión
 Clusterización
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia14 |
Clasificación
 ¿Es A o B?
A
B
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia15 |
Detección de Anomalías
 ¿Qué está fuera de lo común?
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia16 |
Regresión
 ¿Cuánto o cuantos?
25° 20° 18°
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia17 |
?
Clusterización
 ¿Cómo están organizados?
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia18 |
Microsoft y Machine Learning
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia19 |
Azure Machine Learning
 Es un servicio en la nube de Microsoft
 Nos brinda:
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia20 |
Total Gestión Integración Algoritmos
Selectos
Despliegue
Sencillo
Solo se necesita de un
portal para administrar.
Simple drag and drop.
Integración nativa con
otros servicios en la
nube de Microsoft.
Utilice los algoritmos
ya pre-construidos.
Otros aplicativos
pueden consumer el
modelo por medio de
un web service
generado.
Servicio de Machine Learning
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia21 |
Blobs
Tablas
Hadoop (HDInsight)
DB (Azure SQL DB)
Datos Cliente
Modelo en web service
API
Ambiente de desarrollo de Machine
Learning
ML STUDIO
“I spent last semester building a regression model in
Python, and I just did the same thing in 10 minutes
with Azure ML”
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia22 |
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia23 |
Construyendo un Modelo Predictivo para el
Alquiler de Apartamentos
#sqlsatBogota
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia24 |
Arquitectura de la Solución
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia25 |
Azure
Data
Factory
SQL
Azure
Data
base
Power
BI
Archivo
Plano
Azure
Machine Learning
#sqlsatBogota
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia26 |
Preguntas y Respuestas
Capítulo Organizador del SQL Saturday
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia27 |
www.bdotnet.co
Patrocinadores del SQL Saturday
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia28 |
Conéctese con PASS
Regístrese hoy para una membresía gratis:
pass.org
#sqlpass
Sea cual sea su pasión datos - hay un capítulo virtual para
usted!
13/5/2017 | SQL Saturday #608 – Bogotá, Colombia30 |
Gracias !!!

Más contenido relacionado

PPTX
Explorando los Sabores de SSIS 2016
PPTX
Vertica Extreme Analysis
PPTX
24 HOP edición Español - Ssas multidimensional mejores practicas - Ahias Port...
PPTX
Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...
PDF
Inteligencia de Negocios con Microsoft
PPTX
Pizza Fast Assistant Presentación de Proyecto
PPTX
De 0 a 100 con Azure Machine Learning
PDF
Servicios de datos en Microsoft Azure
Explorando los Sabores de SSIS 2016
Vertica Extreme Analysis
24 HOP edición Español - Ssas multidimensional mejores practicas - Ahias Port...
Mas alla de los datos con sql server reporting services 2016 - SQL Saturday B...
Inteligencia de Negocios con Microsoft
Pizza Fast Assistant Presentación de Proyecto
De 0 a 100 con Azure Machine Learning
Servicios de datos en Microsoft Azure

Similar a Introduccion Azure Machine Learning (20)

PDF
Técnicas avanzadas para resolver tus problemas de sql server - SolidQ Summit ...
PDF
Metricsday2019 - Big query
PPTX
BIG DATA APLICADO A LOS NEGOCIOS 2025 -1
PPTX
Base de datos presentacion
PDF
Industrializacionde la IA Maria Borbones
PPTX
Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...
PPTX
24 HOP edición Español - Machine learning - Cesar Oviedo
PPTX
Data flows Virtual Camp Dynamics UG
PPTX
Creando tu primer ambiente de AI en Azure ML y SQL Server
PDF
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data
PPTX
Cloud/On premise BI solutions with Office365
PDF
Arquitectura modelos esri ccu 22092017
PPTX
Formato_Información general.pptx
PDF
Propuesta BASE DE DATOS
PDF
Soluciones tecnológicas y de plataformas..pdf
PPTX
Introducción al análisis predictivo con SQL Server
PDF
Diseño de base de datos clase de mongo db
PPTX
Introduction to Machine Learning with Azure
PPTX
Sql saturday 448 Tips developer SQL 2012
PDF
Data Baséate
Técnicas avanzadas para resolver tus problemas de sql server - SolidQ Summit ...
Metricsday2019 - Big query
BIG DATA APLICADO A LOS NEGOCIOS 2025 -1
Base de datos presentacion
Industrializacionde la IA Maria Borbones
Presentación programas de Inteligencia de negocio y Big data_UOCssió_setemb...
24 HOP edición Español - Machine learning - Cesar Oviedo
Data flows Virtual Camp Dynamics UG
Creando tu primer ambiente de AI en Azure ML y SQL Server
Introducción a U-SQL lenguaje que hace fácil el procesamiento de Big Data
Cloud/On premise BI solutions with Office365
Arquitectura modelos esri ccu 22092017
Formato_Información general.pptx
Propuesta BASE DE DATOS
Soluciones tecnológicas y de plataformas..pdf
Introducción al análisis predictivo con SQL Server
Diseño de base de datos clase de mongo db
Introduction to Machine Learning with Azure
Sql saturday 448 Tips developer SQL 2012
Data Baséate
Publicidad

Más de Raul Martin Sarachaga Diaz (20)

PDF
Webinar_Data Integration en Alibaba Cloud.pdf
PDF
Data Modeling with Power BI
PDF
Modelo Tabulares con Azure SSAS
PDF
Dashboards de Alto Impacto con Power BI
PDF
Data Model with Power BI
PDF
DevOps SQL Server
PDF
PPTX
Azure SQL Data Warehouse - 24 horas de PASS
PDF
Azure SQL Databases para DBAs
PDF
Explorando los Sabores de Azure DW
PDF
Creacion de Cubos Tabulares en SSAS 2016
PDF
Data Modeling With Power BI
PDF
Explorando los Sabores de Power Query
PDF
Migrando mis datos a la nube con Azure Data Factory
PDF
El Despertar de la Fuerza con SSRS 2016
PDF
Explorando los Sabores de Azure Data Factory
PPTX
Azure SQL Database para DBAs
PPTX
Tus Datos en la Nube con Azure SQL Database
PPTX
Analisis de Sentimientos con Power BI
PPTX
Datos Siempre Actualizados con Power BI
Webinar_Data Integration en Alibaba Cloud.pdf
Data Modeling with Power BI
Modelo Tabulares con Azure SSAS
Dashboards de Alto Impacto con Power BI
Data Model with Power BI
DevOps SQL Server
Azure SQL Data Warehouse - 24 horas de PASS
Azure SQL Databases para DBAs
Explorando los Sabores de Azure DW
Creacion de Cubos Tabulares en SSAS 2016
Data Modeling With Power BI
Explorando los Sabores de Power Query
Migrando mis datos a la nube con Azure Data Factory
El Despertar de la Fuerza con SSRS 2016
Explorando los Sabores de Azure Data Factory
Azure SQL Database para DBAs
Tus Datos en la Nube con Azure SQL Database
Analisis de Sentimientos con Power BI
Datos Siempre Actualizados con Power BI
Publicidad

Último (20)

PPTX
Características de jean Piaget y su fase cognitivo
PDF
Presentacion Gestion de Recursos DIA 1.pdf
PPTX
Tutoria 3. Unidad 2 PRUEBAS BIOLÓGICAS.pptx
PDF
Riesgos en Negociaciones_comercio exterior.pdf
PDF
docsity-diapositivas-de-la-salud-mental.pdf
PDF
SEMANA 13.pdf MICROBIOLOGÍA Y PARÁSITISMO
PPTX
TICS EN HONDURAS, PAIS DE CENTROAMERICA.pptx
PPTX
DOROTHEA E OREM EXPO.pptx de una teoridta importante
PPTX
ESTRADA ORDEN INTERNO 111111111111111111
PDF
PRESENTACION DE LA ASIGNATURA materiales no convencionales.pdf
PPTX
Introducción al analisis de datos con Power bi
PDF
6°-Básico-Matemática-Diagrama-de-tallo-y-hoja_y_probabilidades.pdf
PDF
RADIOGRAFIA DEL PARQUE AUTOMOTOR EN BOLIVA Y PROYECCIONES 2025-2030.pdf
PDF
MORFOLOGIA (ASPECTO FORMACION DE PALABRAS).pdf
PPTX
Inteligencia_Artificialdelosk_Mujer.pptx
PPTX
Presentacion Capacitacion RC y RG (5).pptx
PDF
Los 10 mayores Fondos Soberanos de Riqueza (2025).pdf
PPTX
lareformaprevisional-091013175510-phpapp01.pptx
PDF
lavado de manos_20250805_212935_0000.pdf
PDF
REPORTE DE VICTIMAS POR HOMICIDIO DOLOSO IRAPUATO JULIO 2025
Características de jean Piaget y su fase cognitivo
Presentacion Gestion de Recursos DIA 1.pdf
Tutoria 3. Unidad 2 PRUEBAS BIOLÓGICAS.pptx
Riesgos en Negociaciones_comercio exterior.pdf
docsity-diapositivas-de-la-salud-mental.pdf
SEMANA 13.pdf MICROBIOLOGÍA Y PARÁSITISMO
TICS EN HONDURAS, PAIS DE CENTROAMERICA.pptx
DOROTHEA E OREM EXPO.pptx de una teoridta importante
ESTRADA ORDEN INTERNO 111111111111111111
PRESENTACION DE LA ASIGNATURA materiales no convencionales.pdf
Introducción al analisis de datos con Power bi
6°-Básico-Matemática-Diagrama-de-tallo-y-hoja_y_probabilidades.pdf
RADIOGRAFIA DEL PARQUE AUTOMOTOR EN BOLIVA Y PROYECCIONES 2025-2030.pdf
MORFOLOGIA (ASPECTO FORMACION DE PALABRAS).pdf
Inteligencia_Artificialdelosk_Mujer.pptx
Presentacion Capacitacion RC y RG (5).pptx
Los 10 mayores Fondos Soberanos de Riqueza (2025).pdf
lareformaprevisional-091013175510-phpapp01.pptx
lavado de manos_20250805_212935_0000.pdf
REPORTE DE VICTIMAS POR HOMICIDIO DOLOSO IRAPUATO JULIO 2025

Introduccion Azure Machine Learning

  • 1. Mayo 13, 2017 Bogotá, Colombia #sqlsatBogota
  • 2.  Raúl Saráchaga Díaz Business Intelligence Consultant at Kaits Database Administrator MCSA SQL Server 2012/2014 MCSE Data Management and Analytics MCSE Business Intelligence Introducción a Azure Machine Learning Email:raulsarachaga@hotmail.com Blog personal: aprendebi.wordpress.com
  • 3. Desarrollo del Contenido  Ciencia de Datos  Machine Learning  Azure Machine Learning  Demo sobre Azure Machine Learning 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia3 |
  • 4. Ciencia de Datos  Es un campo interdisciplinario que involucra métodos científicos, procesos y sistemas para extraer conocimiento y obtener un mejor entendimiento de los datos, estos podrían ser estructurados o no estructurados.  Así mismo, es el conjunto de campos tales como: la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva. 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia4 |
  • 5. Científico de Datos 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia5 |
  • 6. ¿Qué tienen en común? 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia6 |
  • 7. Machine Learning  Es una rama de la informática en el cual las computadoras “aprenden” a través de los datos, y de esta forma poder luego crear modelos predictivos.  Detección de fraudes en tarjetas de créditos  Recomendaciones para compras online  Predicción de stock de artículos para campaña del día de la madre 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia7 |
  • 8. Machine Learning  Para empezar a trabajar con los datos se deben tener en cuenta algunas consideraciones:  RELEVANTES  CONECTADOS  PRECISOS  SUFICIENTES 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia8 |
  • 9. Relevantes  Para predecir el porcentaje de contaminación no encuentro datos relevantes:  Para predecir el porcentaje de contaminación si encuentro datos relevantes: 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia9 |
  • 10. Conectados  Datos No Conectados  Datos Conectados 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia10 | Automotores Ton/año % contaminación 9270.6 84.0 511 1.7 18.4 0.2 164 1286.6 11.7 Automotores Ton/año % contaminación 4449 9270.6 84.0 511 187.4 1.7 396 18.4 0.2 164 1286.6 11.7
  • 11. Precisos  No Precisos  Precisos 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia11 |
  • 12. Suficientes  Insuficientes, esto va muy relacionada con el tamaño de data histórica que se tiene para entrenar y testear el modelo  Suficientes 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia12 |
  • 13. Tipos de Aprendizaje  Aprendizaje Supervisado  Predicción.  Se dispone de los valores de los datos.  Modelo entrenado para predecir datos.  Aprendizaje No Supervisado  Identificar clúster de datos.  Encontrar el valor de los datos.  Obtener clúster de datos del modelo. 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia13 |
  • 14. Tipos de Algoritmos  Clasificación  Detección de anomalías  Regresión  Clusterización 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia14 |
  • 15. Clasificación  ¿Es A o B? A B 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia15 |
  • 16. Detección de Anomalías  ¿Qué está fuera de lo común? 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia16 |
  • 17. Regresión  ¿Cuánto o cuantos? 25° 20° 18° 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia17 | ?
  • 18. Clusterización  ¿Cómo están organizados? 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia18 |
  • 19. Microsoft y Machine Learning 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia19 |
  • 20. Azure Machine Learning  Es un servicio en la nube de Microsoft  Nos brinda: 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia20 | Total Gestión Integración Algoritmos Selectos Despliegue Sencillo Solo se necesita de un portal para administrar. Simple drag and drop. Integración nativa con otros servicios en la nube de Microsoft. Utilice los algoritmos ya pre-construidos. Otros aplicativos pueden consumer el modelo por medio de un web service generado.
  • 21. Servicio de Machine Learning 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia21 | Blobs Tablas Hadoop (HDInsight) DB (Azure SQL DB) Datos Cliente Modelo en web service API Ambiente de desarrollo de Machine Learning ML STUDIO
  • 22. “I spent last semester building a regression model in Python, and I just did the same thing in 10 minutes with Azure ML” 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia22 |
  • 23. 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia23 |
  • 24. Construyendo un Modelo Predictivo para el Alquiler de Apartamentos #sqlsatBogota 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia24 |
  • 25. Arquitectura de la Solución 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia25 | Azure Data Factory SQL Azure Data base Power BI Archivo Plano Azure Machine Learning
  • 26. #sqlsatBogota 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia26 | Preguntas y Respuestas
  • 27. Capítulo Organizador del SQL Saturday 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia27 | www.bdotnet.co
  • 28. Patrocinadores del SQL Saturday 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia28 |
  • 29. Conéctese con PASS Regístrese hoy para una membresía gratis: pass.org #sqlpass
  • 30. Sea cual sea su pasión datos - hay un capítulo virtual para usted! 13/5/2017 | SQL Saturday #608 – Bogotá, Colombia30 |