SlideShare uma empresa Scribd logo
Aprendizado de Máquinas com
Azure Machine Learning e R
Diego Nogare
@DiegoNogare
www.diegonogare.net
Diego Nogare?
Do que é esta palestra?
Inteligência
Artificial
Análise
Preditiva
Aprendizado
de Máquinas
Big Data
Business
Analytics
Data Science
Aprendizado de Máquinas com Azure Machine Learning e R
Algoritmos
Regressão
Classificação
Cluster
Detecção de
Anomalias
Classificadores Binários
Classificadores Binários
ACURACY (ACURÁCIA):
Quantidade classificada como Positivos e Negativos corretamente
(True Positive + True Negative) /
((True Positive + False Negative) +(False Positive + True Negative))
Com nossos números: (16 + 54) / ((16+0) + (5+54)) => 70 / 75 = 0.9333
Classificadores Binários
PRECISION (PRECISÃO):
Quantidade classificada corretamente
True Positive / (True Positive + False Positive)
Com nossos números: (16) / (16 + 5) => 16 / 21 = 0.7619
Classificadores Binários
RECALL:
Quantidade classificada como Positivo corretamente
True Positive / (True Positive + False Negative)
Com nossos números: 16 / (16+0) => 16 / 16 = 1
Classificadores Binários
F1 SCORE:
Média harmônica entre Precisão e Recall
Precisão: True Positive / (True Positive + False Positive)
Recall: True Positive / (True Positive + False Negative)
(2* True Positive) / (2* True Positive + False Positive + False Negative)
Com nossos números: (2*16) / (2*16 + 5 + 0) => 32 / 37 = 0.8648
2* Precision*Recall / (Precision + Recall)
Com nossos números: 2*(0,76*1)/(0,76+1) => 1,52 / 1,76 = 0.8636
F1- Score – harmonic mean of Precision and Recall
2. precision .recall /(precision+recall)
ROC
Area under the
ROC curve = AUC
0.5(𝑟𝑎𝑛𝑑𝑜𝑚𝑚𝑜𝑑𝑒𝑙)<𝐴𝑈𝐶<1(𝑝𝑒𝑟𝑓𝑒𝑐𝑡𝑚𝑜𝑑𝑒𝑙)
ROC
Area under the
ROC curve = AUC
0.5(𝑟𝑎𝑛𝑑𝑜𝑚𝑚𝑜𝑑𝑒𝑙)<𝐴𝑈𝐶<1(𝑝𝑒𝑟𝑓𝑒𝑐𝑡𝑚𝑜𝑑𝑒𝑙)
Métricas de Performance
Curva ROC (Receiver Operating Characteristic)
– 1.0: Predição Perfeita
– 0.9: Predição Excelente
– 0.8: Predição Boa
– 0.7: Predição Medíocre
– 0.6: Predição Porca
– 0.5: Predição Aleatória
– <0.5: Tem alguma coisa errada!
Classificadores Binários
30times
2
conferências
25jogadoers
US$ 3,5
Bilhões em
contratos
64Jogares
1 All Star
Game
http://deadspin.com/2014-payrolls-and-salaries-for-every-mlb-team-1551868969
Algoritmos
Regressão
Classificação
Cluster
Detecção de
Anomalias
K-Means Cluster
Todos os dados são plotados no gráfico
Os pontos representam os indivíduos analisados, mas não estão
separados em grupos, todos fazem parte do mesmo grupo. Ao informar a
quantidade de centróides, as interções começam até o momento de convergir
e encontrar os K grupos.
Os pontos representam os dados de treinos, neste caso o dataset
K-Means Cluster
Centróides iniciais em posições aleatórias
Ao iniciar o algoritmo, os K pontos (chamados de centróides) são
plotados aleatoriamente no plano e possuem um ponto de partida para iniciar
o algoritmo.
As cruzes representam os centróides, e a linha tracejada é a borda de
separação entre os centróides, fazendo com que esse grupo seja
dividido entre os individuos da parte de cima desta linha, e da parte de
baixo.
K-Means Cluster
Com base nos pontos e centros, inicia-se o algoritmo
Os centróides são re-calculados a cada interação, calculando a
média da distância entre cada ponto e a posição do centróide. Então, com
base neste resultado o centróide muda de lugar ficando mais ao centro de seus
pontos (elementos).
Posição inicial (amarelo) do centróide seguindo para uma próxima
posição (vermelho e azul).
K-Means Cluster
Alteração dos pontos e centros
Enquanto a distância for recalculada e elementos mudarem de
centro, o algoritmo continua executando.
Reparem que os elementos marcados mudaram de centro.
K-Means Cluster
Posição final depois de uma interação.
K-Means Cluster
Com base nos pontos e centros, inicia-se o algoritmo
Mais uma interação e re-calculo das distâncias, e com isso, mais uma
vez a movimentação dos centróides.
Posição inicial (amarelo) do centróide seguindo para uma próxima
posição (vermelho e azul).
K-Means Cluster
Quando parar?
No momento que os centróides não recebem nenhum elemento novo
em seu grupo significa que eles convergiram para uma posição satisfatória, e
criou os grupos necessários.
Enquanto a média da distância calculada ainda alterar pontos entre os
grupos, o algoritmo continua interagindo e re-calculando os centróides.
K-Means Cluster
Ponto satisfatório
Ao encontrar o ponto satisfatório, o algoritmo para de executar e
mantém os elementos conectados com seus centróides.
Depois da interação não houve mudança de elementos.
K-Means Cluster
Quantos centróides usar?
Existe uma linha de pesquisa que usa esta representação de elbow
(cotovelo) para definir uma quantidade razoavel de centróides.
Esta técnica condiz em encontrar o platô e então utilizar valores
anteriores. Quando utilizar um valor que esteja estagnado no platô, o
resultado não terá tanta relevância e impacto para o agrupamento.
K-Means Cluster
K-Means Cluster
K-Means Cluster
K-Means Cluster
K-Means Cluster
K-Means Cluster
K-Means Cluster
K-Means Cluster
K-Means Cluster
K-Means Cluster
Diego Nogare
@DiegoNogare
http://www.DiegoNogare.net
Obrigado!

Mais conteúdo relacionado

PPTX
Big Data e Data Science - GBG - Google Business Group
PPTX
Aprendizado de Máquina com Azure Machine Learning e R
PPTX
Business Intelligence, Data Visualization and Data Science
PPTX
Dia a dia do Cientista de Dados
PPTX
Aplicações Práticas de Machine Learning
PDF
Data Mining - Clustering
PDF
Recursos do Ambiente R para a Análise de Clusters
PDF
Machine Learning - Introdução e Aplicações
Big Data e Data Science - GBG - Google Business Group
Aprendizado de Máquina com Azure Machine Learning e R
Business Intelligence, Data Visualization and Data Science
Dia a dia do Cientista de Dados
Aplicações Práticas de Machine Learning
Data Mining - Clustering
Recursos do Ambiente R para a Análise de Clusters
Machine Learning - Introdução e Aplicações

Destaque (20)

PDF
Super hybrid2016 tdc
PPTX
Quer ser um excelente dba
PPT
O problema não é no banco de dados
PDF
Novidades do Universo MySQL julho-15
PDF
Mineração de Dados no Weka - Regressão Linear
PDF
PostgreSQL Wonderland TDC-SP 2015
PPTX
Alinguagem SQL no mundo NOSQL
PDF
Aprendizado de máquina
PDF
APRENDIZAGEM DE MÁQUINA PARA PREVISÃO DE DEMANDA EM UM SISTEMA DE COMPARTILHA...
PDF
Mini-curso JavaFX Aula3 UFPB
PDF
Mini-curso JavaFX Aula2
PDF
JavaFX: Desktop para desenvolvedores WEB
PDF
Introdução ao JavaFX
PDF
Aplicações desktop (GUI) e aplicações ricas para internet (RIA)
PDF
Como ingressar no mercado de Machine Learning
PDF
Introdução ao Machine Learning para Hackers
PPT
Como lidar com dados temporais e intervalos com a linguagem SQL
PDF
Weka em aplicações java
PDF
Boas práticas na criação de aplicações sérias com JavaFX - TDC 2014 SP
PPTX
Criando aplicações java fx em minutos
Super hybrid2016 tdc
Quer ser um excelente dba
O problema não é no banco de dados
Novidades do Universo MySQL julho-15
Mineração de Dados no Weka - Regressão Linear
PostgreSQL Wonderland TDC-SP 2015
Alinguagem SQL no mundo NOSQL
Aprendizado de máquina
APRENDIZAGEM DE MÁQUINA PARA PREVISÃO DE DEMANDA EM UM SISTEMA DE COMPARTILHA...
Mini-curso JavaFX Aula3 UFPB
Mini-curso JavaFX Aula2
JavaFX: Desktop para desenvolvedores WEB
Introdução ao JavaFX
Aplicações desktop (GUI) e aplicações ricas para internet (RIA)
Como ingressar no mercado de Machine Learning
Introdução ao Machine Learning para Hackers
Como lidar com dados temporais e intervalos com a linguagem SQL
Weka em aplicações java
Boas práticas na criação de aplicações sérias com JavaFX - TDC 2014 SP
Criando aplicações java fx em minutos
Anúncio

Semelhante a Aprendizado de Máquinas com Azure Machine Learning e R (6)

PDF
Trabalho de algoritmos
PPTX
Criando modelos preditivos com Azure Machine Learning
PDF
Agrupamento com K-Means
PPTX
Nilo Antonio de Souza Sampaio - Pesquisa operacional e probabilidade
PPTX
Pesquisa operacional e probabilidade - Prof.Dr. Nilo Sampaio
KEY
Classificação de Documentos
Trabalho de algoritmos
Criando modelos preditivos com Azure Machine Learning
Agrupamento com K-Means
Nilo Antonio de Souza Sampaio - Pesquisa operacional e probabilidade
Pesquisa operacional e probabilidade - Prof.Dr. Nilo Sampaio
Classificação de Documentos
Anúncio

Mais de Diego Nogare (20)

PPTX
Build your first spark big data environment in azure
PPTX
ABC da Aprendizagem de Máquinas
PPTX
Real Time Analytics - do Machine Learning ao Power BI
PPTX
Real Time Analytics in Industry 4.0
PPTX
Real Time Analytics e Machine Learning
PPTX
Análise preditiva com consumo de dados em tempo real
PPTX
The Art of Machine Learning & Predictive Intelligence
PDF
Real Time Analytics na Industria 4.0
PPTX
Big Data: Tomando Decisões
PPTX
Integrando Azure Machine Learning na prática
PPTX
Criando modelos preditivos com Azure Machine Learning
PPTX
Colocando o Azure Machine Learning no seu Cotidiano
PPTX
Mini-Curso: Introdução à Big Data e Data Science - Aula 12 - Sessão de pergun...
PPTX
Mini-Curso: Introdução à Big Data e Data Science - Aula 11 - SQL 2016 + BigDa...
PPTX
Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...
PPTX
Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...
PPTX
Mini-Curso: Introdução à Big Data e Data Science - Aula 8 - Introdução ao Azu...
PPTX
Mini-Curso: Introdução à Big Data e Data Science - Aula 7 - Introdução à Ling...
PPTX
Mini-Curso: Introdução à Big Data e Data Science - Aula 5 - Onde usamos Data ...
PPTX
Mini-Curso: Introdução à Big Data e Data Science - Aula 4 - O que é Data Scie...
Build your first spark big data environment in azure
ABC da Aprendizagem de Máquinas
Real Time Analytics - do Machine Learning ao Power BI
Real Time Analytics in Industry 4.0
Real Time Analytics e Machine Learning
Análise preditiva com consumo de dados em tempo real
The Art of Machine Learning & Predictive Intelligence
Real Time Analytics na Industria 4.0
Big Data: Tomando Decisões
Integrando Azure Machine Learning na prática
Criando modelos preditivos com Azure Machine Learning
Colocando o Azure Machine Learning no seu Cotidiano
Mini-Curso: Introdução à Big Data e Data Science - Aula 12 - Sessão de pergun...
Mini-Curso: Introdução à Big Data e Data Science - Aula 11 - SQL 2016 + BigDa...
Mini-Curso: Introdução à Big Data e Data Science - Aula 10 - Introdução ao HD...
Mini-Curso: Introdução à Big Data e Data Science - Aula 9 - Introdução ao Pow...
Mini-Curso: Introdução à Big Data e Data Science - Aula 8 - Introdução ao Azu...
Mini-Curso: Introdução à Big Data e Data Science - Aula 7 - Introdução à Ling...
Mini-Curso: Introdução à Big Data e Data Science - Aula 5 - Onde usamos Data ...
Mini-Curso: Introdução à Big Data e Data Science - Aula 4 - O que é Data Scie...

Último (19)

PDF
Fullfilment AI - Forum ecommerce 2025 // Distrito e Total Express
PPTX
Informática Aplicada Informática Aplicada Plano de Ensino - estudo de caso NR...
PPTX
Aula 18 - Manipulacao De Arquivos python
PDF
Gestão de transportes básica no SAP S/4HANA, S4611 Col20
PDF
20250805_ServiceNow e a Arquitetura Orientada a Serviços (SOA) A Base para Ap...
PDF
Fundamentos de gerenciamento de ordens e planejamento no SAP TransportationMa...
PPTX
Gestao-de-Bugs-em-Software-Introducao.pptxxxxxxxx
PDF
Custos e faturamento no SAP S/4HANA Transportation Management, S4TM3 Col26
PDF
Aula04-Academia Heri- Tecnologia Geral 2025
PDF
Processos na gestão de transportes, TM100 Col18
PDF
COBITxITIL-Entenda as diferença em uso governança TI
PDF
Apple Pippin Uma breve introdução. - David Glotz
PPTX
Programação - Linguagem C - Variáveis, Palavras Reservadas, tipos de dados, c...
PDF
Mergulho profundo técnico para gestão de transportes no SAP S/4HANA, S4TM6 Col14
PDF
Otimizador de planejamento e execução no SAP Transportation Management, TM120...
PPTX
Aula16ManipulaçãoDadosssssssssssssssssssssssssssss
PPTX
BANCO DE DADOS - AULAS INICIAIS-sgbd.pptx
PDF
Custos e liquidação no SAP Transportation Management, TM130 Col18
PPTX
Como-se-implementa-um-softwareeeeeeeeeeeeeeeeeeeeeeeee.pptx
Fullfilment AI - Forum ecommerce 2025 // Distrito e Total Express
Informática Aplicada Informática Aplicada Plano de Ensino - estudo de caso NR...
Aula 18 - Manipulacao De Arquivos python
Gestão de transportes básica no SAP S/4HANA, S4611 Col20
20250805_ServiceNow e a Arquitetura Orientada a Serviços (SOA) A Base para Ap...
Fundamentos de gerenciamento de ordens e planejamento no SAP TransportationMa...
Gestao-de-Bugs-em-Software-Introducao.pptxxxxxxxx
Custos e faturamento no SAP S/4HANA Transportation Management, S4TM3 Col26
Aula04-Academia Heri- Tecnologia Geral 2025
Processos na gestão de transportes, TM100 Col18
COBITxITIL-Entenda as diferença em uso governança TI
Apple Pippin Uma breve introdução. - David Glotz
Programação - Linguagem C - Variáveis, Palavras Reservadas, tipos de dados, c...
Mergulho profundo técnico para gestão de transportes no SAP S/4HANA, S4TM6 Col14
Otimizador de planejamento e execução no SAP Transportation Management, TM120...
Aula16ManipulaçãoDadosssssssssssssssssssssssssssss
BANCO DE DADOS - AULAS INICIAIS-sgbd.pptx
Custos e liquidação no SAP Transportation Management, TM130 Col18
Como-se-implementa-um-softwareeeeeeeeeeeeeeeeeeeeeeeee.pptx

Aprendizado de Máquinas com Azure Machine Learning e R