SlideShare uma empresa Scribd logo
Introdução a Data Science com Python
Por quanto vender
um imóvel?
● Preço muito alto afasta
compradores
● Preço abaixo do valor é
prejuízo
Preço (R$)
Área (m²)
y: Preço em milhares de R$
x: área construída em m²
y = 2.59x + 7.8
Regressão Linear para estimar preços
Introdução a Data Science com Python
Formando um cientista de dados
Estatística Álgebra Linear Machine Learning Computação Cálculo
Limpeza de
Dados
Análise
Exploratória
Engenharia
de Atributos
Treinamento
de Modelos
Python R SAS Tableau PowerBI QlikView
Marketing Finanças Saúde
Bottom-up Top-down
Processo da Ciência de Dados
Extração de
Dados
Limpeza de
Dados
Análise
Exploratória
Treinamento
de Modelos
Implantação
do Modelo
Engenharia de
Atributos
Caixa de Ferramentas
● Notebooks Python na nuvem
● Documentação e código juntos
● Principais bibliotecas pré-instaladas
● GPUs e TPUs gratuitos
● Disponível em https://colab.research.google.com/
Introdução a Data Science com Python
Introdução a Data Science com Python
● Dados tabulares em DataFrames
● Carrega diversas fontes de dados
● Limpeza de dados
● Análise Exploratória
● Engenharia de atributos
● Disponível em https://pandas.pydata.org/
Leitura de Dados
Medidas Resumo
Matriz de Correlação
Operações Vetorizadas
One-hot encoding
● Plotagem de gráficos variados
● Alto grau de customização
● Exporta para diferentes formatos
● Biblioteca de “baixo nível”
● Disponível em https://matplotlib.org/
● Baseado no matplotlib
● Orientado para funcionalidade
● Biblioteca de “alto nível”
● Disponível em https://seaborn.pydata.org/
seaborn: statistical data visualization
seaborn: statistical data visualization
seaborn: statistical data visualization
seaborn: statistical data visualization
● Algoritmos de machine learning
○ Classificação
○ Regressão
○ Clustering
○ Redução de dimensionalidade
● Funções de pré-processamento
● Treinamento de modelos
○ separação de dados de treinamento e validação
○ cross-validation
○ funções para cálculos de score
● Interface simples
● 2 métodos
○ fit(): executa o treinamento
○ predict(): retorna a estimativa
● Disponível em https://scikit-learn.org/
Atributos entrada/saída
Dados treinamento/teste
Treinamento e predição
Avaliação do Modelo
Create your first machine learning model in 5
minutes with Google Colab
http://bit.ly/mlgc5min

Mais conteúdo relacionado

PDF
Seleção de Features para Ranking
PDF
Oficina de Mapas
PDF
TDC2016SP - Trilha Data Science
PDF
Data Science For Dummies From a Dummy
PPTX
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...
PDF
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
PDF
Da Exploração à Produção - Inteligência Artificial com a plataforma Marvin
PPTX
Real Time Analytics - do Machine Learning ao Power BI
Seleção de Features para Ranking
Oficina de Mapas
TDC2016SP - Trilha Data Science
Data Science For Dummies From a Dummy
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Da Exploração à Produção - Inteligência Artificial com a plataforma Marvin
Real Time Analytics - do Machine Learning ao Power BI

Semelhante a Introdução a Data Science com Python (20)

PDF
pgModeler: muito mais que um modelador de bancos de dados PostgreSQL
PDF
Big Data Analytics - Data Science - Aplicação e Tecnologia
PDF
Webinar: Monitorando sensores IoT: Do ESP32 ao Grafana
PDF
Eiti Kimura - Analisador de dados automatizado utilizando machine learning
PDF
Big data e globo.com - Uma visão sobre a cultura de dados
PPT
AppPrint
PDF
TDC2017 - Misturando dados com Pentaho para insights mais significativos
PDF
Processamento e Análise de Dados em Tempo Real com Python, Kafka e ElasticSearch
PDF
2019: LCoN - Centro de Excelência em Inteligência Artificial
PDF
Big Data como Serviço: da captura à visualização de dados com alto desempenho
PDF
Big Data e Data Science: admirável mundo novo - IV SIC IFNMG
PPTX
Meetup Globo - Big Data | Big Data @ TV Globo
PDF
Big Data Analytics - Data Engineer, Arquitetura, AWS e Mais
PPTX
Business intelligence x Datamining
PPTX
Sql Server
PPTX
ABC da Aprendizagem de Máquinas
PPTX
Integrando Azure Machine Learning na prática
PDF
Business Analytics
PPTX
ASP.Net Performance – A pragmatic approach - Luis Paulino
PPTX
Desenvolvendosistemasgigantesnainternetcomarquiteturabaseada 190213231932 (1)
pgModeler: muito mais que um modelador de bancos de dados PostgreSQL
Big Data Analytics - Data Science - Aplicação e Tecnologia
Webinar: Monitorando sensores IoT: Do ESP32 ao Grafana
Eiti Kimura - Analisador de dados automatizado utilizando machine learning
Big data e globo.com - Uma visão sobre a cultura de dados
AppPrint
TDC2017 - Misturando dados com Pentaho para insights mais significativos
Processamento e Análise de Dados em Tempo Real com Python, Kafka e ElasticSearch
2019: LCoN - Centro de Excelência em Inteligência Artificial
Big Data como Serviço: da captura à visualização de dados com alto desempenho
Big Data e Data Science: admirável mundo novo - IV SIC IFNMG
Meetup Globo - Big Data | Big Data @ TV Globo
Big Data Analytics - Data Engineer, Arquitetura, AWS e Mais
Business intelligence x Datamining
Sql Server
ABC da Aprendizagem de Máquinas
Integrando Azure Machine Learning na prática
Business Analytics
ASP.Net Performance – A pragmatic approach - Luis Paulino
Desenvolvendosistemasgigantesnainternetcomarquiteturabaseada 190213231932 (1)
Anúncio

Mais de Rodolfo Mendes (6)

PPTX
Descobrindo Conhecimento em Dados para Auxiliar a Tomada de Decisões
PPTX
Introdução à API java.io
PPTX
Introdução à API java.io
PPT
NoSQL Na Nuvem
ODP
Indexando e Ordenando Data Sets
PPT
Entendendo a Arquitetura de Armazenamento, parte 1
Descobrindo Conhecimento em Dados para Auxiliar a Tomada de Decisões
Introdução à API java.io
Introdução à API java.io
NoSQL Na Nuvem
Indexando e Ordenando Data Sets
Entendendo a Arquitetura de Armazenamento, parte 1
Anúncio

Último (12)

PPTX
Apresentação Lagoa Mandaú Lagoa Mandaú Lagoa Mandaú
PPTX
Sermao a mensagem da Cruz.pptx gdfvdcdfdfdsfcdsfxdfdfdfvdgf
PDF
Bases de dados - basicos dos basicos. como identificar chaves
PDF
Investigação Operacional história completa
PDF
Previsão de Paradas em Máquinas Industriais
PDF
712893401-Geografia-em-perspectiva-3.pdf
PDF
01 Anticoag + fibrinol Abr 24 - prof MAISA DIA 020424.pdf
PPT
AULA COACHING INICIAL *******************
PPTX
Slide Gêneros textuais: resenha crítica.ppxt
DOC
COMO CRIAR DASHBOARD ATRAVES DE CODIFICAÇÃO PYTHON
PDF
48585b89-ee4d-4f8d-b2c0-7db19cc44e44.pdf
PDF
Medidor de PH de bancada PH140 para uso em laboratório
Apresentação Lagoa Mandaú Lagoa Mandaú Lagoa Mandaú
Sermao a mensagem da Cruz.pptx gdfvdcdfdfdsfcdsfxdfdfdfvdgf
Bases de dados - basicos dos basicos. como identificar chaves
Investigação Operacional história completa
Previsão de Paradas em Máquinas Industriais
712893401-Geografia-em-perspectiva-3.pdf
01 Anticoag + fibrinol Abr 24 - prof MAISA DIA 020424.pdf
AULA COACHING INICIAL *******************
Slide Gêneros textuais: resenha crítica.ppxt
COMO CRIAR DASHBOARD ATRAVES DE CODIFICAÇÃO PYTHON
48585b89-ee4d-4f8d-b2c0-7db19cc44e44.pdf
Medidor de PH de bancada PH140 para uso em laboratório

Introdução a Data Science com Python