SlideShare uma empresa Scribd logo
Pacotes e Ferramentas
Python para Data Science e
Machine Learning
Gabriel Cypriano Saca
Quem sou eu?
Co-fundei startup de música Songwich.com
Convite para mentoria no curso de Machine Learning da Universidade de
Stanford no Coursera
Atualmente Cientista de Dados Júnior na K2 Data Science
http://gabrielcs.me
Data Science
75%
Python tem 75% mais vagas de emprego relacionadas a Machine Learning e
Data Science do que R no Indeed.com. Fonte: http://bit.ly/2n3a3bZ
Análise de Dados
Jupyter Notebook
Web app
Live code
Equações
Visualizações
Texto explanatório
Titanic
Vamos prever quem sobreviveu
à tragédia.
Dados: http://bit.ly/2aKeyjU
Pandas ● Manipulação e análise de dados
● Estruturas de dados:
○ DataFrame
○ Series
Pandas
NumPy ● Array de N-dimensões
● Operações de álgebra linear
● Implementação vetorizada
● Utilizado pelo Pandas
● Útil para simular distribuições
Gera gráficos 2D
Integração com NumPy e
Pandas
Matplotlib
Matplotlib
Baseado no Matplotlib
Estilo mais moderno
Adiciona alguns tipos de gráficos ao arsenal
do Matplotlib
Seaborn
Seaborn
SciPy ● Vários subpacotes com funções
matemáticas, inclusive um de estatística.
● Útil para:
○ Criar amostras aleatórias
○ Calcular função densidade, função
massa de probabilidade, função
distribuição acumulada
○ Testes de inferência estatística
SciPy: é possível afirmar com 95% de
confiança que sobreviventes pagaram mais
pelo bilhete do que não-sobreviventes?
Machine Learning
Scikit-learn ● Pacote mais utilizado de Machine
Learning
● Interface simples e elegante
● Integração com NumPy, SciPy e
Matplotlib
Scikit-learn: prevendo quais passageiros
foram sobreviventes ou não
Vix Data
Meetup
meetup.com/Vix-Data-Meetup
Obrigado!
http://gabrielcs.me

Mais conteúdo relacionado

PDF
[Palestras] machine learning gênesis ao apocalipse
PDF
Data Science For Dummies From a Dummy
PDF
TDC2016SP - Trilha Data Science
ODP
G.O. - Grafos Online
PDF
Processamento e Análise de Dados em Tempo Real com Python, Kafka e ElasticSearch
PPSX
Big data e data science
PDF
Bigadata casese opotunidades
PDF
Codelab - Análise de Redes Sociais com Python
[Palestras] machine learning gênesis ao apocalipse
Data Science For Dummies From a Dummy
TDC2016SP - Trilha Data Science
G.O. - Grafos Online
Processamento e Análise de Dados em Tempo Real com Python, Kafka e ElasticSearch
Big data e data science
Bigadata casese opotunidades
Codelab - Análise de Redes Sociais com Python

Semelhante a Data Science & Machine Learning - Python Conference ES 2017 (20)

PDF
Introdução ao Machine Learning para Hackers
PDF
O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...
PPTX
Palestra Ciência de Dados
PDF
Cientista de Dados
PDF
Scipy meetup-2020-02
PPTX
Uma breve introdução ao Big Data e Inteligência Artificial.pptx
PDF
Utilizando o Arduino em Ciência de Dados - Arduino Week 2022
PPTX
Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...
PPTX
Mineração de Dados na prática com Weka.pptx
PDF
Machine learning java ce conference 2012 - fortaleza ce
PDF
Big Data Analytics - Data Science - Aplicação e Tecnologia
PPTX
Mini-Curso: Introdução à Big Data e Data Science - Aula 4 - O que é Data Scie...
PDF
Cientista de Dados - A profissão mais sexy do século 21
PDF
Internet das Coisas - Uma Revolução que vale a pena participar
PPTX
The Data Science Workflow
PDF
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
PDF
Big data, e eu com isso?
PPTX
Aplicações do Python na escola e no mercado de trabalho
PPTX
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...
PPT
Ferramentas de Recomendação
Introdução ao Machine Learning para Hackers
O Potencial Competitivo da Ciencia de Dados e da Inteligencia Artificial nas ...
Palestra Ciência de Dados
Cientista de Dados
Scipy meetup-2020-02
Uma breve introdução ao Big Data e Inteligência Artificial.pptx
Utilizando o Arduino em Ciência de Dados - Arduino Week 2022
Mini-Curso: Introdução à Big Data e Data Science - Aula 2 - Onde usamos Big D...
Mineração de Dados na prática com Weka.pptx
Machine learning java ce conference 2012 - fortaleza ce
Big Data Analytics - Data Science - Aplicação e Tecnologia
Mini-Curso: Introdução à Big Data e Data Science - Aula 4 - O que é Data Scie...
Cientista de Dados - A profissão mais sexy do século 21
Internet das Coisas - Uma Revolução que vale a pena participar
The Data Science Workflow
Orquestrando HBase, Cassandra e MongoDB com o Pentaho Big Data Analytics.
Big data, e eu com isso?
Aplicações do Python na escola e no mercado de trabalho
Python Brasil 2020 - Desmitificando pipeline de dados com Python: o que apren...
Ferramentas de Recomendação
Anúncio

Último (9)

PDF
48585b89-ee4d-4f8d-b2c0-7db19cc44e44.pdf
PPTX
Perguntas e respostas.pptx Informática aplicada
DOC
COMO CRIAR DASHBOARD ATRAVES DE CODIFICAÇÃO PYTHON
PDF
Plano de gestão - template.pptx.pdf.pdf
PDF
Medidor de PH de bancada PH140 para uso em laboratório
PPTX
Sermao a mensagem da Cruz.pptx gdfvdcdfdfdsfcdsfxdfdfdfvdgf
PPT
AULA COACHING INICIAL *******************
PPTX
Apresentação Lagoa Mandaú Lagoa Mandaú Lagoa Mandaú
PDF
Bases de dados - basicos dos basicos. como identificar chaves
48585b89-ee4d-4f8d-b2c0-7db19cc44e44.pdf
Perguntas e respostas.pptx Informática aplicada
COMO CRIAR DASHBOARD ATRAVES DE CODIFICAÇÃO PYTHON
Plano de gestão - template.pptx.pdf.pdf
Medidor de PH de bancada PH140 para uso em laboratório
Sermao a mensagem da Cruz.pptx gdfvdcdfdfdsfcdsfxdfdfdfvdgf
AULA COACHING INICIAL *******************
Apresentação Lagoa Mandaú Lagoa Mandaú Lagoa Mandaú
Bases de dados - basicos dos basicos. como identificar chaves
Anúncio

Data Science & Machine Learning - Python Conference ES 2017

Notas do Editor

  • #4: Na etapa Model, o Cientista de Dados trabalha com algoritmos de Machine Learning. As outras etapas são realizadas tanto por Cientistas de Dados quanto por Analistas de Dados.
  • #17: Valor-p deu 10-11
  • #18: Sub-área da Ciência da Computação que estuda algoritmos pro computador aprender com os dados. Ao invés de se especificar explicitamente as regras do programa, o algoritmo faz com que o computador crie as regras implicitamente a partir dos dados de entrada. Exemplo clássico: identificação de dígitos escritos à mão.