Do curso: Fundamentos do Aprendizado de Máquina com Python
Acesse uma demonstração gratuita desse curso
Cadastre-se hoje mesmo e acesse mais de 24.900 cursos criados por especialistas.
Dados faltantes: tratamentos simples - Tutorial de Python
Do curso: Fundamentos do Aprendizado de Máquina com Python
Dados faltantes: tratamentos simples
Dados faltantes, ou missing values, podem ocorrer de forma aleatória ou estar relacionada com o valor de alguma outra variável. Por exemplo, pessoas que moram em bairros periféricos podem não querer falar o seu endereço por receio de discriminação. Não existe uma diretriz para tratar dados faltantes, mas há alguns métodos que vou te mostrar nesse vídeo. Para isso, vamos usar os dados disponíveis na plataforma Kaggle, que é uma plataforma sobre ciência de dados e inteligência artificial. Usaremos o conjunto de dados de expectativa de vida. O Kaggle possui a sua própria API para consumo de dados. Para isso, precisaremos instalar a biblioteca Kaggle Hub Pandas datasets. Após a instalação, vamos importar a biblioteca para o nosso notebook. Em seguida, informamos o título do arquivo, que é esse arquivo que vamos consumir. Cada conjunto de dados podem ter vários recursos. Nesse existem três. Por isso, é importante informar exatamente qual é o recurso do conjunto de dados que você quer…
Conteúdos
-
-
-
-
-
-
(Bloqueados)
Dados faltantes: tratamentos simples5 m12 s
-
(Bloqueados)
Dados faltantes: imputação múltipla2 m21 s
-
(Bloqueados)
Dados discrepantes5 m26 s
-
(Bloqueados)
Normalizando dados1 m55 s
-
(Bloqueados)
Reduzindo a dimensionalidade do conjunto de dados - aprendizado supervisionado3 m26 s
-
(Bloqueados)
Reduzindo a dimensionalidade do conjunto de dados - aprendizado não supervisionado3 m
-
(Bloqueados)
Criando um conjunto de dados para treinamento e teste3 m23 s
-
(Bloqueados)
-
-
-