Do curso: Fundamentos do Aprendizado de Máquina com Python
Acesse uma demonstração gratuita desse curso
Cadastre-se hoje mesmo e acesse mais de 24.900 cursos criados por especialistas.
Dados faltantes: imputação múltipla - Tutorial de Python
Do curso: Fundamentos do Aprendizado de Máquina com Python
Dados faltantes: imputação múltipla
Há várias maneiras de tratar dados faltantes. Uma delas é a imputação múltipla. Com essa técnica, os dados ausentes são preenchidos levando em consideração as informações de outras colunas. Vou te apresentar um modelo mice, que é um método avançado de imputação que preenche os dados ausentes através de múltiplas rodadas de predição. Para isso, vou instalar a biblioteca mice forest, além de consumir os dados do Kaggle, como vimos em vídeos anteriores. Agora, importar as bibliotecas, informar o recurso do conjunto de dados e consumir o conjunto de dados. Vou converter a coluna country e status para o tipo categórico, e agora gerar os dados a serem imputados, informando que os dados são oriundos do dataframe DF, e estabelecendo uma semente para que esse experimento seja reprodutível. Vou usar a função inputation kernel. Salvei a função em uma variável. E agora vou acumular nessa função duas interações no dataframe. E agora, a partir dessa dupla interação de regressão no nosso dataframe…
Conteúdos
-
-
-
-
-
-
(Bloqueados)
Dados faltantes: tratamentos simples5 m12 s
-
(Bloqueados)
Dados faltantes: imputação múltipla2 m21 s
-
(Bloqueados)
Dados discrepantes5 m26 s
-
(Bloqueados)
Normalizando dados1 m55 s
-
(Bloqueados)
Reduzindo a dimensionalidade do conjunto de dados - aprendizado supervisionado3 m26 s
-
(Bloqueados)
Reduzindo a dimensionalidade do conjunto de dados - aprendizado não supervisionado3 m
-
(Bloqueados)
Criando um conjunto de dados para treinamento e teste3 m23 s
-
(Bloqueados)
-
-
-