Do curso: Fundamentos do Aprendizado de Máquina com Python

Acesse uma demonstração gratuita desse curso

Cadastre-se hoje mesmo e acesse mais de 24.900 cursos criados por especialistas.

Dados faltantes: imputação múltipla

Dados faltantes: imputação múltipla

Há várias maneiras de tratar dados faltantes. Uma delas é a imputação múltipla. Com essa técnica, os dados ausentes são preenchidos levando em consideração as informações de outras colunas. Vou te apresentar um modelo mice, que é um método avançado de imputação que preenche os dados ausentes através de múltiplas rodadas de predição. Para isso, vou instalar a biblioteca mice forest, além de consumir os dados do Kaggle, como vimos em vídeos anteriores. Agora, importar as bibliotecas, informar o recurso do conjunto de dados e consumir o conjunto de dados. Vou converter a coluna country e status para o tipo categórico, e agora gerar os dados a serem imputados, informando que os dados são oriundos do dataframe DF, e estabelecendo uma semente para que esse experimento seja reprodutível. Vou usar a função inputation kernel. Salvei a função em uma variável. E agora vou acumular nessa função duas interações no dataframe. E agora, a partir dessa dupla interação de regressão no nosso dataframe…

Conteúdos