Do curso: Python para Ciência de Dados: Formação Básica

Acesse o curso completo hoje mesmo

Cadastre-se hoje mesmo e acesse mais de 24.900 cursos criados por especialistas.

Removendo dados duplicados

Removendo dados duplicados

É muito importante fazer a limpeza dos dados, isso ajuda a eliminar redundâncias, aumentando a confiança, a acurácia, consistência e a completude dos dados. Uma das formas mais comuns de limpeza de dados é remover dados duplicados. A remoção de dados duplicados ajuda a manter os dados consistentes com a realidade que representam, e também causa o aumento da acurácia das análises, pois evita a obtenção de estatísticas erradas ou conclusões que induzam erros. Vamos aprender a remover dados duplicados do nosso conjunto. Vamos começar importando as nossas bibliotecas de trabalho. E também vamos importar o objeto data frame da biblioteca Pandas. Agora, vamos criar um data frame com dados repetidos para que possamos fazer o teste com as nossas novas funções. Eu vou começar criando um dicionário que contenha esses dados. Vou chamar esse dicionário de "Dados =", e eu vou copiar e colar um dicionário que eu já deixei pronto nas minhas anotações. Cada…

Conteúdos