Do curso: Fundamentos do Aprendizado de Máquina com Python

Acesse uma demonstração gratuita desse curso

Cadastre-se hoje mesmo e acesse mais de 24.900 cursos criados por especialistas.

Dados discrepantes

Dados discrepantes

Outliers, ou dados discrepantes, são valores numericamente distantes da maior parte do conjunto de dados, ou seja, valores extremos. Se os valores discrepantes não são erros produzidos na coleta dos dados, eliminá-los ou substituí-los pode modificar as inferências a partir da análise de dados, o que pode ocasionar desenvolvimento de tecnologias discriminatórias. A diversidade dos dados é a chave para a produção de tecnologias inclusivas. Outliers devem ser explicados e não eliminados. No entanto, caso esses outliers sejam fruto de uma coleta equivocada, então precisamos tratá-los. E é o que eu vou te apresentar nesse vídeo. Para começar, vou te mostrar como detectar outliers. Vamos fazer uma visualização em Boxplot, que é um tipo de gráfico muito útil para identificar outliers. Aqui temos o limite superior, o limite inferior e a mediana do conjunto de dados. Nesse caso, estamos considerando os dados da coluna temperatura. Todos os dados que ultrapassam o limite superior e o limite…

Conteúdos