Do curso: Fundamentos do Aprendizado de Máquina com Python
Acesse uma demonstração gratuita desse curso
Cadastre-se hoje mesmo e acesse mais de 24.900 cursos criados por especialistas.
Dados discrepantes - Tutorial de Python
Do curso: Fundamentos do Aprendizado de Máquina com Python
Dados discrepantes
Outliers, ou dados discrepantes, são valores numericamente distantes da maior parte do conjunto de dados, ou seja, valores extremos. Se os valores discrepantes não são erros produzidos na coleta dos dados, eliminá-los ou substituí-los pode modificar as inferências a partir da análise de dados, o que pode ocasionar desenvolvimento de tecnologias discriminatórias. A diversidade dos dados é a chave para a produção de tecnologias inclusivas. Outliers devem ser explicados e não eliminados. No entanto, caso esses outliers sejam fruto de uma coleta equivocada, então precisamos tratá-los. E é o que eu vou te apresentar nesse vídeo. Para começar, vou te mostrar como detectar outliers. Vamos fazer uma visualização em Boxplot, que é um tipo de gráfico muito útil para identificar outliers. Aqui temos o limite superior, o limite inferior e a mediana do conjunto de dados. Nesse caso, estamos considerando os dados da coluna temperatura. Todos os dados que ultrapassam o limite superior e o limite…
Conteúdos
-
-
-
-
-
-
(Bloqueados)
Dados faltantes: tratamentos simples5 m12 s
-
(Bloqueados)
Dados faltantes: imputação múltipla2 m21 s
-
(Bloqueados)
Dados discrepantes5 m26 s
-
(Bloqueados)
Normalizando dados1 m55 s
-
(Bloqueados)
Reduzindo a dimensionalidade do conjunto de dados - aprendizado supervisionado3 m26 s
-
(Bloqueados)
Reduzindo a dimensionalidade do conjunto de dados - aprendizado não supervisionado3 m
-
(Bloqueados)
Criando um conjunto de dados para treinamento e teste3 m23 s
-
(Bloqueados)
-
-
-