Do curso: Fundamentos do Aprendizado de Máquina com Python
Acesse uma demonstração gratuita desse curso
Cadastre-se hoje mesmo e acesse mais de 24.900 cursos criados por especialistas.
Reduzindo a dimensionalidade do conjunto de dados - aprendizado não supervisionado - Tutorial de Python
Do curso: Fundamentos do Aprendizado de Máquina com Python
Reduzindo a dimensionalidade do conjunto de dados - aprendizado não supervisionado
A redução da dimensionalidade é o método para representar um determinado conjunto de dados usando um número menor de características enquanto ainda permanece com as propriedades significativas nos dados originais. Alguns benefícios são a redução da necessidade de capacidade computacional, prevenção de overfit, ou seja, com menos variáveis, ajuda o método a generalizar, e a remoção de redundância. Vou te mostrar nesse vídeo uma das técnicas mais comuns para reduzir dimensionalidade de dados que serão usados em modelos de aprendizado não supervisionado. Essa técnica chamada PCA, principal Component Analysis. Para isso, usaremos o conjunto de dados sobre países do Kaggle. E o primeiro que vou fazer é Selecionar apenas colunas numéricas. Diferente do LDA, o PCA não precisa ser informado sobre a variável alvo. Normalizando os dados com a técnica de Standard Scale, e reduzindo de dez para cinco componentes, cinco Dimensionalidade, reduzindo de dez para cinco usando a função PCA e…
Conteúdos
-
-
-
-
-
-
(Bloqueados)
Dados faltantes: tratamentos simples5 m12 s
-
(Bloqueados)
Dados faltantes: imputação múltipla2 m21 s
-
(Bloqueados)
Dados discrepantes5 m26 s
-
(Bloqueados)
Normalizando dados1 m55 s
-
(Bloqueados)
Reduzindo a dimensionalidade do conjunto de dados - aprendizado supervisionado3 m26 s
-
(Bloqueados)
Reduzindo a dimensionalidade do conjunto de dados - aprendizado não supervisionado3 m
-
(Bloqueados)
Criando um conjunto de dados para treinamento e teste3 m23 s
-
(Bloqueados)
-
-
-