Do curso: Fundamentos do Aprendizado de Máquina com Python

Acesse uma demonstração gratuita desse curso

Cadastre-se hoje mesmo e acesse mais de 24.900 cursos criados por especialistas.

Reduzindo a dimensionalidade do conjunto de dados - aprendizado não supervisionado

Reduzindo a dimensionalidade do conjunto de dados - aprendizado não supervisionado - Tutorial de Python

Do curso: Fundamentos do Aprendizado de Máquina com Python

Reduzindo a dimensionalidade do conjunto de dados - aprendizado não supervisionado

A redução da dimensionalidade é o método para representar um determinado conjunto de dados usando um número menor de características enquanto ainda permanece com as propriedades significativas nos dados originais. Alguns benefícios são a redução da necessidade de capacidade computacional, prevenção de overfit, ou seja, com menos variáveis, ajuda o método a generalizar, e a remoção de redundância. Vou te mostrar nesse vídeo uma das técnicas mais comuns para reduzir dimensionalidade de dados que serão usados em modelos de aprendizado não supervisionado. Essa técnica chamada PCA, principal Component Analysis. Para isso, usaremos o conjunto de dados sobre países do Kaggle. E o primeiro que vou fazer é Selecionar apenas colunas numéricas. Diferente do LDA, o PCA não precisa ser informado sobre a variável alvo. Normalizando os dados com a técnica de Standard Scale, e reduzindo de dez para cinco componentes, cinco Dimensionalidade, reduzindo de dez para cinco usando a função PCA e…

Conteúdos