Do curso: Fundamentos do Aprendizado de Máquina com Python

Acesse uma demonstração gratuita desse curso

Cadastre-se hoje mesmo e acesse mais de 24.900 cursos criados por especialistas.

Clusterização

Clusterização

Clusterização é uma técnica de aprendizado de máquina não supervisionado, que tem como finalidade agrupar dados não rotulados em clusters baseados em suas similaridades. O objetivo da clusterização é identificar padrões e relações nos dados sem prévia rotulagem dos dados. É agrupar os dados pela sua semelhança e separar pelas diferenças. Para esse vídeo vamos usar o conjunto de dados sobre características de vinhos. Vamos selecionar apenas as colunas numéricas, preparar os dados. Nesse caso, temos apenas as variáveis que vão compor o X. Normalizando os dados. E vamos usar a técnica para reduzir a dimensionalidade dos dados. Ao invés de 12 colunas, vamos usar apenas duas. E agora vamos usar a técnica de caminhos. Vamos tentar encontrar o número ideal de grupos para esse conjunto de dados. O caminho é um algoritmo que divide os dados em grupos baseado em sua similaridade. E aqui temos a quantidade de K, é a quantidade de grupos. E aqui o score. Vamos encontrar o melhor K, que foi o que…

Conteúdos