Do curso: Fundamentos do Aprendizado de Máquina com Python
Acesse uma demonstração gratuita desse curso
Cadastre-se hoje mesmo e acesse mais de 24.900 cursos criados por especialistas.
Clusterização - Tutorial de Python
Do curso: Fundamentos do Aprendizado de Máquina com Python
Clusterização
Clusterização é uma técnica de aprendizado de máquina não supervisionado, que tem como finalidade agrupar dados não rotulados em clusters baseados em suas similaridades. O objetivo da clusterização é identificar padrões e relações nos dados sem prévia rotulagem dos dados. É agrupar os dados pela sua semelhança e separar pelas diferenças. Para esse vídeo vamos usar o conjunto de dados sobre características de vinhos. Vamos selecionar apenas as colunas numéricas, preparar os dados. Nesse caso, temos apenas as variáveis que vão compor o X. Normalizando os dados. E vamos usar a técnica para reduzir a dimensionalidade dos dados. Ao invés de 12 colunas, vamos usar apenas duas. E agora vamos usar a técnica de caminhos. Vamos tentar encontrar o número ideal de grupos para esse conjunto de dados. O caminho é um algoritmo que divide os dados em grupos baseado em sua similaridade. E aqui temos a quantidade de K, é a quantidade de grupos. E aqui o score. Vamos encontrar o melhor K, que foi o que…