Do curso: Fundamentos do Aprendizado de Máquina com Python
Acesse uma demonstração gratuita desse curso
Cadastre-se hoje mesmo e acesse mais de 24.900 cursos criados por especialistas.
Criando um conjunto de dados para treinamento e teste - Tutorial de Python
Do curso: Fundamentos do Aprendizado de Máquina com Python
Criando um conjunto de dados para treinamento e teste
Antes de iniciar o treinamento de um modelo de aprendizado de máquina supervisionado, precisamos separar conjuntos de dados em dois subconjuntos, um dedicado a treinamento e outro dedicado a teste. O de treinamento será usado para treinar o modelo e o de teste utilizaremos para testar a performance do modelo após o seu treinamento. Para isso, vamos usar o conjunto de dados de países do KAggle. Para iniciar, vamos criar uma variável alvo. Que é criar uma coluna com a categoria de expectativa de vida, tendo três categorias diferentes: baixa, média e alta. Vamos separar a variável feature e target. E agora vamos fazer uma divisão simples usando novamente o sklearn, a função train test split. Aqui estamos informando a categoria de features, a categoria alvo que desejamos prever, o tamanho da subconjunto de teste e também vamos plantar uma semente para que esse experimento seja reprodutível. E aqui está! Temos uma quantidade diferente para cada conjunto. De teste e treino. Da variável…
Conteúdos
-
-
-
-
-
-
(Bloqueados)
Dados faltantes: tratamentos simples5 m12 s
-
(Bloqueados)
Dados faltantes: imputação múltipla2 m21 s
-
(Bloqueados)
Dados discrepantes5 m26 s
-
(Bloqueados)
Normalizando dados1 m55 s
-
(Bloqueados)
Reduzindo a dimensionalidade do conjunto de dados - aprendizado supervisionado3 m26 s
-
(Bloqueados)
Reduzindo a dimensionalidade do conjunto de dados - aprendizado não supervisionado3 m
-
(Bloqueados)
Criando um conjunto de dados para treinamento e teste3 m23 s
-
(Bloqueados)
-
-
-