Do curso: Fundamentos do Aprendizado de Máquina com Python

Acesse uma demonstração gratuita desse curso

Cadastre-se hoje mesmo e acesse mais de 24.900 cursos criados por especialistas.

Criando um conjunto de dados para treinamento e teste

Criando um conjunto de dados para treinamento e teste

Antes de iniciar o treinamento de um modelo de aprendizado de máquina supervisionado, precisamos separar conjuntos de dados em dois subconjuntos, um dedicado a treinamento e outro dedicado a teste. O de treinamento será usado para treinar o modelo e o de teste utilizaremos para testar a performance do modelo após o seu treinamento. Para isso, vamos usar o conjunto de dados de países do KAggle. Para iniciar, vamos criar uma variável alvo. Que é criar uma coluna com a categoria de expectativa de vida, tendo três categorias diferentes: baixa, média e alta. Vamos separar a variável feature e target. E agora vamos fazer uma divisão simples usando novamente o sklearn, a função train test split. Aqui estamos informando a categoria de features, a categoria alvo que desejamos prever, o tamanho da subconjunto de teste e também vamos plantar uma semente para que esse experimento seja reprodutível. E aqui está! Temos uma quantidade diferente para cada conjunto. De teste e treino. Da variável…

Conteúdos