Do curso: Fundamentos do Aprendizado de Máquina com Python

Acesse uma demonstração gratuita desse curso

Cadastre-se hoje mesmo e acesse mais de 24.900 cursos criados por especialistas.

Sumarizando dados

Sumarizando dados

A análise exploratória dos dados serve inicialmente para conhecer e se familiarizar com os dados. Então costumamos iniciar uma análise exploratória com uma visão geral desses dados. Para esse exercício, usaremos o conjunto de dados sobre proposições legislativas, disponível no Portal de Dados Abertos da Câmara dos Deputados. Transformaremos esses dados para um dataframe Pandas. Vamos olhar como estão. Temos colunas relacionadas ao ID, ao RI, sigla do tipo, código, número, ano e a ementa da proposta. Pandas tem o método describe, que traz uma sumarização simples com a contagem, média, desvio padrão, valor mínimo, primeiro, segundo, terceiro quartil e o valor máximo de cada coluna. Isso funciona bem para colunas de tipo numérico, mas eu quero te apresentar a biblioteca Pandas profiling. Essa biblioteca gera relatórios interativos em HTML a partir de um dataframe Pandas. Assim, fica mais completo e mais fácil de verificar dados estatísticos correspondentes ao tipo de dado de cada coluna.…

Conteúdos