O documento aborda um sistema de processamento de dados em tempo real, destacando a arquitetura de publish-subscribe distribuído do Apache Kafka, criado pelo LinkedIn e open-sourced em 2011. Apresenta características como persistência de mensagens, alto throughput e escalabilidade, além de detalhar a estrutura de brokers, produtores, consumidores e particionamento das mensagens. O Kafka permite reprocessamento e manutenção histórica de registros, focando em eficiência e flexibilidade em grandes volumes de dados.
Related topics: