5. Walter Silvestre Coan
www.linkedin.com/in/waltercoan/
• Microsoft MVP na categoria Internet das Coisas
• Mestre em Sistemas Distribuídos e Redes de sensores sem fio
PUCPR
• Instrutor autorizado Microsoft, AWS, NVIDIA na Ka Solution
• Professor universitário a 19 anos
9. Retrieval-Augmented
Generation
•Relevância Aumentada: A recuperação de
informações relevantes antes da geração ajuda a
aumentar a relevância e a precisão das respostas.
•Atualização de Conteúdo: Como a recuperação
pode ser feita em tempo real, as respostas podem
incluir informações mais atualizadas do que aquelas
disponíveis durante o treinamento do modelo.
•Mitigação de Alucinações: A técnica ajuda a reduzir
o problema de "alucinações" dos modelos de
geração, onde o modelo pode gerar informações
incorretas ou inventadas.
Benefícios
10. Retrieval-Augmented
Generation
•Assistentes Virtuais: Melhorar a precisão e a
relevância das respostas fornecidas por assistentes
virtuais.
•Sistemas de FAQ: Fornecer respostas mais precisas
e informadas em sistemas de perguntas frequentes.
•Geração de Conteúdo: Ajudar na criação de
conteúdo que exige informações atualizadas e
específicas.
Aplicações do RAG
14. Embeddings
“Embeddings são representações vetoriais de
informações, usadas com frequência em
aprendizado de máquina e inteligência artificial,
especialmente no processamento de linguagem
natural. Eles transformam dados, como
palavras, imagens ou outros tipos de
informações, em um formato numérico que os
computadores podem processar.”
15. Azure Cosmos DB ❤️
“O Azure Cosmos DB é um banco de dados NoSQL
distribuído globalmente e desenvolvido pela
Microsoft. Ele foi projetado para oferecer alta
disponibilidade, latência baixa e escalabilidade
elástica. O Cosmos DB suporta vários modelos de
dados, como documentos, grafos, tabelas e chave-
valor, permitindo flexibilidade para atender diferentes
necessidades de aplicações modernas.”
16. Azure Cosmos DB ❤️
“Entre suas principais características estão:
• Escalabilidade global e regional: Você pode replicar os dados
automaticamente em várias regiões do Azure para alta
disponibilidade.
• Baixa latência: Ideal para aplicativos que exigem respostas
rápidas, independentemente da localização do usuário.
• Compatibilidade com APIs: Ele suporta APIs de MongoDB,
Cassandra, Gremlin, Table e SQL para atender diferentes
necessidades e preferências.
• Consistência configurável: Oferece cinco modelos de
consistência para equilibrar desempenho e precisão dos
dados.”
• Windows emulator, containers Linux e módulo do
Testcontainers para ambientes de testes
17. Vector Search
Técnica matemática utilizada para determinar o quão
similar (próximos) dois vetores específicos estão dentro dos
embeddings.
18. Vector Search
Técnica matemática utilizada para determinar o quão
similar (próximos) dois vetores específicos estão dentro dos
embeddings.