SQL Saturday 2025 RAG COSMOSDB Azure OpenAI

Implementando Retrieval-
Augmented Generation utilizando
Vector Search no Azure Cosmos DB
Renato Groffe e Walter
Coan

by Comunidado
Joinville 05 de abril 2025
10 anos

Renato Groffe
https://www.linkedin.com/in/
renatogroffe/
• Microsoft MVP nas categorias Microsoft Azure, Developer
Technologies
• Docker Captain
• MTAC
• Solutions Achitect

Walter Silvestre Coan
www.linkedin.com/in/waltercoan/
• Microsoft MVP na categoria Internet das Coisas
• Mestre em Sistemas Distribuídos e Redes de sensores sem fio
PUCPR
• Instrutor autorizado Microsoft, AWS, NVIDIA na Ka Solution
• Professor universitário a 19 anos

Agenda
• Retrieval-Augmented Generation
• Embeddings
• Azure Cosmos DB ❤️
• Vector Search

Retrieval-Augmented
Generation
“Retrieval-Augmented Generation (RAG) é uma técnica
que combina a recuperação de informações (retrieval)
com a geração de texto (generation) para melhorar a
qualidade e a relevância das respostas geradas por
modelos de linguagem. “

Retrieval-Augmented
Generation
•Relevância Aumentada: A recuperação de
informações relevantes antes da geração ajuda a
aumentar a relevância e a precisão das respostas.
•Atualização de Conteúdo: Como a recuperação
pode ser feita em tempo real, as respostas podem
incluir informações mais atualizadas do que aquelas
disponíveis durante o treinamento do modelo.
•Mitigação de Alucinações: A técnica ajuda a reduzir
o problema de "alucinações" dos modelos de
geração, onde o modelo pode gerar informações
incorretas ou inventadas.
Benefícios

Retrieval-Augmented
Generation
•Assistentes Virtuais: Melhorar a precisão e a
relevância das respostas fornecidas por assistentes
virtuais.
•Sistemas de FAQ: Fornecer respostas mais precisas
e informadas em sistemas de perguntas frequentes.
•Geração de Conteúdo: Ajudar na criação de
conteúdo que exige informações atualizadas e
específicas.
Aplicações do RAG

Retrieval-Augmented
Generation

Retrieval-Augmented
Generation
Cosmos DB
Azure Open
AI Services
Fases: Preparação do Banco de
Dados
Aplicação
Insert dados
brutos + embeddings
Embeddings
Dados brutos
Insert
Usuário

Retrieval-Augmented
Generation
Cosmos DB
Azure Open
AI Services
Fases: Inferência (Geração de
conteúdo)
Aplicação
Documentos
Vector Search
Prompt
Usuário
Prompt + Docs
Chat Completion
Retrieval
Generation

Embeddings
“Embeddings são representações vetoriais de
informações, usadas com frequência em
aprendizado de máquina e inteligência artificial,
especialmente no processamento de linguagem
natural. Eles transformam dados, como
palavras, imagens ou outros tipos de
informações, em um formato numérico que os
computadores podem processar.”

Azure Cosmos DB ❤️
“O Azure Cosmos DB é um banco de dados NoSQL
distribuído globalmente e desenvolvido pela
Microsoft. Ele foi projetado para oferecer alta
disponibilidade, latência baixa e escalabilidade
elástica. O Cosmos DB suporta vários modelos de
dados, como documentos, grafos, tabelas e chave-
valor, permitindo flexibilidade para atender diferentes
necessidades de aplicações modernas.”

Azure Cosmos DB ❤️
“Entre suas principais características estão:
• Escalabilidade global e regional: Você pode replicar os dados
automaticamente em várias regiões do Azure para alta
disponibilidade.
• Baixa latência: Ideal para aplicativos que exigem respostas
rápidas, independentemente da localização do usuário.
• Compatibilidade com APIs: Ele suporta APIs de MongoDB,
Cassandra, Gremlin, Table e SQL para atender diferentes
necessidades e preferências.
• Consistência configurável: Oferece cinco modelos de
consistência para equilibrar desempenho e precisão dos
dados.”
• Windows emulator, containers Linux e módulo do
Testcontainers para ambientes de testes

Vector Search
Técnica matemática utilizada para determinar o quão
similar (próximos) dois vetores específicos estão dentro dos
embeddings.

SQL Saturday 2025 RAG COSMOSDB Azure OpenAI

Mais conteúdo relacionado

Mais de Walter Coan (20)

Último (19)

SQL Saturday 2025 RAG COSMOSDB Azure OpenAI