SlideShare uma empresa Scribd logo
by
Comunidado
Implementando Retrieval-
Augmented Generation utilizando
Vector Search no Azure Cosmos DB
Renato Groffe e Walter
Coan
by Comunidado
Joinville 05 de abril 2025
10 anos
Renato Groffe
https://www.linkedin.com/in/
renatogroffe/
• Microsoft MVP nas categorias Microsoft Azure, Developer
Technologies
• Docker Captain
• MTAC
• Solutions Achitect
Walter Silvestre Coan
www.linkedin.com/in/waltercoan/
• Microsoft MVP na categoria Internet das Coisas
• Mestre em Sistemas Distribuídos e Redes de sensores sem fio
PUCPR
• Instrutor autorizado Microsoft, AWS, NVIDIA na Ka Solution
• Professor universitário a 19 anos
Agenda
• Retrieval-Augmented Generation
• Embeddings
• Azure Cosmos DB ❤️
• Vector Search
Repositório
GitHub
Retrieval-Augmented
Generation
“Retrieval-Augmented Generation (RAG) é uma técnica
que combina a recuperação de informações (retrieval)
com a geração de texto (generation) para melhorar a
qualidade e a relevância das respostas geradas por
modelos de linguagem. “
Retrieval-Augmented
Generation
•Relevância Aumentada: A recuperação de
informações relevantes antes da geração ajuda a
aumentar a relevância e a precisão das respostas.
•Atualização de Conteúdo: Como a recuperação
pode ser feita em tempo real, as respostas podem
incluir informações mais atualizadas do que aquelas
disponíveis durante o treinamento do modelo.
•Mitigação de Alucinações: A técnica ajuda a reduzir
o problema de "alucinações" dos modelos de
geração, onde o modelo pode gerar informações
incorretas ou inventadas.
Benefícios
Retrieval-Augmented
Generation
•Assistentes Virtuais: Melhorar a precisão e a
relevância das respostas fornecidas por assistentes
virtuais.
•Sistemas de FAQ: Fornecer respostas mais precisas
e informadas em sistemas de perguntas frequentes.
•Geração de Conteúdo: Ajudar na criação de
conteúdo que exige informações atualizadas e
específicas.
Aplicações do RAG
Retrieval-Augmented
Generation
Retrieval-Augmented
Generation
Cosmos DB
Azure Open
AI Services
Fases: Preparação do Banco de
Dados
Aplicação
Insert dados
brutos + embeddings
Embeddings
Dados brutos
Insert
Usuário
Retrieval-Augmented
Generation
Cosmos DB
Azure Open
AI Services
Fases: Inferência (Geração de
conteúdo)
Aplicação
Documentos
Vector Search
Prompt
Usuário
Prompt + Docs
Chat Completion
Retrieval
Generation
Embeddings
“Embeddings são representações vetoriais de
informações, usadas com frequência em
aprendizado de máquina e inteligência artificial,
especialmente no processamento de linguagem
natural. Eles transformam dados, como
palavras, imagens ou outros tipos de
informações, em um formato numérico que os
computadores podem processar.”
Azure Cosmos DB ❤️
“O Azure Cosmos DB é um banco de dados NoSQL
distribuído globalmente e desenvolvido pela
Microsoft. Ele foi projetado para oferecer alta
disponibilidade, latência baixa e escalabilidade
elástica. O Cosmos DB suporta vários modelos de
dados, como documentos, grafos, tabelas e chave-
valor, permitindo flexibilidade para atender diferentes
necessidades de aplicações modernas.”
Azure Cosmos DB ❤️
“Entre suas principais características estão:
• Escalabilidade global e regional: Você pode replicar os dados
automaticamente em várias regiões do Azure para alta
disponibilidade.
• Baixa latência: Ideal para aplicativos que exigem respostas
rápidas, independentemente da localização do usuário.
• Compatibilidade com APIs: Ele suporta APIs de MongoDB,
Cassandra, Gremlin, Table e SQL para atender diferentes
necessidades e preferências.
• Consistência configurável: Oferece cinco modelos de
consistência para equilibrar desempenho e precisão dos
dados.”
• Windows emulator, containers Linux e módulo do
Testcontainers para ambientes de testes
Vector Search
Técnica matemática utilizada para determinar o quão
similar (próximos) dois vetores específicos estão dentro dos
embeddings.
Vector Search
Técnica matemática utilizada para determinar o quão
similar (próximos) dois vetores específicos estão dentro dos
embeddings.
Docker Hub – Gen AI Catalog
Docker Hub – Gen AI Catalog
Obrigado!
by Comunidado
Joinville 05 de abril 2025
10 anos

Mais conteúdo relacionado

PPTX
Esquenta MVP Conf 2025 Blumenau Azure IoT Platform
PPT
Palestra SQLSAT 2025 AZURE ML NVIDIA CUDA
PPTX
Azure User Group Moçambique - Azure IoT Operations
PPTX
DevOps Experience 2025 - Certificacoes em Kubernetes CNCF
PPTX
Devops Exp 2024 O que é o Radius Novembro-2024
PPTX
Devops Exp 2024 OpenTelemetry Grafana Agosto 2024
PPTX
Computação em nuvem status da tecnologia nas empresas
PPTX
API Gateways DevOps Experience Abril-2024.pptx
Esquenta MVP Conf 2025 Blumenau Azure IoT Platform
Palestra SQLSAT 2025 AZURE ML NVIDIA CUDA
Azure User Group Moçambique - Azure IoT Operations
DevOps Experience 2025 - Certificacoes em Kubernetes CNCF
Devops Exp 2024 O que é o Radius Novembro-2024
Devops Exp 2024 OpenTelemetry Grafana Agosto 2024
Computação em nuvem status da tecnologia nas empresas
API Gateways DevOps Experience Abril-2024.pptx

Mais de Walter Coan (20)

PPTX
2024-04-20-GlobalAzure-EventGridNamespacesMQTT.pptx
PPTX
CODECON Caminhos para Formação de um Arquiteto de Soluções em Nuvem
PPTX
Talk Floripa - Desenvolvimento de projetos de Internet das Coisas
PPTX
TechConnection 2023 Floripa Azure Container Apps
PPTX
Shift left DevOps Experience
PPTX
DevFest2023-Pragmatismo da Internet das Coisas
PPTX
DevOps Experience 2022: Build de aplicações Spring Boot utilizando Github Act...
PPTX
Primeira certificação no Azure: AZ-900
PPTX
Novidades da plataforma Azure IoT
PPTX
Aplicações resilientes e Chaos Engineering em .NET com Polly + Simmy
PPT
TDC Connections 2022 - .NET + Microsserviços: alternativas open source para d...
PPTX
Desenvolvimento de aplicações para o Microsoft Azure utilizando C#
PPTX
Microsoft Reactor Desenvolvimento serverless com azure function
PPTX
Azure Floripa - Introdução a plataforma Azure IoT
PPTX
Utilização do NVidia DeepStream para execução de modelos de IA no Azure IoT Edge
PPTX
Azure Sphere: a evolução da plataforma de IoT concebida com princípios de seg...
PPTX
Integração: IoT Central + CosmosDB + Power BI - Dicas, desafios e boas práticas.
PPTX
MVPConf 2021 - .NET + Azure Functions Dicas e truques no desenvolvimento serv...
PPTX
Canal .NET - Utilizando o Event Hub e o Event Grid
PPTX
Internet das Coisas na Medicina - Summit ACM 2021
2024-04-20-GlobalAzure-EventGridNamespacesMQTT.pptx
CODECON Caminhos para Formação de um Arquiteto de Soluções em Nuvem
Talk Floripa - Desenvolvimento de projetos de Internet das Coisas
TechConnection 2023 Floripa Azure Container Apps
Shift left DevOps Experience
DevFest2023-Pragmatismo da Internet das Coisas
DevOps Experience 2022: Build de aplicações Spring Boot utilizando Github Act...
Primeira certificação no Azure: AZ-900
Novidades da plataforma Azure IoT
Aplicações resilientes e Chaos Engineering em .NET com Polly + Simmy
TDC Connections 2022 - .NET + Microsserviços: alternativas open source para d...
Desenvolvimento de aplicações para o Microsoft Azure utilizando C#
Microsoft Reactor Desenvolvimento serverless com azure function
Azure Floripa - Introdução a plataforma Azure IoT
Utilização do NVidia DeepStream para execução de modelos de IA no Azure IoT Edge
Azure Sphere: a evolução da plataforma de IoT concebida com princípios de seg...
Integração: IoT Central + CosmosDB + Power BI - Dicas, desafios e boas práticas.
MVPConf 2021 - .NET + Azure Functions Dicas e truques no desenvolvimento serv...
Canal .NET - Utilizando o Event Hub e o Event Grid
Internet das Coisas na Medicina - Summit ACM 2021
Anúncio

Último (19)

PDF
Apple Pippin Uma breve introdução. - David Glotz
PPTX
Informática Aplicada Informática Aplicada Plano de Ensino - estudo de caso NR...
PDF
COBITxITIL-Entenda as diferença em uso governança TI
PDF
20250805_ServiceNow e a Arquitetura Orientada a Serviços (SOA) A Base para Ap...
PPTX
Como-se-implementa-um-softwareeeeeeeeeeeeeeeeeeeeeeeee.pptx
PDF
Fullfilment AI - Forum ecommerce 2025 // Distrito e Total Express
PDF
Custos e faturamento no SAP S/4HANA Transportation Management, S4TM3 Col26
PDF
Otimizador de planejamento e execução no SAP Transportation Management, TM120...
PDF
Processos na gestão de transportes, TM100 Col18
PDF
Mergulho profundo técnico para gestão de transportes no SAP S/4HANA, S4TM6 Col14
PDF
Gestão de transportes básica no SAP S/4HANA, S4611 Col20
PPTX
Gestao-de-Bugs-em-Software-Introducao.pptxxxxxxxx
PDF
Aula04-Academia Heri- Tecnologia Geral 2025
PPTX
BANCO DE DADOS - AULAS INICIAIS-sgbd.pptx
PDF
Fundamentos de gerenciamento de ordens e planejamento no SAP TransportationMa...
PDF
Custos e liquidação no SAP Transportation Management, TM130 Col18
PPTX
Aula16ManipulaçãoDadosssssssssssssssssssssssssssss
PPTX
Programação - Linguagem C - Variáveis, Palavras Reservadas, tipos de dados, c...
PPTX
Aula 18 - Manipulacao De Arquivos python
Apple Pippin Uma breve introdução. - David Glotz
Informática Aplicada Informática Aplicada Plano de Ensino - estudo de caso NR...
COBITxITIL-Entenda as diferença em uso governança TI
20250805_ServiceNow e a Arquitetura Orientada a Serviços (SOA) A Base para Ap...
Como-se-implementa-um-softwareeeeeeeeeeeeeeeeeeeeeeeee.pptx
Fullfilment AI - Forum ecommerce 2025 // Distrito e Total Express
Custos e faturamento no SAP S/4HANA Transportation Management, S4TM3 Col26
Otimizador de planejamento e execução no SAP Transportation Management, TM120...
Processos na gestão de transportes, TM100 Col18
Mergulho profundo técnico para gestão de transportes no SAP S/4HANA, S4TM6 Col14
Gestão de transportes básica no SAP S/4HANA, S4611 Col20
Gestao-de-Bugs-em-Software-Introducao.pptxxxxxxxx
Aula04-Academia Heri- Tecnologia Geral 2025
BANCO DE DADOS - AULAS INICIAIS-sgbd.pptx
Fundamentos de gerenciamento de ordens e planejamento no SAP TransportationMa...
Custos e liquidação no SAP Transportation Management, TM130 Col18
Aula16ManipulaçãoDadosssssssssssssssssssssssssssss
Programação - Linguagem C - Variáveis, Palavras Reservadas, tipos de dados, c...
Aula 18 - Manipulacao De Arquivos python
Anúncio

SQL Saturday 2025 RAG COSMOSDB Azure OpenAI

  • 2. Implementando Retrieval- Augmented Generation utilizando Vector Search no Azure Cosmos DB Renato Groffe e Walter Coan
  • 3. by Comunidado Joinville 05 de abril 2025 10 anos
  • 4. Renato Groffe https://www.linkedin.com/in/ renatogroffe/ • Microsoft MVP nas categorias Microsoft Azure, Developer Technologies • Docker Captain • MTAC • Solutions Achitect
  • 5. Walter Silvestre Coan www.linkedin.com/in/waltercoan/ • Microsoft MVP na categoria Internet das Coisas • Mestre em Sistemas Distribuídos e Redes de sensores sem fio PUCPR • Instrutor autorizado Microsoft, AWS, NVIDIA na Ka Solution • Professor universitário a 19 anos
  • 6. Agenda • Retrieval-Augmented Generation • Embeddings • Azure Cosmos DB ❤️ • Vector Search
  • 8. Retrieval-Augmented Generation “Retrieval-Augmented Generation (RAG) é uma técnica que combina a recuperação de informações (retrieval) com a geração de texto (generation) para melhorar a qualidade e a relevância das respostas geradas por modelos de linguagem. “
  • 9. Retrieval-Augmented Generation •Relevância Aumentada: A recuperação de informações relevantes antes da geração ajuda a aumentar a relevância e a precisão das respostas. •Atualização de Conteúdo: Como a recuperação pode ser feita em tempo real, as respostas podem incluir informações mais atualizadas do que aquelas disponíveis durante o treinamento do modelo. •Mitigação de Alucinações: A técnica ajuda a reduzir o problema de "alucinações" dos modelos de geração, onde o modelo pode gerar informações incorretas ou inventadas. Benefícios
  • 10. Retrieval-Augmented Generation •Assistentes Virtuais: Melhorar a precisão e a relevância das respostas fornecidas por assistentes virtuais. •Sistemas de FAQ: Fornecer respostas mais precisas e informadas em sistemas de perguntas frequentes. •Geração de Conteúdo: Ajudar na criação de conteúdo que exige informações atualizadas e específicas. Aplicações do RAG
  • 12. Retrieval-Augmented Generation Cosmos DB Azure Open AI Services Fases: Preparação do Banco de Dados Aplicação Insert dados brutos + embeddings Embeddings Dados brutos Insert Usuário
  • 13. Retrieval-Augmented Generation Cosmos DB Azure Open AI Services Fases: Inferência (Geração de conteúdo) Aplicação Documentos Vector Search Prompt Usuário Prompt + Docs Chat Completion Retrieval Generation
  • 14. Embeddings “Embeddings são representações vetoriais de informações, usadas com frequência em aprendizado de máquina e inteligência artificial, especialmente no processamento de linguagem natural. Eles transformam dados, como palavras, imagens ou outros tipos de informações, em um formato numérico que os computadores podem processar.”
  • 15. Azure Cosmos DB ❤️ “O Azure Cosmos DB é um banco de dados NoSQL distribuído globalmente e desenvolvido pela Microsoft. Ele foi projetado para oferecer alta disponibilidade, latência baixa e escalabilidade elástica. O Cosmos DB suporta vários modelos de dados, como documentos, grafos, tabelas e chave- valor, permitindo flexibilidade para atender diferentes necessidades de aplicações modernas.”
  • 16. Azure Cosmos DB ❤️ “Entre suas principais características estão: • Escalabilidade global e regional: Você pode replicar os dados automaticamente em várias regiões do Azure para alta disponibilidade. • Baixa latência: Ideal para aplicativos que exigem respostas rápidas, independentemente da localização do usuário. • Compatibilidade com APIs: Ele suporta APIs de MongoDB, Cassandra, Gremlin, Table e SQL para atender diferentes necessidades e preferências. • Consistência configurável: Oferece cinco modelos de consistência para equilibrar desempenho e precisão dos dados.” • Windows emulator, containers Linux e módulo do Testcontainers para ambientes de testes
  • 17. Vector Search Técnica matemática utilizada para determinar o quão similar (próximos) dois vetores específicos estão dentro dos embeddings.
  • 18. Vector Search Técnica matemática utilizada para determinar o quão similar (próximos) dois vetores específicos estão dentro dos embeddings.
  • 19. Docker Hub – Gen AI Catalog
  • 20. Docker Hub – Gen AI Catalog
  • 22. by Comunidado Joinville 05 de abril 2025 10 anos