Skip to Content

RAG

A arquitetura Agentic RAG (Retrieval-Augmented Generation) combina modelos de linguagem de grande porte (LLMs) com mecanismos de recuperação de informações, permitindo que agentes autônomos consultem bases de conhecimento externas para gerar respostas mais precisas e atualizadas.

Componentes Principais

  • Usuário: Envia perguntas ou comandos.
  • Agente (Agent): Orquestra o fluxo, decide quando recuperar informações e como usá-las.
  • Retriever: Busca documentos relevantes em uma base de dados ou index.
  • LLM: Gera respostas utilizando tanto o contexto da consulta quanto os documentos recuperados.
  • Base de Conhecimento: Fonte de dados estruturados ou não estruturados.

Fluxo de Funcionamento

  1. O usuário faz uma pergunta ao agente.
  2. O agente analisa a consulta e decide se precisa buscar informações externas.
  3. O retriever localiza documentos relevantes na base de conhecimento.
  4. O agente integra os documentos recuperados ao prompt do LLM.
  5. O LLM gera uma resposta fundamentada.
  6. O agente retorna a resposta ao usuário.

Diagrama


Resumo:
A arquitetura Agentic RAG potencializa LLMs com busca ativa de informações, tornando-os mais precisos, atualizados e adaptáveis a diferentes domínios.