RAG
A arquitetura Agentic RAG (Retrieval-Augmented Generation) combina modelos de linguagem de grande porte (LLMs) com mecanismos de recuperação de informações, permitindo que agentes autônomos consultem bases de conhecimento externas para gerar respostas mais precisas e atualizadas.
Componentes Principais
- Usuário: Envia perguntas ou comandos.
- Agente (Agent): Orquestra o fluxo, decide quando recuperar informações e como usá-las.
- Retriever: Busca documentos relevantes em uma base de dados ou index.
- LLM: Gera respostas utilizando tanto o contexto da consulta quanto os documentos recuperados.
- Base de Conhecimento: Fonte de dados estruturados ou não estruturados.
Fluxo de Funcionamento
- O usuário faz uma pergunta ao agente.
- O agente analisa a consulta e decide se precisa buscar informações externas.
- O retriever localiza documentos relevantes na base de conhecimento.
- O agente integra os documentos recuperados ao prompt do LLM.
- O LLM gera uma resposta fundamentada.
- O agente retorna a resposta ao usuário.
Diagrama
Resumo:
A arquitetura Agentic RAG potencializa LLMs com busca ativa de informações, tornando-os mais precisos, atualizados e adaptáveis a diferentes domínios.