RAG

A arquitetura Agentic RAG (Retrieval-Augmented Generation) combina modelos de linguagem de grande porte (LLMs) com mecanismos de recuperação de informações, permitindo que agentes autônomos consultem bases de conhecimento externas para gerar respostas mais precisas e atualizadas.

Componentes Principais

Usuário: Envia perguntas ou comandos.
Agente (Agent): Orquestra o fluxo, decide quando recuperar informações e como usá-las.
Retriever: Busca documentos relevantes em uma base de dados ou index.
LLM: Gera respostas utilizando tanto o contexto da consulta quanto os documentos recuperados.
Base de Conhecimento: Fonte de dados estruturados ou não estruturados.

Fluxo de Funcionamento

O usuário faz uma pergunta ao agente.
O agente analisa a consulta e decide se precisa buscar informações externas.
O retriever localiza documentos relevantes na base de conhecimento.
O agente integra os documentos recuperados ao prompt do LLM.
O LLM gera uma resposta fundamentada.
O agente retorna a resposta ao usuário.

Diagrama

Resumo:
A arquitetura Agentic RAG potencializa LLMs com busca ativa de informações, tornando-os mais precisos, atualizados e adaptáveis a diferentes domínios.