RAG (Geração Aumentada por Recuperação)

Retrieval-Augmented Generation (RAG), ou Geração Aumentada por Recuperação, é uma estrutura de AI que aprimora as saídas de large language models (LLM) combinando-as com a recuperação de conhecimento externo. Em vez de depender apenas dos dados de treinamento do modelo, os sistemas RAG primeiro recuperam documentos ou dados relevantes de uma base de conhecimento, e então usam este contexto para gerar respostas mais precisas e fundamentadas.

A arquitetura RAG tipicamente consiste em três componentes principais:

Retriever: Busca em um banco de dados vetorial ou repositório de documentos para encontrar informações relevantes com base na consulta do usuário. Métodos de recuperação comuns incluem busca vetorial densa (usando embeddings) e busca esparsa baseada em palavras-chave.
Knowledge Base: Uma coleção de documentos, bancos de dados ou outras fontes de informação que o retriever pode pesquisar. Isso pode incluir documentação interna, catálogos de produtos, artigos de pesquisa ou qualquer conteúdo específico de domínio.
Generator: O LLM que recebe tanto a consulta original quanto o contexto recuperado para produzir uma resposta final que é fundamentada nas informações fornecidas.

RAG é particularmente valioso para aplicações empresariais onde a precisão, a atribuição da fonte e o acesso a informações proprietárias ou frequentemente atualizadas são críticos. Ajuda a reduzir alucinações e permite que os modelos forneçam respostas verificáveis com citações.

RAG (Geração Aumentada por Recuperação)

Definição