RAG (Retrieval-Augmented Generation)

Generación Aumentada por Recuperación (RAG) es un marco de AI que mejora las salidas de los modelos de lenguaje grandes (LLM) al combinarlos con la recuperación de conocimiento externo. En lugar de depender únicamente de los datos de entrenamiento del modelo, los sistemas RAG primero recuperan documentos o datos relevantes de una base de conocimiento, y luego utilizan este contexto para generar respuestas más precisas y fundamentadas.

La arquitectura RAG típicamente consta de tres componentes principales:

Recuperador: Busca en una base de datos vectorial o almacén de documentos para encontrar información relevante basada en la consulta del usuario. Los métodos de recuperación comunes incluyen la búsqueda vectorial densa (usando embeddings) y la búsqueda dispersa basada en palabras clave.
Base de Conocimiento: Una colección de documentos, bases de datos u otras fuentes de información que el recuperador puede buscar. Esto puede incluir documentación interna, catálogos de productos, trabajos de investigación o cualquier contenido específico del dominio.
Generador: El LLM que recibe tanto la consulta original como el contexto recuperado para producir una respuesta final que está fundamentada en la información proporcionada.

RAG es particularmente valioso para aplicaciones empresariales donde la precisión, la atribución de fuentes y el acceso a información propietaria o frecuentemente actualizada son críticos. Ayuda a reducir las alucinaciones y permite que los modelos proporcionen respuestas verificables con citas.

RAG (Retrieval-Augmented Generation)

Definición