Búsqueda Semántica
Búsqueda de información basada en el significado profundo y el contexto, en lugar de coincidencias exactas de palabras clave.
Definición
La búsqueda semántica es un enfoque de recuperación de información que encuentra resultados basándose en el significado y la intención detrás de una consulta, en lugar de coincidir con palabras clave exactas. Funciona convirtiendo tanto las consultas como los documentos en embeddings vectoriales densos que codifican relaciones semánticas, para luego encontrar las coincidencias más cercanas en el espacio de embeddings utilizando métricas de similitud como la distancia coseno.
Las características clave de la búsqueda semántica incluyen:
-
Coincidencia Basada en el Significado: Una búsqueda de "cómo arreglar una implementación rota" puede mostrar documentos sobre "solución de problemas de lanzamientos fallidos" incluso si no hay superposición de palabras clave, porque los conceptos subyacentes son semánticamente similares.
-
Modelos de Embedding: El texto se transforma en vectores utilizando modelos como sentence-transformers, los modelos de embedding de OpenAI o Cohere Embed. La calidad del modelo de embedding determina directamente la calidad de la búsqueda.
-
Capacidad Translingüe: Los modelos de embedding multilingües permiten la búsqueda entre idiomas, devolviendo resultados relevantes sin importar si la consulta y el documento comparten el mismo idioma.
-
Sensibilidad al Contexto: A diferencia de la búsqueda por palabras clave, la búsqueda semántica considera el contexto completo de una consulta, distinguiendo entre "Python el lenguaje" y "python la serpiente" basándose en los términos circundantes.
La búsqueda semántica es la base de los sistemas RAG modernos e impulsa la recuperación de conocimiento en asistentes de AI, motores de búsqueda empresariales y herramientas de búsqueda de código.