Engenharia de Contexto
Organização e manutenção do conjunto ideal de tokens e dados de estado durante a inferência de LLM.
Definição
A engenharia de contexto é a prática de projetar, organizar e gerenciar deliberadamente as informações que fluem para a janela de contexto de um grande modelo de linguagem para maximizar a qualidade e a relevância de seus resultados. Enquanto a engenharia de prompts se concentra na elaboração de instruções individuais, a engenharia de contexto adota uma visão de nível de sistema de como todas as partes do contexto, incluindo prompts de sistema, documentos recuperados, histórico de conversas, saídas de ferramentas e entradas de usuários, são montadas e priorizadas.
As principais características da engenharia de contexto incluem:
-
Arquitetura de Informação: Os profissionais decidem quais informações incluir, excluir, resumir ou adiar, tratando a janela de contexto como um recurso escasso que deve ser alocado estrategicamente.
-
Montagem Dinâmica de Contexto: Em vez de prompts estáticos, a engenharia de contexto envolve a construção de pipelines que montam o contexto dinamicamente com base na tarefa atual, no estado do usuário e nas informações disponíveis.
-
Gerenciamento de Estado: Em fluxos de trabalho de vários turnos ou agênticos, os engenheiros de contexto projetam como o histórico de conversas é compactado, quais saídas de ferramentas são retidas e quando redefinir ou resumir o estado acumulado.
-
Integração de Recuperação: A engenharia de contexto determina como e quando extrair conhecimento externo via RAG, equilibrando a relevância da recuperação com a capacidade da janela de contexto.
-
Orientado por Avaliação: A engenharia de contexto eficaz requer a medição da qualidade da saída em relação a diferentes configurações de contexto, tratando o design de contexto como um problema de otimização empírica em vez de uma configuração única.
No Agentic Development Handbook, a engenharia de contexto é a base do pilar Arquitetura Context-First. O Context Index serve como o registro canônico que mapeia cada artefato do projeto — registros de decisão de arquitetura, grafos de dependência, guias de estilo e acessórios de teste — para um local recuperável que os agentes podem consultar no momento da tarefa. Os Context Packets são o mecanismo de entrega: pacotes escopados de arquivos, regras e referências de Live Spec montados para uma única tarefa do agente, para que o modelo receba precisamente as informações de que precisa sem esgotar seu orçamento de tokens.