Glossário
InfraestruturaEmergente

Orçamento de Tokens

O gasto máximo de computação autorizado por período de tempo, funcionando como um disjuntor contra loops de agente descontrolados.

Definição

Um Orçamento de Tokens é o gasto máximo de computação autorizado para a execução de um agente dentro de um determinado período de tempo. Funciona como uma restrição rigorosa, não uma diretriz consultiva, que previne custos descontrolados e força a priorização do trabalho do agente. Quando o orçamento é esgotado, o agente para e a tarefa é escalada para um humano.

Orçamentos de Tokens operam em múltiplos níveis:

  1. Orçamentos por Tarefa — cada tarefa individual tem uma alocação máxima de tokens. Se um agente excede este limite, a execução é interrompida e um Sinalizador de Bloqueio é acionado.
  2. Limites por Loop — dentro de uma tarefa, cada iteração do loop de execução do agente tem um limite para prevenir ciclos de tentativa e erro infinitos.
  3. Alocação Semanal — o gasto total de computação para o squad é definido durante as sessões semanais de Planejamento de Contexto e Alocação.

Orçamentos de Tokens previnem o modo de falha mais comum em equipes de agentes: loops de agente descontrolados que consomem grandes quantidades de computação sem produzir valor incremental. Eles são aplicados na Camada de Orquestração e rastreados em tempo real no Dashboard AgentOps, onde o Flow Manager monitora o consumo em relação à alocação semanal.

Última atualização: 3/11/2026