Eficiência de Fluxo
A proporção do tempo de computação ativo do agente em relação ao tempo total de relógio (wall-clock time), medindo quanto tempo os agentes gastam trabalhando versus esperando.
Definição
A Eficiência de Fluxo mede a proporção do tempo de computação ativo do agente em relação ao tempo total de relógio (wall-clock time) para uma tarefa. É calculada da seguinte forma:
Tempo de computação ativo / Tempo total desde a atribuição da tarefa até o envio do PR
O tempo de computação ativo inclui todos os períodos em que o agente está gerando código, executando testes ou interagindo com o Eval Harness. O tempo total inclui tudo, desde o momento em que uma tarefa é atribuída a um agente até o envio da solicitação de pull final — incluindo todos os estados de espera, tempo de fila e atrasos na revisão humana.
Faixas de meta:
- Acima de 0.6 — os agentes gastam mais de 60% do tempo atribuído trabalhando ativamente. Isso indica um pipeline bem funcionando com gargalos mínimos.
- 0.4 a 0.6 — eficiência moderada com fatores de arrasto identificáveis. A melhoria é possível ao abordar estados de espera específicos.
- Abaixo de 0.4 — o gargalo está nos processos humanos, não na velocidade do agente. Os agentes estão gastando mais tempo esperando do que trabalhando, o que significa que adicionar mais agentes não aumentará a vazão.
Fatores de arrasto comuns que reduzem a Eficiência de Fluxo:
- Acúmulo na Fila de Revisão — o trabalho concluído do agente aguarda revisão humana. Esta é a causa mais comum de baixa Eficiência de Fluxo e é abordada melhorando a Operator Leverage Ratio.
- Atrasos na Preparação de Contexto — Live Specs e Pacotes de Contexto não estão prontos quando os agentes estão disponíveis, criando tempo ocioso no início do pipeline.
- Tempos de Espera da Infraestrutura — o provisionamento de Ephemeral Workbenches, o download de dependências ou a espera pela disponibilidade de serviços externos adiciona tempo não produtivo.
- Latência de Missão de Resgate — quando um agente levanta uma Blocker Flag, o tempo entre a sinalização e a resposta do operador é tempo de espera puro.
A Eficiência de Fluxo é monitorada no AgentOps Dashboard e revisada durante o Daily Flow Sync. Ela complementa o rastreamento de Token Budget: uma baixa Eficiência de Fluxo com baixo gasto de tokens indica que o pipeline está carente de atenção humana, enquanto uma baixa Eficiência de Fluxo com alto gasto de tokens indica que os agentes estão repetindo abordagens falhas.