Estudo de Caso: Da Especificação à Produção
Um exemplo de ponta a ponta de rotinas de desenvolvimento agentic aplicadas a um sistema de recomendação de e-commerce
Visão Geral
Esta página detalha um exemplo completo de como as rotinas de governança definidas na página anterior funcionam juntas na prática. O cenário: uma equipe construindo um recurso de Recommender System para uma plataforma de e-commerce.
Definição de Epic (Trimestral)
Durante a Definição Estratégica de Especificação, o Context Architect decompõe a iniciativa "Recomendações Personalizadas" em três Epics:
- User Behavior Tracking — Capturar eventos de navegação, busca e compra.
- Recommendation Engine — Construir o pipeline de ML que produz as recomendações.
- Frontend Integration — Exibir as recomendações na UI do produto.
Cada Epic recebe uma Live Spec de alto nível. O Epic Recommendation Engine é classificado como de alto risco (arquitetura inovadora, complexidade do pipeline de ML) e configurado com portões HITL obrigatórios em todas as etapas.
Live Spec Task (Semanal)
Durante o Bloco de Engenharia de Especificação, o Context Architect produz um Context Packet para a primeira tarefa no Epic User Behavior Tracking: "Implementar a captura de eventos para visualizações de página de produto."
O Context Packet inclui:
- Live Spec — Critérios de aceitação: capturar eventos de visualização de página com ID do produto, sessão do usuário, timestamp e dados de viewport. Casos de borda: usuários anônimos, filtragem de tráfego de bot, sessões concorrentes.
- Architectural Rules — Os eventos devem fluir através do barramento de eventos existente. Nenhuma gravação direta no banco de dados a partir da camada de captura. Os eventos devem estar em conformidade com o esquema CloudEvents da plataforma.
- Golden Sample — Uma implementação de referência da captura de eventos "adicionar ao carrinho" existente, mostrando os padrões corretos, convenções de nomenclatura e estrutura de teste.
Agent Execution (Diário)
O Agent Operator alimenta o Context Packet a um Feature Agent. O prompt do Claude Code segue esta estrutura:
Você está implementando a captura de eventos para visualizações de página de produto.
Context Packet:
- Live Spec: [anexado]
- Architectural Rules: Eventos fluem através do EventBus. Sem gravações diretas no DB.
Esquema CloudEvents necessário.
- Golden Sample: Veja a implementação do evento add-to-cart em
src/events/add-to-cart.ts
Requisitos:
1. Implementar ProductPageViewEvent seguindo o esquema CloudEvents
2. Registrar o manipulador de eventos com o EventBus
3. Incluir filtragem de tráfego de bot usando o serviço BotDetector existente
4. Escrever testes de unidade cobrindo todos os critérios de aceitação e casos de borda
Restrições:
- Não modificar nenhum arquivo fora de src/events/ e src/events/__tests__/
- Seguir as convenções de nomenclatura mostradas no Golden Sample
- Todos os testes devem passar antes de enviar o PR
Ciclo de Feedback Iterativo
O agent produz uma implementação inicial. O Evaluation Harness executa testes automatizados. Dois testes falham: a lógica de filtragem de bot não lida com o caso de borda em que uma string de user agent está ausente, e a validação do esquema CloudEvents rejeita o evento porque o campo source usa o formato errado.
O agent itera: corrige o tratamento de user-agent nulo, corrige o formato do campo source e reenviou. Todos os testes passam.
Rescue Mission
Na segunda tarefa — "Implementar a captura de eventos de consulta de busca" — o agent trava. Ele tenta importar um módulo do domínio do recommendation engine, violando o limite de contexto delimitado. O Evaluation Harness sinaliza uma violação arquitetural, mas o agent não consegue resolvê-la porque não possui contexto sobre o padrão correto de comunicação interdomínio.
O Agent Operator intervém:
- Diagnostica o problema: o contexto do agent não inclui a definição da interface AsyncMessageBus e um exemplo de publicação de evento entre domínios.
- Injeta o contexto ausente: a definição da interface AsyncMessageBus e um exemplo de publicação de eventos entre domínios.
- Retoma o agent, que agora publica corretamente o evento de busca através do message bus em vez de importar do domínio de recomendação.
Conclusão da Tarefa
O Agent Operator revisa o pull request final. O código segue os padrões do Golden Sample, passa em todos os testes automatizados e respeita os limites arquiteturais. O pull request é aprovado e mergeado. O Flow Manager atualiza o AgentOps Dashboard, marcando a tarefa como concluída e registrando o consumo de token em relação ao orçamento semanal.
Tempo total decorrido do Context Packet para o pull request mergeado: 47 minutos para duas tarefas, incluindo uma Rescue Mission. O trabalho equivalente teria levado um desenvolvedor humano aproximadamente 1,5 a 2 dias.
Principais Aprendizados
Este exemplo ilustra vários princípios da estrutura:
- A qualidade do contexto determina a qualidade da execução. A primeira tarefa foi bem-sucedida na segunda iteração porque o Context Packet era completo. A segunda tarefa exigiu uma Rescue Mission porque o padrão de comunicação interdomínio estava ausente do contexto.
- O Evaluation Harness detecta erros que o agent não consegue autodiagnosticar. Violações arquiteturais são invisíveis para o agent sem restrições explícitas. Verificações automatizadas detectaram o que o agent não conseguiu.
- As Rescue Missions são diagnósticas, não punitivas. O operador não reescreveu o código — ele identificou o contexto ausente, injetou-o e deixou o agent concluir o trabalho.
- O ciclo de vida completo se conecta. O planejamento trimestral definiu os epics, a engenharia de especificação semanal produziu os context packets e a execução diária os consumiu. Cada cadência alimenta a próxima.
O Que Vem a Seguir
A próxima página aborda as métricas e estruturas de acompanhamento de sucesso que medem se essas rotinas estão realmente funcionando — desde índices de alavancagem e eficiência de fluxo até as métricas econômicas que justificam o investimento em infraestrutura agentic.