Gerenciando Agents: orquestração, contexto e custo
Agent não é botão mágico. É processo com contexto, memória, ferramentas, orçamento e política. Gerenciar agents em organização séria é mais parecido com orquestrar serviços distribuídos do que com pedir ajuda num chat: você define limites, observa comportamento, mede outcome, corta custo, auditoria em cima. Quem trata agent como chatbot paga em bug de produção.
As 5 dimensões de gestão de agent
Orquestração: quando usar múltiplos agents
Por que subagents vencem “um agent faz tudo”. (1) Contexto isolado — research agent não polui janela do orquestrador com 20 arquivos lidos; só retorna o sumário. (2) Paralelização — rodar research+security ao mesmo tempo acelera lead time. (3) Especialização — subagent com system prompt específico performa melhor. (4) Custo — cada subagent paga só pelo próprio contexto.
Contexto: o recurso mais escasso
Armadilha do “coloca tudo na janela”. Jogar o repo inteiro num modelo de 1M tokens não é estratégia — é preguiça. Qualidade cai. Latência sobe. Custo explode. Contexto é curado como query em banco de dados, não como despejo.
Memória: o que persiste, o que expira
| Tipo | Onde vive | Escopo | Exemplo |
|---|---|---|---|
| Projeto | CLAUDE.md na raiz do repo | Um repositório | Stack, padrões, gotchas, comandos de build |
| Usuário | Arquivo de memória do agent | Uma pessoa | Prefs de estilo, feedback recorrente ("não use emoji") |
| Global | Docs externos citados em prompts | Toda org | Guias de segurança, políticas, SLAs |
| Session | Contexto da conversa atual | Uma execução | Raciocínio intermediário, desaparece ao terminar |
CLAUDE.md é o gerente de memória. É o arquivo que o agent lê sempre ao abrir o projeto. Boa regra: 200 linhas max, seções claras (Stack, Comandos, Gotchas, Padrões). Mais que isso vira ruído e o agent começa a ignorar.
Controle de custo (token budget)
Custo de agent é linear com tokens. Uma tarefa “pequena” pode virar $5 em um loop de ferramenta. Gerenciar custo é operacional:
# Exemplo: política de custo por agent em .agent/policy.yaml
models:
default: claude-sonnet-4-6
heavy: claude-opus-4-6
light: claude-haiku-4-5
budget:
per_task_max_tokens: 100000
per_day_max_usd: 50
alert_threshold_usd: 40
policy:
require_approval_above_usd: 5
kill_switch_above_usd: 20Segurança: menor privilégio
Nunca. (1) Dar credencial de produção pra agent sem HSM/vault intermediando. (2) Rodar , , sem confirmação humana. (3) Permitir chamada a endpoint caro (OpenAI, SMS, Twilio) sem budget cap. (4) Deixar agent com acesso a webhook público executar código arbitrário.
Política escrita (prompt engineering operacional)
Boa política mora em CLAUDE.md e é clara, curta, com exemplo:
# Policies (em CLAUDE.md)
## O que agent NUNCA faz sem confirmação humana
- git push --force, git reset --hard
- DROP TABLE / ALTER TABLE destrutivo
- Apagar arquivo fora de /tmp ou worktree
- Chamar API externa paga (LLM, SMS, pagamento)
- Alterar .env, credentials.json, secrets
## Estilo de código
- TypeScript strict. Nunca "any".
- Componentes React: named export, function component.
- Testes: vitest + msw; não mockar banco.
## Fluxo de PR
- Sempre abrir PR, nunca commit direto em main.
- PR deve linkar a spec (docs/specs/<slug>.md).
- Descrição: 1 parágrafo do "o que e por quê".
## Onde achar contexto
- Ticket em Linear/INGEST = bugs de pipeline.
- SLOs em grafana.internal/d/api-latency.
- Runbook em ops/RUNBOOK.md.Observabilidade do agent
Cenários reais de decisão
📋 Migrar 200 endpoints de Express pra Fastify num monorepo
Orchestrator quebra em batches de 20 endpoints por subagent; cada sub carrega contexto mínimo (seu batch + utils compartilhados), retorna PR. Humano revisa cada PR com checklist — agent faz o que agent faz bem.
Alt: Um agent pra tudo —
📋 Debug de latência P99 intermitente em API crítica
Exige intuição operacional, traces, correlação com deploys. Agent lê flamegraph, sugere hipótese, escreve benchmark. Decisão é humana — você responde pelo incidente.
Alt: Agent sozinho —
📋 Feature nova com impacto em 30 arquivos e integração com stripe
Spec na mão. Security subagent roda antes do merge (scan de vulns, review de chamadas ao stripe, verificação de idempotência). Sem esse gate, dívida cresce em silêncio.
Perguntas típicas
❓ Meu time tem 10 devs. Posso usar o mesmo CLAUDE.md pra todos?
❓ Como evito que agent mexa em arquivo que não é da tarefa?
❓ Agent é confiável pra merge automático?
❓ Quando não usar agent?
❓ Como prevenir um agent quebrar um agent (loop)?
Take-aways. (1) Agent é processo: contexto + memória + tools + orçamento + política. (2) Orchestrator + subagents ganham de “um agent pra tudo”. (3) Contexto é curado, não despejado. (4) Menor privilégio é inegociável. (5) Mede outcome (lead time, bug escape, custo), não volume. (6) Próximo: você vai criar um agent customizado.
Próximos passos sugeridos
Discussão
Carregando…