Projeto
Construa um agent Claude que resolve problema real (escolha: triage de issues, revisor de PR, CS assistant). Entregue em produção com usuários reais.
Stack
- Claude API com prompt caching em system prompt + context
- Tool use: 3+ tools custom (DB query, API call, write action)
- MCP servers: conecta a fontes relevantes (Linear/GitHub/Slack)
- Memory: session em Redis com TTL
- Observability: Langfuse (traces, feedback, cost/query)
- Eval harness: golden set + LLM judge + regression em CI
- Rate limit graceful: backoff exponencial, queue em overflow
- Feature flag: canary por versão do agent
✅
Entregável: URL de produção, métricas de 7+ dias de uso real, repo com eval harness rodando em CI, retrospective do que aprendeu. Portfolio real.