Blog
Para quem já sabe o básico e quer ir fundo. Aqui o assunto é como os modelos funcionam em produção: memória, roteamento, ferramentas, agentes. O lado técnico que pouca gente explica direito.
Engineer que entende usuário, métrica e trade-off business. Stripe/Airbnb/Shopify como referência. Staff+ path via produto. DRI vs IC puro.
Release flag vs experiment flag vs permission flag. GrowthBook (open source, stats-first), Unleash, LaunchDarkly, Vercel Flags. Kill switch. Flag debt.
Hypothesis, power analysis, sample size. Stat sig real (p-values são tricky). CUPED variance reduction. Peeking problem. Sequential testing.
CUPED (Controlled experiments Using Pre-Experimental Data). Reduz variance 30-50%, meaning smaller sample sizes. Covariate adjustment. Published by Microsoft 2013.
Metrics de segurança que NÃO podem regredir (latency, crash rate, revenue). Guardrails fail-fast. Statistical power em ambas direções. Netflix/LinkedIn playbooks.
Event tracking schema. Funnels, cohorts, retention, user flow. PostHog (open source + self-host), Mixpanel, Amplitude. GDPR/LGPD compliant tracking.
Rodar experiment real: hypothesis, flag setup, power analysis, deploy, monitor guardrails, análise com CUPED, writeup. Repro em datasets públicos ok.