Blog
Para quem já sabe o básico e quer ir fundo. Aqui o assunto é como os modelos funcionam em produção: memória, roteamento, ferramentas, agentes. O lado técnico que pouca gente explica direito.
Method R (Brendan Gregg). USE method (utilization, saturation, errors). Latência de tail (p99 importa mais que média). Amdahl vs Gustafson. Perf budget.
perf record + perf script + flamegraph.pl. Async profiler (Java). py-spy (Python). pprof (Go). Diffed flamegraph. Off-CPU flamegraph. Icicle.
eBPF = programa no kernel sandboxed. bcc tools (tcpconnect, opensnoop), bpftrace one-liners. Quando eBPF resolve sem modificar código.
JVM: async-profiler, JFR. Node: clinic.js, 0x. Python: py-spy, scalene. Go: pprof (built-in). Rust: perf + cargo-flamegraph. Quando CPU vs memory vs allocation profiler.
Hardware cache levels e latência (L1 1ns, L2 3ns, L3 12ns, RAM 100ns). Cache lines (64B). False sharing. Branch misprediction cost. perf stat.
Profiling locks (contention via eBPF, JFR). Adaptive spin/block. Lock-free alternatives. I/O: iostat, iotop, strace. Async I/O (io_uring). EFIX patterns.
Pegar sistema com perf problem real (próprio ou repo público), aplicar método. Entregáveis: writeup com hipótese, flamegraphs antes/depois, fix, benchmark. Estilo Gergely Orosz ou high-scalability.