Chaos Engineering

Para quem já sabe o básico e quer ir fundo. Aqui o assunto é como os modelos funcionam em produção: memória, roteamento, ferramentas, agentes. O lado técnico que pouca gente explica direito.

6artigos

335XP total

⚗️ Chaos engineering: os princípios

Principles of Chaos (Netflix manifesto). Steady-state hypothesis, vary real-world events, run in production (com cuidado), minimize blast radius, automatize experiments.

⏱ 11 min·+45 XP

→

🐒 Chaos Monkey, Simian Army, Gremlin

Netflix Chaos Monkey (kill instances), Chaos Kong (region failure), Chaos Gorilla (AZ failure). Gremlin SaaS com GUI. ChaosToolkit open source. Quando cada.

⏱ 12 min·+50 XP

→

☸️ LitmusChaos no Kubernetes

LitmusChaos CNCF incubating. Pod delete, node drain, network chaos, disk fill, resource stress. ChaosHub (library experiments). Integration com Prometheus/Grafana.

⏱ 13 min·+55 XP

→

🎮 Game days estruturados

Game day = chaos experiment manual com time. Script com hypothesis, scope, abort criteria, timeline. Facilitator + observers. Postmortem. Google SRE book capítulo.

⏱ 12 min·+50 XP

→

💉 Fault injection prática

Network (latency, packet loss via tc), CPU/memory pressure (stress-ng), disk fill, clock skew. Service mesh (Istio fault injection), AWS FIS (Fault Injection Simulator).

⏱ 13 min·+55 XP

→

🏁 Capstone: chaos experiment end-to-end

Rodar experiment em sistema próprio: hypothesis, scope, abort criteria, execute, observe, document. Entregáveis: runbook + findings + action items + melhorias de resiliência.

⏱ 18 min·+80 XP

→

← Voltar à home