🧠FFVAcademy
💰

Otimização de Custos: RI, Savings Plans, Spot

12 min de leitura·+60 XP

Cost-Optimized é 20% do SAA-C03. O exame testa se você sabe escolher o modelo de compra certo (RI, SP, Spot), identificar over-provisioning (Compute Optimizer), usar ferramentas de monitoramento (Cost Explorer, Budgets, Trusted Advisor) e aplicar padrões arquiteturais que economizam sem sacrificar resiliência.

📘 Cost-Optimized· 20%

Modelos de compra de EC2 — o espectro completo

ModeloDesconto vs On-DemandCommitFlexibilidadeCaso
On-Demand0%NenhumTotalDev/test, spikes imprevisíveis
Compute Savings PlansAté 66%1 ou 3 anosAlta: cross-family, cross-region, Lambda/FargateWorkloads estáveis mas que podem mudar tipo
EC2 Instance Savings PlansAté 72%1 ou 3 anosFamília + região fixasWorkloads muito previsíveis em família específica
Standard RIAté 72%1 ou 3 anosBaixa: troca em mesma famíliaLegado, substituído por Savings Plans na maioria dos casos
Convertible RIAté 54%1 ou 3 anosMédia: pode trocar famíliaQuando precisa de RI específica (Windows BYOL)
SpotAté 90%NenhumTolera interrupção (2min aviso)Batch, ML training, containers stateless
Dedicated HostVariável1 ou 3 anos ou On-DemandHost físico dedicadoLicenças BYOL, compliance
Capacity ReservationSem desconto extraFlexívelGarante capacity em AZ específicaEventos críticos, DR
💡
Recomendação atual da AWS: Savings Plans sobre RIs para novos commits. Mais flexíveis e desconto equivalente em Compute SP vs Standard RI. RIs ainda existem para workloads herdados.

Quando cada um ganha — decisão rápida

📋 Web app roda 24/7 com 20 EC2 m5.xlarge há 2 anos, crescendo lentamente

Compute Savings Plans 3 anos

Carga previsível + tamanho estável = commit de 3 anos. Compute SP (não EC2 SP) porque se a empresa migrar para m6g Graviton, o SP cobre igual.

📋 Renderização de filmes 8h por noite, 500 EC2 c5.24xlarge, tolera instância morrer e reiniciar

Spot Instances com diversificação de instance types

Spot dá até 90% off. Diversificar em vários types reduz risco de interrupção simultânea. Checkpoint em S3 permite resume.

📋 Workload roda em Lambda + Fargate + EC2, com proporção variando mensalmente

Compute Savings Plans

Único SP que cobre Lambda e Fargate. Mistura de compute changes over time — Compute SP absorve.

📋 Oracle DB legado precisa rodar em hardware dedicado por licença BYOL

Dedicated Host

Licença Oracle exige core tracking. Dedicated Host expõe sockets/cores para compliance. Dedicated Instance não serve (não expõe hardware).' }

Spot Instances — detalhes críticos

Interruption Notice2 minutos via instance metadata (/latest/meta-data/spot/termination-time) ou CloudWatch event.
Spot FleetProvisiona pool de múltiplos instance types em múltiplas AZs. Reduz risco de interrupção em massa.
EC2 FleetEvolução — mistura Spot + On-Demand + RI em único request.
Spot Blocks (descontinuado)Reservava Spot por 1–6h sem interrupção. AWS descontinuou em 2021.
Hibernate on interruptionEstado em memória salvo em EBS; resume quando capacity volta.
Bad fitAplicações single-master sensíveis à interrupção (bancos, sessões não replicadas).

Ferramentas de visibilidade e controle

FerramentaFunção
Cost ExplorerVisualização histórica + forecast. Drill-down por serviço/tag/account.
AWS BudgetsAlertas quando custo/uso excede threshold. Pode disparar ação (SNS, Lambda).
AWS Cost CategoriesAgrupamentos customizados (ex: "time-A", "produto-X") para relatórios.
Cost Allocation TagsTags ativadas para aparecer em relatórios. Base de FinOps.
Trusted Advisor5 pilares (cost, performance, security, fault tolerance, service limits). Cost checks: idle EC2, unused EIPs, RI/SP opportunity.
Compute OptimizerML recomenda rightsizing para EC2, EBS, ASG, Lambda baseado em CloudWatch.
AWS Pricing CalculatorEstimativa de custo pré-deploy.
CUR (Cost & Usage Report)Dump granular em S3 (hora por hora, recurso por recurso). Analisado com Athena/QuickSight.

Padrões arquiteturais que economizam

Auto ScalingReduz compute fora de horário de pico. Combine com schedule scaling (desliga à noite).
S3 LifecycleMova objetos frios para IA/Glacier automaticamente.
CloudFrontReduz egress de S3/EC2 (tráfego do POP para o cliente é mais barato que direto).
VPC EndpointsGateway endpoints para S3/DynamoDB são GRÁTIS. Evitam custo de NAT Gateway para tráfego intra-AWS.
Reserved Capacity em DynamoDB/ElastiCache/RDSMesma lógica de RIs em outros serviços.
gp3 sobre gp2gp3 é ~20% mais barato na mesma configuração (e desacopla IOPS).
Graviton (Arm)m6g/c6g dão 20–40% melhor price/performance vs x86 equivalente.
Fargate Spot / EC2 Spot em EKSEconomia para workloads batch em containers.

Cenários de SAA

📋 Conta com 150 EC2 e 20TB EBS gp2, consultor recomenda economizar

Compute Optimizer para rightsizing + migrar EBS gp2→gp3 + comprar Compute SP 1 ano

Compute Optimizer identifica over-provisioning. gp3 reduz 20% do EBS. SP 1 ano captura ~30% sem commit longo.

📋 NAT Gateway cobrando $5.000/mês; tráfego é 90% para S3 e DynamoDB

Substitua por VPC Gateway Endpoints para S3 e DynamoDB

Gateway Endpoints são grátis e rotam tráfego internamente. NAT Gateway só paga para os 10% restantes.

📋 Análise ad-hoc precisa processar 10TB de logs em S3 mensalmente

Athena (serverless SQL, paga por TB scanned) + Parquet + Partitioning

Athena não cobra compute idle. Parquet colunar reduz scan. Partitioning por data limita scope. Alternativa EMR cobraria cluster idle.

Q&A estilo exame

Como alocar custo de infra compartilhada entre 3 departamentos?

Cost Allocation Tags obrigatórias via SCP/IAM. Ative no Billing Console. Relatório no Cost Explorer por tag “department”. Use Cost Categories para agrupar contas/serviços em buckets lógicos.

Budget alerta em $10k mas conta continua gastando. O Budget faz enforcement?

Não por padrão — Budgets apenas notifica. Para forçar corte, configure action: desanexar IAM policies restritivas, parar EC2 específicas via SSM, ou desabilitar serviços. “Budget Actions” é o feature para enforcement ativo.

Vale trocar x86 por Graviton (Arm)?

Na maioria dos casos sim — 20–40% melhor price/performance. Mas exige binários compatíveis. Node.js, Python, Go, Java (JVM moderna) funcionam nativo. Código com dependências x86 nativas (.so específicas) requer rebuild.

Compute SP vale mais que EC2 SP quando?

Sempre que você NÃO tem certeza de estabilidade em família/região. EC2 SP dá mais desconto (até 72% vs 66%) mas você perde todo o desconto se trocar para outra família. Em dúvida, Compute SP é o hedge certo.
⚠️
Armadilhas: (1) RI/SP são pagamento garantido — se não usar, paga igual; (2) Spot pode morrer a qualquer momento, não rode sessão stateful; (3) gp2 ainda é default em muitos templates — trocar para gp3 economiza sem esforço; (4) NAT Gateway é um dos maiores ofensores de custo em VPC mal planejada; (5) data transfer OUT é caro (especialmente cross-region e para internet).
Take-aways: mapa mental — On-Demand (default), Savings Plans (estável), Spot (interruptível), RI (legado). Use Compute Optimizer para rightsizing, Budgets para guardrails, Cost Explorer para visibility, CUR para análise profunda. Arquitetura bem desenhada economiza mais que qualquer desconto de compra.
🧩

Quiz rápido

3 perguntas · Acerte tudo e ganhe o badge 🎯 Gabarito