🧠FFVAcademy
💾

Storage: S3, EBS, EFS, Glacier

11 min de leitura·+55 XP

Storage na AWS não é "um disco na nuvem" — é uma família inteira de serviços com casos de uso distintos. Escolher errado custa caro: storage mal escolhido pode multiplicar a fatura por 10 ou criar gargalos de performance. O CLF-C02 cobra fundamentos de object storage (S3), block storage (EBS) e file storage (EFS/FSx).

Onde isso entra no exame

📘 Domain 3 — Cloud Technology and Services· 34%

Storage é o segundo maior sub-tópico do domínio 3. As questões testam: diferença entre object/block/file; storage classes do S3 e quando usar cada uma; EBS volume types; e escolha correta dado um cenário.

As 3 famílias de storage

🗺️ Object vs Block vs File

┌────────────────┬────────────────┬────────────────┐
│    OBJECT      │    BLOCK       │    FILE        │
├────────────────┼────────────────┼────────────────┤
│ "arquivos +    │ "disco"        │ "share NFS/    │
│  metadata via  │                │  SMB"          │
│  API HTTP"     │                │                │
├────────────────┼────────────────┼────────────────┤
│  Exemplo:      │  Exemplo:      │  Exemplo:      │
│  S3            │  EBS           │  EFS (Linux),  │
│                │                │  FSx (Win/Lustre)│
├────────────────┼────────────────┼────────────────┤
│  Ilimitado     │  Até 64 TiB    │  Até PB        │
├────────────────┼────────────────┼────────────────┤
│  Acesso API    │  1 EC2 por vez │  N clientes    │
│  (HTTPS)       │  (Multi-Attach │  simultâneos   │
│                │   raro)        │                │
├────────────────┼────────────────┼────────────────┤
│  Paga por GB   │  Paga por GB   │  Paga por GB   │
│  + reqs        │  provisionado  │  usado         │
└────────────────┴────────────────┴────────────────┘

Amazon S3 (Simple Storage Service)

Object storage. Ilimitado, 11 9s de durabilidade (99,999999999%), acessado via HTTPS. Organizado em buckets (nomes globalmente únicos) contendo objetos (arquivo + metadata, até 5 TB cada). Não há estrutura de diretórios real — "pastas" são só um prefixo no nome da chave (fotos/2026/abril/x.jpg).

Principais features:

  • Versioning — mantém versões históricas de cada objeto
  • Replication — CRR (cross-region) ou SRR (same-region)
  • Lifecycle — transita entre storage classes ou deleta automaticamente
  • Encryption — SSE-S3, SSE-KMS, SSE-C, client-side
  • Object Lock — WORM (Write Once Read Many) para compliance
  • Event Notifications — dispara Lambda, SQS, SNS em upload/delete
  • Transfer Acceleration — upload acelerado via CloudFront
  • Multi-part upload — obrigatório para arquivos >5 GB

S3 Storage Classes (cobrado no exame)

ClasseAcessoDurabilidadePreço relativoUso
S3 StandardFrequente (ms)99,999999999%$$$Dados ativos, websites, analytics
S3 Intelligent-TieringFrequente → raro automático99,999999999%AutoAcesso imprevisível
S3 Standard-IARaro (ms)99,999999999%$$Backups, DR secundário
S3 One Zone-IARaro (ms)99,999999999% em 1 AZ$Backups recriáveis
S3 Glacier Instant RetrievalRaro (ms)99,999999999%$Arquivos médicos, logs acessados 1x/ano
S3 Glacier FlexibleMinutos a horas99,999999999%¢¢Backups long-term
S3 Glacier Deep Archive12 horas99,999999999%¢Compliance 7+ anos
💡
Trade-off central: quanto menor o preço de storage, maior o custo de retrieval (recuperar) e maior o tempo de acesso. Glacier Deep Archive custa centavos/GB mas cobra alto para recuperar + leva 12h.

Amazon EBS (Elastic Block Store)

Volumes de bloco anexados a EC2 — "o HD virtual". Persistente (sobrevive ao desligamento da EC2). Uma AZ apenas (backup para outra AZ via snapshot).

TipoMídiaUsoIOPS máximo
gp3SSDPadrão general purpose (boot, DB)16.000 (baseline) até 80.000
gp2SSDLegado general purpose3.000 baseline até 16.000
io2 Block ExpressSSD NVMeWorkloads críticos (Oracle, SAP)256.000
io1SSDLegado alto-IOPS64.000
st1HDDThroughput sequencial (big data)Baseline 40 MB/s por TB
sc1HDDArquivamento barato (raro acesso)Baseline 12 MB/s por TB
⚠️
EBS é na mesma AZ da EC2. Para usar em outra AZ ou outra Região, você cria um snapshot (armazenado em S3), e restaura o snapshot na nova AZ/Região.

Instance Store (ephemeral)

Storage físico acoplado ao host. Altíssima performance (NVMe local) mas perde todos os dados quando a EC2 é parada/terminada. Incluído no preço de certas instâncias (i3, d3).

Uso: caches, dados temporários, swap. Nunca dados que você não pode perder.

Amazon EFS e FSx

ServiçoProtocoloSOUso
Amazon EFSNFS v4LinuxCompartilhamento entre EC2 Linux, Lambda, ECS
FSx for WindowsSMBWindowsActive Directory, apps Windows legadas
FSx for LustreLustreLinuxHPC, ML training (integra com S3)
FSx for NetApp ONTAPNFS, SMB, iSCSILinux/WinEnterprise NAS (snapshots, dedup)
FSx for OpenZFSNFS v3/v4.xLinuxAlternativa ZFS (clone instantâneo, compressão)

AWS Backup — backup centralizado

Serviço gerenciado que faz backup de EBS, EFS, FSx, RDS, DynamoDB, Storage Gateway, EC2 (via snapshot) com políticas centralizadas. Substitui scripts manuais. Cross-region e cross-account suportados.

AWS Snow Family — migração física

DispositivoCapacidadeUso
Snowcone8 TBEdge computing leve + migração pequena
Snowball Edge Storage80 TBMigração média
Snowball Edge Compute42 TB + GPUCompute em ambiente disconnected
Snowmobile100 PBContainer de caminhão para mudanças gigantescas (descontinuado 2024 — agora multi-Snowball)

Cenários de decisão

📋 Fotos de usuários de um app de rede social (mix de acesso)

S3 Intelligent-Tiering

Fotos recentes são acessadas muito, fotos antigas ocasionalmente. Intelligent-Tiering move automaticamente entre classes, otimizando custo sem retrieval fees.

📋 Compliance bancário: guardar logs por 10 anos com acesso quase zero

S3 Glacier Deep Archive + Object Lock

$1/TB/mês é o menor custo da AWS. Object Lock em modo Compliance garante WORM — nem a root account pode deletar. 12h de retrieval é aceitável para auditoria.

📋 Banco de dados PostgreSQL em EC2 com 10k TPS

EBS io2 Block Express

Workloads transacionais exigem IOPS previsíveis e baixa latência. io2 suporta até 256k IOPS por volume. Para escala horizontal, considere RDS/Aurora em vez de EC2 manual.

Alt: EBS gp3Ok para cargas menores; limite de 80k IOPS

📋 Cluster EC2 Linux compartilhando diretório /var/data

Amazon EFS

Múltiplas EC2s montam o mesmo FS via NFS. Escala elástica. IAM controla acesso. Backup via AWS Backup.

📋 Migração de 500 TB de dados on-prem com link ADSL de 20 Mbps

AWS Snowball Edge

Via rede levaria ~60 dias. Snowball chega em 1 semana, copia localmente, retorna à AWS. Mais rápido e barato.

Exemplos de CLI

bash
# S3 — criar bucket, upload, listar
aws s3 mb s3://meu-bucket-unico-123
aws s3 cp arquivo.pdf s3://meu-bucket-unico-123/
aws s3 ls s3://meu-bucket-unico-123/

# S3 — habilitar versioning
aws s3api put-bucket-versioning \
  --bucket meu-bucket-unico-123 \
  --versioning-configuration Status=Enabled

# S3 — aplicar lifecycle (mover p/ Glacier após 90d)
aws s3api put-bucket-lifecycle-configuration \
  --bucket meu-bucket-unico-123 \
  --lifecycle-configuration file://lifecycle.json

# EBS — criar volume gp3 e anexar
aws ec2 create-volume --size 100 --volume-type gp3 \
  --availability-zone sa-east-1a
aws ec2 attach-volume --volume-id vol-xxx \
  --instance-id i-yyy --device /dev/sdf

# Snapshot para backup / mover de AZ
aws ec2 create-snapshot --volume-id vol-xxx \
  --description "Backup diário"
⚠️
Pegadinha: S3 é "eventually consistent" para deletes? — Não. Desde dez/2020, S3 é strong read-after-write consistency para todas as operações. Se a questão mencionar "eventually consistent", é desatualizada ou a resposta errada.

Perguntas típicas (Q&A)

Qual storage é o mais durável da AWS?

S3 com 99,999999999% (11 9s) de durabilidade para todas as classes exceto One Zone-IA. Isso significa que em 10 milhões de objetos, você perderia estatisticamente 1 a cada 10.000 anos.

Em S3, qual é o tamanho máximo de um único objeto?

5 TB por objeto. Acima de 5 GB é obrigatório usar Multipart Upload. Upload simples (PUT único) é limitado a 5 GB.

Qual feature do S3 permite pagar pelo tráfego de saída em vez de quem baixa?

Nenhuma padrão — o dono do bucket paga egress. Mas Requester Pays permite repassar esse custo para quem faz o download (comum em datasets públicos grandes).

EBS snapshot é armazenado onde?

Em S3, internamente, mas você NÃO vê o bucket. É gerenciado pelo EBS. Incremental: só os blocos alterados desde o último snapshot são copiados.
Take-aways: Object (S3) / Block (EBS) / File (EFS, FSx). S3 tem 7 storage classes com trade-off storage↔retrieval. EBS é por AZ, snapshots vão para S3. EFS para Linux compartilhado, FSx para Windows ou HPC. Lifecycle + Intelligent-Tiering automatizam economia. Object Lock = WORM para compliance. Snow Family = migração física.
🧩

Quiz rápido

3 perguntas · Acerte tudo e ganhe o badge 🎯 Gabarito