IA e ML na AWS: Bedrock, SageMaker, Q e Amigos
A AWS tem um zoológico de serviços de IA — e o CLF-C02 (versão 2024+) cobra que você saiba escolher entre eles. A regra de ouro: serviços prontos por domínio (imagem, voz, texto) resolvem 80% dos casos sem escrever modelo nenhum. SageMaker aparece quando você precisa treinar algo específico. Bedrock e Amazon Q são a aposta de GenAI. Entender essa camada evita que você use um canhão pra matar mosquito.
As 3 camadas de IA/ML na AWS
| Camada | Serviços | Quando usar |
|---|---|---|
| AI Services (prontos) | Rekognition · Comprehend · Polly · Transcribe · Translate · Lex · Kendra · Textract · Bedrock · Q | Você não tem ciência de dados — quer resolver problema de negócio com API pronta |
| ML Platform | Amazon SageMaker (Studio, Training, Endpoints, Pipelines, Canvas, JumpStart) | Precisa treinar modelo customizado com seus dados |
| ML Frameworks + Infra | EC2 GPU (p5, g6) · Deep Learning AMI · EKS + Karpenter · Trn1/Inf2 (Trainium/Inferentia) | Equipe de ML madura quer controle total |
Amazon SageMaker
Plataforma completa de ML gerenciada. Cobre do notebook ao endpoint de produção.
| Recurso | Para que serve |
|---|---|
| Studio | IDE Jupyter-based, o “VS Code do ML” |
| Autopilot | AutoML — encontra o melhor modelo sozinho |
| Canvas | AutoML no-code (para analistas, não engenheiros) |
| Ground Truth | Labeling de dados com humanos (público ou privado) |
| Feature Store | Banco de features compartilhado entre treino e inferência |
| JumpStart | Modelos pré-treinados e soluções prontas |
| Clarify | Detecta bias e explica decisões do modelo |
| Pipelines | MLOps (CI/CD para modelos) |
| Model Registry | Versionamento e aprovação de modelos |
Opções de deployment: Real-time Endpoint (ms de latência), Serverless Inference (paga por invocação), Async Inference (jobs longos, resultado em S3), Batch Transform (processamento em lote).
Amazon Bedrock
Serviço gerenciado para foundation models (LLMs, modelos de imagem). API única, sem gerenciar GPU. Modelos disponíveis:
- Anthropic Claude (Sonnet, Opus, Haiku)
- Meta Llama
- Amazon Titan (texto, embeddings, imagem)
- Mistral (Large, 7B, 8x7B)
- Cohere Command R
- Stability AI (imagem)
Amazon Q
Assistente GenAI corporativo com duas variantes que caem no exame:
| Variante | Para quem | Exemplo |
|---|---|---|
| Amazon Q Business | Usuários de negócio | Chatbot sobre docs corporativos (SharePoint, Confluence, S3), conectores prontos |
| Amazon Q Developer | Desenvolvedores | Plugin IDE (VS Code/JetBrains) que escreve código, sugere correções, explica AWS |
Serviços de domínio específico
| Serviço | Domínio | Caso de uso típico |
|---|---|---|
| Rekognition | Visão (imagem/vídeo) | Detectar rostos, objetos, texto em imagem, moderação de conteúdo, PPE detection |
| Textract | Documentos | Extrai texto + tabelas + formulários de PDFs/imagens (OCR estrutural) |
| Comprehend | NLP | Sentimento, entidades, tópicos, PII detection/redaction |
| Polly | Text-to-Speech | Gera áudio natural em 30+ vozes/idiomas |
| Transcribe | Speech-to-Text | Transcreve áudio com speaker diarization, timestamps, vocabulário custom |
| Translate | Tradução | Tradução neural em 75+ idiomas |
| Lex | Chatbot conversacional | Mesmo engine da Alexa — bots de voz/texto com intents |
| Kendra | Search empresarial | Busca NLU sobre SharePoint, S3, Salesforce, Confluence |
| Forecast | Séries temporais | Previsão de demanda, vendas, energia |
| Personalize | Recomendação | Sistema de recommendation estilo Amazon.com |
| Fraud Detector | Detecção de fraude | Score de risco para transações, sign-ups |
Decisão rápida
📋 Construir um chatbot que responde sobre docs internos
Q Business já integra conectores (SharePoint, Confluence, S3), search e GenAI em um produto só. Montar na mão exige Kendra + Bedrock + orquestração.
Alt: Kendra + Lex — mais tradicional, mais trabalho.
Alt: SageMaker com modelo próprio — só se precisa fine-tuning muito específico.
📋 App mobile que identifica pragas em plantas por foto
Rekognition Custom Labels permite treinar com 10-100 imagens por classe sem escrever código de ML. JumpStart tem modelos pré-treinados para vision.
Alt: SageMaker + ResNet custom — se já tem time de ML.
Alt: API Rekognition base — se for objeto comum, não precisa treino.
📋 Redigir PII automaticamente de logs e tickets antes de armazenar
Comprehend detecta e redige CPF, email, telefone, cartão nativamente. Sem treinar nada.
Alt: Macie — para PII em S3, escaneamento.
Alt: Regex caseiro — sempre deixa passar algo.
Perguntas típicas (Q&A)
❓ Qual a diferença entre Bedrock e SageMaker?
❓ Quando usar Kendra em vez de OpenSearch?
❓ Macie, Comprehend e Rekognition podem detectar PII?
Quiz rápido
3 perguntas · Acerte tudo e ganhe o badge 🎯 Gabarito