Computer Vision Clássico

Para quem já sabe o básico e quer ir fundo. Aqui o assunto é como os modelos funcionam em produção: memória, roteamento, ferramentas, agentes. O lado técnico que pouca gente explica direito.

7artigos

395XP total

🖼️ Computer vision básico com OpenCV

Imagens como arrays numpy. Color spaces (BGR/RGB/HSV). Filters (blur, edge detection Sobel/Canny). Contours. Quando CV clássico ainda ganha.

⏱ 11 min·+45 XP

→

🔄 Image processing em pipeline

Augmentation (albumentations), normalization, preprocessing para inference. Batch processing. GPU acceleration com CuPy. DALI para data loading.

⏱ 12 min·+50 XP

→

🧠 CNNs: ResNet, EfficientNet, ConvNeXt

Convolution mental model, pooling, batch norm. ResNet (skip connections), EfficientNet (compound scaling), ConvNeXt (2022+), ViTs como alternativa. Transfer learning.

⏱ 13 min·+55 XP

→

🎯 Object detection: YOLO, DETR, RT-DETR

Two-stage (Faster R-CNN) vs one-stage (YOLO). YOLOv8/v10 arquitetura. DETR/RT-DETR (transformer-based). mAP, NMS, anchors. Ultralytics ecossistema.

⏱ 13 min·+55 XP

→

✂️ Segmentation: U-Net, Mask R-CNN, SAM

Semantic vs instance vs panoptic. U-Net (biomédica), Mask R-CNN, SAM (Segment Anything Model da Meta 2023). Click-based prompting em 2024-2026.

⏱ 13 min·+55 XP

→

🔤 OCR na prática: Tesseract, PaddleOCR, TrOCR

Tesseract legacy, PaddleOCR open-source moderno, TrOCR (HuggingFace), AWS Textract, Azure Document Intelligence. Layout analysis, tables, forms.

⏱ 12 min·+50 XP

→

🏁 Capstone: pipeline CV em produção

Projeto: detector YOLO fine-tuned em dataset próprio, export ONNX, inference em Triton com dynamic batching, API FastAPI, monitoring drift. Entregáveis: repo + docker + benchmark latência.

⏱ 20 min·+85 XP

→

← Voltar à home