Segmentação (segmentation) é a tarefa de visão computacional onde, em vez de classificar a imagem inteira ou detectar caixas em torno de objetos, você atribui categoria a cada pixel. Resultado: mapa colorido onde cada cor representa uma classe.
Tipos:
- Segmentação semântica: cada pixel recebe classe (céu, estrada, carro, pessoa). Não distingue instâncias do mesmo objeto.
- Segmentação de instância: distingue cada objeto individual (carro 1, carro 2, carro 3).
- Segmentação panóptica: combina ambas — categorias para "things" (objetos contáveis) e "stuff" (céu, grama).
Modelos famosos:
- U-Net: clássico para segmentação médica.
- Mask R-CNN: pioneiro em segmentação de instância.
- DeepLab (Google): segmentação semântica.
- SAM (Segment Anything Model) da Meta: revolucionário em 2023, segmenta qualquer coisa via prompt.
- SAM 2 (2024): estende para vídeo.
SAM mudou tudo: antes você treinava modelo específico para cada caso. Agora SAM faz "zero-shot segmentation" — clica no objeto e ele segmenta, sem treino prévio.
Casos de uso:
- Médico: contornar tumores, órgãos em exames.
- Autônomo: separar estrada, calçada, pedestres.
- Edição de imagem: remover fundo, separar pessoa da cena.
- Agricultura: identificar áreas plantadas, mato, solo nu.
- Industrial: detectar defeitos em superfícies.
- Geoespacial: analisar imagens de satélite.
Ferramentas:
- SAM via API (Replicate, Roboflow): zero-shot fácil.
- Roboflow: plataforma completa para datasets de segmentação.
- CVAT, Labelbox: ferramentas de anotação.
- PyTorch + segmentation_models: para treinar próprios.
- PhotoshopAI / Remove.bg: para usuários finais.
Para o profissional brasileiro:
- Saúde: muitos hospitais brasileiros usam segmentação para apoiar diagnóstico.
- Agronegócio: análise de imagens de drones para fazendas.
- Varejo: separar produtos em prateleira em fotos.
- Mídia: edição automatizada (remover fundos, isolar elementos).
Em 2026, com SAM e modelos multimodais (Claude Sonnet 4, GPT-5 com visão), segmentação ficou acessível para qualquer dev sem expertise em CV. É outro exemplo de democratização — o que era pesquisa acadêmica há 5 anos é hoje API.
