Modelo, em IA, é o resultado final do processo de treinamento. É um arquivo (às vezes pequeno, às vezes de centenas de gigabytes) que contém todos os parâmetros aprendidos. Quando você "usa o ChatGPT", você está rodando inferência sobre o modelo GPT-5 da OpenAI.
Pense num modelo como um cérebro digital especializado:
- Modelo de visão (ex: YOLO): aprendeu a identificar objetos em imagens.
- Modelo de linguagem (ex: GPT-5, Claude Sonnet 4): aprendeu a prever a próxima palavra em sequência.
- Modelo de fala (ex: Whisper): aprendeu a transcrever áudio.
- Modelo multimodal (ex: Gemini): aprendeu a combinar texto, imagem e áudio.
Modelos têm tamanhos muito diferentes:
- Pequenos (1-7 bilhões de parâmetros): rodam no celular ou notebook. Ex: Llama 3 8B, Phi-3, Mistral 7B.
- Médios (10-70B): precisam de uma GPU boa. Ex: Llama 3 70B.
- Grandes (>100B): rodam só em data centers. Ex: GPT-5, Claude Sonnet 4.
Para o profissional brasileiro, o modelo certo depende do caso de uso:
- Para um chatbot de SAC simples: modelo pequeno, rodando local, custa centavos.
- Para análise de contratos jurídicos: modelo grande, com janela de contexto enorme.
- Para gerar imagem para um post no Instagram: modelo de difusão (Midjourney, Stable Diffusion).
Modelos open weights (Llama, Mistral) você pode baixar e rodar no seu próprio servidor — útil para LGPD e dados sensíveis. Modelos fechados (GPT, Claude, Gemini) você acessa só via API. A escolha entre os dois é uma das decisões estratégicas mais importantes em 2026.
