Modelo, em IA, é o resultado final do processo de treinamento. É um arquivo (às vezes pequeno, às vezes de centenas de gigabytes) que contém todos os parâmetros aprendidos. Quando você "usa o ChatGPT", você está rodando inferência sobre o modelo GPT-5 da OpenAI.

Pense num modelo como um cérebro digital especializado:

Modelo de visão (ex: YOLO): aprendeu a identificar objetos em imagens.
Modelo de linguagem (ex: GPT-5, Claude Sonnet 4): aprendeu a prever a próxima palavra em sequência.
Modelo de fala (ex: Whisper): aprendeu a transcrever áudio.
Modelo multimodal (ex: Gemini): aprendeu a combinar texto, imagem e áudio.

Modelos têm tamanhos muito diferentes:

Pequenos (1-7 bilhões de parâmetros): rodam no celular ou notebook. Ex: Llama 3 8B, Phi-3, Mistral 7B.
Médios (10-70B): precisam de uma GPU boa. Ex: Llama 3 70B.
Grandes (>100B): rodam só em data centers. Ex: GPT-5, Claude Sonnet 4.

Para o profissional brasileiro, o modelo certo depende do caso de uso:

Para um chatbot de SAC simples: modelo pequeno, rodando local, custa centavos.
Para análise de contratos jurídicos: modelo grande, com janela de contexto enorme.
Para gerar imagem para um post no Instagram: modelo de difusão (Midjourney, Stable Diffusion).

Modelos open weights (Llama, Mistral) você pode baixar e rodar no seu próprio servidor — útil para LGPD e dados sensíveis. Modelos fechados (GPT, Claude, Gemini) você acessa só via API. A escolha entre os dois é uma das decisões estratégicas mais importantes em 2026.

Modelo

Termos relacionados

Aprenda na prática