Fundamentos de IA e ML

Modelo

O artefato resultante do treinamento — um arquivo de pesos que sabe fazer uma tarefa específica.

Modelo, em IA, é o resultado final do processo de treinamento. É um arquivo (às vezes pequeno, às vezes de centenas de gigabytes) que contém todos os parâmetros aprendidos. Quando você "usa o ChatGPT", você está rodando inferência sobre o modelo GPT-5 da OpenAI.

Pense num modelo como um cérebro digital especializado:

  • Modelo de visão (ex: YOLO): aprendeu a identificar objetos em imagens.
  • Modelo de linguagem (ex: GPT-5, Claude Sonnet 4): aprendeu a prever a próxima palavra em sequência.
  • Modelo de fala (ex: Whisper): aprendeu a transcrever áudio.
  • Modelo multimodal (ex: Gemini): aprendeu a combinar texto, imagem e áudio.

Modelos têm tamanhos muito diferentes:

  • Pequenos (1-7 bilhões de parâmetros): rodam no celular ou notebook. Ex: Llama 3 8B, Phi-3, Mistral 7B.
  • Médios (10-70B): precisam de uma GPU boa. Ex: Llama 3 70B.
  • Grandes (>100B): rodam só em data centers. Ex: GPT-5, Claude Sonnet 4.

Para o profissional brasileiro, o modelo certo depende do caso de uso:

  • Para um chatbot de SAC simples: modelo pequeno, rodando local, custa centavos.
  • Para análise de contratos jurídicos: modelo grande, com janela de contexto enorme.
  • Para gerar imagem para um post no Instagram: modelo de difusão (Midjourney, Stable Diffusion).

Modelos open weights (Llama, Mistral) você pode baixar e rodar no seu próprio servidor — útil para LGPD e dados sensíveis. Modelos fechados (GPT, Claude, Gemini) você acessa só via API. A escolha entre os dois é uma das decisões estratégicas mais importantes em 2026.

Termos relacionados

Aprenda na prática

Cursos do AulasDeIA que aplicam Modelo no dia a dia profissional brasileiro.

← Voltar ao glossárioExplorar cursos completos →