Zero-shot é o oposto de few-shot: você descreve a tarefa em linguagem natural sem fornecer exemplos. O modelo deve entender só pela descrição. É a forma mais simples de prompting e a mais usada no dia a dia.
Exemplo:
Traduza para português brasileiro coloquial:
"The pricing strategy needs to be revised next quarter."
O modelo responde sem precisar ver exemplos prévios.
Quando funciona bem:
- Tarefas comuns que o modelo viu muito durante treino: tradução, sumarização, classificação básica, geração de texto.
- Modelos grandes e capazes: GPT-5, Claude Sonnet 4 fazem zero-shot bem em quase tudo.
- Tarefas onde formato é flexível: não importa o detalhe exato.
Quando falha:
- Formato muito específico (JSON com campos exatos): few-shot é mais confiável.
- Tom muito particular que difícil descrever: melhor mostrar exemplos.
- Domínios obscuros: o modelo pode não ter contexto.
- Tarefas raras: poucos dados de treino, falha mais.
Truques para melhorar zero-shot:
- Adicionar "Pense passo a passo": ativa CoT, melhora raciocínio.
- Definir papel claro: "Você é um especialista em X..."
- Especificar formato: "Responda em JSON com campos X, Y, Z."
- Restrições explícitas: "Não use emojis. Máximo 100 palavras."
Comparação prática:
Para classificação de sentimento, em 2026:
- Modelo simples (modelo de 7B parâmetros) + zero-shot: ~75% acurácia.
- Modelo simples + few-shot (5 exemplos): ~85%.
- Modelo grande (GPT-5) + zero-shot: ~92%.
- Modelo grande + few-shot: ~94%.
Ou seja: modelo grande quase iguala few-shot só com zero-shot. Por isso, com modelos top de 2026, zero-shot é cada vez mais viável.
Para o profissional brasileiro:
- Use zero-shot como padrão com modelos top.
- Migre para few-shot se notar inconsistência ou erros sistemáticos.
- Para tarefas críticas em produção: sempre teste com e sem exemplos, escolha o melhor.
Limitação interessante: para tarefas verdadeiramente novas (que não estão na internet), modelos sofrem em zero-shot. Daí a importância de RAG (dar contexto) ou few-shot (mostrar como).
Em 2026, "zero-shot" virou benchmark importante na indústria. Quanto melhor um modelo é em zero-shot, mais útil ele é "out of the box" — sem precisar engenharia complexa de prompts.
