Modelos de Linguagem (LLMs)

Chain-of-Thought (CoT)

Técnica de prompting que pede ao modelo para raciocinar passo a passo antes de dar a resposta final.

Chain-of-Thought (CoT), ou cadeia de raciocínio, é uma técnica simples mas poderosa: pedir ao modelo que explique seu raciocínio passo a passo antes de chegar à conclusão. Modelos costumam acertar mais quando "pensam alto".

Comparação:

  • Sem CoT: "Quanto é 23 × 17?" → "391" (pode errar em problemas mais complexos).
  • Com CoT: "Quanto é 23 × 17? Pense passo a passo." → "23 × 17 = 23 × 10 + 23 × 7 = 230 + 161 = 391."

Por que funciona: CoT força o modelo a usar mais "compute" — gerar mais tokens intermediários significa mais oportunidades de "pensar". É similar a humanos: erramos menos rascunhando do que respondendo de cabeça.

Variações poderosas:

  • Zero-shot CoT: simplesmente adicionar "Pense passo a passo" ao prompt.
  • Few-shot CoT: dar exemplos de problemas resolvidos com raciocínio.
  • Self-consistency: gerar várias cadeias de raciocínio e escolher a resposta mais frequente.
  • Tree of Thoughts (ToT): explorar várias cadeias em árvore, com backtrack.
  • ReAct: alternar entre raciocinar (Reason) e agir (Act, chamar ferramentas).

Em 2026, modelos novos como o1 da OpenAI, Claude Sonnet 4 (com extended thinking) e Gemini 2 Thinking já fazem CoT internamente. Você não precisa pedir — eles "pensam" durante segundos a minutos antes de responder, gerando milhares de tokens internos de raciocínio.

Trade-offs:

  • Latência: CoT é mais lento (mais tokens gerados).
  • Custo: você paga pelos tokens de raciocínio também.
  • Qualidade: para problemas complexos (matemática, lógica, código), o ganho é enorme.
  • Para tarefas simples: CoT é overkill, prefira respostas diretas.

Para o profissional brasileiro:

  • Use CoT em problemas de matemática, análise lógica, programação.
  • Para extrações simples (qual o nome no documento?), CoT é desperdício.
  • Em prompts críticos (jurídico, médico), CoT melhora confiabilidade — você consegue auditar o raciocínio.
  • Combine com ferramentas: ReAct é o padrão para agentes que precisam decidir e executar.

Exemplo prático: para escrever um plano de marketing, peça "Antes de propor o plano, analise o público (passo 1), defina objetivo (passo 2), liste canais (passo 3), justifique a escolha (passo 4) e só então apresente o plano". A qualidade do output dispara.

Termos relacionados

Aprenda na prática

Cursos do AulasDeIA que aplicam Chain-of-Thought (CoT) no dia a dia profissional brasileiro.

← Voltar ao glossárioExplorar cursos completos →