Visão, Mídia e Ética

Vector Database

Banco de dados especializado em armazenar e buscar embeddings vetoriais por similaridade.

Vector database (banco de dados vetorial) é um banco especializado em armazenar embeddings — vetores de centenas a milhares de dimensões — e fazer busca por similaridade extremamente rápida. É a infraestrutura por trás de RAG, busca semântica, recomendação e qualquer aplicação que precisa de "encontre o mais parecido".

Por que precisa de banco especial:

  • Busca não é por valor exato: é por proximidade no espaço vetorial.
  • Algoritmos especializados: HNSW, IVF, ScaNN — fazem busca aproximada eficiente.
  • Escala: milhões a bilhões de vetores precisam de indexação inteligente.
  • Filtragem: combinar busca semântica com filtros (data, categoria).

Principais opções em 2026:

  • pgvector (Postgres extension): excelente, mais usado para começar. Postgres você já tem.
  • Qdrant: open source, alta performance, escrita em Rust. Muito popular.
  • Pinecone: SaaS, serverless, fácil de usar.
  • Weaviate: open source com features modernas (multi-modal, hybrid search).
  • Chroma: leve, ótimo para protótipos e desenvolvimento local.
  • Milvus: maduro, escala bem para bilhões de vetores.
  • Redis com Redis Search: para quem já usa Redis.
  • Elasticsearch: também ganhou suporte a vetores.
  • MongoDB Atlas Vector Search: integrado em MongoDB.
  • Supabase Vector (pgvector): fácil para devs em projetos com Supabase.

Critérios de escolha:

  • Tamanho: até 10M vetores → pgvector. 100M+ → Qdrant, Milvus, Pinecone.
  • Performance: latência < 50ms? Qdrant, Pinecone.
  • Complexidade: protótipo? Chroma. Produção sério? Qdrant ou pgvector.
  • Self-hosted vs SaaS: pgvector/Qdrant/Milvus locais; Pinecone/Weaviate Cloud SaaS.
  • Hybrid search (vector + keyword): Weaviate, Qdrant fortes.
  • Compliance: dados no Brasil? Self-host ou SaaS com região BR.

Operações comuns:

  • Upsert: adicionar ou atualizar vetor com metadata.
  • Search: dado um vetor query, retornar K mais próximos.
  • Filter + search: K mais próximos onde categoria = "FAQ".
  • Delete: remover vetores por ID ou filtro.
  • Hybrid search: combinar score vetorial com BM25 textual.

Métricas de distância:

  • Cosine similarity: padrão para texto. Mede ângulo entre vetores.
  • Euclidean (L2): distância no espaço.
  • Dot product: para vetores normalizados.

Boas práticas:

  • Dimensão certa: 384, 768, 1024, 1536, 3072 são comuns. Maior = mais qualidade, mais custo.
  • Normalização: muitos modelos retornam vetores normalizados; alguns índices preferem assim.
  • Reranking: depois de top-K vetorial, use modelo melhor (Cohere Rerank) para refinar.
  • Metadados: salvar texto original, fonte, data — essencial para citations.
  • Atualização: políticas para reindexação quando documentos mudam.

Para o profissional brasileiro:

  • Para começar: pgvector. Postgres já roda, fácil de adicionar.
  • Para escalar: Qdrant é a escolha de muitos devs brasileiros (open, Rust, performance).
  • Para SaaS rápido: Pinecone, especialmente para times que não querem operar infra.
  • Compliance LGPD: self-hosted em servidores BR garante dados em território.

Casos de uso:

  • RAG corporativo: base de conhecimento da empresa pesquisável.
  • Busca semântica em produto: e-commerce com "encontre algo parecido".
  • Recomendação: produtos, posts, vídeos similares.
  • Detecção de duplicatas: em catálogos enormes.
  • Anti-fraude: transações similares a padrões suspeitos.

Em 2026, vector database é parte essencial da stack de IA empresarial. Tanto quanto Redis para cache ou Postgres para dados relacionais, vector DB é peça em qualquer produto sério.

Termos relacionados

Aprenda na prática

Cursos do AulasDeIA que aplicam Vector Database no dia a dia profissional brasileiro.

← Voltar ao glossárioExplorar cursos completos →