Vector database (banco de dados vetorial) é um banco especializado em armazenar embeddings — vetores de centenas a milhares de dimensões — e fazer busca por similaridade extremamente rápida. É a infraestrutura por trás de RAG, busca semântica, recomendação e qualquer aplicação que precisa de "encontre o mais parecido".

Por que precisa de banco especial:

Busca não é por valor exato: é por proximidade no espaço vetorial.
Algoritmos especializados: HNSW, IVF, ScaNN — fazem busca aproximada eficiente.
Escala: milhões a bilhões de vetores precisam de indexação inteligente.
Filtragem: combinar busca semântica com filtros (data, categoria).

Principais opções em 2026:

pgvector (Postgres extension): excelente, mais usado para começar. Postgres você já tem.
Qdrant: open source, alta performance, escrita em Rust. Muito popular.
Pinecone: SaaS, serverless, fácil de usar.
Weaviate: open source com features modernas (multi-modal, hybrid search).
Chroma: leve, ótimo para protótipos e desenvolvimento local.
Milvus: maduro, escala bem para bilhões de vetores.
Redis com Redis Search: para quem já usa Redis.
Elasticsearch: também ganhou suporte a vetores.
MongoDB Atlas Vector Search: integrado em MongoDB.
Supabase Vector (pgvector): fácil para devs em projetos com Supabase.

Critérios de escolha:

Tamanho: até 10M vetores → pgvector. 100M+ → Qdrant, Milvus, Pinecone.
Performance: latência < 50ms? Qdrant, Pinecone.
Complexidade: protótipo? Chroma. Produção sério? Qdrant ou pgvector.
Self-hosted vs SaaS: pgvector/Qdrant/Milvus locais; Pinecone/Weaviate Cloud SaaS.
Hybrid search (vector + keyword): Weaviate, Qdrant fortes.
Compliance: dados no Brasil? Self-host ou SaaS com região BR.

Operações comuns:

Upsert: adicionar ou atualizar vetor com metadata.
Search: dado um vetor query, retornar K mais próximos.
Filter + search: K mais próximos onde categoria = "FAQ".
Delete: remover vetores por ID ou filtro.
Hybrid search: combinar score vetorial com BM25 textual.

Métricas de distância:

Cosine similarity: padrão para texto. Mede ângulo entre vetores.
Euclidean (L2): distância no espaço.
Dot product: para vetores normalizados.

Boas práticas:

Dimensão certa: 384, 768, 1024, 1536, 3072 são comuns. Maior = mais qualidade, mais custo.
Normalização: muitos modelos retornam vetores normalizados; alguns índices preferem assim.
Reranking: depois de top-K vetorial, use modelo melhor (Cohere Rerank) para refinar.
Metadados: salvar texto original, fonte, data — essencial para citations.
Atualização: políticas para reindexação quando documentos mudam.

Para o profissional brasileiro:

Para começar: pgvector. Postgres já roda, fácil de adicionar.
Para escalar: Qdrant é a escolha de muitos devs brasileiros (open, Rust, performance).
Para SaaS rápido: Pinecone, especialmente para times que não querem operar infra.
Compliance LGPD: self-hosted em servidores BR garante dados em território.

Casos de uso:

RAG corporativo: base de conhecimento da empresa pesquisável.
Busca semântica em produto: e-commerce com "encontre algo parecido".
Recomendação: produtos, posts, vídeos similares.
Detecção de duplicatas: em catálogos enormes.
Anti-fraude: transações similares a padrões suspeitos.

Em 2026, vector database é parte essencial da stack de IA empresarial. Tanto quanto Redis para cache ou Postgres para dados relacionais, vector DB é peça em qualquer produto sério.

Vector Database

Termos relacionados

Aprenda na prática