Vector database (banco de dados vetorial) é um banco especializado em armazenar embeddings — vetores de centenas a milhares de dimensões — e fazer busca por similaridade extremamente rápida. É a infraestrutura por trás de RAG, busca semântica, recomendação e qualquer aplicação que precisa de "encontre o mais parecido".
Por que precisa de banco especial:
- Busca não é por valor exato: é por proximidade no espaço vetorial.
- Algoritmos especializados: HNSW, IVF, ScaNN — fazem busca aproximada eficiente.
- Escala: milhões a bilhões de vetores precisam de indexação inteligente.
- Filtragem: combinar busca semântica com filtros (data, categoria).
Principais opções em 2026:
- pgvector (Postgres extension): excelente, mais usado para começar. Postgres você já tem.
- Qdrant: open source, alta performance, escrita em Rust. Muito popular.
- Pinecone: SaaS, serverless, fácil de usar.
- Weaviate: open source com features modernas (multi-modal, hybrid search).
- Chroma: leve, ótimo para protótipos e desenvolvimento local.
- Milvus: maduro, escala bem para bilhões de vetores.
- Redis com Redis Search: para quem já usa Redis.
- Elasticsearch: também ganhou suporte a vetores.
- MongoDB Atlas Vector Search: integrado em MongoDB.
- Supabase Vector (pgvector): fácil para devs em projetos com Supabase.
Critérios de escolha:
- Tamanho: até 10M vetores → pgvector. 100M+ → Qdrant, Milvus, Pinecone.
- Performance: latência < 50ms? Qdrant, Pinecone.
- Complexidade: protótipo? Chroma. Produção sério? Qdrant ou pgvector.
- Self-hosted vs SaaS: pgvector/Qdrant/Milvus locais; Pinecone/Weaviate Cloud SaaS.
- Hybrid search (vector + keyword): Weaviate, Qdrant fortes.
- Compliance: dados no Brasil? Self-host ou SaaS com região BR.
Operações comuns:
- Upsert: adicionar ou atualizar vetor com metadata.
- Search: dado um vetor query, retornar K mais próximos.
- Filter + search: K mais próximos onde categoria = "FAQ".
- Delete: remover vetores por ID ou filtro.
- Hybrid search: combinar score vetorial com BM25 textual.
Métricas de distância:
- Cosine similarity: padrão para texto. Mede ângulo entre vetores.
- Euclidean (L2): distância no espaço.
- Dot product: para vetores normalizados.
Boas práticas:
- Dimensão certa: 384, 768, 1024, 1536, 3072 são comuns. Maior = mais qualidade, mais custo.
- Normalização: muitos modelos retornam vetores normalizados; alguns índices preferem assim.
- Reranking: depois de top-K vetorial, use modelo melhor (Cohere Rerank) para refinar.
- Metadados: salvar texto original, fonte, data — essencial para citations.
- Atualização: políticas para reindexação quando documentos mudam.
Para o profissional brasileiro:
- Para começar: pgvector. Postgres já roda, fácil de adicionar.
- Para escalar: Qdrant é a escolha de muitos devs brasileiros (open, Rust, performance).
- Para SaaS rápido: Pinecone, especialmente para times que não querem operar infra.
- Compliance LGPD: self-hosted em servidores BR garante dados em território.
Casos de uso:
- RAG corporativo: base de conhecimento da empresa pesquisável.
- Busca semântica em produto: e-commerce com "encontre algo parecido".
- Recomendação: produtos, posts, vídeos similares.
- Detecção de duplicatas: em catálogos enormes.
- Anti-fraude: transações similares a padrões suspeitos.
Em 2026, vector database é parte essencial da stack de IA empresarial. Tanto quanto Redis para cache ou Postgres para dados relacionais, vector DB é peça em qualquer produto sério.
