Bases de datos vectoriales

Las bases de datos vectoriales almacenan y permiten buscar vectores (embeddings) por similitud semántica. Son el componente de almacenamiento central en sistemas RAG, búsqueda semántica y recomendaciones.

A diferencia de una base de datos relacional (que busca coincidencias exactas), una base de datos vectorial busca los vectores más cercanos al vector de consulta según una métrica de distancia (coseno, euclidiana...).

Comparativa

Base de datos	Tipo	Escala	Búsqueda híbrida	Destacado
ChromaDB	Open source	Millones	Sí	Prototipado rápido
FAISS	Librería	Miles de millones	No	Velocidad máxima
Qdrant	Open source	Cientos de millones	Sí	Producción autoalojada
Weaviate	Open source / Cloud	Cientos de millones	Sí	Vectorización automática
Milvus	Open source	Miles de millones	Sí	Escala distribuida
pgvector	Extensión PostgreSQL	Decenas de millones	Parcial	Integración PostgreSQL
Pinecone	SaaS gestionado	Miles de millones	Sí	Zero-ops, cloud

tip

La elección de la base de datos vectorial representa solo el 5–10% de la calidad de un sistema RAG. La estrategia de chunking, el modelo de embeddings y el pipeline de recuperación tienen mucho más impacto.

Comparativa​

Referencias​

Comparativa

Referencias