概述
一个向量存储存储嵌入的数据并执行相似性搜索。接口
LangChain 为向量存储提供了统一的接口,允许您:addDocuments- 添加文档到存储中。delete- 根据 ID 移除存储的文档。similaritySearch- 查询语义相似的文档。
初始化
在初始化向量存储时,LangChain 中的大多数向量存储接受一个嵌入模型作为参数。添加文档
您可以使用addDocuments 函数将文档添加到向量存储中。
删除文档
您可以使用delete 函数从向量存储中删除文档。
相似性搜索
使用similaritySearch 执行语义查询,它会返回最接近的嵌入文档:
k— 返回的结果数量filter— 基于元数据的条件过滤
相似度指标与索引
嵌入相似度可以通过以下方式计算:- 余弦相似度
- 欧几里得距离
- 点积
元数据过滤
通过元数据(例如来源、日期)过滤可以细化搜索结果:主要集成
选择嵌入模型:OpenAI
OpenAI
安装依赖:添加环境变量:实例化模型:
Azure
Azure
安装依赖添加环境变量:实例化模型:
AWS
AWS
安装依赖:添加环境变量:实例化模型:
Google Gemini
Google Gemini
安装依赖:添加环境变量:实例化模型:
Google Vertex
Google Vertex
安装依赖:添加环境变量:实例化模型:
MistralAI
MistralAI
安装依赖:添加环境变量:实例化模型:
Cohere
Cohere
安装依赖:添加环境变量:实例化模型:
Ollama
Ollama
安装依赖:实例化模型:
Memory
Memory
Chroma
Chroma
FAISS
FAISS
MongoDB
MongoDB
PGVector
PGVector
Pinecone
Pinecone
Qdrant
Qdrant