阿里开源了向量数据库 Zvec。
对于不熟悉向量数据库的读者,简单来说,它专门用于存储和检索向量数据,常见于相似性搜索、推荐系统、AI应用等场景。
和传统需要独立部署的向量数据库不同,Zvec 直接运行在应用程序进程内部。这意味着不需要额外服务器,没有配置负担,也省去了基础设施成本。

Zvec 基于阿里巴巴内部长期使用的 Proxima 向量搜索引擎构建。官方数据显示,它能在毫秒内完成对数十亿向量的搜索。安装只需 pip install zvec,60秒内即可开始使用。
它支持密集向量和稀疏向量,单次调用即可完成混合搜索。作为进程内库,Zvec 可以在笔记本、服务器、CLI工具甚至边缘设备上运行。项目采用 Apache 2.0 开源协议。
import zvec
# 定义集合模式
schema = zvec.CollectionSchema(
name="example",
vectors=zvec.VectorSchema("embedding", zvec.DataType.VECTOR_FP32, 4),
)
# 创建集合
collection = zvec.create_and_open(path="./zvec_example", schema=schema)
# 插入文档
collection.insert([
zvec.Doc(id="doc_1", vectors={"embedding": [0.1, 0.2, 0.3, 0.4]}),
zvec.Doc(id="doc_2", vectors={"embedding": [0.2, 0.3, 0.4, 0.1]}),
])
# 向量相似性搜索
results = collection.query(
zvec.VectorQuery("embedding", vector=[0.4, 0.3, 0.3, 0.1]),
topk=10
)
有开发者认为,这种将向量数据库能力直接嵌入应用的方式,能简化查询流程,让开发更顺畅。对于构建 RAG 系统或需要本地向量搜索的场景,Zvec 可能改变游戏规则。
不过也有网友对内存瓶颈表示担忧,毕竟向量数据通常占用较大内存。还有用户声称发现安全后门,但未提供具体证据。
项目 GitHub 页面提供了完整的安装指南和示例代码:https://github.com/alibaba/zvec
关注“鲸栖”小程序,掌握最新AI资讯
本文来自网络搜集,不代表鲸林向海立场,如有侵权,联系删除。转载请注明出处:http://www.itsolotime.com/archives/22689


