被 ChatGPT 点燃的向量数据库们

主要观点:
向量数据库可以让开发者以向量嵌入的形式处理非结构化数据(两个向量之间的距离代表了它们的关联性),这对于使用和扩展大型语言模型(LLM)尤为重要 。
1、 是个全托管的 SaaS 向量数据库厂商,包括免费版、标准版和企业版 。
2、创建于2019年,是一个为可扩展的相似性搜索而建立的开源向量数据库;
3、,一个开源的向量数据库,可以同时存储对象和向量,开发者可以很容易地创建自己的语义系统或向量搜索引擎 。
4、于2021年在柏林成立,使用Rust编写,是一个为 AI 开发者打造的向量搜索引擎和非结构化数据的数据库 。是开源的,用户可以直接下载使用 。
【被 ChatGPT 点燃的向量数据库们】5、 是一个开源的向量嵌入存储 。虽然 2023 年 2 月才正式推出,在过去的一个月已经有 35K 次下载了,它现在只有免费的开源版使用,应该很快会推出托管版本 。
6、 是的插件,允许在数据库中存储和查询向量嵌入 。
7、Redis,它有一个 use case 是向量数据库,其实就是通过一些扩展模块,比如,(VSS),来实现向量存储和查询(不过只有企业版才能用这些功能) 。
原文
摘自:被点燃的向量数据库们
在 AIGC 革命大爆发的日子,一个特别的挑战是大规模存储和查询非结构化数据(比如图像、视频、文本)的能力 。
为了快速搜索和理解非结构化数据,现在的普遍解法是使用向量数据库( ) 。在向量数据库中,向量是一等公民,所有的功能都是围绕着它建立的 。
向量数据库可以让开发者以向量嵌入的形式处理非结构化数据(两个向量之间的距离代表了它们的关联性),这对于使用和扩展大型语言模型(LLM)尤为重要,比如的插件就依靠向量数据库帮助用户从他们的数据源获得相关文件片段 。
这个领域很新,连自己都搞不太清楚,和是同一家 。

被 ChatGPT 点燃的向量数据库们

文章插图
几乎所有由 LLM 驱动的 AI 产品或技术都使用了向量数据库,随着和 AI 的流行,VC 也都涌向了这条赛道。我们收集了一些近期向量数据库融资的消息:
已经挤起来了,不过每家都有不同的功能、性能和价格,我们来了解一下 。
1、
是个全托管的 SaaS 向量数据库厂商(支持 GCP & AWS),团队分布在纽约,三藩和特拉维夫 。2021 年 1 月公开了 Beta 版和 $10M 种子轮融资;同年 9 月,发布了2.0,也宣布了他们全新基于使用的定价方案,其中包括免费版、标准版和企业版 。
2022 年间他们用 Rust 重写了一遍产品(过去是 C/C++ 和写的),虽然过程无比艰辛,但是结局很美好:产品性能和开发速度都得以提高 。
2、 /
创建于 2019 年,是一个为可扩展的相似性搜索而建立的开源向量数据库,它基于AI(Faiss), Non- Space() 和 Annoy,并额外扩展了它们的功能 。
Cloud 是基于的 SaaS 服务,有 30 天免费试用和。
3、
总部位于荷兰,一个开源的向量数据库,可以同时存储对象和向量,开发者可以很容易地创建自己的语义系统或向量搜索引擎 。
前几天刚宣布了他们的 Cloud进入了公测,大家可以去试用( 版有 14 天免费)!
4、
于 2021 年在柏林成立,使用 Rust 编写,是一个为 AI 开发者打造的向量搜索引擎和非结构化数据的数据库 。是开源的,用户可以直接下载使用,今年年初起推出了云服务Cloud,已经有超过 1000 个集群正在提供服务了 。
5、
是一个开源的向量嵌入存储 。虽然 2023 年 2 月才正式推出,在过去的一个月已经有35K 次下载了,它现在只有免费的开源版使用,应该很快会推出托管版本 。