【对于AI产业趋势的思考:生成式AI驱动向量数据库加速发展】 报告出品方:弘则研究
toB生成式A1应用均需外挂知识库以提升大模型精度,将驱动向量数据库的爆发。向量数据库是非结构化数据的特殊形式,它的核心是将各种数据( 如文档、音频和视频 转化为空间向量进行相似性搜索以提高不同数据类型的搜索效率和准确性,这使其在A1和深度学习领域中有着广泛的应用。生成式A1出现后,尤其是在toB场景中需要应用到向量数据库在大模型上外挂“企业知识库”,企业内部数据将被存储在向量数据库中,以提升大模型精度,
向量数据库潜在市场空间是传统结构化关系型数据库的数倍达到千亿美元。据信通院统计数据,全球数据库市场规模在2020年为671亿美元,到2025年有望达到798亿美元,CAGR 3.5%估算关系型数据库全球龙头Oracle收入规模小几百亿美元。仅考虑现有非结构化数据的向量化处理,估算需要的存储空间增量为之前的数倍。未来随着生成式AI应用增量数据的爆发对于向量数据库的需求会更大。
产业处在发展早期,尚未形成寡头垄断,厂商具备错位竞争优势。全球市场不同背景厂商以不同商业模式切入向量数据库赛道。美股上市公司中,MongoDB于今年12月在自身非结构化数据库业务基础上推出向量数据库产品Atlas Vector Search,Elastic于今年5月在自身搜索工具业务基础上推出向量搜索解决方案Elasticsearch Relevance Engine。最新业绩说明会中,两家公司均对向量数据库业务前景非常乐观。A股上市公司中,星环科技于今年5月推出向量数据库Hippo,目前已迭代到1.2版本,已有客户开始试用。
报告全文下载方式: