在2023年7月26日举办的AWS纽约峰会上,亚马逊云科技推出了七项生成式AI创新,进一步降低了生成式AI的使用门槛,让企业可以更专注于核心业务,提高生产效率。其中有很引人注目的一项就是向量数据库相关,将要推出的亚马逊云科技向量引擎推出预览版。
就在近日,亚马逊云科技推出Amazon OpenSearch Serverless向量引擎预览版这次推出标志着在云搜索服务领域的一个重大飞跃,它为用户提供了一个简单、高性能且可扩展的相似性搜索功能。
在2023年2月,亚马逊云科技已经连续八年被Gartner评为云数据库管理系统的领导者,这样的荣誉并非偶然,而是对亚马逊云科技不懈追求技术创新和卓越的充分肯定。
那么,亚马逊云科技的向量引擎预览版的性能如何呢?是否能承担得起大众对它的期待呢?
我们都知道,现在这个时代,因为生成式AI能处理大数据、自动化内容生成及提供类人交互响应等,正在被各行业迅速采用。集成聊天机器人、问答系统和个性化推荐等AI应用利用自然语言搜索和查询,理解语义、用户意图,生成拟人响应,已经彻底变革用户体验和数字平台交互。
而机器学习搜索和生成式AI应用需向量嵌入,作为文本、图像、音频和视频的数字表示,用于生成动态内容。这些嵌入基于用户数据进行训练,表示信息的语义和上下文。此过程无需依赖外部数据源或应用,用户将会期望向量数据库易于构建,快速从原型进入生产环境,专注于差异化应用。
Amazon OpenSearch Serverless向量引擎正是基于以上需求的变化,扩展了Amazon OpenSearch的搜索能力,实时存储、搜索和追溯数十亿向量嵌入,实现相似性匹配和语义搜索,无需考虑基础设施。
因此,它的性能大致能概括为以下几个特点:
其一,天然具备鲁棒性。使用Amazon OpenSearch Serverless向量引擎试用版,用户无需担忧后端基础设施的选型、调优和扩展问题。该引擎能自动调整资源,适应变化的工作负载和需求,确保始终提供快速性能和适当规模。无论向量数量从数千增至数亿,引擎都能无缝扩展,无需重新索引或重载数据,使基础设施扩展更为便捷。
其二、单独的计算资源。向量引擎为索引和工作负载搜索提供独立计算资源,实现实时无缝获取、更新和删除向量,确保用户查询性能不受影响。数据长久存储在Amazon S3中,享有相同的数据持久性保证。虽处于预览阶段,但引擎为生产环境设计,具备应对中断和故障的冗余机制。
其三、提供的结果精准而可靠。客户在托管集群中使用OpenSearch kNN搜索,实现应用程序的语义搜索和个性化推荐。向量引擎提供与Serverless环境相同的用户体验,简单易用。Amazon OpenSearch Serverless向量引擎基于OpenSearch项目的k近邻(kNN)搜索功能,支持欧氏距离、余弦距离和点积等距离指标,可容纳16000个维度,适用于各种基础模型和AI/ML模型,可以为用户提供精准可靠的检索结果。
除了以上强大性能之外,亚马逊云科技还计划推出两项功能降低客户首个集合成本。首先是新的开发-测试选项,允许用户在无备份或副本情况下启动集合,降低50%入门成本,数据持久性仍通过保存在Amazon S3中的向量引擎确保。其次是初始阶段配置0.5 OCU资源,根据实际工作负载扩展,进一步降低成本。适用于数万至数十万个向量(依维度而定)的初始工作负载。此外,亚马逊云科技还将首个集合所需最低OCU从每小时4个降至每小时1个,提供更多支持。
当然了,亚马逊云科技的野心肯定还不止于此,他们还持续致力于优化向量图的性能和内存使用,包括改进缓存和合并等功能。
期待在不远的未来,亚马逊云科技Amazon OpenSearch Serverless向量引擎正式版的推出,到那时生成式AI或将进入另一个天地