当前位置:首页|资讯|AI大模型

英飞流:AI数据库革新者,张颖峰的突破之旅

作者:张通社发布时间:2024-03-25

原标题:英飞流:AI数据库革新者,张颖峰的突破之旅

AI大模型直接带火了小众IT产品——向量数据库。

英伟达CEO黄仁勋曾在GTC大会上着重提到,向量数据库对于构建大语言模型至关重要;Open AI曾强调向量数据库可让大模型访问个性化数据。各种向量数据库成了“资本宠儿”。Qdrant、Chroma、Weaviate、Pinecone先后斩获巨额融资,仅在去年4月前后,这4家公司先后合计融资就超过10亿元。

有券商预测,到2030年,全球向量数据库市场规模有望达到3000亿元,国内向量数据库市场规模有望超600亿人民币。

曾经默默无闻的小众品类,一时间成了炙手可热的“香饽饽”。成立尚不足一年的上海英飞流有限公司(以下简称“英飞流”)便是其中之一。

张颖峰是一位连续创业者,在2023年8月创立了英飞流。英飞流正在打造一款AI原生数据库,这款数据库在向量数据库基础上进行深度优化,让AI更贴合企业落地需要。

英飞流在同年9月获得晨晖创投和希扬资本的联合天使轮融资,并入选了非凡资本的2023年中国AIGC100强。

日前,张通社在浦东软件园AIGC创业营见识了张颖峰的精彩路演,对英飞流产生了浓厚的兴趣,并实地探访了位于八佰伴附近的英飞流办公地,邀请张颖峰谈谈自己的创业经历。

英飞流创始人 张颖峰

01

上海交大校友三度创业

乘上AI第三次浪潮

张颖峰从上海交通大学电子工程硕士毕业后,阴差阳错地进入了一家野心勃勃的初创公司。早在2008年AI的重要还未被国内业界所感知到的时候,这家公司便尝试将AI与搜索相结合,凭借着与硅谷同步的技术优势,它的搜索引擎成为国内知名的独立商品搜索与比价平台。作为公司最早的员工之一,张颖峰经历了搜索软件从0到1,再从1到10的过程。

然而,技术的绝对领先并不能保证产品的市场成功。在激烈的市场竞争中,这家公司并没有占据市场优势,而张颖峰最后选择了离开。“国内互联网大厂在2012年以后逐步开始用到的技术,我们2008年就在做了。虽然公司产品没有成功,但是我十分感激这段经历给予我的启发与指导。”

如果以搜索为代表的AI是人工智能的第一次浪潮,那么等到2015年的深度学习迎来新突破,AI的第二次浪潮来临了,张颖峰所领导的团队也参与其中。他们在2018年百万人脸识别挑战赛MegaFace上,打破了俄罗斯团队保持的91%准确率世界纪录,将最高基准线拉升至98%,并将代码开源,时至今日,该项目仍是人脸识别检测领域最有影响力的开源项目。

2020年,他与腾讯云高管一起创办了数据库公司矩阵起源。矩阵起源专注于开发云边端一体的分布式数据库,并获得了五源资本、钟鼎资本、险峰长青等知名VC的垂青。在那里,他对基础软件在企业数字化进程中所起作用的认知愈发清晰:基础软件对数字化至关重要,而数据库是企业数字化转型所必备的技术中台的最佳载体。

2023年,以大模型为代表的生成式AI崛起,迎接张颖峰的是AI第三次浪潮。他发觉自己在基础软件,以及人工智能领域协同耕耘15年的经验有着更大的用武之地。数据库与大模型在企业场景相结合,能够让AI大模型更快、更可靠、更便捷地使用企业数据,生成准确的结果,因此两者结合将成为企业从数字化到数智化进程必不可少的环节,它将为企业在AI时代贡献不可估量的价值。

这个认知,在张颖峰和矩阵起源的数据库内核研发负责人金海的常年讨论中达成了共识,金海也是国内最先进的向量数据库Milvus 1.0的作者(它的母公司Zilliz获得了6000万美元B+轮融资)。因此,他们有了再次创业的想法,在2023年共同成立了英飞流,提供为大模型服务的AI原生数据库。

02

突破向量数据库的产品局限

释放AI大模型的B端价值

大模型在企业场景中落地,不外乎三类场景。“第一类是文生图,文生视频等,本质都是通过文字要求让AI大模型生成诸如广告的创意素材;第二类是AI协助写代码;第三类是AI+数据库的RAG场景,这类场景是多种多样的。”

AI大模型+AI原生数据库对企业信息架构的改变

RAG是检索增强生成(Retrieval Augmented Generation)的缩写,结合了AI大模型的生成能力和AI数据库的检索能力,能在简历匹配、相亲交友、合同问答、研报生成、问诊咨询等方面用途。“未来,RAG还将解锁更多场景,可以说,只要企业让AI根据自己内部数据回答问题的需要,就一定是RAG的适用范围。”

“在企业里,AI大模型能一定程度上取代人的决策能力、推理能力和总结能力,同时需要一个数据基础设施,用来承载数以TB计的企业数据,方便AI大模型调用。这个数据基础设施就是数据库。”因此,相比于仅仅采用AI大模型的企业落地方案,AI大模型+数据库的RAG方案能够更贴合应用需要,企业的使用体验被极大增强。“以前,业务要调用订单、交易、文档等数据,需要程序员编写代码才可以。以后,不懂技术的员工直接向大模型提问,让AI从数据库内捞取数据,然后按照要求加工返回即可。”

很多人认为RAG场景下的数据库就是向量数据库,英伟达黄仁勋与Open AI Sam Altman分别在各自场合表达了向量数据库的重要性,各种向量数据企业一时成了“资本宠儿”。

但是在张颖峰看来,RAG场景下的数据库并非只是向量数据库,它必须拥有更强大的功能。换句话说,向量数据库是AI大模型落地企业的必要条件,而非充分条件。

张颖峰认为,目前向量数据库已经暴露了两个主要问题:

英飞流AI原生数据库方案

“首先,它无法帮助AI大模型准确地理解企业内部数据:一个词、一段文字、一篇文章、一张图片、一段声音、一段视频都被压缩成一种数据,并被向量数据库记录与表达。然而,这种数据表达存在无法逾越的技术限制,就是无法表达精确信息。然而在多数情况下,企业需要的是精确信息,例如分类信息提取,数值字段问答,精确报告生成等等。因此,单纯的向量数据库无法满足企业的需要。”

“其次,它无法处理企业的各种输入数据,特别是杂乱无章的非结构化文本。如果不经加工地把这些数据送到数据库,那么呈现在企业用户面前的将会是乱七八糟的内容。”

针对以上问题,张颖峰正在提供英飞流的解决方案——一方面从数据库入手,让英飞流的数据库同时具备单纯向量数据库能力、全文搜索能力和结构化数据查询能力。“这能满足企业在任何场景下给大模型提供数据查询的需要——同时提供精确和语义查询的融合功能,这就是‘多路召回’机制。再加上融合排序机制,这样,英飞流就能解决向量数据库暴露的第一类问题。”

另一方面,针对第二类问题,他们还提供从数据到大模型推理的端到端RAG方案。英飞流提供一系列的AI模型,负责自动化地将企业数据按照规整的方式送入数据库,从而确保数据的语义正确,只有数据正确地进入到数据库了,大模型才可能正确地回答问题。“向量数据库其实是一种技术门槛并不高的产品,我们的方式可让它变得更有‘技术含金量’。更重要的是,可以让它更加AI原生。”

端到端RAG方案在视觉的文档理解和切分中的应用

英飞流通过自己的方案,正在尝试解决AI大模型落地企业的难题,让AI大模型的回答变得更准确。

03

代码全部开源获开发者认可

赢得知名创投机构青睐

虽然成立仅仅半年时间,但是英飞流的数据库产品与RAG解决方案已经成形,并且不少科技大厂正在尝试使用公司的两款产品。科技公司的产品代码是企业核心资产,对于初创公司而言更是如此。然而,张颖峰做出了一个十分大胆的决定——将英飞流所有产品的核心代码全部开源!

2023年末,英飞流就将数据库产品Infinity开源到了GitHub上,仅仅40天,该项目已经获得了超1000的star。不久将来,英飞流也会把RAG开源。

40天,AI原生数据库开源项目已经在GitHub上获得了超1000的star

谈到开源的原因,张颖峰认为数据库是一种基础软件,而开源本质上是一种性价比最高的市场运营策略,“开源是基础软件最好的市场策略,不开源的数据库是没有出路的”。

“我们还没有销售团队,无法当面拜访所有企业客户。通过开源,我们能以很低的成本宣传自己,触达潜在用户。开源可以培养开发者们的使用习惯,也培养起企业对我们的信心,这样当用户做技术选型时候,更愿意采用我们的产品。另一方面,开源能够收集更多的客户反馈,是最佳的产品迭代依据。”

因此,开源成了英飞流触达用户性价比最高的一种方式。

对于开源的质疑往往伴随着难以商业化的困境。对此,张颖峰有着自己的想法:一方面,英飞流能通过对数据库进行运维保障和巡检服务而获取收益;另一方面,英飞流也将提供付费的云原生版本,并提供更加强大的功能。

凭借这套产品规划与商业理念,晨晖创投找到英飞流并快速完成首轮融资,投资方包括晨晖创投和希扬资本。

从市场竞争看,腾讯、阿里、百度等互联网大厂纷纷入局这一领域,并推出了自己的产品。面对未来可能遇到的竞争时,张颖峰并没有过于担心。“大厂内部团队由于KPI机制,更愿意选择造轮子的路线,在已有数据库基础上 ‘魔改’,而非从更底层进行创新,这就阻碍着他们做出一个特别满意的产品。底层创新才是一个基础软件长期具备竞争力的灵魂所在。

“另一方面,大厂项目团队往往根据自己的业务场景进行定制,而非站在普通用户角度,这也容易让整个产品在易用性,成本等方面未必能够达成理想的目标。”

“虽然英飞流是一家初创公司,但是我们比别人走得更早。尽管我们人手有限,但是基础软件并非‘堆人’就能做好的,基础软件从来都是更有远见,并坚持长期主义的少数派才能坚守的游戏。”

张颖峰坦言,自己十几年来深耕基础软件与AI领域,从而建立了核心科技发展的洞见。“过去十多年,我们在核心技术研发的决策和预判上从来没有失误过,我们擅长的是如何把握这些长期核心科技演进的趋势, 在如今人工智能爆发的前夜,搭着大模型的快车,我们找到了一种让这些基础软件也能直面业务的快速通道。”


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1