作者 | 邓咏仪
编辑 | 苏建勋
生成式AI火了近一年后,AIGC领域本年度最大并购出现了。
北京时间6月26日晚间,Databricks正式宣布,以约13亿美元收购生成式人工智能初创公司MosaicML,以提供为企业构建类ChatGPT工具的服务,交易预计将在今年7月31日前完成。
Databricks是大数据领域中的龙头,旗下主要产品为大数据平台Spark,Sparks是基于Apache Spark开源大数据框架的统一数据分析平台,定义了云计算时代数据处理标准的引擎。而在云计算更加普及后,Spark提出的“湖仓一体”理念,深深影响了一批大数据初创企业。
自2013年成立后,Databricks火速成长为全球最火的Data Infra公司。去年,Databricks公布的年收入超过10亿美元,而在2021年8月完成最新一轮融资后,其最新估值达到380亿美金。
MosiacML则是一家年轻的硅谷公司,成立2021年,公司目前仅有62人。MosiacML的主要产品,是AI为企业提供用于训练、部署大语言模型的生成式AI工具平台。
两者为何选择合并?事实上,两者业务本来就有AI基础。Databricks由伯克利大学AMP实验室的数位教授共同创立。创立之初,Databricks就一直秉持着All in Cloud的策略,并且自己也有推出AI大模型。
而Databricks所在的数据库层,更是与AI大模型训练、部署联系紧密的一层——由于数据量和算力需求都很大,AI大模型要大规模应用,也必须在云上。
Databricks此举固然有抗衡之意。今年开始,Databricks和老对手Snowflakes就在AI领域“暗暗较劲”,Snowflakes也在前不久收购了一家AI初创公司Neeva。
Databricks和MosaicML的结合,也体现出如今硅谷反抗AI垄断的思潮。
MosaicML在公告中表示:MosaicML的成立是为了解决必要的困难工程和研究问题,使每个人都能更容易地进行大规模神经网络训练和推理。“我们从根本上相信一个更美好的世界,每个人都有权训练自己的模型,充满自己的数据、智慧和创造力,而不是将这种能力集中在几个通用模型中。”
MosaicML创始人Naveen Rao是一位连续创业者。他在2014年创立了Nervana,并于2016年以约4.08亿美元的价格将出售给英特尔。Naveen Rao一直认为,有比使用堆砌算力更好的方法来训练更大的AI模型,这也是他后来成立MosaicML的原因。
就在交易披露的前几天,MosaicML还发布了新的可商用的开源大语言模型MPT-30B,拥有300亿参数,并且性能优于GPT-3。企业可以自由采用这一开源模型构建自己的大语言模型。
自今年5月份以来,MPT系列模型下载量已经超过300万次,成为最流行的开源商业大语言模型之一。Naveen Rao曾公开表示,MosiacML可以让企业的训练成本,从数千万美元降至数十万美元。
值得注意的是,据Techcrunch,MosaicML上一轮的投后估值仅为2.22亿美元。对比如今13亿美金的收购价,公司估值直接跃升6倍。
估值飙升,一方面是来源于AIGC的持续热度。另一方面,Databricks愿意支付高溢价,更重要的是人才——合并后,MosiacML全员也将加入Databricks。
并购MosiacML后,Databricks将会让两者的产品相结合。MosaicML会成为Databricks Lakehouse平台的一部分,与Databricks现有的多云产品一起,为企业用户提供生成式AI工具,包括存储、数据处理、分析等AI相关服务。
争夺AI人才已经成为如今硅谷当仁不让的主题,如今硅谷的大小公司,都在以投资、并购、挖人等各种方式,将AI大模型相关技术引入实际业务中。无独有偶,北京时间6月27日,另一则并购也浮出水面——金融数据巨头汤森路透宣布,以6.5亿美元并购AI法律初创公司Casetext。