当前位置:首页|资讯|AIGC|OpenAI

战略押注AIGC,Databricks以13亿美元收购大模型初创公司MosaicML

作者:IT168企业级发布时间:2023-06-28

原标题:战略押注AIGC,Databricks以13亿美元收购大模型初创公司MosaicML

6月26日,Databricks宣布以13亿美元收购大模型初创公司MosaicML,战略押注AIGC。

MosaicML于2021年在旧金山成立,是OpenAI的竞争对手,帮助企业训练并部署自己的大模型,迄今已从投资者那里筹集了近6400万美元,上一轮融资其投后估值2.2亿美元,此次被收购的估值较前者提升了6倍。

据悉,这笔交易要求MosiacML整个团队的60多名员工,包括联合创始人&首席执行官Naveen Rao在内都会加入到Databricks,他们将继续致力于开发更多的基础模型。未来,Databricks将把MosaicML的模型训练能力添加到其Lakehouse平台。

战略押注AIGC

在AIGC时代,谁也不想错失这波AI的机会,尤其是一向以面向AI时代自居的Databricks,更是要紧跟这波浪潮。

今年早些时候,NVIDIA创始人兼首席执行官黄仁勋称生成式AI是 “人工智能的iPhone时刻”,许多企业正在权衡他们的选择,即如何最好地利用这项技术,同时保留对其数据的控制。

Databricks和其老牌竞争对手Snowflake都在铆足劲布局AI,打得难舍难分。几周前,Snowflake收购了位于山景城的AI初创公司Neeva,以期望在其数据云平台上增加基于AI的生成式搜索。今年5月,Databricks 还收购了AI为中心的数据治理平台供应商Okera,收购金额未披露。

前一段时间,Databricks发布了名为Dolly的开源大语言模型(LLM),将模型命名为 Dolly 是为了向第一只克隆羊多莉(Dolly )致敬。Dolly是在开放的数据集上开发的,这是为了满足企业用于开发新大模型应用的需求,Databricks一直期望大模型应用能够走进千行百业。而与闭源训练的模型(如ChatGPT)相比,后者对商业使用有限制。

如今以如此高估值收购MosaicML,让我们看到了Databricks持续战略押注AIGC的决心。MosaicML有什么特殊的地方吗,值得如此高价?

为什么是MosaicML?

MosaicML以其最先进的MPT大型语言模型(LLMs)而闻名。随着MPT-7B的下载量超过330万次,以及最近MPT-30B的发布,MosaicML已经展示了企业如何以经济有效的方式利用自己的数据快速建立和训练自己的大模型。该公司表示,MPT-30B的能力与OpenAI的GPT-3相当,但训练参数更少,该模型仅用300亿个参数训练,而GPT-3的参数为1750亿个。除了基本模型外,该公司还提供了几个专注于特定用例的变体,包括为聊天机器人、短文教学和故事写作而微调的模型。

收购MosaicML后,Databricks预计将把MosiacML的模型、训练和推理能力加入其Lakehouse平台,供企业开发生成式AI应用,该公司强调其开源的大模型政策。MosiacML的模型,即上文提到的MPT-7B和MPT-30B是开源的,符合Databricks的现有政策。

另一个Databricks看重的是Databricks Lakehouse+MosaicML MPT相结合,让其看到了实现大模型应用走进千行百业的希望。

生成式AI的企业应用往往需要高水平的准确性,这是基础模型本身无法保证的,而很多领域大模型和行业大模型出现,使得大模型离走向千行百业更近一步。目前,使用公司数据建立专有模型,同时保持对数据的控制、安全和所有权是许多企业的一个目标。

Naveen Rao在一份声明中说,推出MosaicML是为了解决必要的困难工程和研究问题,使大规模培训更容易为每个人所接受,这一举措在最近的AIGC浪潮中变得更加关键。

与竞品OpenAI不同的是,MosaicML聚焦于帮助企业利用自身数据训练自己的专有大模型,使开发者能够对他们建立的大模型保持完全的控制,并将模型所有权和数据隐私纳入平台的设计中。这种差异化定位,想必Databricks非常看重。

Databricks表示,MosaicML的生成式AI能力与Databricks Lakehouse平台相结合,将提供一个强大而灵活的平台,将为客户提供一种简单、快速的方式,以保留对其宝贵数据的控制、安全和所有权,而不需要高成本。据MosaicML称,与标准方法相比,模型训练的自动优化提供了2-7倍的训练速度。结合资源的近乎线性扩展,几十亿个参数的模型可以在几小时内完成训练。有了Databricks和MosaicML,训练和使用LLM将花费数千美元,而不是数百万美元。

据MosiacML称,其大模型的另一大优势是“零人工干预”的特点,使训练系统可以自动化。“我们对MPT-7B的训练自始至终都是零人工干预:在440个GPU上进行了9.5天的训练,MosaicML平台检测并解决了4个硬件故障,并自动恢复了训练运行,而且由于我们进行的架构和优化改进,没有出现灾难性的损失,”MosiacML在一篇博文中写道。

开源、帮助企业构建专有大模型、低成本,这些便是MosiacML打动Databricks的重要因素。

据悉,MosiacML的现有客户仍将能够使用其LLM和推理产品。现有客户包括Allen Institute for AI、Generally Intelligent、Hippocratic AI、Replit和Scatter Labs等。

在AIGC时代,谁都不想被落下,浪潮汹涌,但前方并非一片坦途。大模型的应用还处在起步阶段,还需要更多探索。Databricks收购MosiacML,吹响了进军AIGC的号角。能否一路高歌还要看双方的团队、产品融合情况,我们拭目以待。

参考链接:https://www.infoworld.com/article/3700773/databricks-1-3-billion-mosiacml-acquisition-to-boost-generative-ai-offerings.htmlhttps://www.datanami.com/this-just-in/databricks-signs-definitive-agreement-to-acquire-mosaicml-a-leading-generative-ai-platform/https://www.datanami.com/2023/06/26/databricks-1-3b-mosaicml-buyout-a-strategic-bet-on-generative-ai/


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1