当前位置:首页|资讯|AIGC|融资|人工智能|生成式AI

AIGC领域最大收购:MosaicML被Databricks以13亿美元的价格收购

作者:AI研习所发布时间:2023-06-27

美西时间今天早晨,Databricks同意以约13亿美元的估值收购位于旧金山的生成式人工智能初创公司MosaicML

收购后,MosaicML将成为Databricks Lakehouse平台的一部分,MosaicML整个团队都将纳入Databricks旗下。据悉,截至目前,该笔交易是今年生成式AI领域内所公布的最大一笔收购案。

令人差异的是,MosaicML是一家21年成立的公司且刚成立不久便得到了知名风投DCVC、Lux Capital、Future Ventures等投资者3700万美元的融资。在上一轮的融资中,公司估值为2.2亿美元,而本次收购中MosaicML的估值直接提高近6倍。

被Databricks这样的大数据巨头青睐,MosaicML到底是做什么的呢?

在今年的6月22日,MosaicML宣布发布迄今为止最先进的模型:MPT-30B,该模型具有 300 亿参数,是一款开源商用的大语言模型,训练成本“仅有其他同类竞品模型的零头”。这些最先进的模型已使用 NVIDIA 最新一代 H100 加速器在 MosaicML 平台上进行训练,并声称与原始 GPT-3 模型相比可提供更卓越的质量。

借助 MPT-30B,企业可以利用生成式人工智能的力量,同时维护数据隐私和安全。MosaicML 的 MPT 模型针对高效训练和推理进行了优化,使开发人员能够轻松构建和部署企业级模型。

MPT-30B 的一项显着成就是它能够超越 GPT-3 的质量,同时仅使用 300 亿个参数,而 GPT-3 需要 1750 亿个参数。这使得 MPT-30B 更容易在本地硬件上运行,并且部署推理的成本显著降低。


基于 MPT-30B 训练的定制模型成本也大大低于训练原始 GPT-3 的估算成本,这使其成为对企业有吸引力的选择。

此外,MPT-30B是在长达8000个标记的序列上进行训练的,使其能够处理数据密集的企业应用。它的性能得到了NVIDIA H100 GPU的支持,该GPU提供了更高的吞吐量和更快的训练时间。

多家公司已经在其人工智能应用程序中采用了 MosaicML 的 MPT 模型。

Replit,是一款基于 Web 的 IDE,它使用其专有数据和 MosaicML 的培训平台成功构建了代码生成模型,从而提高了代码质量、速度和成本效益。

Scatter Lab,一家专门从事聊天机器人开发的 AI 初创公司,训练了自己的 MPT 模型,创建了能够理解英语和韩语的多语言生成 AI 模型,从而增强了用户群的聊天体验。

Navan,一家全球旅行和费用管理软件公司,利用MPT基础开发定制的LLM,用于虚拟旅行代理和对话式商业智能代理等应用。

Navan 联合创始人兼首席技术官 Ilan Twig 表示:“在 Navan,我们在产品和服务中使用生成式人工智能,为我们的虚拟旅行代理和对话式商业智能代理等体验提供支持。MosaicML 的基础模型提供了最先进的语言功能,同时能够极其高效地进行大规模微调和服务推理。”

开发者可以通过 HuggingFace Hub 访问 MPT-30B, 可以灵活地根据数据微调模型,并将其部署到自己的设备上进行推理。

此外开发人员还可以利用MosaicML的托管端点MPT-30B-Instruct,与类似端点相比,它可以以极低的成本提供无忧的模型推理。MPT-30B-Instruct每1,000个token的价格为0.005美元,为开发人员提供了经济高效的解决方案。MosaicML发布的MPT-30B模型在大型语言模型领域取得了重大进展,使企业能够充分利用生成式人工智能的能力,同时优化成本并对其数据保持控制。

那么在被Databricks收购后MosaicML又会给我们带来什么惊人的表现呢,让我们拭目以待。



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1