微软推新模型MAI-1，5000亿参数挑战OpenAI

作者：巴比特资讯发布时间：2024-05-15

微软 OpenAI 谷歌

文章来源：头部科技

文丨海天

图片来源：由无界AI生成

微软似乎对开发新AI模型极为痴迷，接二连三发布新作品。 2023年6月微软发布Phi-1，12月又更新至Phi-2，到了今年4月，它又发布拥有38亿参数的Phi-3。

按照微软的介绍，Phi-3追求“小而美”，可以在智能手机、笔记本电脑上运行。

最近又有消息称微软正在开发MAI-1模型，它与Phi-3完全背道而驰，拥有5000亿参数，是微软至今为止最大的模型。

虽然我们现在还不知道MAI-1有什么卖点，也不知道微软想通过它达成怎样的目标，但有一点是可以肯定的：微软希望凭借MAI-1巩固AI霸主地位。

MAI-1意味着微软与OpenAI的竞争开始升级

微软MAI-1还没有正式发布，目前仍处在开发阶段，所以很多细节我们无从知晓。考虑到MAI-1是超大模型，它瞄准的对手无疑是谷歌、OpenAI。虽然微软是OpenAI的早期投资者，但二者也存在竞争关系。

对于微软来说，训练MAI-1有优势，因为它拥有海量数据。为什么微软要从零开始开发全新模型MAI-1呢？可能微软不想将全部赌注押在OpenAI身上，也可能是想摆脱垄断嫌疑，让美国监管机构放心。

MAI-1拥有5000亿参数，比很多其它大模型都要庞大，例如，Meta开发的Llama 2模型只有700亿参数。尽管MAI-1是微软至今为止最大的模型，但还是比不过OpenAI GPT-4，后者据说有1万亿参数。

微软拥有庞大的数据资源和算力，它还采购大量英伟达GPU，组建服务器集群，完全有实力训练规模庞大的模型。未来微软肯定会继续加大算力投入，训练更大的模型。

2019年微软首席技术官Kevin Scott曾在邮件中告诫员工，相比谷歌和OpenAI，微软在AI领域进步缓慢。暗中开发MAI-1意味着微软想挑战行业领导者，降低对OpenAI的依赖，实现AI产品多样化，未来微软与谷歌、OpenAI的竞争将会升级。

由行业大佬操刀性能值得期待帮助微软开发MAI-1的大佬叫Mustafa Suleyman，他曾是AI创业公司Inflection的CEO。不久前微软斥资6.5亿美元收购Inflection，Mustafa Suleyman顺理成章成为微软员工。

虽然MAI-1是Mustafa Suleyman领导开发的，但它并没有采用Inflection模型，而是微软重新打造的。微软有可能借用了Inflection的数据和技术，但并没有将Inflection模型拿过来直接更换皮肤然后使用。

Mustafa Suleyman在创建Inflection之前曾在谷歌AI部门工作，所以他在美国AI领域名声远扬。在谷歌工作时，Mustafa Suleyman创建了谷歌DeepMind AI实验室，实际上他为微软工作才一个月，我们有理由相信微软团队才是MAI-1的真正“作者”，只是现在工作交到Mustafa Suleyman手中，由他接管。

5月7日Mustafa Suleyman在推特上发消息称微软从上到下拥有强大文化，这在如此规模庞大的企业中实属罕见。他还强调微软是一家“真正的AI优先企业”，推动着技术实现大变革。

3月份Mustafa Suleyman加盟微软时微软CEO Satya Nadella曾野心勃勃表示，要以安全、负责任态度让AI服务于地球上的每一个人和每一个组织。言语之中不难看出Satya Nadella对Mustafa Suleyman有着超高期待。

Mustafa Suleyman对AI有着自己的独家见解，他认为AI本质上就是“劳力替代工具”，他极为看重责任感，要求AI开发向社会负责，这一主张与Satya Nadella的理念是吻合的。

微软目前正在重点打造Copilot，Mustafa Suleyman认为它是真正具有变革性的AI工具，前途不可限量，希望能为Copilot进化贡献自己的智慧。

真能与GPT-4抗衡吗？恐怕很难正如之前所说的，MAI-1的参数为5000亿，而GPT-4达到万亿，明显GPT-4有优势。不论是原始处理能力还是应对复杂任务的能力，MAI-1都比不过GPT-4。

2020年年中时OpenAI推出GPT-3，它拥有1750亿参数；到了GPT-4，参数膨胀至1万亿。1万亿只是外界猜测的数据，OpenAI并没有确认。有人甚至认为OpenAI旗舰LLM拥有1.76万亿参数，谷歌Gemini Ultra拥有1.6万亿参数。Gemini Ultra对标的也是GPT-4。

如果单看参数，MAI-1远不及GPT-4和Gemini Ultra，考虑到微软拥有庞大的数据资源和超强计算基础设施，差距应该能缩小一些，但不太可能超越GPT-4。

在比较时我们也不能光看参数，还要关注大模型的功能和性能。两款大模型都能执行多种任务，比如自然语言处理、代码生成。无论是用学术指标还是职业标准衡量，GPT-4都很出色，已经得到认可，MAI-1还没有正式发布，也没有接受评测，所以它的性能如何我们还无法给出结论。

唯一的线索来自Mustafa Suleyman，他暗示MAI-1非常强大，至于是不是夸大，夸大了多少，还要让时间来回答。不用等很久，有消息称MAI-1最快可能本月就会发布。

MAI-1和GPT-4并不是毫无关系的两个产品，二者也有一定联系。例如，微软训练MAI-1时借用了GPT-4生成的文本。

5月16日微软将会召开Build开发者大会，业界普遍认为如果性能达到预期，微软会在大会上发布MAI-1。如果真是这样，微软可能已经拥有原型MAI-1产品，如果没有，那么未来几周必然准备好原型。