“鸡蛋不能放在同一个篮子里”,深谙其道理的微软在 AI 领域开始广泛布局。前牵手 OpenAI、Meta、Mistral、Inflection 等公司后,如今据外媒 The information 报道,微软开始亲自“操刀”,开发大模型——MAI-1。
不同于之前开发 27 亿参数的小模型 Phi-2,这一次的 MAI-1 将直接对标 Google 的 Gemini、Anthropic 的 Claude 和 OpenAI 的 GPT-4 等最先进的大模型。
据悉,MAI-1 的开发是由不久之前刚被微软“变相收购”的 AI 初创企业 Inflection AI CEO Mustafa Suleyman 主导。
Mustafa Suleyman 此前是 Google DeepMind 联合创始人,而后在 2022 年加入 AI 独角兽公司 Inflection AI 担任 CEO。
今年 3 月,微软高调发文称,公司已经聘请了 Inflection AI 的 CEO Mustafa Suleyman 领导新成立的微软人工智能部门。有消息称,微软向 Inflection AI 公司支付了 6.5 亿美元,主要用于获得其 AI 软件的授权。而后,微软聘请了包括 Mustafa Suleyman 以及首席科学家 Karén Simonyan 等 Inflection AI 公司的大部分员工。分析称,微软这种吸纳行为是变相收购,本质上是为了规避反垄断审查。
就在此番广纳人才的一个多月后,便传来了 MAI-1 大模型的消息,其中“M”或是“微软”(Microsoft)的首字母,“1”则暗指这可能是其人工智能模型的第一个版本。
据悉,MAI-1 拥有大约 5000 亿个参数,将比微软之前的开源模型大得多,需要更多的计算能力和训练数据。MAI-1 或力求与 OpenAI 的 GPT-4 处于同等的规模,据传 GPT-4 拥有超过 1 万亿个参数(在专家混合配置中),并且远远高于 Meta 和 Mistral 的 700 亿个参数模型等较小模型。
尽管有传言称,MAI-1 可能建立在前 Inflection 员工带来的技术之上,但有两名熟悉该项目的微软员工透露,MAI-1 是一种全新的大型语言模型 (LLM)。
这也让人有些不解,毕竟微软和 OpenAI 这几年间的强强联手,促使微软的不少产品线已经率先应用了先进的大模型,实现智能化的升级。
时间回到 2019 年,微软以 10 亿美元投资刚和马斯克分道扬镳的 OpenAI,联合开发新的 Azure AI 超级计算技术,同时,OpenAI 也将开发服务转移到微软 Azure 上运行。
2021 年,微软继续投资 OpenAI 20 亿美元。此时两家合作已经初见成效,最被众人所熟知的 GitHub Copilot 便出自其两家合作之手,它基于 GitHub 及其他网站的源代码,利用了 OpenAI 的技术,可根据上文提示为程序员自动编写下文代码。
2023 年 1 月,微软和 OpenAI 合作升级,OpenAI 获得了微软的“多年期、数十亿美元的投资”。虽然两家未正式对外公布具体的交易金额,但据 The Verge 透露,此番投资金额高达 100 亿美元,作为这项投资的一部分:
这期间,微软还获得了对 OpenAI 软件的优先访问权,使其能够将 OpenAI 的软件连同其利用 OpenAI 技术的人工智能产品一起转售给其 Azure 客户。
近一年多以来,我们也亲眼见证了微软系列产品在 AI 驱动下的革新,如 Bing 搜索引擎搭载 GPT-4 大模型、微软的 AI 图像生成工具 Copilot Designer 在 OpenAI DALL-E 的驱动下带来不错的效果;智能副驾驶 Microsoft 365 Copilot 的到来让“打工人”迎来春天,通过大模型(LLM)与 Microsoft Graph 和 Microsoft 365 应用中的数据相结合,打破了传统办公软件的方式,能够自动生成文档、电子邮件、PPT,让 Word、Excel、PowerPoint、Outlook、Teams 等办公软件的效率提升多倍......
两家原本深度的合作关系,随着微软不断扩大其商业版图以及在 AI 领域的布局,在外界看来似乎有些微妙。
一方面,微软在去年 Meta 发布 Llama 2 时宣布两家合作,成为 Llama 2 的首选合作伙伴,即 Llama 2 可在 Azure AI 模型目录中使用,基于此,使用 Microsoft Azure 的开发人员能够使用 Llama 2 进行构建,并利用其云原生工具进行内容过滤和安全功能。
与此同时,Llama 2 还经过优化,可以在 Windows 上本地运行,为开发人员提供无缝的工作流程,为跨不同平台的客户带来生成式 AI 体验。Llama 2 也可通过 Amazon Web Services (AWS)、Hugging Face 和其他提供商获取。
另一方面,微软在今年押注法国初创 AI 公司Mistral AI。如同当年 OpenAI 在艰难之际获得微软的资金和算力支持,微软总裁 Brad Smith 在这次合作中宣布与 Mistral 建立“多年合作伙伴关系”,以帮助这家成立 10 个月的公司将其人工智能模型推向市场。作为合作的一部分,微软拥有 Mistral AI 少量股份。自此,Mistral AI 获得 OpenAI 同等待遇,直接将模型资源放在微软云当中售卖,成为第二家在微软 Azure 云平台上提供商业 AI 模型的公司。
毋庸置疑,从与 OpenAI 的独家合作再扩展到牵手开源大模型、AI 初创公司,微软现下又开启了自研之路,似乎是步步为营,打造了自家的 AI 技术壁垒。
有人猜测,MAI-1 的出现也暗显微软内部既关注移动设备本地运行的小型语言模型,又关注由云支持的大型最先进模型。同时,这一新进展暗示微软可能正在致力于摆脱 OpenAI 影响的模型,甚至可能被设计为 ChatGPT 的直接竞争对手。也许微软会继续在 Copilot 等工具中使用 ChatGPT,但正在为其他利基用途(例如业务管理)创建另一个模型。
不过,据 The Information 报道称,MAI-1 的确切用途尚未确定(即使在微软内部),其最理想的用途将取决于其性能。为了训练该模型,微软一直在分配大量配备 NVIDIA GPU 的服务器,并编译来自各种来源的训练数据,包括 OpenAI 的 GPT-4 生成的文本和公共互联网数据。
据悉,微软可能最早在本月晚些时候的 Build 开发者大会上发布 MAI-1 预览版,我们也将静观其变。
最后,对于微软自研 MAI-1 的传言,有不少网友惊叹微软的布局能力,其表示:
令人震惊的是,微软在大型语言模型上投入了如此多的精力。他们有:
还有人质疑道,「如果 OpenAI 如此出色,而 MSFT 拥有其中 49% 的股份,为什么 MSFT 需要做这样的事情呢?为什么不将所有计算用于产品特定数据的微调模型。」
有网友回复称,“因为 49% 并不是 100%。很明显,每家大型科技公司都希望控制自己的 LLM。”
当然,面对 LLM 百家争鸣之盛况,我们更期待 LLM 带来的颠覆和创新:
那么,MAI-1 是真是假,我们也将进一步关注 5 月 21 日的微软 Build 2024 大会。
参考:
https://news.ycombinator.com/item?id=40279350
https://arstechnica.com/information-technology/2024/05/microsoft-developing-mai-1-language-model-that-may-compete-with-openai-report/
本文来自微信公众号“CSDN”(ID:CSDNnews),整理:屠敏 ,36氪经授权发布。