Mistral AI 走上了 OpenAI 开源再闭源的老路了吗?
作者|刘杨楠
编辑|赵健
昨夜,被称为“法国版 OpenAI”的 Mistral AI 再放大招,正式发布 Mistral Large 旗舰模型,并且推出对标 ChatGPT 的对话产品:Le Chat,直接杀到 OpenAI 家门口。
就在 Mistral Large 发布前几个小时,全球市值第一的微软宣布与 Mistral AI 达成深度合作。未来,Mistral AI 将获得 OpenAI 同等待遇,直接将模型资源放在微软云当中售卖,成为第二家在微软 Azure 云平台上提供商业 AI 模型的公司。
据Mistral AI CEO Arthur Mensch 透露,开发这款新模型的成本不到 2000 万欧元(约合 2200 万美元)。
另外据外媒报道,微软收购了少数 Mistral AI的股权,这意味着在投资 OpenAI 之后,Mistral AI 成为微软投资的第二家大模型公司。
但是,作为开源公司出道的 Mistral AI ,并没有将这款新旗舰模型开源。对此,埃隆·马斯克评价道:“微软是否让它们成为闭源代码?”
Mistral AI 是否走上了 OpenAI 开源再闭源的老路?
1.Mistral Large 性能直逼 GPT-4
据官方新闻稿介绍,Mistral Large 是 Mistral AI 的最新旗舰版,达到了顶级的推理能力。它可以用于复杂的多语言推理任务,包括文本理解、转换和代码生成。
在常用基准测试上 Mistral Large 表现强劲,以 81.2% 的成绩超越了Claude 2、Gemini Pro、GPT-3.5、Llama 2-70B 四款模型,仅次于 GPT-4。
在 MMLU(测量大规模多任务语言理解)上,GPT-4、Mistral Large(预训练)、Claude 2、Gemini Pro 1.0、GPT 3.5 和 LLaMA 2 70B的比较。
Mistral Large 具有以下特点:
它在英语、法语、西班牙语、德语和意大利语方面具有天然的流利度,对语法和文化背景有细腻的理解。
它的 32K token 上下文窗口允许从大型文档中精确地回忆信息。
它精确的指令遵循能力使开发者能够设计他们的审核政策——Mistral AI 用它来设置 Le Chat 的系统级审核。
它天然具备函数调用能力。这一点,加上在 la Plateforme 上实施的受限输出模式,使得应用开发和技术栈现代化能够规模化进行。
和常用基准测试上的顶级 LLM 模型相比,Mistral Large 也表现不俗。
推理和知识
市场上顶级 LLM模型在广泛常识、推理和知识基准测试上的性能:MMLU(测量大规模多任务语言理解)、HellaSwag( 10-shot)、Wino Grande( 5-shot )、Arc Challenge( 5-shot)、Arc Challenge( 25-shot)、TriviaQA( 55-shot)和 TruthfulQA。
多语言能力
Mistral Large 还是一个语言方面的“多面手”。在法语、德语、西班牙语和意大利语的 HellaSwag、Arc Challenge 和MMLU 基准测试中,它的表现远远超过 LLaMA 2 70B。
在法语、德语、西班牙语和意大利语的 HellaSwag、Arc Challenge 和 MMLU 上,Mistral Large、Mixtral 8x7B和LLaMA 2 70B 的比较。
数学和编码
Mistral Large 不仅有强大的语言天赋,数学和编码所代表的逻辑能力也很强。
市场上领先 LLM 模型在流行的编码和数学基准测试上的性能:HumanEval pass@1、MBPP pass@1、Math maj@4、GSM8K maj@8( 8-shot )和GSM8K maj@1( 5-shot )。
这次和 Mistral Large 一起面世的,还有一个更“小而美”的 Mistral Small。Mistral Small 的性能超过 Mixtral 8x7B,并且延迟更低,这使它成为开放权重产品和旗舰模型之间的一个精细的中间解决方案。
Mistral Small 和 Mistral Large 在 RAG 启用和函数调用方面都有相同的创新。
目前,开发者可从两个渠道获取Mistral AI:
La Plateforme:在欧洲的 Mistral 基础设施上安全托管,这个接入点使开发者能够在全面的模型范围内创建应用和服务。
Azure:Mistral Large 可以通过 Azure AI Studio 和 Azure Machine Learning 获得,用户体验与 API 一样无缝。Beta 客户已经成功使用了它。
自我部署:Mistral Large 环境上部署,并且可以访问模型权重。
Mistral Large 在 Azure AI 上的定价如下:输出为 0.024 美元 / 1000 token,输入为 0.008 美元 / 1000 token。相比之下,128K 上下文窗口的 GPT-4 Turbo 定价为:输出为 0.03 美元/1000 token,输入 0.01 美元/ 1000 token。
此外,Mistral AI 还还发布了首个对标 ChatGPT 的对话助手 Le Chat,该助手可以在后台使用 Mistral Large 或 Mistral Small,或者一个名为 Mistral Next 的原型模型;并发布了面向企业的 Le Chat Enterprise。
值得注意的是,Le Chat 目前还不支持联网功能。
2.Mistral AI 与 OpenAI 相争,微软成最大赢家 ?
Mistral AI 创始人 Guillaume Lample 在X上官宣 Mistral Large 后,图灵奖获得者、Meta 首席科学家 Yann LeCun(杨立昆)一改往日对 OpenAI 的苛刻态度,第一时间发来祝贺:
还有热心网友向杨立昆发来关切,并鼓励其发布完全开源的 LLama 3。对此,杨立昆则希望网友多点耐心。
事实上,Mistral AI 这个成立不到 10 个月的年轻团队大有扭转局面的气势。
Mistral AI 公司成立于 2023 年 5 月,总部位于法国巴黎,以一己之力将 LLM 的聚光灯从中美的主战场拉向了欧洲。
Mistral AI 是开源、小模型领域的“先锋”选手。
Mistral AI 在 2023 年 9 月推出开源的 7B 模型,发布时间晚于 LLama 2,但并未被 LLama 2 抢了风头。其越级达到了大部分模型 20B 左右的水平,实际使用时进一步微调的表现也比其他模型更容易学到领域专用知识,得到很多开源和企业使用者的认可。
Mistral 创始团队以年轻科学家为主,其中 7 人来自 Meta(4位是 Llama 的参与者),3人来自 Hugging Face,2人来 Deepmind;之前领导过 Llama 1&2、Flamingo(Google DeepMind 论文,GPT-4V 外最重要的多模态模型)、Chinchilla(Google DeepMind 论文,建立了模型数据与参数量的标准)、RETRO(Google DeepMind 论文,第一个结合 Retrieval 和 LLM 的大模型)、BLOOM(Llama 1 出现前的最重要开源模型)等重要模型。
Mistral AI 的管理层一共四人。
其中,CEO Arthur Mensch 来自 Deepmind,参与了 Deepmind 的多个经典的模型:Flamingo、Chinchilla、Gopher。
CTO 和 首席科学家分别是 Llama & Llama2 的核心工程、研究角色(由于离职,并未在 Llama2 论文中体现)。Chief Business Officer Florian 则由创始顾问,Alan 的 CEO 推荐加入。
目前,Mistral 已完成了三轮公开融资,总额超过6亿美元。
- 2023 年 6 月,公司完成 1.05 亿欧元(约合 1.13 亿美元)的种子轮融资,由 Lightspeed Venture Partners(光速创投)领投,投后估值 2.4 亿欧元;
- 2023 年 12 月,Mistral 完成由 Andreessen Horowitz(a16z)领投,英伟达、Salesforce、法国巴黎银行、美国风投机构 General Catalyst 等投资的 3.85 亿欧元(约合 4.15 亿美元)融资。
2024 年 2 月,微软入股 Mistral。
据悉,Mistral公司估值已超过20亿欧元(约合156.2亿元人民币),成为 AI 领域的独角兽公司。
自成立以来,Mistral AI 便被认为是 OpenAI 有力的竞争对手,并一直坚定站在 OpenAI 的“反面——OpenAI 闭源,Mistral AI 开源;OpenAI 坚定地走“大数据+大算力+大规模参数”的暴力美学路径,Mistral AI 则掀起一轮“小模型”热潮,在 7B 规模下不断再创辉煌。
不过,在OpenAI和Mistral AI的较量中,微软或成最大的赢家,将两条路线均收入囊中。
此次,微软与 Mistral AI 的合作重点关注三个核心领域:
超级计算基础设施:微软将通过 Azure AI 超级计算基础设施来支持 Mistral AI,为 Mistral AI 旗舰模型的 AI 训练和推理工作负载提供一流的性能和规模。
扩展到市场:微软和 Mistral AI 将通过Azure AI Studio和Azure 机器学习模型目录中的模型即服务 (MaaS) 向客户提供 Mistral AI 的高级模型。除了 OpenAI 模型之外,模型目录还提供开源和商业模型的多种选择。开发者可使用 Microsoft Azure 消费承诺 (MACC)来购买 Mistral AI 的模型。Azure 的 AI 优化基础设施和企业级功能为 Mistral AI 提供了向全球 Microsoft 客户推广、销售和分发其模型的额外机会。
人工智能研究和开发:微软和 Mistral AI 将探索围绕为特定客户(包括欧洲公共部门工作负载)培训特定目的模型的合作。
此外,据英国《金融时报》报道,微软对Mistral AI进行了小额投资,但不持有该公司任何股权。
(封面图来源:Mistral AI 官网)
END.