不敢对比阿里Qwen2.5，Mistral“最强小模型”陷争议，欧洲的OpenAI也不Open了

作者：量子位发布时间：2024-10-17

欧洲的OpenAI，也不Open了。

Mistral AI发布自称“世界上最好的边缘模型”，却陷入质疑和争议。

不仅因为这一次没有磁力链接开放模型权重，也因为声称“始终优于同行”，但竞品对比并不全面。

官方账号和CEO的评论区中，有网友不留情面的指出问题：怎么不和Qwen2.5对比呢？

Mistral AI这次最新发布两款模型，Ministral 3B/8B，用于端侧和边缘计算。

公告中声称，两款模型在10B以下规模的知识、常识、推理、函数调用和效率方面推进了新的前沿。

展示的基准测试则使用内部框架重新评估所有模型，并声称在多项任务中“始终优于同行”。

但在具体评测结果中，只对比了自家初代Mistral模型、谷歌的Gemma和Meta的Llama系列。

缺失的Qwen2.5系列在9月19日发布，官方评测结果中对比对象同样包含Mistral 7B、Llama 3和Gemma 2。

尽管不是严格同样条件下的对比，在很多开发者看来相对数据也有参考价值。

StabilityAI前CEO Emad Mostaque初步体验后也表示，认为Qwen2.5感觉上更好，开源许可也更宽松，推荐更多人尝试Qwen2.5。

端侧小模型竞争激烈

Ministral 3B/8B两款模型都支持128k上下文长度，Ministral 8B具有特殊的交错滑动窗口注意力，可实现更快且节省内存的推理。

除此之外，目前没有透露更多技术细节。

两款模型从今天开始在官方平台提供API调用，需要联系官方获得商业许可。

另外8B模型权重仅供研究使用，3B模型权重目前并未开放。

对此，Django框架创始人Simon Willison发文表示，在拥有更宽松开源许可且质量很高的Llama系列情况下，很难对Mistral新模型感到兴奋。

值得注意的是，Qwen2.5-7B虽然是宽松的Apache 2.0开源许可，但3B模型与Mistral一样选择了研究用许可。

从中也可以看出，能在手机等设备跑的端侧小模型中，目前真正实用的3B规模商业化落地正在加速，AI公司之间的竞争也越来越激烈。

欧洲的OpenAI变味了

Mistral AI发布端侧小模型的这一天，也是他们首款模型Mistral 7B的一周年附近。

官方还制作了忍者神龟梗图，展示其品线已经在一年之内迅速完善起来。

一年前，Mistral AI以先丢出神秘磁力链接、开放模型权重，几天后再发技术报告的独特作风，成为开源社区新宠。

但如今，这家“欧洲的OpenAI”也渐渐不Open了。

在2024年初，Mistral AI宣布与微软合作，同期推出的Mistral Large大模型不再开放权重，并悄悄撤回了官方网站上有关开源社区义务的内容。

这一举动被视为公司战略的重大转变，引起一波议论。

一些开源社区成员对此表示失望，认为这种先通过免费或低成本的产品吸引用户，然后通过高级功能收费的方式，是一种“背叛”。

最近一次Mistral AI甩磁力链接开放权重的模型，是他们首款多模态大模型Pixtral。

有观点认为这是由于他们刚进入多模态这一赛道，之后商业模式成熟了也会渐渐转向非开源。

有网友表示，随着大模型商业竞争加剧，未来Mistral AI走向开源的对立面是不可避免的，令人难过。

尽管如此，他们仍然赢得了许多善意，所以我还在为他们加油。

参考链接：

[1]https://mistral.ai/news/ministraux/

[2]https://x.com/arthurmensch/status/1846565876046201289

[3]https://simonwillison.net/2024/Oct/16/un-ministral-des-ministraux/

本文来自微信公众号“量子位”，作者：梦晨，36氪经授权发布。

近期资讯

深度探索：利用 Xinference 高效部署企业级大模型

Xinference 是一款开源模型推理平台，除了支持 LLM，它还可以部署 Embedding 和 ReRank 模型，这在企业级 RAG 构建中非常关键。同时，Xinference 还提供

五号厂房 2024-10-15

npm 中的 package.json 实践

main: 指定程序入口，作为包时会按该字段加载包文件; bin: 指定可执行文件，包安装后，会为该文件创建软连接并添加可执行权限; files: 指定上传到 npm 的文件;

枫桦在掘金 2024-10-15

面试必备：从URL输入到页面呈现的技术奥秘

面试必备：从URL输入到页面呈现的技术全解析引言在技术面试中，"请描述一下从在浏览器中输入URL到页面完全呈现的整个过程"是一个很经典的问题。这个问题看似简单，实则涵盖了网络通信、操作系统、Web

zifer 2024-10-15

zyosasa 2024-10-15

WindowManagerService(WMS)窗口显示流程分析之创建Window

在android中，WMS 负责管理设备上所有的 Window ，所以应用想显示一个 Window 需要通过WMS来完成。

岸芷漫步 2024-10-15

✨Chrome DevTools 使用指☞北 - 来源面板 🔔

使用断点暂停代码 🌈 暂停时检查值 🐾 新建一个代码段，将下面内容粘贴到工作区。按下 Ctrl + S 保存代码，之后按下 Ctrl + Enter 执行代码执行暂停时，调试程序会展示当前函数中

Anita_Sun 2024-10-15

Redis 万字入门教程

Redis 是一个遵循 BSD 开源的基于内存、高性能的数据存储库，可用于作为数据库、缓存、消息中间件。

Java陈序员昨天

flutter doctor 报错，https://maven.google.com

flutter doctor 报错：A network error occurred while checking "https://maven.google.com/"

wallen 2024-10-15

不敢对比阿里Qwen2.5，Mistral“最强小模型”陷争议，欧洲的OpenAI也不Open了

端侧小模型竞争激烈

欧洲的OpenAI变味了

推荐体验

相关资讯

刚刚，OpenAI与Mistral同时发布了各自最强小模型，针尖对麦芒

阿里云发布最强开源模型Qwen2

最强开源大模型面世：阿里发布Qwen2

微软押注“欧洲版OpenAI”，Mistral新模型直追GPT-4，这次不开源了

谷歌发开源模型，不Open的只剩OpenAI

近期资讯

深度探索：利用 Xinference 高效部署企业级大模型

npm 中的 package.json 实践

面试必备：从URL输入到页面呈现的技术奥秘

名堂最多的表单组件开发

[深度学习]单独使用keras和tensorflow中的keras,有什么区别

SwiftUI 精通之路10: 关于 ScrollView 的简单应用

WindowManagerService(WMS)窗口显示流程分析之创建Window

✨Chrome DevTools 使用指☞北 - 来源面板 🔔

Redis 万字入门教程

flutter doctor 报错，https://maven.google.com

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响