媲美GPT-4的开源模型泄露！Mistral老板刚刚证实：正式版本会更强

作者：量子位发布时间：2024-02-01

GPT-4

媲美GPT-4的开源模型泄露！Mistral老板刚刚证实：正式版本会更强

白交发自凹非寺

量子位 | 公众号 QbitAI

Mistral-Medium竟然意外泄露？此前仅能通过API获得，性能直逼GPT-4。

CEO最新发声：确有其事，系早期客户员工泄露。但仍表示敬请期待。

换句话说，这个版本尚且还是旧的，实际版本性能还会更好。

这两天，这个名叫“Miqu”的神秘模型在大模型社区里炸了锅，不少人还怀疑这是LIama的微调版本。

对此Mistral CEO也做出了解释， Mistral Medium是在Llama 2基础上重新训练的，因为需尽快向早期客户提供更接近GPT-4性能的API，预训练在Mistral 7B发布当天完成。

如今真相大白，CEO还卖关子，不少网友在底下戳戳手期待。

Mistral-Medium意外泄露

我们还是重新来回顾一下整个事件。1月28日，一个名叫Miqu Dev的神秘用户在HuggingFace上发布一组文件“miqu-1-70b”。

文件指出新LLM的“提示格式”以及用户交互方式同Mistral相同。

同一天，4chan上一个匿名用户发布了关于miqu-1-70b文件的链接。

于是乎一些网友注意到了这个神秘的模型，并且开始进行一些基准测试。

结果惊人发现，它在EQ-Bench 上获得83.5 分（本地评估），超过世界上除GPT-4之外的所有其他大模型。

一时间，网友们强烈呼吁将这个大模型添加到排行榜中，并且找出背后的真实模型。

大致怀疑方向主要有三个：

与Mistral-Medium是同一个模型。

有网友晒出了对比效果：它知道标准答案还说得过去，但不可能连俄语措辞也跟Mistral-Medium完全相同吧。

Miqu应该是LIama 2的微调版本。

但另外的网友发现，它并不是MoE模型，并且同LIama 2架构相同、参数相同、层数相同，。

不过马上就受到其他网友的质疑，Mistral 7b也具有与 llama 7B 相同的参数和层数。

相反，这更像是Mistral早期非MoE版本模型。

不过讨论来讨论去，不可否认的是在不少人心中，这已经是最接近GPT-4的模型了。

如今，Mistral 联合创始人兼首席执行官 Arthur Mensch承认泄露，是他们一位早期客户员工过于热情，泄露了他们训练并公开发布的一个旧模型量化版本。

至于Perplexity这边CEO也澄清说，他们从未获得过Mistral Medium的权重。

网友担心是否会撤下这个版本。

有趣的是，Mensch并没有要求删除HuggingFace上的帖子。

而是留下评论说：可能会考虑归属问题。

参考链接：

[1]https://www.reddit.com/r/LocalLLaMA/comments/1af4fbg/llm_comparisontest_miqu170b/

[2]https://twitter.com/teortaxesTex/status/1752427812466593975

[3]https://twitter.com/N8Programs/status/1752441060133892503

[4]https://twitter.com/AravSrinivas/status/1752803571035504858

近期资讯

江苏明越精密取得高温镍合金棒材表面处理设备专利，提升打磨块位置调节时的稳定性

金融界2024年12月30日消息，国家知识产权局信息显示，江苏明越精密高温合金有限公司取得一项名为“高温镍合金棒材表面处理设备”的专利，授权公告号CN222222011U，申请日期为2024年5月。

金融界 2024-12-30

河北速优特取得五轴数控工具磨床的磨头装置专利，有利于打磨轮对不同深度的孔进行打磨

金融界2024年12月30日消息，国家知识产权局信息显示，河北速优特精密工具有限公司取得一项名为“一种五轴数控工具磨床的磨头装置”的专利，授权公告号CN222222002U，申请日期为2024年5月。

金融界 2024-12-30

东莞丝科取得五金件打磨装置专利，提高工作效率

金融界2024年12月30日消息，国家知识产权局信息显示，东莞丝科五金实业有限公司取得一项名为“一种五金件打磨装置”的专利，授权公告号CN222222010U，申请日期为2024年4月。

金融界 2024-12-30

绍兴超立机械取得链轮生产用插齿机专利，减少冷却液因温度升高造成工件冷却效果不佳的情况

金融界2024年12月30日消息，国家知识产权局信息显示，绍兴超立机械有限公司取得一项名为“一种链轮生产用插齿机”的专利，授权公告号CN222221984U，申请日期为2023年12月。

金融界 2024-12-30

宁波创微取得外圆磨冷却油除沫装置专利，保证冷却系统正常运转

金融界2024年12月30日消息，国家知识产权局信息显示，宁波创微机械有限公司取得一项名为“一种外圆磨冷却油除沫装置”的专利，授权公告号CN222222015U，申请日期为2024年3月。

金融界 2024-12-30

深圳市艾客达取得一种便于安装的对刀仪专利，便于进行将磁铁停止吸附

金融界2024年12月30日消息，国家知识产权局信息显示，深圳市艾客达科技有限公司取得一项名为“一种便于安装的对刀仪”的专利，授权公告号CN222221992U，申请日期为2024年3月。

金融界 2024-12-30

江苏钴锋新材料研究院取得刀片磨削加工磨床专利，能够阻挡打磨刀片时的火星子

金融界2024年12月30日消息，国家知识产权局信息显示，江苏钴锋新材料研究院有限公司取得一项名为“一种刀片磨削加工磨床”的专利，授权公告号CN222222004U，申请日期为2024年4月。

金融界 2024-12-30

中建二局取得可移动可接焊渣切割防护罩专利，使防护罩清理操作更便捷

金融界2024年12月30日消息，国家知识产权局信息显示，中建二局第三建筑工程有限公司取得一项名为“一种可移动可接焊渣切割防护罩”的专利，授权公告号CN222221983U，申请日期为2024年5月。

金融界 2024-12-30

重庆新兴通用传动取得内孔磨床专利，提高生产效率

金融界2024年12月30日消息，国家知识产权局信息显示，重庆新兴通用传动有限公司取得一项名为“种内孔磨床”的专利，授权公告号CN222222013U，申请日期为2024年5月。

金融界 2024-12-30

中村机器人取得承载高强度旋转机构专利，有效提高旋转机构承载能力

金融界2024年12月30日消息，国家知识产权局信息显示，中村机器人（无锡）有限公司取得一项名为“一种承载高强度的旋转机构”的专利，授权公告号CN222221994U，申请日期为2024年3月。

金融界 2024-12-30

媲美GPT-4的开源模型泄露！Mistral老板刚刚证实：正式版本会更强

媲美GPT-4的开源模型泄露！Mistral老板刚刚证实：正式版本会更强

推荐体验

相关资讯

媲美GPT-4的开源模型泄露！Mistral老板刚刚证实：正式版本还会更强

媲美GPT-4的开源模型泄露！正式版本还会更强

性能逼近GPT-4，开源Mistral-Medium意外泄露？CEO最新回应来了

性能接近GPT-4，Mistral-Medium遭泄露？CEO最新回应来了......

微软押注“欧洲版OpenAI”，Mistral新模型直追GPT-4，这次不开源了

近期资讯

江苏明越精密取得高温镍合金棒材表面处理设备专利，提升打磨块位置调节时的稳定性

河北速优特取得五轴数控工具磨床的磨头装置专利，有利于打磨轮对不同深度的孔进行打磨

东莞丝科取得五金件打磨装置专利，提高工作效率

绍兴超立机械取得链轮生产用插齿机专利，减少冷却液因温度升高造成工件冷却效果不佳的情况

宁波创微取得外圆磨冷却油除沫装置专利，保证冷却系统正常运转

深圳市艾客达取得一种便于安装的对刀仪专利，便于进行将磁铁停止吸附

江苏钴锋新材料研究院取得刀片磨削加工磨床专利，能够阻挡打磨刀片时的火星子

中建二局取得可移动可接焊渣切割防护罩专利，使防护罩清理操作更便捷

重庆新兴通用传动取得内孔磨床专利，提高生产效率

中村机器人取得承载高强度旋转机构专利，有效提高旋转机构承载能力

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响