Mistral联合英伟达开源12B小模型：碾压Llama 3，单张4090可跑

作者：AI研习所发布时间：2024-07-22

小模型，成为本周的AI爆点。

与动辄上千亿参数的大模型相比，小模型的优势是显而易见的:它们不仅计算成本更低，训练和部署也更为便捷，可以满足计算资源受限、数据安全级别较高的各类场景。因此，在大笔投入大模型训练之余，像 OpenAI、谷歌等科技巨头也在积极训练好用的小模型。先是HuggingFace推出了小模型SmoLLM；OpenAI直接杀入小模型战场，发布了GPT-4o mini。

GPT-4o mini发布同天，欧洲最强AI初创公司Mistral立马发布旗下最新最强小模型——Mistral NeMo。这个小模型由 Mistral AI 和英伟达联合打造，参数量为120亿（12B），上下文窗口为128k。这是一款寻求在不依赖大量云资源的情况下实施 AI 解决方案的企业的强大工具。

卓越性能

Mistral NeMo支持128K上下文，能够更加连贯、准确地处理广泛且复杂的信息，确保输出与上下文相关。

与同等参数规模模型相比，它的推理、世界知识和编码准确性都处于领先地位。

下表结果所示，除了在MMLU基准上，Mistral NeMo不如Gemma 2 9B。但在多轮对话、数学、常识推理、世界知识和编码等基准中，超越了Gemma 2 9B和Llama 3 8B。

Mistral在Apache2.0许可证下发布了预训练的基本检查点和指令微调检查点，允许商用。

Mistral NeMo 经过量化感知训练，可在不损失任何性能的情况下进行 FP8推理。

此外，模型使用FP8数据格式进行模型推理，这可以减少内存大小并加快部署速度，而不会降低准确性。这意味着，模型可以流畅丝滑地学习任务，并更有效地处理不同的场景，使其成为企业的理想选择。

这种格式可以在任何地方轻松部署，各种应用程序都能灵活使用。因此，模型可以在几分钟内，部署到任何地方，免去等待和设备限制的烦恼。

Mistral NeMo瞄准企业用户的使用，采用属于NVIDIA AI Enterprise一部分的企业级软件，具有专用功能分支、严格的验证流程以及企业级安全性的支持。开放模型许可证也允许企业将Mistral NeMo无缝集成到商业应用程序中。

Mistral NeMo NIM专为安装在单个NVIDIA L40S、NVIDIA GeForce RTX 4090或NVIDIA RTX 4500 GPU的内存上而设计，高效率低成本，并且保障安全性和隐私性。也就是说，单个英伟达L40S，一块GPU就可跑了。

先进模型

Mistral AI和英伟达各自擅长的领域结合，优化了Mistral NeMo的训练和推理。模型利用Mistral AI的专业知识进行训练，尤其是在多语言、代码和多轮内容方面，受益于英伟达全堆栈的加速训练。它专为实现最佳性能而设计，利用高效的模型并行技术、可扩展性以及与Megatron-LM的混合精度。该模型使用NVIDIA NeMo的一部分Megatron-LM进行训练，在DGX Cloud上配备3,072个H100 80GB Tensor Core GPU，由NVIDIA AI架构组成，包括加速计算、网络结构和软件，以提高训练效率。

民主化 AI：面向大众的多语言模型

Mistral NeMo模型专为全球多语言应用程序而设计。它受过函数调用训练，拥有一个大型上下文窗口，在英语、法语、德语、西班牙语、意大利语、葡萄牙语、中文、日语、韩语、阿拉伯语和印地语方面表现尤为突出。可以说，这是将前沿人工智能模型带到全世界不同语言使用者手中的重要一步。下图是Mistral NeMo 在多语言基准测试中的表现：

Tekken：更高效的分词器

Mistral NeMo使用基于Tiktoken的全新分词器——Tekken，该分词器已针对100多种语言进行训练，并且比以前的Mistral模型中使用的SentencePiece分词器更有效地压缩自然语言文本和源代码。具体而言，在压缩源代码、中文、意大利语、法语、德语、西班牙语和俄语方面的效率提高了约30%；在压缩韩语和阿拉伯语方面的效率也分别提高了2倍和3倍。与Llama 3分词器相比，Tekken在压缩大约85%的所有语言的文本方面表现更为出色。

指令微调

Mistral NeMO 经历了高级微调和调整阶段。与 Mistral 7B 相比，它在遵循精确指令、推理、处理多轮对话和生成代码方面表现得更好。

小结

随着 AI 领域的不断发展，Mistral-NeMo 的发布标志着为企业提供更可访问、高效和强大的 AI 工具方面的重要里程碑。这将如何影响更广泛的 AI 生态系统还有待观察，但可以肯定的是：将 AI 能力更接近最终用户的竞赛正在升温，Nvidia 和 Mistral AI 已经在这一方向上迈出了大胆的一步。用户可以立即通过ai.nvidia.com作为NVIDIA NIM体验Mistral NeMo，可下载的NIM版本即将推出。

高性价比GPU算力：https://www.ucloud.cn/site/active/gpu.html?ytag=gpu_wenzhang_0722_shemei

Mistral联合英伟达开源12B小模型：碾压Llama 3，单张4090可跑

卓越性能

先进模型

民主化 AI：面向大众的多语言模型

Tekken：更高效的分词器

指令微调

小结

推荐体验

相关资讯

英伟达Mistral炼出新模型：12B小杯、128k上下文，性能超过Llama 3 8B

OpenAI掀小模型血战！苹果DCLM强势登场，碾压Mistral 7B全开源

AI生图格局大震！Stable Diffusion 3开源倒计时，2B单机可跑碾压闭源Midjourney

国产版Sora开源了！推理优化到18G，4090单卡可跑

Llama 3.1 405B VS Mistral Large 2，谁是开源之王？｜AI横评

近期资讯

台州闪能申请锰酸锂正极材料专利，有效提升锂离子电池循环性能

广州建丰稀土申请一种大比表面积电子级氧化镝的制备方法专利，应用广泛

江苏拢研机械取得用于法兰的扩孔机专利，解决了法兰扩孔易偏移的问题

山西和创鑫取得防堵冲孔模具专利，避免冲孔槽内壁残留碎屑磨损冲头保证冲孔质量

洛阳建龙微纳申请含金属阳离子的RHO型结构分子筛专利，特别在气体吸附分离过程中，具有良好的吸附活性和选择性吸附CO2性能

天津锐升取得轮毂加工间歇打孔装置专利，能够适用更多大小种类的轮毂打孔

文成县昌泰电力有限责任公司申请一种利用配体竞争配位调控多金属基普鲁士蓝类似物的晶体形貌的专利，所得产物纯度高

途顺数控取得断桥铝滚压复合机专利，实现对断热隔热条与断桥铝复合的迅速冷却

中国石油天然气申请一种 SAPO-11 分子筛及其合成方法与应用专利，该合成方法可以有效抑制杂晶的生成并能提高单釜产率

大连海得取得具有物料推送结构的冲孔机专利，便于出料

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响