踢馆Llama 3.1，“欧洲OpenAI”发布开源新模型Large 2 | 最前线

作者：王奕昕发布时间：2024-07-26

作者 | 王奕昕

编辑 | 邓咏仪

Meta发布最新的开源大模型Llama 3.1还不到一天，法国AI初创公司Mistral就来踢馆——7月24日，Mistral发布了其全新的旗舰模型Large 2。

Mistral AI是一家成立刚满一年的法国AI初创公司，也是截至目前欧洲范围内资金最充足、最有竞争力的AI玩家，其核心成员来自Google DeepMind等顶尖AI机构，比如联创Mensch就是对Chinchilla等大模型论文的作者，提出了包括Scaling Laws（缩放法则）在内的核心技术。

2023年6月成立后仅4周，Mistral AI便靠6人团队斩获1.05亿欧元融资。公司专注在开源大模型的研发，被法国总统马克龙赞为“新一代欧洲初创企业与美国科技巨头竞争的典范”。

2023年12月，Mistral 曾发布名为Mistral 8x7B 的开源大模型，有560亿参数，效率和表现与LLaMA-65B旗鼓相当，在大模型界一炮而红。除此之外，该公司还对标ChatGPT，推出名为 Le Chat 的多语言对话助手（官网显示仍在测试阶段，需注册并申请测试资格），用于展示公司最新的技术能力。

Mistral表示，Large 2在使用Llama 3.1 405B不到三分之一的参数，即1230亿个参数的情况下，代码生成、数学和推理能力超过了前者，在生成响应时比其他领先的AI模型也更简洁，避免了过多的冗长描述。这意味着，Large 2在成本方面更具优势，开发者在本地运行也更迅速。

和Meta 的Llama 3.1一样，Large 2也没有上多模态能力，但对话的回应准确度和可靠性上，可以向Llama“以小博大”。Mistral表示，模型的幻觉问题是在Large 2的训练过程中的重点之一。此外，在指令遵循和对话任务、处理精确指令和长时间、多轮对话方面，Large 2也有所提升。

Large 2拥有128k上下文长度，可以在单次对话中接收约等于一本300页书的字符数。此外，Large 2还支持多种语言，能够处理包括英语、法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语，以及80种代码语言。

图源：Mistral官网

需要指出的是，Mistral的模型并非传统意义上的开源模型，商用需付费。

目前，Large 2已经进驻了Google、Amazon、Azure和IBM的平台，为用户提供使用。用户也可以在Mistral的La Plateforme（简化AI应用开发的综合平台，提供预训练模型、数据处理工具和API接口）上通过“mistral-large-2407”体验，或在Le Chat上免费测试。

Mistral于今年6月完成B轮融资，共筹集了6.4亿美元，估值达60亿美元。此轮融资由General Catalyst领投，投资者还包括光速创投、安德森·霍洛维茨、英伟达、三星风险投资公司和IBM等。

Mistral AI目前约有60名员工，其中45名在法国，10名在美国，5名在英国。据《金融时报》报道，约四分之三的员工从事产品开发和研究工作。