作者 | 王奕昕
编辑 | 邓咏仪
Meta发布最新的开源大模型Llama 3.1还不到一天,法国AI初创公司Mistral就来踢馆——7月24日,Mistral发布了其全新的旗舰模型Large 2。
Mistral AI是一家成立刚满一年的法国AI初创公司,也是截至目前欧洲范围内资金最充足、最有竞争力的AI玩家,其核心成员来自Google DeepMind等顶尖AI机构,比如联创Mensch就是对Chinchilla等大模型论文的作者,提出了包括Scaling Laws(缩放法则)在内的核心技术。
2023年6月成立后仅4周,Mistral AI便靠6人团队斩获1.05亿欧元融资。公司专注在开源大模型的研发,被法国总统马克龙赞为“新一代欧洲初创企业与美国科技巨头竞争的典范”。
2023年12月,Mistral 曾发布名为Mistral 8x7B 的开源大模型,有560亿参数,效率和表现与LLaMA-65B旗鼓相当,在大模型界一炮而红。除此之外,该公司还对标ChatGPT,推出名为 Le Chat 的多语言对话助手(官网显示仍在测试阶段,需注册并申请测试资格),用于展示公司最新的技术能力。
Mistral表示,Large 2在使用Llama 3.1 405B不到三分之一的参数,即1230亿个参数的情况下,代码生成、数学和推理能力超过了前者,在生成响应时比其他领先的AI模型也更简洁,避免了过多的冗长描述。这意味着,Large 2在成本方面更具优势,开发者在本地运行也更迅速。
和Meta 的Llama 3.1一样,Large 2也没有上多模态能力,但对话的回应准确度和可靠性上,可以向Llama“以小博大”。Mistral表示,模型的幻觉问题是在Large 2的训练过程中的重点之一。此外,在指令遵循和对话任务、处理精确指令和长时间、多轮对话方面,Large 2也有所提升。
Large 2拥有128k上下文长度,可以在单次对话中接收约等于一本300页书的字符数。此外,Large 2还支持多种语言,能够处理包括英语、法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语,以及80种代码语言。
图源:Mistral官网
需要指出的是,Mistral的模型并非传统意义上的开源模型,商用需付费。
目前,Large 2已经进驻了Google、Amazon、Azure和IBM的平台,为用户提供使用。用户也可以在Mistral的La Plateforme(简化AI应用开发的综合平台,提供预训练模型、数据处理工具和API接口)上通过“mistral-large-2407”体验,或在Le Chat上免费测试。
Mistral于今年6月完成B轮融资,共筹集了6.4亿美元,估值达60亿美元。此轮融资由General Catalyst领投,投资者还包括光速创投、安德森·霍洛维茨、英伟达、三星风险投资公司和IBM等。
Mistral AI目前约有60名员工,其中45名在法国,10名在美国,5名在英国。据《金融时报》报道,约四分之三的员工从事产品开发和研究工作。
IT时报 2024-12-22
IT之家 2024-12-22
雷科技 2024-12-22
Eva的科技生活 2024-12-22