“
Mistral AI将在大型语言模型和生成AI的构建、培训和应用方面与OpenAI和谷歌竞争,开发生成式人工智能基础设施。
编译:Poetry |
据外媒报道,由前 Meta 和 Alphabet研发人员共同成立的AI初创公司 Mistral 在四个月前刚刚获得了由光速创投领投的1.13亿美元融资。而在最近,他们再次获得了一笔价值3亿美元的投资。
据另一位知情人士透露,这一轮投资预计将使这家总部位于巴黎的初创公司估值超过10亿美元,该公司正在开发一个开源的大型语言模型,并将自己定位为欧洲的“OpenAI”。
Mistral AI是一家人工智能服务商,由前DeepMind和Meta公司的研究人员组建的新公司,将在大型语言模型和生成AI的构建、培训和应用方面与OpenAI和谷歌竞争,开发生成式人工智能基础设施。
01
斩获3亿美元新融资
近日,生成式 AI 初创公司 Mistral AI(常自称为“欧洲 OpenAI”)已宣布获得 3 亿美元新融资。如果一切顺利,那么新融资将帮助这家年轻企业估值突破 10 亿美元大关。
据了解,Mistral AI 总部位于法国巴黎,由来自 Meta Platforms 和 Alphabet 的几位前研究人员 Arthur Mensch(现任 CEO)、Guillaume Lample 和 Timothee Lacroix 共同创立,公司成立于 2023 年 5 月,专门开发大语言模型及各类 AI 技术。Mistral 这个名号来自北方寒冷的季风,也体现了他们想要在 AI 领域占据一席之地的愿望。
Mistral AI 联合创始人:Guillaume Lample、Arthur Mensch、Timothée Lacroix
6 月,Mistral 在拿下 1.13 亿美元巨额种子融资后引发业界轰动,公司估值也瞬间来到 2.6 亿美元。彼时,该公司刚刚成立,员工仅 6 人,还未做出任何产品,仅仅凭借着 7 页 PPT 就斩获了巨额融资。
该轮融资由 Lightspeed Venture Partners 牵头,Redpoint、Index Ventures、Xavier Niel、德高控股以及意大利、德国、比利时和英国的其他知名风险投资公司参与。但该公司很快发现这“区区”1 亿美元根本不够,要推动后续增长和扩张计划还需要更多资金的支持。
据 The Information 近日报道,熟悉谈判内情的消息人士称,Mistral 已从投资者处额外筹集 3 亿美元,而此时距离由 Lightspeed Venture Partners 领投的种子轮融资才刚刚过去四个月。
目前还不清楚 Mistral 已经与哪些风险投资商进行过沟通,但根据另一位知情人士透露,生成式 AI 投资领域的重要参与者 Andreessen Horowitz 正在积极寻求向开源大语言模型(LLM)开发者注资的机会。如果能够顺利合作,自然不失为一件美事。
Mistral AI 团队成员
Mistral 公司 CEO、前 DeepMind 研究科学家 Mensch 表示,这家企业的使命是“打造出能够解决现实世界问题的下一代 AI 系统”。他同时补充称,新一轮融资将用于扩大团队、加快研发工作,以及在欧洲和美国建立新的办事处。
Mistral 敢于开出如此夸张的融资数额,也体现出投资者对于 AI 初创企业不断增长的关注和信心。近年来,AI 初创公司已经筹得海量资金,其中不少企业正在开发前沿 AI 技术,有望彻底颠覆众多传统行业。
但目前 Mistral 仍在起步阶段,能否成为 AI 领域的主要参与者仍然有待观察。尽管如此,该公司强大的初始团队和雄心勃勃的发展目标,已经使其成为当前乃至未来几年中最值得关注的 AI 初创力量之一。
02
“最强 7B 开源模型”Mistral 7B
9 月 27 日,Mistral AI 团队发布了自家首个大模型 Mistral 7B,该模型号称是“最强 7B 开源模型”。
据介绍,Mistral 7B 是一套拥有 73 亿参数的大语言模型,采用 Apache 2.0 许可证,以不加限制的方式对外开放以供使用。在所有基准测试中,Mistral 7B 均优于 Llama 2 13B;在多种基准测试中,优于 Llama 1 34B;拥有比肩 CodeLlama 7B 的编码性能,并同时保持着良好的英语能力;使用分组查询注意力(GQA)来加快推理速度;使用滑动窗口注意力(SWA)以较低成本处理更长序列。
Mistral 7B 基础设施集群由 CoreWeave 提供 24/7 全天候支持,CINECA/EuroHPC 团队及 Leonardo 运营团队提供资源与帮助,FlashAttention、vLLM、xFormers、Skypilot 维护团队提供新功能以及方案集成指导。HuggingFace、AWS、GCP、Azure ML 团队协助实现了 Mistral 7B 的全平台兼容。
Mistral 7B 还能针对任意任务进行轻松微调。Mistral AI 团队将 Mistral 7B 与 Llama 2 系列模型进行了比较,并重新运行了这些模型以验证评估结论是否准确。
Mistral 在一份报告中表示,Mistral 7B 在多项基准测试中轻松击败了 Llama 2 的 70 亿和 130 亿参数两个模型。
在涵盖数学、历史、法律和其他科目的大规模多任务语言理解测试中,Mistral 的模型准确率达到 60.1%,而 Llama 2 模型70亿参数和130亿参数两个版本的准确率分别为 44%和 55%。
在常识推理和阅读理解基准测试中,Mistral 的表现也优于 Llama 2 的模型。
只有在编码方面Mistral落后于Meta。Mistral 7B 在 "Humaneval "和 "MBPP "两项基准测试中的准确率分别为 30.5% 和 47.5%,而 Llama 2 的 70 亿模式的准确率分别为 31.1% 和 52.5%。
除了性能之外,Mistral 还声称比 Llama 2 使用了更少的计算量。在 MMLU 基准测试中,Mistral 模型的输出的结果是同规模下的 Llama 2 的三倍多。如果与ChatGPT做比较,根据medium的计算,Mistral AI 的使用成本要比 GPT 4便宜约 187 倍,比 GPT 3.5 模型便宜约 9 倍。
参考链接:
https://www.theinformation.com/articles/mistral-a-wannabe-openai-of-europe-seeks-300-million
https://techstartups.com/2023/10/31/mistral-a-generative-ai-startup-aiming-to-be-europes-openai-seeks-300-million-in-new-funding/
https://mistral.ai/news/announcing-mistral-7b/
本文提供的信息仅用于一般指导和信息目的,本文的内容在任何情况下均不应被视为投资、业务、法律或税务建议。