云从科技从容大模型升级1.5版本综合实力跻身全球前5

作者：云从科技发布时间：2024-01-03

ChatGPT GPT-4

8月21日，云从科技正式发布从容大模型1.5版本。该版本包含十亿级、百亿级、千亿级多种模型规格，实测性能在全球大模型综合性考试评测（C-Eval）中位居百亿级第1，总榜单4。

为了解决大模型落地的难题，从容1.5版本的重点是参数量为130亿（13B）的行业大模型，该模型从千亿大模型中蒸馏产生，在52类测试指标中有44类超过ChatGPT、29类超过GPT-4，这距离从容大模型正式发布仅仅过去2个多月时间。

解决落地难题降低算力需求

大模型在行业落地时，面临着几大难题：

（1）严肃行业对大模型的回答准确性要求更高，需要结合知识数据进行推理，大模型支持的上下文长度至关重要，一定程度上决定了大模型的使用价值；

（2）绝大多数行业对大模型的使用并发和响应时间要求较高，因此在兼顾大模型算法效果的同时，更要充分考虑大模型的推理速度；

（3）为了让行业大模型的落地成本可控，大模型推理的成本是必须要考虑的因素，在更高的算法效果要求、更长的上下文要求、更高的推理并发要求、更短的响应时间要求的情况下，对大模型进行性能加速的诉求非常强烈。

从容大模型专注于行业大模型落地，针对性推出了模型参数量为130亿（13B）的行业大模型，可以降低算法推理的服务器需求，提升算法推理的性能、降低算法推理的门槛，可以在常用的推理卡运行并进行高性能推理，算法效果上与千亿参数级大模型差距较小，在特定场景中的表现超过ChatGPT和GPT4。

行业定向优化性能全球领先

从容大模型1.5版本针对行业大模型进行了定向优化，提高了金融、政务、零售、交通、安防、能源、教育、医疗、文娱等行业领域的行业数据集占比，并重点训练了行业领域的下游任务。同时，模型上下文长度（Context length）更是实现了32K Tokens，超过全球绝大部分模型2k至8k水平。并且，从容大模型对中文编码器进行了深度优化，一个中文汉字平均仅占0.7 Tokens，这使得从容大模型1.5版本支持的上下文长度超过4.5万字。

多轮对话场景经常出现大段文字甚至长篇文章，在对长文档和知识数据进行知识增强大模型推理时，提升上下文长度可以支撑大模型对更多的文档内容、知识数据进行综合理解，从而进行更详尽、更完备的问题推理和答案总结，显著提升了大模型的实战应用能力。

与此同时，从容大模型1.5版本也对中文上下文的提示效果进行了深度优化，提升了在超长提示或者多轮对话时对上下文中的专用词、数字、人物关系、背景知识、逻辑关系等复杂提示的语言理解效果，减少了对话中碰到的歧义问题和幻觉问题。

目前，云从科技通过从容1.5版本已在数字化经营能力提升、学科建设、智算中心建设、低代码平台、多模态文档分析、游戏制作、智能运维、交通管理等方面与生态伙伴展开深入合作。

2023年5月18日，云从科技正式发布从容大模型，积极推动人工智能技术在各个行业的应用。当月云从西部智算中心也正式运营，标志着从容大模型生产线正式投产。

6月，云从科技联合华为昇腾在重庆市高新区人工智能计算中心成功适配从容大模型推训一体机，服务于企业的智转数改，为大模型私有化部署奠定基础。

7月，云从科技携手佳都科技、重庆城市交通开发投资集团举办的知行城市交通行业大模型联合发布，三方就深入开展城市交通技术研发及应用落地达成战略合作。

8月，云从科技子公司众数信科发售基于从容大模型的众寻AI鼠标，支持语音输入、PPT生成、智能问答、智能写作等功能，全面提升办公效率。

未来，云从科技将继续加大研发投入，不断优化AI大模型，促进人工智能与实体经济融合发展，深度参与数字中国的建设，为现代化发展注入新动能。

附：

C-Eval 是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集，包含 13948 道多项选择题，涵盖 52 个不同学科和四个难度级别（初中、高中、大学和专业），是对模型潜力判断最具权威性的大模型榜单之一。