当前位置:首页|资讯|科大讯飞|ChatGPT|GPT-4

科大讯飞刘庆峰:星火大模型V3.0已超越ChatGPT,明年将对标GPT-4|钛媒体焦点

作者:钛媒体APP发布时间:2023-10-24

原标题:科大讯飞刘庆峰:星火大模型V3.0已超越ChatGPT,明年将对标GPT-4|钛媒体焦点

科大讯飞董事长刘庆峰

钛媒体App获悉,10月24日举行的第六届世界声博会暨2023科大讯飞全球1024开发者节上,科大讯飞董事长刘庆峰正式推出讯飞星火认知大模型V3.0版本(以下简称“星火大模型3.0”)。

据介绍,此次发布的星火大模型3.0在文本生成、语言理解、知识回答、逻辑推理、数学能力等七大能力上均持续提升。刘庆峰称,星火大模型3.0通用模型将全面对标去年11月美国OpenAI公司发布的ChatGPT,中文能力已超越ChatGPT,英文能力与之相当。

对于新的GPT-4,刘庆峰表示,当前星火大模型3.0在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解等方面与GPT-4都存在不小差距,但科大讯飞计划于2024年上半年发布讯飞星火大模型4.0版本,从而将正式对标GPT-4。另外,科大讯飞还与华为公司发布了基于昇腾平台的“飞星一号”,以用于星火大模型4.0算力训练。

然而,资本市场似乎对此并不“感冒”。截至10月24日15点收盘,科大讯飞(002230.SH)股价报收46.70元/股,日跌9.97%,成交额超41亿元。而年初至今,科大讯飞股价已累计涨42.68%。

171天,星火大模型3.0综合能力超越ChatGPT

据悉,2022年11月30日,OpenAI发布了基于 AI 大模型(LLMs)的聊天机器人产品ChatGPT,其轻松写诗、回答数学问题和流畅的交流对话能力引发了全球热议,并使得以ChatGPT为代表的新一轮生成式 AI 浪潮风靡全球。

截至目前,ChatGPT在全球月访问用户数达到18亿人次,已超过Reddit、Netflix等消费级平台的访问量。

今年5月6日,科大讯飞公司正式发布讯飞星火大模型1.0版本,并通过171天的4次重大技术迭代,让其产品的技术能力对标ChatGPT。9月5日,讯飞星火平台正式获批,可对外开放使用,短短14个小时,讯飞星火平台的用户数量超过100万。截至目前,用户数已经超过1200万。

据刘庆峰介绍,新的星火大模型3.0版本在多模态、拟人化等多项能力上均有提升。相比前代,新的3.0版本在文本生成方面提高7%,语言理解提高6%,知识问答提升7%,逻辑推理提升8%,数学能力提高3%,代码能力提高9%,多模态能力提高7%。

现场演示过程中,星火大模型3.0展示平台新的“友伴”功能,可实现包括“孔夫子”、“诸葛亮”等人设,以古代人士或自己的形象口吻回答问题。

刘庆峰认为,讯飞需要让大模型有“人格”,从性格、情绪、表达、风格等方面来设立它的基本人设,而且要随时随地导入特定知识,从而让星火大模型将成为每个人的 AI 助手。

“它(大模型)绝不仅仅是一个玩的工具,他可以解决我们的情绪,释放给我们带来特定方向的灵感,也可以帮助我们教育孩子等其他方面。”刘庆峰表示。

刘庆峰强调,目前发布的星火大模型3.0版本,综合能力方面已经超越基于GPT-3.5模型的ChatGPT。他进一步解释称,根据《通用认知智能大模型评测体系》构建测试集,在10月16日至20日的测试中,星火认知大模型V3.0的中文能力客观测评超越ChatGPT,另外基于OpenAI官网的英文任务测试集,在10月16日-20日的测试中,星火V3.0的英文能力对标ChatGPT 48项任务结果相当,二者得分分别为85.1%(星火V3.0)和84.3%。

刘庆峰透露,目前,讯飞星火生态开发者团队已达到552.8万个,相较5月6日以来新增143.4万个,同比增幅达到331%。其中,有17.8万个开发者团队直接与大模型相关。

与此同时,除了基础大模型之外,科大讯飞今天还宣布将发布12个行业大模型,覆盖金融、汽车、运营商、工业、住建、物业、法律、科技文献、传媒、政务、文旅、水利等行业。

其中在工业领域,今年9月科大讯飞联合羚羊工业互联网股份有限公司发布基于星火的羚羊工业大模型,可以在生产运管、工业质检、设备运维等方面赋能工业生产,截至10月23日平台服务企业次数增至370.6万,30多天增长88%;科研领域,星火与中国科学院文献情报中心联合科技文献大模型,可以帮助检索相关论文,分析成果并生成综述概要,助力科研人员开展科研活动;代码领域,基于星火代码大模型的智能编程助手iFlyCode已经与京东云、软通动力等107家机构实现深度对接应用,最新iFlyCodeV2.0可在设计、编码、测试阶段提效分别为50%、37%、44%。

而在教育、医疗、家居等众多领域,讯飞星火也有一定的落地应用。刘庆峰引述Gartner报告数据,预计到2026年,80%的企业都要用到生成式 AI 技术,如今这一数据才5%。

刘庆峰指出,星火大模型正在开启一个增长新的 AI 时代,而且与每个人息息相关。“在当前全球政治、经济、军事面临巨大的挑战和不确定的前提下,通用人工智能是这个时代最确定的增长动力来源。”刘庆峰称。

讯飞和华为强强合作,算力训练效率翻倍

另外,科大讯飞还宣布与华为公司打造基于昇腾生态的自主可控大模型算力底座“飞星一号”平台,并在此基础上,讯飞星火大模型将开启对标GPT-4的更大规模算力训练。

据悉,这是基于昇腾AI硬件、昇思AI开源框架的国产软硬件一体化的私有专属大模型解决方案。2023年初,讯飞与华为昇腾启动专项攻关,与华为联合研发高性能算子库,合力打造中国通用 AI 新底座。

早前刘庆峰表示,华为的GPU(图形处理器)芯片技术现在已经与英伟达的A100显卡相当。

刘庆峰今天表示,很庆幸中国能出现华为这样伟大的公司。

华为轮值董事长徐直军表示,科大讯飞敢于对标ChatGPT并超越,让人对中国大模型时代快速发展的未来充满信心。自2016年以来,双方在智能语言等多个业务领域合作,如今又联合攻关大模型训练难题,让昇思星火大模型训练效率推理效率翻番。未来基于昇腾生态的“飞星一号”平台,不仅使训练效率翻番以及高效稳定的训练迭代,而且还将形成更大的专属模型。

然而,目前关于星火大模型和科大讯飞自身的市场争议依然不断。

一方面,大模型算力成本日趋攀升,对于每个季度要发布财报的科大讯飞这一上市公司来说,面临一定的盈利挑战。

10月20日科大讯飞发布的财报显示,公司2023年第三季度营收47.72亿元,同比增长2.89%;净利2579万元,较上年同期下降81.86%;扣非后净亏损为2019万元,上年同期的扣非后净利为正。而今年前三季度营收达126.14亿元,较上年同期下降0.37%;净利9936万元,同比下降76.36%;扣非后净亏损为3.24亿元。

另一方面是关于讯飞数据质量争议。最新一个事件是人民日报全国党媒信息公共平台10月23日转载山东的海报新闻称,科大讯飞学习机中《蔺相如》一文发现一些不良内容,目前科大讯飞工作人员已表示永久下架《蔺相如》文章,并进一步进行溯源核查和系统排查,接下来将加强内容安全管理。

科大讯飞在财报会上透露,目前讯飞 AI 开放平台已经与超过 1 万家企业合作对接。面向B端客户的交付模式有两种:一是通过云计算提供企业服务;二是面向高端客户交付私有化解决方案,包括使用与华为合作的讯飞星火一体机和基于客户自有硬件的“软件+服务”解决方案。

刘庆峰今天坦言,中国现有的大模型与万亿参数的GPT-4相比都仍有一定差距,在人机协同的强化学习、数据积累等方面OpenAI还是领先一步,所以大家要正视与GPT-4的差距,找到差距所在,需要从复杂知识推理、小样本快速学习、跨模态的统一理解等方面一步步赶上。

“要将认知大模型赋能百业,这是一场硬仗,绝不是靠吹牛能做成的,只有实事求是的精神才能真正实现超越。而我们也点出了下一个里程碑,在2024年上半年,讯飞星火4.0发布,我们就要对标GPT-4。”刘庆峰表示。

(本文首发钛媒体App,作者|林志佳)


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1