中国基金报记者 冯尧
星火大模型进化至V3.0版、与华为联手推出算力底座平台、明年对标GPT-4、人形机器人……
10月24日,科大讯飞在2023全球1024开发者节上对外释放一系列重大动作。其中星火大模型V3.0如期而至,在指标上已经全面超越ChatGPT(GPT3.5)。
更为重要的是,科大讯飞与华为的联手更进一步。此次活动中,双方基于华为昇腾生态的“飞星一号”算力底座平台发布,科大讯飞明年上半年能够对标GPT-4的星火大模型V4.0将在这一自主可控的平台上完成训练。
如期发布 星火大模型进阶
在2023全球1024开发者节上,科大讯飞董事长刘庆峰宣布,星火认知大模型V3.0正式发布,实现全面对标GPT3.5。用刘庆峰的话说便是,“中文超越、英文相当”。刘庆峰对星火大模型有着更高期待,即不仅能回答问题,还要能提出问题,不仅要有知识,还要有个性。
在中文方面,科大讯飞对星火大模型V3.0注入了“个性”,即AI人设。在现场演示中,星火大模型V3.0被要求“以孔夫子的人设写一篇演讲稿”,星火大模型最终以文言文形式呈现演讲稿,并植入多个孔子经典名言语录。刘庆峰透露,AI人设涉及特定知识学习、大模型人格以及对话记忆学习。
据刘庆峰介绍,星火大模型V3.0已实现从多轮对话、主动对话再到启发探究式对话的跨越。
而在英文方面,根据OpenAI在官网发布的英文任务测试集,在10月16日至20日的测试中,星火V3.0的英文能力对标GPT3.5的48项任务结果相当,二者得分分别为85.1%(星火V3.0)和84.3%。
不过刘庆峰坦言,星火大模型在英文开放式问答方面还弱于GPT3.5。“跟GPT-4相比,还有更大的学习空间”。
据记者现场了解,综合来看,在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力七个维度上,星火大模型V3.0较V2.0版本能力提升3-9个百分点之间。
另外根据《通用认知智能大模型评测体系》在10月16日-20日的测试,对比GPT3.5,星火大模型在上述七大维度中的六方面:文本生成、语言理解、知识问答、逻辑推理、数学能力和代码能力实现全面超越。
尤其是在代码能力方面,据刘庆峰透露,科大讯飞内部近期完成了Windows到Linux的跨平台移植,其中涉及20万行代码,正常需要3个月时间完成这项工作,但用基于星火大模型的智能编程助手iFlyCode,整个过程只用了1个月时间。据悉,iFlyCode自8月15日发布以来,已与京东云、软通动力等107家机构实现深度对接应用。
不过,刘庆峰也表示,和GPT4相比,科大讯飞代码能力“还有一个学习的过程”。
联手华为 明年对标GPT-4
在此次活动中,另一大关注焦点在于科大讯飞与华为两大巨头的联手。据记者了解,华为轮值董事长徐直军也参与此次活动。在活动中,科大讯飞方面对外发布联合华为打造、基于昇腾生态的自主可控大模型算力底座“飞星一号”平台。
实际上,科大讯飞与华为之间在AI领域的联手日益紧密。“被列入实体清单后,我首先想到向华为请教如何应对,”刘庆峰在会上坦言。
事实上,在星火大模型V2.0发布同时,科大讯飞便联合华为推出to B市场的讯飞星火一体机,以便企业在国产自主创新平台上自主可控地进行大模型私有化部署。
民生证券在一份研报中分析,星火一体机基于昇腾芯片,或代表国内最强AI一体机水平,昇腾AI芯片为核心提供2.5PFLOPS,通过算力软硬件协同优化 构建了算力集中、性能优越、供给稳定、数据安全的大模型训练集群。其具有130/650/1750 亿的模型参数可选,做到开箱即用、安全可控。
科大讯飞在近期的机构调研中也曾介绍,讯飞星火一体机在性能方面已经可以对标A100平台水平。太平洋证券认为,AI大模型在数据安全与数据要素驱动下,将会带来央国企与政府大模型本地化部署刚需。该机构预计,2027年G端AI一体机市场规模超4500亿元。
而徐直军也在此次活动中介绍,目前华为在全球所有智能终端的语音技术,都是来自于科大讯飞。他同时表示,星火大模型V3.0是双方合作的一个案例,为更为强大的星火大模型V4.0提供支撑。
据了解,科大讯飞将开启星火大模型V4.0版本训练,将2024年上半年实现对标GPT-4,而训练所用的平台正是算力底座“飞星一号”。
刘庆峰在会上也正视了与GPT-4的差距。在他看来,国内现有大模型与GPT4相比还有差距,尤其是在复杂知识推理,小样本快速学习,超长文本处理,跨模态统一处理领域。“核心技术还需要持续进步,但这不是某一家公司或者某一家科研机构单独来做的事情。”
商用落地 赋能人形机器人
记者在现场观察到,星火大模型多个领域的商用落地正处于加速中,包括医疗、教育以及科研文献等领域。
在此次活动中,讯飞星火医疗大模型也正式发布。据刘庆峰介绍,GPT-4在国外已经在医疗领域大展拳脚。而通过上线实际使用数据抽查12万例并通过第三方测试数据显示,讯飞星火医疗大模型在医疗海量知识问答、医疗复杂语言理解、医疗专业文本生成、医疗诊断治疗推荐的问题回答率全面超越GPT-4。
与此同时,科大讯飞在活动中还宣布,即将发布12个行业大模型,覆盖金融、汽车、运营商、工业、住建、物业、法律、科技文献、传媒、政务、文旅、水利等行业。
此外,刘庆峰还透露了科大讯飞在机器人方面的布局。在去年的1024开发者日上,科大讯飞曾展示了自研AI机器人,并发布了讯飞机器人超脑平台AIBOT平台,希望赋予实体机器人智能,通过云端协调、软硬结合的方式,推动AI机器人的发展。
刘庆峰此次表示,星火大模型将让AIBOT赋能机器人发展进入到一个全新阶段,人形机器人对复杂任务的拆解、开放场景的物体寻找明显提升,在强化学习泛化抓取、仿人行走的复杂地形运动能力上都比主流系统有一个非常大提升。
“下一步我们将以人形机器人为牵引,来推动‘视觉-语言-动作’多模态具身大模型,能够更好地赋能人形机器人,”刘庆峰表示。
编辑:小茉
审核:许闻
版权声明
《中国基金报》对本平台所刊载的原创内容享有著作权,未经授权禁止转载,否则将追究法律责任。
授权转载合作联系人:于先生(电话:0755-82468670)
万亿巨头:紧急报警!