出品 | 搜狐科技
作者 | 梁昌均
国内大模型混战之下,科大讯飞成为最新的入局者。自去年12月15日,科大讯飞启动1+N的大模型专项攻关后,历时近半年终于发布了最新技术成果。
5月6日,科大讯飞正式对外发布讯飞星火认知大模型,该公司董事长刘庆峰、研究院院长刘聪现场实测七大核心能力,并发布教育、办公、汽车、数字员工四大行业应用成果。
刘庆峰在现场演讲中表示,ChatGPT在全球引起了人工智能的全新的浪潮,各行各业都在拥抱这个巨大的变革和机会,传统意义上通过堆时长、堆人力的商业模式将被根本性的颠覆。
他提到,当前对通用人工智能系统的需求主要体现在七个维度,具体包括文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力。“这将对整个人类的生产和生活方式带来巨大的颠覆,产生全新的机会。”
“认知大模型成为通用人工智能的曙光,科大讯飞有信心实现智能涌现。”刘庆峰表示,当前讯飞星火认知大模型已经在文本生成、知识问答、数学能力三大能力上已超ChatGPT。
他进一步公布大模型年内三次升级时间点,10月底将整体赶超ChatGPT。同时他表示,科大讯飞还将联合开发者推动大模型应用落地,共建人工智能“星火”生态。
文本生成、知识问答、数学能力已超ChatGPT
发布会现场,科大讯飞实时演示了星火认知大模型在多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力等七个方面的能力。
值得注意的是,不同于其它大语言模型,讯飞星火大模型可以支持语音输入,并将语音识别成文字,同时生成的内容还可以用语音朗读出来,甚至可以合成虚拟人制作成视频输出,视频背景也可以随着文字而进行变动。
“孙悟空和奥特曼也偷偷潜入了会场,他们都争着想做讯飞星火认知大模型的代言人,还为此吵了一架,请根据上述信息创作一个故事。”刘聪直接语音输入,星火认知大模型不仅准确的进行了语音转文字,而且迅速给出了四五百字的脑洞大开的故事。
在文本生成方面,它还能写邮件、做方案、写新闻通稿、生成英文宣传等。“每一次重新生成,结果都是不一样的,这也是我们星火大模型的魅力所在。”刘庆峰表示,在长文本生成上,讯飞星火大模型在国内明显领先,并且在中文方面超过了ChatGPT,并且在持续进步中。
在语言理解上,星火认知大模型还能修改英语语法错误,同时在中文理解有也有不错的表现。随着问题的变化,也会灵活调整自己的答案。
大模型现场还展示了“情感分析”能力,展现出跟人类共情的潜力,比如如对不同情境下的“默默地站了一分钟”就能理解到背后不同的含义。刘庆峰表示,科大讯飞现在的语言能理解能力相比ChatGPT还略有差距,但已超越国内同类产品。
在数学能力方面,讯飞星火大模型除了常规计算、几何、情景应用等,对于比鸡兔同笼更为复杂的计算题也能很快准确生成答案,并给出详细的解题步骤。刘庆峰表示,数理能力一定程度代表了大模型的聪明程度,星火大模型不仅在国内系统中遥遥领先,也超过了ChatGP。
此外,刘聪还展示了大模型面向泛领域开放式知识问答,能够对生活常识、科学知识、工作技巧,以及医学知识等应对自如,该能力也已超过ChatGPT。此外,星火大模型也具备逻辑推理能力与代码能力,为了还将进一步升级多模态输入和表达能力,不断实现自身迭代进化。
不过,在实际演示过程中,星火大模型也出现了在逻辑推理等方面首次判断有误等情况,以及在英文输出中夹杂中文等情况。刘庆峰坦言,目前大模型技术还有待攻克的缺陷,比如新知识难以及时更新、事实类问答容易“张冠李戴”,史实、传统典籍等容易编造情节等,但这些问题在今年会有明显的改进。
刘庆峰还公布了年内大模型技术持续升级的三个关键里程碑节点:6月9日,将突破开放式问答、多轮对话能力明显提升、数学能力再升级;8月15日,代码能力升级以及多模态交互能力提升;10月24日,将实现通用模型对标ChatGPT,中文超越ChatGPT的当前版本,英文能做到相当水平,并在教育、医疗等领域做到业界领先。
“今天认知大模型刚开始起步,还在快速成长和迭代,如果只是找一些单点例子来比较系统的强和弱,我觉得没有意义。”刘庆峰表示,要向Open AI致敬和学习,同时在快速追赶并努力超越的过程中,首先需要一套科学系统的评测体系。
为此科大讯飞和中国科技大学共同承建的认知智能全国重点实验室,牵头设计了通用认知大模型的评测体系,涵盖前述七大维度,涉及481个细分任务类型。
刘庆峰认为,现在有很多企业和科研机构都在进行大模型的技术和产业化研究,这套评测系统可以帮助用来判定技术发展到了什么程度,下一步应该往哪走,具体应用是否已经达标,以及还有哪些工作需要去做。
率先落地四大领域,首批将接入3000余家企业开发者
但业内还在争论大模型如何落地的时候,科大讯飞在发布星火大模型的同时就已经想好了如何去应用。此次发布会上,科大讯飞发布了大模型在教育、办公、汽车、数字员工等四个领域的应用成果。
在教育领域,科大讯飞推出大模型加持的讯飞学习机T20系列产品。在作文批改上,它可实现中英文作文类人批改,具备围绕写作要求、分析全篇结构和文采的深度高阶批功能,还可以利用AI润色技术生成片段优化参考和写作建议提升。在口语对话方面,讯飞AI学习机精通中英双语,孩子直接说中文也能翻译成英文并教孩子朗读,还能对孩子的发音进行评分。
在办公场景,搭载大模型技术的讯飞智能办公本升级了会议纪要、语篇规整两大功能,其中语篇规整可以去除语音转写文稿中的口语化词汇、过滤冗余词汇,使得阅读效率提升50%。
同时,大模型加持的讯飞听见通过AI分析文字内容,可以一键生成包括全文摘要、工作待办、工作计划、新闻稿件、宣传文案、多语种翻译等多种文本,还可以根据原文件内容,进行AI对话并对原文内容进行提问追溯。此外,讯飞智能录音笔、讯飞智能麦克风等办公产品的相关功能也将进行更新。
在智能汽车领域,科大讯飞已为数千个车型提供智能语音交互服务,累计服务用户已经超过4610万,在国内汽车智能语音应用市场保持占有率第一。刘庆峰表示,认知智能大模型将使得车载人机交互再上一个新的台阶,实现更自由、更拟人化地沟通。
在数字员工方面,科大讯飞首创新一代基于大模型的生成式RPA,帮助企业员工完成大量重复性工作。科大讯飞还推出虚拟人智能交互机,消费者通过对话直接说出需求,数字员工即可为消费者推荐相关产品。
刘庆峰表示,讯飞星火认知大模型未来还将赋能包括医疗、城市、政法、工业等在内的更多行业,向更广阔的产业领域延伸。讯飞开放平台还将新增星火认知大模型,目前该已经开放了560项AI能力,并聚集了超过500万生态合作伙伴。
他还在现场宣布,首批来自36个行业的3000余家企业开发者将接入星火大模型,联合各行业合作伙伴共建大模型“星火”生态。同时科大讯飞启动2023科大讯飞AI星火营生态计划,面向千行百业的开发者,提供技术赋能、方案打造、赛事运营、商业运作、创业扶持等多维度资源,推动大模型的应用落地。
刘庆峰还介绍称,算力方面科大讯飞将联手华为,保证认知大模型的持续进化要在自主可控的平台上不断提升。同时他强调到,科大讯飞将在保护伦理和安全的前提下推动大模型健康发展。