本文由速途网(sootoo123)原创
作者 / 赵佳茹
5月的第一个大模型来了,你看好讯飞星火吗?
2022年11月OpenAI发布ChatGPT,随即2023年1月BuzzFeed宣布与OpenAI合作来协助公司创意生成引爆二级市场,国内外以谷歌、微软、百度、阿里巴巴、字节跳动、腾讯、华为、科大讯飞在内的互联网企业纷纷宣布有GPT相关技术储备。
4月20日,科大讯飞宣布讯飞星火大模型在5月6日发布;紧接着,在4月24日,科大讯飞毫无征兆地对外开启了公测,用户填写问卷调查后就能获取测试资格。
不少网友称“科大讯飞实现反向跳票”,在正式发布之前开启公测,也看得出科大讯飞对讯飞星火认知大模型的自信。
在讯飞星火认知大模型的发布会现场,科大讯飞董事长刘庆峰直言,“认知大模型刚刚起步,还在快速成长和迭代过程中,如果只是找一些单点例子来证明哪个系统强和弱,是没有意义的。”
但这款大模型的表现到底如何?速途网根据科大讯飞的科学评测体系来体验一把。
发布会上,科大讯飞董事长刘庆峰介绍了当前通用人工智能的七大维度能力,包括了文本生成、逻辑推理、语言理解、数学能力、代码能力、知识问答、多模态能力。同时,展示了星火认知大模型在写发言稿、邮件、营销方案、英文写作等不同方式的效果呈现,甚至还能以小红书文本方式生成等。
值得注意的是,在手机或PC浏览器中打开讯飞星火,都能够实现语音输入问题,就目前市面上的类ChatGPT产品而言,仅科大讯飞实现了语音输入和输出,这点值得称赞。当然,这主要得益于科大讯飞多年在智能语音方面的研究,与讯飞听见、讯飞有声等产品内容的基础相关。
据速途网深度体验显示,目前版本的讯飞星火大模型为单模态人工智能大模型,支持文字信息。但速途网在5月5日选择官方推荐的对话“用emoji表情为我介绍电影《泰坦尼克号》”,星火的回答中出现错码/乱码的情况。
不过,在今日讯飞星火认知大模型发布会期间,速途网再次测试该问题后发现,讯飞星火出现了emoji表情,与此前回复有所差别,不再出现乱码,这说明讯飞星火已经迭代。
紧接着,速途网又以“今年母亲节是哪天?”“今年母亲节是几月几日?”进行提问。
对于问题中的“今年、哪天”,星火只能反馈到今年是2023年,当提示词更加精准到“几月几日”时,回答也定位到了2023年5月14日。
对于汉语口语化的词“哪天”,讯飞星火的理解能力表现中规中矩。
此外,速途网通过语音识别输入提问问题“请帮我筹划一下,今年母亲节我该送给妈妈什么礼物?”讯飞星火的回答与文心一言、ChatGPT等目前已发布的大模型并未有什么差距。
图为讯飞星火认知大模型
图为百度文心一言
图为ChatGPT3.5大模型
当速途网提问“我在北京,她在山西,我该如何在母亲节体验孝心?”
讯飞星火则回复“即使身在不同的城市,也可以通过以下方式在母亲节体验孝心”,这其中值得注意的是第3个方案中,“为她做饭”,显然不在同一个城市无法为妈妈亲手做一顿丰盛的饭菜,AI的逻辑性还有待提升。
在讯飞星火发布会期间,科大讯飞董事长刘庆峰的测试中,讯飞星火能够理解“高兴、自豪”等情感词,其理解能力在发布会表现比较良好,由此看来,星火大模型在发布会期间迭代为最新的版本,但在发布会的现场演示中,多语种、逻辑推理和数学能力的演示过程中表现出了不足。
在科大讯飞现场的演示中,讯飞星火能够合成虚拟人视频进行文本朗读也引发了网友的关注,在现场演示中,不到30秒的时间就可以直接生成一段女生形象的虚拟人朗读上述生成的文本。
但速途网在目前的测试版本中对讯飞星火进行提问,将星火大模型生成的五一旅游计划进行虚拟人朗读操作后发现目前的版本中还未支持合成虚拟人视频,对此,也有不少网友猜测,生成虚拟人视频功能或许将在未来成为收费项目。
对此,速途网也联系到科大讯飞工作人员,她表示,目前的版本中不支持生成虚拟人视频,还未开放全功能版本,将在后续开放全功能版本。
在速途网的测试中也注意到,讯飞星火大模型目前在理解能力、逻辑能力以及数学能力中展示的并不完美,甚至在发布会现场演示也出现了外语回答中夹杂中文字样的回复,但整体来看,科大讯飞能在5个月的时间内交付出讯飞星火也证明了其多年的技术积累,也希望在今后快速的迭代中,讯飞星火能够达到客户满意的程度。
此外,科大讯飞董事长刘庆峰也在发布会现场提出了“纯大模型技术的攻克缺陷”,针对“新知识难以及时更新”、“事实类问答容易张冠李戴”、“史实、传统典籍等容易编造情节”,科大讯飞针对目前存在的问题也提出了解决方案,更是宣布在今年的三个阶段的升级计划:
第一阶段,在6月9日,突破开放性问答,如实时问答;多轮对话能力再次升级;数学能力再上台阶;
第二阶段,在8月15日,突破代码能力;多模态交互能力正式开放给客户;
第三阶段:10月24日,在通用大模型领域对标ChatGPT,中文超越,英文相当。
当然这一计划公布,不禁也让网友为科大讯飞捏了一把汗,到底是刘庆峰的口嗨还是中国高新技术企业的自信?
如果说讯飞星火认知大模型的发布是科大讯飞在“秀肌肉”,那将其大模型运用并实践在了产品中,也是大模型的具体落地形式,让大模型有了“用武之地”,也在真正意义上实现了“AI+”的趋势来临。
对于星火认知大模型未来的行业应用,刘庆峰表示,将主要应用在教育、办公、汽车、数字员工四大方面。
速途网注意到,在科大讯飞发布会进行到第二部分,刘庆峰演示科大讯飞学习机、翻译笔、办公本等硬件产品和讯飞输入法、讯飞听见 APP、虚拟人等软件产品的AI能力,展示了全线接入讯飞星火后,能够进行作文的评阅修改、英文语法、单词修改、文章润色等功能,以及科大讯飞语音识别翻译等技术,给不少用户带来了新功能的惊喜。
以讯飞星火为代表的认知大模型技术,注定会在人工智能领域、各行各业掀起新的变革。事实上,AI大模型此刻的光鲜亮丽,是众多科技企业多年的技术沉淀与积累。
短短几个月,国内就超过10来家企业推出了大模型产品,让人感觉到中国企业科技研发能力的强大。在充满不确定性的内外环境下,中国企业能够深耕认知AI,可以预见的是,在新一轮行业变革中,以百度、科大讯飞、昆仑万维、出门问问等为代表的中国企业已经站在了前沿。速途网期待更多中国企业的研究成果出现,还将持续关注国内最新的人工智能成果。