在8月15日,科大讯飞如期发布了备受期待的“讯飞星火认知大模型V2.0版本”(以下简称为“星火V2.0”)。据悉,星火V2.0在代码能力和多模态能力方面实现了显著的提升,为人工智能技术的发展和应用带来了更多的可能性。
会上,据科大讯飞董事长刘庆峰介绍,在业界参考测试集上的效果对比中,星火V2.0在基于Python和C++进行代码写作方面的能力已经非常接近ChatGPT,两者之间的差距仅有1%和2%。这一数据充分证明了星火V2.0在代码生成和编程方面的优秀表现,也为其在实际应用中的表现提供了有力的保障。
现场演示代码生成全过程
科大讯飞在发布会现场展示了星火大模型最新的代码能力。演示人在现场向星火大模型下达了一段指令,要求用Python完整实现以下功能:判断输入字符串是否符合代码规则,密码规则为长度不小于8位,必须包括大小写字母、数字及特殊符号。随后,星火大模型给出的代码在系统中顺利运行并得到验证。在现场演示中,星火大模型甚至完成了“贪吃蛇”游戏的代码生成,并成功运行游戏。
据透露,在科大讯飞内部,星火V2.0的代码采纳率提升了30%,编码效率提升了30%,综合效率提升了15%。这些数据表明,星火V2.0在大模型开发和应用方面取得了显著的成果,为用户提供了更加强大和便捷的代码处理能力。
现场展示多模态能力提升,
星火V2.0的多模态能力主要体现在于其在图像描述、图像问答、识图创作、文图生成、虚拟人合成等方面。 在现场演示环节,演示者甚至直接现场拍摄会场照片,抛给星火V2.0识别并令其作出描述。星火V2.0随后将发布会现场描述为一个“重大而正式”场景,同时将并不清晰图片中的文字获取,写出相应文案。
此外,基于多模态能力升级,科大讯飞还同时发布了“讯飞智作2.0”工具。这一工具能够进行视频分析,写创意文案,进行AI配音,提供配图生成、AI主播功能。在现场演示中,讯飞智作2.0直接为一段视频配上字幕、并生成虚拟主播以及语音配音,大幅度提升图文创意、视频配音和视频制作工作效率。
明年上半年的重头戏——对标GPT4
据了解,星火大模型的下一个重要节点是今年10月24日。按照此前的规划,星火大模型将实现对ChatGPT的中文超越和英文相当。这一目标的实现将标志着星火大模型在全球范围内的竞争力得到了进一步提升。刘庆峰还表示,讯飞星火代码能力明年上半年将正式对标GPT4。
随着星火大模型的不断发展和优化,讯飞人工智能开放平台的开发者团队数量也在迅速增长。在未来几个月内,我们有理由相信,星火大模型将在中文自然语言处理领域取得更多的突破和成果,为用户提供更加智能和便捷的服务。