国产大模型迎来又一次阶段性升级。
8月15日,科大讯飞如期发布“讯飞星火认知大模型V2.0版本”(简称:星火V2.0),迎来代码能力和多模态能力的大幅提升。前者是支撑认知大模型智慧的关键维度,后者可以生成多种不同形式的数据,例如图像、语音、文本等,以及它们之间的组合和交互,从而扩展模型的应用场景,提高数据的多样性和丰富性。
科大讯飞董事长刘庆峰表示,从业界参考测试集上的效果对比来看,星火V2.0基于Python和C++两种编程语言行代码写作能力已高度逼近ChatGPT,差距仅为1%和2%。同时,他明确了星火大模型远期目标:到10月24日,星火大模型代码能力全面超越ChatGPT,明年上半年将正式对标GPT4。
在现场演示中,星火大模型不但能现场写出一段代码在系统中顺利跑通,并可以利用编程语言处理处理一段长达2分钟的视频,从中提取第二到第十秒,把画面缩小一半,同时加速5倍,然后保存成gif图片。大模型还完成了“贪食蛇”游戏的代码生成,并令游戏流畅运行。
在刘庆峰看来,代码是一项硬碰硬的能力,不存在任何主观评分标准,所以其也被视为大模型聪明程度的重要标志。根据GitHub数据显示,92%的美国程序员正在使用 AI工具。国海证券认为,代码能力的提升将进一步提升大模型的用户规模。
星火V2.0另一重大升级则在多模态能力方面。据了解,这一最新版本在图片理解、图片描述、图片推理、文图生成、虚拟人合成等能力取得重要进展。在现场演示环节,演示者直接现场拍摄会场照片,抛给大模型识别并令其作出描述。大模型随后将发布会现场描述为一个“重大而正式”场景,同时将并不清晰图片中的文字获取,写出相应文案。
基于多模态能力升级,科大讯飞发布“讯飞智作2.0”工具,该工具能进行视频分析,写创意文案,进行AI配音,提供配图生成、AI主播功能。同时,公司宣布联合华为推出讯飞星火一体机,支持企业在国产自主创新的平台上进行私有化部署,保护数据安全。
记者注意到,为冲刺目标,公司的相应激励机制也随之改变。近日,科大讯飞对2021年股票激励计划第三个行权期的业绩考核指标进行修订,加入了关于大模型技术先进性考核,其一是完全基于国产自主可控算力平台,实现通用人工智能“讯飞星火认知大模型”的训练和推理;其二是在性能上,对标 ChatGPT(指GPT3.5),中文超越,英文相当,处于国内领先水平。同时,如果业务2023年营收对比2020年增长率超过50%至70%以上,也分别对应了相应的行权比例。