8月15日,科大讯飞宣布讯飞星火认知大模型V2.0发布,包括代码能力和多模态能力升级,同时重磅推出讯飞智作2.0。
本次讯飞星火认知大模型V2.0升级发布会上亮点众多,从内容生产到多模交互,大模型应用场景持续突破。
如今,认知大模型成为通用人工智能全新曙光,但实际上,讯飞早就关注到了多模态智能大模型,并深耕多年。在今年4月份,科大讯飞就依托在语言及语音、图像、自然语言理解等底层技术的深厚积累,推出AIGC内容创作平台——讯飞智作,它是一个虚拟的“AI演播室”,通过简单地输入文稿,选定虚拟主播,即可一键完成音视频内容的输出。
在发布会现场,科大讯飞研究院院长刘聪向我们展示了使用讯飞智作进行虚拟人短视频生成、视频创作,“写一段黄山毛峰宣传文案,包括茶叶的产地、包装、色泽等特点”,一个推荐黄山毛峰的短视频就马上生成。
当下,互联网、多屏互动等技术飞速发展和海量音视频内容产出需求旺盛,搭载讯飞星火认知大模型2.0的讯飞智作将会给内容创作领域带来新的赋能。
讯飞智作可为各行各业定制专属的3D虚拟人方案,通过AI主播系统实现文字到音频以及视频的输出,结合相关的视频处理需求实现多轨混编,满足音视频内容快速生产的需求。作为讯飞AIGC内容创作基地,讯飞智作提供2D真人、专属3D虚拟人定制方案,从拍摄到最后的使用均有专业人员贴心服务,以保障最终使用效果,便于打造企业和个人品牌新势能。
讯飞星火多模态能力的升级也将为AIGC带来前所未有的产业机会,讯飞智作2.0进一步降低了短视频制作的门槛,能够满足更多元的视频制作需求,推动AIGC产业的发展。
多模态能力是赋能行业的刚需,也是实现通用人工智能的必经之路。科大讯飞深耕人工智能领域24年,近三年来,在多模态领域获得17个国际权威评测冠军。讯飞以独特的创新理念和超前的技术引领中国科技行业发展,成为大模型行业中一颗璀璨的明珠。