近日,我国首部文生视频AI系列动画片《千秋诗颂》在中央广播电视总台(以下简称总台)央视综合频道首播。
据了解,去年7月,上海AI实验室联合中央广播电视总台联合发布了首个专注于视听媒体内容生产的AI大模型——央视听媒体大模型。利用央视听大模型,《千秋诗颂》从美术设计到动效生成,再到后期成片,均有AIGC辅助制作的身影。
《千秋诗颂》截图
《千秋诗颂》是首部在电视上播出的AI动画片,由大模型赋能, AIGC辅助制作,集合了总台海量视听数据与上海人工智能实验室的技术优势,应用实验室视频生成大模型书生·筑梦、文生视频框架AnimateDiff及多项可控图像生成、图像驱动等技术。
上海AI实验室相关研究人员告诉南都记者,为了让央视听媒体大模型具备理解古诗词的能力,节目导演与科研人员对大模型“投喂”了大量精准数据并进行训练,使其可精确生成符合历史依据的人物、建筑、场景等美术图,美术风格符合中华传统文化的水墨、工笔等风格化传统审美。
导演团队在创作中坚持以史实为基础,片中的建筑、酒具器皿、摆件等道具的创作依据源自博物馆现存文物及图片。运用人工智能相关技术,研究团队对这些文物进行动画复原,让文物“活”了过来。在人物方面,服饰及相貌由真人装扮后通过AI进行动画转化完成,而针对五官特点等更为精细的内容,则由后期团队“精雕细琢”完成。
上海AI实验室相关研究人员透露,基于上海AI实验室书生通用大模型体系强大的语言能力、宽广的知识体系以及优秀的开放世界理解和内容生成能力, 央视听媒体大模型能够理解古诗词含义,检索诗人生平,并生成脚本等文稿内容。
《千秋诗颂》导演认为,“AI不是要替代人类,而是帮助人类提升了效率。比如,传统的纯人工制作,我们团队一个月只能做一集,现在一个月可以做三集。”
上海AI实验室相关研究人员告诉南都记者,作为一款融合文本、图像、视频等多模态数据的视频生成大模型,书生·筑梦支持“文生视频”与“图生视频”多样化任务,所生成视频具备“转场流畅、故事连贯、画质高清”特质。
书生·筑梦转场视频生成能力,可根据提示词和扩散模型为多段视频场景自动生成转场视频,从而实现不同场景和视频之间的“丝滑”连接。在主体一致性模块的作用下,所生成视频可呈现“多机位”效果,使长视频中的故事一致性成为可能。同时,书生·筑梦可直接输出2K画质及24FPS帧率标准高清视频。
据了解,凭借全面的通用化能力,书生通用大模型体系积极为科研创新提供支持,为产业应用赋能。目前,书生大模型在助力基础科学、自动驾驶、智慧医疗、实景三维、气象预报、文化传媒、金融财经、智能客服等多个产业和领域的智能化进程。
采写:南都记者 汪陈晨 马宁宁