随着“腾讯智影”的出现,AIGC创作领域或迎来加速时刻。
01
AI智能创作助手 “腾讯智影”来了
"大家好,我是数字人大亨,很荣幸能够与大家探讨一个备受关注的话题:AIGC(AIGC即AIGenerated Content,是指利用人工智能技术来生成内容)是否能代替人类进行创作?历史证明,人类的创造力和创作风格是随着时代和技术革新不断演进的。在内容创作,尤其是创作优质个性化内容方面,AIGC和人类的协同是非常必要的一环。
3月底,在2023新榜大会上,腾讯内容平台部副总经理姚天恒通过他的数字人"大亨”做了这样的演讲开场。令人关注的是,这个数字人不仅在形象上高度逼真,而且在语音、语调、唇动等方面也非常真实,甚至连姚天恒惯常的表情和动作都毫不马虎地模拟了出来。
数字人“大亨”是以姚天恒真人为原型打造,采用腾讯智影最新人工智能技术,通过深度学习他本人少量的真实音频、视频数据生成的分身模型。借此机会,腾讯也正式对外发布了全新的AI智能创作助手“腾讯智影”,通过为内容创作者提供一系列的智能创作工具,帮助创作者在内容创作时提质增效。
02
藏在微信里的AIGC工具
腾讯在AI领域的动作很快,距离腾讯在2022全年业绩财报电话会上坦言AI“非常令人兴奋”,并表态未来可能将AI纳入微信和QQ,刚刚过去一周时间,腾讯就分别在博鳌亚洲论坛2023年年会“下一代互联网”论坛上透露正在研发类ChatGPT聊天机器人,并且集成集成到QQ、微信,以及腾讯云的版本“都会有”,以及正是在“2023新榜大会”上发布“腾讯智影”。
然而,很多人都没想到“腾讯智影”发布的第一时间,人们久可以在微信小程序中找到并体验,与此同时,用户还可以使用PC浏览器登陆zenvideo.qq.com开启“腾讯智影”平台,以获得更便利的操控体验。
在官方主页可以看到,腾讯智影主要提供“人”“声”“影”三个方面的能力。其中在“人”的方面,“智影数字人”是腾讯智影最核心的功能。用户可通过输入文本或音频内容,即可生成数字人播报视频。根据用户差异化的应用需求和场景,“腾讯智影”又细分为视频剪辑、文本配音、数字人播报、视频审阅等多个功能。
具体而言,在“人”的方面,“智影数字人”是腾讯智影最核心的功能。用户可通过输入文本或音频内容,即可生成数字人播报视频;在“声”的方面,腾讯智影则提供了文本配音、音色定制、智能变声等功能;在“影”的方面,通过腾讯智影文章转视频能力,创作者可以直接将自己撰写的文字转化为视频内容,无需进行繁琐的素材收集和处理;此外,腾讯智影分段式的素材呈现方式,让创作者可以快速处理分镜、添加卡点、滤镜、特效等,从而大大缩短视频制作的周期和成本。
如此强大的功能,再凭借腾讯微信小程序的覆盖面,自然在第一时间成为市场关注的焦点。
03
让人人都能实现数字人自由
相较其他视频剪辑工具,“智影数字人”是腾讯智影最核心的功能。用户只需要输入文本或音频内容,几分钟内即可生成数字人播报视频,极大降低了“数字人”生成门槛,也成为本次体验的重点。
在“腾讯智影”主界面点击“数字人播报”后即可打造属于自己的数字人主播。用户首先需要选择相应的数字人形象(提供2D和3D两个类别可供选择)后,即可进入数字人创作界面。
这里要提醒大家的是“腾讯智影”需要在Chrome浏览器进行访问,即便是腾讯QQ浏览器也会提示PC用户更换浏览器进行工作。在3D主播生成界面可以看到,左侧主要是工具栏界面,数字人、背景、配乐等细节都可以单独编辑,以“数字人编辑”为例,用户可以对3D主播的形象及动作、画面、字幕等细节进行个性化打造。
从服装样式、服装颜色、人物姿势到动作,“腾讯智影”都提供了预设模式给用户选择,用户只需要根据个人偏好进行点选即可,上手非常快。
追求易用性的同时,“腾讯智影”在细节上并没有完全“放权”。用户可以选择3D数字人各种动作表达,配合文字内容形成自然、连贯的播报,但数字人具体发型、面部表情其实是没办法做个性化定制的,不过在“高级编辑”中,用户还是可以上传自己的视频、音频和图片资料,进而强化数字人主播内容的差异化。
不过目前“腾讯智影”只对免费用户开放了部分体验功能,其余大部分需要用户付费使用。如免费版,可以获得每个月5分钟的免费数字人生成视频时长,每天3次的智能工具使用等;398元一的年高级会员是每个月10分钟的数字人生成视频时长或高级+专业音色的文本配音服务二选一,以及每天50次的智能工具等。而在数字人定制上,目前照片定制数字人形象的价格为首年3999元,视频定制数字人形象的价格为首年7999元。
值得一提的是“腾讯智影”内部已经嵌入了金币体系,部分服务需要使用“金币”付费,而金币除了注册时赠送的1000金币外,还可通过签到等活跃行为获得。
04
强悍的工具属性
抛开数字人的打造,“腾讯智影”本身是一款影音剪辑工具,对于不少“小白”用户而言,其在文本配音、视频剪辑等方面的工具属性更具实用性。
在“腾讯智影”主界面中点击“文本配音”后进入相应编辑界面,在顶部菜单栏找到“导入文本”的选项,平台支持doc、docx、txt等格式的文本,默认文本上限 8000个字,注意满足半小时左右的配音需求了。
不同于其他视频剪辑软件,用户能对配音的节奏(整体速度、局部速度),发音等等进行调教,最为强大的地方是智影“文本配音”支持不同句,不同字添加不同配音的,比如旁白、开场、小会的话都可以选用不同的人声。
除配音功能非常人性化外,“文本配音”本身预置了舒适款配音素材可选,用户可以根据视频配音、文章播报、新闻播报、有声小说、语音助手等分类快速选择最适合自己的配音模板,而且顶部还有语气和情绪的分类,再加上“百变”标签人物下的方言选项,足以为用户带来灵活多变的文本配音。
而对于高阶玩家,“文本配音”还提供了“定制专属音色”服务,系统可根据用户上传音色进行“声音复刻”,从而打造独一无二的配音。
除了极其强悍的配音功能外,视频剪辑也是“腾讯智影”的基础功能。从素材到音轨,从转场到特效,“腾讯智影”的视频剪辑功能可以说是相当强大,无论是初学者还是专业剪辑师都能快速上手。
素材和快捷键可以说是“腾讯智影”剪辑功能的一大特色,在轨道区进行创作,免不了对素材进行雕琢,智影目前已具备十余种种素材调整操作功能,而且右上角的快捷键栏也上线30余个预设快捷键,极大提升了剪辑效率。
05
趣味十足的微信小程序
相对功能强悍的PC版,微信“腾讯智影”小程序同样能够实现数字人、智能配音等热门功能,但受限于手机操作空间,视频剪辑等功能并非其主打,而是引入了当下最热门的“AI绘画”。
进入AI绘画页面后,发现“腾讯智影”在绘图方面支持文本生图和图生图两种生成方式,其中图生图只能生成动漫风格一种风格,但可以额外添加文字修饰,以更加准确地生成自己想要的效果。
而文本生图支持的风格则比较多元,有2D动漫、2.5D动漫、国风、彩漫、素描、线稿、人像特写、油画、印象派共9种,比较遗憾的是暂时只支持生成人像。从最终生成效果来看,“AI绘画”最终成像效果还是比较让人满意了。
总体而言,“腾讯智影”本身并非全新产品,本次在AI上的升级,让其不仅兼顾了市场上已有的功能,而且更是从一个视频创作工具升级为“智慧”的创作助手,无疑能进一步解放短视频创作者生产力,更让入门级用户也能通过数字人践行自己的想法,极大推动了AIGC内容产业落地。
06
迎接人工智能的下一个时代
从引爆AI作画领域的DALL-E 2、StableDiffusion等AI模型,到以ChatGPT为代表的接近人类水平的对话机器人,AIGC不断刷爆网络,其强大的内容生成能力给人们带来了巨大的震撼。学术界和产业界也都形成共识:AIGC绝非昙花一现,其底层技术和产业生态已经形成了新的格局。
就内容生产而言,AIGC作为新的生产力引擎,让我们从过去的PGC、UGC,已经不可避免地进入AIGC时代。AIGC代表着AI技术从感知、理解世界到生成、创造世界的跃迁,正推动人工智能迎来下一个时代。
经过了2022年的预热,2023年AIGC领域将迎来更大发展。AIGC生成内容的类型不断丰富、质量不断提升,也将有更多的企业积极拥抱AIGC。
AIGC的大爆发不仅有赖于AI技术的突破创新,还离不开产业生态快速发展的支撑。在技术创新方面,生成算法、预训练模型、多模态技术等AI技术汇聚发展,为AIGC的爆发提供了肥沃的技术土壤。
AIGC领域目前呈现AIGC的内容类型不断丰富、内容质量不断提升、技术的通用性和工业化水平越来越强等趋势,这使得AIGC在消费互联网领域日趋主流化,涌现了写作助手、AI绘画、对话机器人、数字人等爆款级应用,支撑着传媒、电商、娱乐、影视等领域的内容需求。目前AIGC也正在向产业互联网、社会价值领域扩张应用。
AIGC技术让聊天机器人接近人类水平日益成为现实,当前以ChatGPT为代表的聊天机器人已经在刺激搜索引擎产业的神经,未来人们获取信息是否会更多通过聊天机器人而非搜索引擎?这已经使谷歌等公司面临的巨大压力。
AIGC也在大大提升数字人的制作效能,并且使其更神似人。比如腾讯AI LAB的虚拟歌手AI艾灵,能够基于AIGC实现作词和歌曲演唱。在元宇宙领域,AIGC在构建沉浸式空间环境、提供个性化内容体验、打造智能用户交互等方面发挥重要作用。比如,扎克伯格在元宇宙的岛屿上,可以通过发出语音命令生成创造海滩、变换天气,添加不同的场景等。
而只有借助AGIC,元宇宙才可能以低成本、高效率的方式满足海量用户的不同内容需求。