今年4月份,我参加了上海的AIGC(人工智能生成内容)创建者大会,当时对于趋势做了一些分享。具体可以参看文章《AIGC革命:拐点降临的内容产业,如何赢得时代先机》。
山雨欲来风满楼,将近半年过去了,现在趋势又会有怎么样的变化?技术迭代又给我们带来怎样的机遇?
如今,抖音、快手、微信视频号等短视频平台迅速崛起,短视频和推荐算法构建的信息茧房,已让许多人无法释手、难以自拔。
互联网行业有个普遍的共识:“视频的价值远超过图文和音频”。因为视频能在单位时间内传递更多维度的信息,这不仅带来了丰富的感官体验,还更容易建立情感纽带,从而实现较高参与度、较强社交传播力和更高的商业转化。如Youtube的贴片广告的变现价值和哔哩哔哩的弹幕的互动价值都是传统的图文和音频内容无法比拟的。
基于此,我们可以得出第一条公理:“在单位时间内,高信息密度内容的价值要远大于低信息密度内容的价值”。
然而,互联网视频内容的普及并非一蹴而就,2007年,我国网民数量是1.62亿,互联网的普及率只有12.3%。到了2023年,我国网民规模达10.79亿人,互联网普及率达76.4%,移动互联网人群成为了主力。
正如每一次量子跃迁都会释放出巨大的能量,新兴技术的普及也会带来巨大的红利。随着移动网络和智能手机的性能提升和普及,PC互联网时代跃迁至移动互联网时代,释放了巨大的增量市场,也孕育了新的内容创作和消费场景。
在PC互联网时代,由于网络环境和设备的限制,主要人群局限在日常使用电脑的学生和白领,UGC(用户生产内容)主要是图文形式,如人人网、天涯论坛、新浪博客和微博等。由于视频内容较高的制作门槛,更多是由专业人士通过PGC(专业生产内容)形式生产。
今天,普通人通过一台手机就可以随时随地制作视频和分享内容。如此低门槛的方式,引发了UGC内容爆发性增长。同时,移动社交网络兴起也为内容传播提供了新的平台,进一步推动了视频内容消费的频次和多样性。
正所谓:“旧时王谢堂前燕,飞入寻常百姓家”。正是因为PC互联网到移动互联网的变革,催生了从PGC到UGC转变,带来了今天内容产业的繁荣。
由此,我们可以得出第二条公理:“技术革新的普及大大降低了普通人的内容创作和消费的门槛,从而释放出巨大的市场增量价值。”
如今,强大的生成式AI让我们又一次站在了重塑内容产业格局的风口浪尖。ChatGPT、Midjourney、DALL-E、Stable Diffusion等生成式的AI大模型不断推陈出新,AI新应用也让人应接不暇。
当我们理解“内容信息密度”和“技术革新普及率”这两条公理之后,我们才能更好地去洞察这一切的变化,才能见微知著地做好趋势的判断。
随着Midjourney、Stable Diffusion技术的普及,制作AIGC图片已经成为众多创作者们兴趣爱好。但现在仅靠生成“1girl”的静态图像已不能满足日益增长的创作需求。在Stable Diffusion生态里,新的方法、论文和模型如雨后春笋般不断出现,AIGC的创作方式也在快速进化。
我们洞察到了几个新趋势:首先是以ComfyUI为代表的AIGC工作流程的革新,它为个性化创作内容带来了前所未有的便捷;其次,AnimateDiff引领的动画生成展现了动态内容创作的无限可能;最后,DreamGaussian所展现的3D内容生成正开辟着全新的视觉艺术领域。这些趋势预示着一个更加繁荣和多元的AIGC时代即将到来,同时也将带来更多的机遇。
在Stable Diffusion项目中,目前普遍流行的WebUI,如Automatic 1111,因其缺乏灵活性,让普通用户难以根据自己的想法构建完整的创作流程,也限制了用户对新方法和新模型的尝试。
新推出的ComfyUI正在改变这一切。它允许用户通过拖拽节点和连线的方式,将不同的模型、算法和参数组合在一起,形成一套自己的工作流,从而编织出更有创造力的AIGC内容。
这意味着,即使是无编程背景的用户,也能够高度灵活和个性化地使用Stable Diffusion进行创作。ComfyUI按需加载模块的设计方式,在保证灵活性的同时,也大大减轻了系统资源的消耗,让装有中低端显卡的电脑也能顺利运行。
AIGC的创意很重要,但AIGC工作流更具价值,因为这才是人类创造力的真正体现。让人惊喜的是ComfyUI还可以通过PNG图片共享完整的工作流信息。也就是说,用户不仅可以创造多彩的作品,还可以非常轻松地分享他们的创作流。这直接促进了优秀的AIGC工作流技巧在社区普及和传播,也将带来更多具有创意性内容。
ComfyUI不仅为Stable Diffusion带来了更高级的创作体验,它还为我们揭示了AIGC工作流的巨大潜力,预示着我们正步入一个更高效、更具共享性和创新性的AIGC创作新阶段。
因为创作者不满足于2D静态图像的生成,AnimateDiff应运而生,其目标是将Stable Diffusion的静态图片生成能力扩展到动画生成领域。这一工具可以无缝将文本或静态图像转化为高质量的个性化动画图像,免去了复杂的模型微调。
AnimateDiff之所以卓越,是因为它从大量视频中汲取了动作的先验知识,不仅确保了动画的流畅性、一致性和多样性,还能实现无可比拟的平滑过渡,几乎没有任何闪烁。
AIGC动画的优势在于其更高的自由度和容错性。创作者可以释放无限创意,打造出超越现实的艺术品。而且,它改变了传统动画对专业技能和资源的依赖,使非专业用户也能轻松参与。
这不仅是技术的巨大进步,更标志着创意表达方式的革新。现在,每个人都有机会成为宫崎骏,创作出令人惊叹的动画作品。
AIGC正从图片领域跃迁到视频领域,预示着新的内容创作浪潮的即将到来。就像我前几天在视频号分享的动画短片,利用AIGC技术,创作者不仅能吸引更多观众,还能获得视频的巨大流量和商业价值。这在传统图文媒介中是难以实现的,这是所有内容创作者都不应忽视的机遇。
同样因为不满足于2D图像生成,也有不少AIGC创作者也在探索如何将2D图像转化为3D形象和场景,因为3D有着比2D更高的灵活性和操控性。然而,传统的文字或图像生成3D算法耗时长、精度低,这严重阻碍了AIGC在3D领域的深入应用。
最近DreamGaussian横空出世,它实现了一种高效的文本和图片生成3D算法。它可以在短短两分钟内,从单一视角的图片中重建出高质量的纹理3D网格,其效率是现有技术的十倍之多。更难能可贵的是,尽管处理速度极快,但它在输出模型的质量上却毫不妥协,下图是老算法和新算法的渲染效率比较。
DreamGaussian通过采用创新的3D高斯喷洒技术,在虚拟空间中模拟粒子的自然运动,可以精确地构建3D模型。这种技术不只是还原物体的几何形状,还能捕捉其表面的细微纹理和色彩,展现了惊人的细节和还原度。该技术虽已展现出强大的潜力,但它的旅程才刚刚开始,在效率、精度和应用场景上仍然有一定的优化的空间。
通过与Stable Diffusion结合,DreamGaussian使内容创作者能够以前所未有的速度和创造力生产出高品质的模型,从而极大地加快了创作流程。更重要的是,3D内容生成技术将为各行各业开辟了新的应用路径。无论是电影和游戏产业的快速内容创建,还是产品设计和建筑领域的可视化原型设计。AIGC 3D将优化现有工作流程,降低成本并激发新的创意表达形式。
相信不久的将来,内容消费者能够在内容平台看到越来越多的AIGC 3D视频内容,能够在VR和AR体验中享受到更逼真、高质量的3D环境,实现前所未有的沉浸式体验和交互性。随着这一技术的不断成熟,我们预见一个更加丰富、精细、互动性强的元宇宙即将到来。
AIGC依然在飞速发展,正所谓“春江水暖鸭先知”,一线的AIGC创作者们已经敏锐地感知到这些趋势变化。AIGC的工作流程优化和内容形式迭代,正为创作者、投资人和创业者打开一片新天地。具体的产业机遇主要集中在以下几个方面:
未来,一个更加繁荣、多元的内容产业将会浮现。在这个产业中,个人创作者能够更自由地表达创意,观众可以享受到更加丰富和个性化的内容,而AIGC创作和服务需求也将因技术迭代和普及而迎来新的增长点。
我在《AIGC革命:拐点降临的内容产业,如何赢得时代先机》做了一个论断:如果你能够帮助更多人跨越鸿沟,那你在这个过程中也能获得巨大成功。
目前,AIGC技术还在迅速迭代,AIGC技术的使用门槛依然相对较高,但这正是巨大的市场机遇所在。那些能够构建桥梁,帮助大众跨越这一技术鸿沟的企业和个人,将站在价值转化的最前沿。但是将前沿科技应用到大众市场也并非易事。
“如何凭自己的能力找一个最容易撬动的价值杠杆,如何用最少的资源跑通一个可持续的商业模型?”依然是考验每一个创业者的难题。请记住这句话:找到你的客户最想要的需求和你能够做得最好的东西,并请专注于两者的交集。
我相信,无论是打造更友好的创作工具,还是通过提供教育和培训来降低AIGC的门槛,这些先行者都将收获属于这场技术革命的红利。
对于所有的创作者、创业者和投资者来说,现在正是深入了解这一趋势、积极参与并引领这场技术革命的最佳时机。让我们一起勇敢地踏上这条新的征程!
本文来自微信公众号“PM熊叔”(ID:pmxiongshu),作者:PM熊叔,36氪经授权发布。