又是信息量爆棚的一周。AIGC领域重磅资讯持续涌现,不断冲击我们对人工智能的认知,改变了我们的日常生活。
3月29日,由量子位举办的中国AIGC产业峰会在北京举行。本次峰会以「Hello,New World」为主题,AIGC领域学界、产业界的专家学者共襄盛举,共同探讨生成新世界的过去、现在和未来。
昆仑万维CEO方汉受邀参会并发表演讲,分享昆仑万维在AIGC领域的布局和行业探索。站在从业者角度,方汉认为预训练大模型能力决定AIGC能力上限,并大胆预测“AIGC将彻底改变艺术创作的生产范式”。
▲方汉发表演讲▲
以下为方汉演讲的核心观点
UGC内容存在两个定律
AI会导致人类职业发展出现两极分化
ChatGPT的出现将AIGC的范畴泛化了,今天我的分享更多偏向于对AIGC原有含义即人类娱乐内容的生成方面进行探讨。
对于用户创造UGC内容的平台,如小红书,知乎、抖音、快手,用户创造内容的门槛每降低一倍,用户创造内容的数量就会增加10倍。这是UGC内容创作的第一个定律。
例如,在手机摄像头出现之前,人类拍摄视频一定是靠专业的摄像机和数码相机,但是自从手机出现之后,它将摄像门槛拉低,人类创造的视频数量极大爆发,在抓住手机摄像头和4G爆发之后,形成了快手和抖音,中国UGC领域迎来了巨大突破。
第二个定律,C端工具商业逻辑其实是社区,B端工具商业逻辑是功能完备性。C端的工具不只是为了做工具,而是让大家生产出来的内容通过社区分发,如用快手、抖音拍视频,这是C端工具逻辑。B端工具的商业逻辑,以功能完备性来获得用户的青睐,如Adobe的PhotoShop全家桶、微软Office全家桶。
AI技术的进展,将对内容生产领域产生巨大影响。不得不承认,现在AIGC对存量知识的理解与表达还远没有到100分水准,但到80分没有任何问题。如果人类的水平也只是80分,我们的工作一定会被AIGC替代,80分以上的人将去管理AIGC操作员,完成曾经需要腰部作者完成的工作。
未来可以预见,头部工作者的产量将极大提升,作为AIGC操作员的底部工作者的生产能力也会得到极大提升。我认为,腰部工作者大概率会被淘汰——腰部工作者要么力争上游做头部工作者,要不就老老实实成为AIGC操作员。
AIGC三种商业路径互为补充
预训练大模型能力决定AIGC能力上限
在AIGC领域,文生图领域出现了三种完全不同的商业模式:
1、stability.ai→开源生态
2、Midjourney →专业SaaS生态
3、Adobe Firefly→传统工具生态
这三种商业路径在AIGC领域,不论是文生图、文生图像、文生音乐、小说创作等都会长期存在,三种模式互为补充。
▲AIGC涌现三种商业路径对比▲
C端用户会倾向于使用Midjourney完成工作。如现在的电商从业者,大量使用 Midjourney 进行电商广告素材创作;Adobe firefly契合一些传统B端企业的需求,他们会使用Adobe Firefly来作为创作工具;stability.ai是一种开源模式,特别适合在这个领域进行创业的中小企业,通过开源模式来进行改装与改进,满足长尾需求,这是另外两个模式永远没有办法提供的功能。
开源大模型是商业闭源大模型的有力补充和替代。大家可以把ChatGPT想成早期的Windows,Windows存在是整个电脑商业软件的一个基石,也是绝大多数人的生产工具。Linux通过30年的努力把自己变成Windows的替代,Linux开源大模型也一定会出现。
只有开源模式可以满足用户的长尾需求。全世界所有的云厂商、大型互联网企业都以Linux为自己的服务底座,因为所有人要满足自己的长尾需求的时候,只有一个选择,就是用 Linux 进行改装。所以只有开源模式才可以满足中小企业的增长需求。
Stable Diffusion的出现比OpenAI DALL·E2晚了整整6个月。它在性能上、质量上都低于DALL·E2和 Midjourney,但依然有众多用户选择使用,因为它开源,进步速度难以想象。
它催生了ControlNet,T2I-Adapter、Composer,以及LoRA训练技巧,可控生成作为 AI 创作最后一道高墙,极有可能在可预见的时间内有进一步突破,从而极大地降低用户的创作成本,提高创作的可玩性。距离 ControlNet 开源仅仅过去两周,其官方Star就已经超过 1 万,这种热度无疑是空前的。
开源社区也极大地降低了用户的使用门槛。如Hugging Face平台提供了基础模型权重以及通用的模型训练框架diffusers,Stable-Diffusion-WebUI开发了完善的一套Demo平台,Civitai贡献了海量风格化LoRA权重。
我们还要注意,不能只盯着目前AIGC进展,认为预训练大模型已经突破传统AIGC范畴进入AGI领域,各种AIGC工具能力仍然受到预训练大模型限制,尤其GPT-4大模型出现之后这个现象更加突出,我觉得做AIGC领域的企业,对大模型的需求仍是非常强烈的。
AIGC会大量污染原创内容
版权问题、信息伪造问题迫在眉睫
技术的进步,会导致AIGC出现几个大问题。
首先,AIGC发展起来之后,优质内容是不是更加稀缺?因为AI生成的内容会大量污染原创的内容。
第二,如何解决大模型底座导致的偏见?OpenAI、ChatGPT生成的内容是存在偏见的,怎么解决大模型底座导致偏见对于内容生成上的问题,这是个值得关注的问题。
第三,版权问题、信息伪造问题,这方面要做的工作非常多。Adobe的Firefly提出了新的模式,它与作者达成了协议,通过model的收费给内容作者分成。在版权、信息伪造等方面,从监管到行业自律,我们可做的事情非常多,而且迫在眉睫。
关于未来AIGC的展望(仅指娱乐内容AIGC),我认为,首先AIGC对整个社会最大的意义是低成本终极解决方案,这一点毋庸置疑,所有人类都有消费内容、产生多巴胺的权力;第二,AIGC会涌现新的范式,彻底改变艺术创作的生产方式;最后,AIGC会推动内容生产的极大发展,使得VR和元宇宙变得更加可行。
· END ·
● 昆仑万维方汉:GPT-4的出现是人类进化史的第二次进化 2023年是硅基生命的元年
●AI的iPhone时刻到了 ChatGPT成为人类能力的放大器
●GPT-4来了,少数聪明的机构已经提前用上GPT-4了!
●宣布与OpenAI合作,昆仑万维旗下Opera浏览器将引入更多AIGC功能
●外媒报道昆仑万维ChatGPT进展 生成式AI大有可为
●看看AI眼里的春天