当前位置:首页|资讯|AIGC|Midjourney

昆仑万维方汉:预训练大模型能力决定AIGC能力上限

作者:昆仑万维集团发布时间:2023-03-29

原标题:昆仑万维方汉:预训练大模型能力决定AIGC能力上限

又是信息量爆棚的一周。AIGC领域重磅资讯持续涌现,不断冲击我们对人工智能的认知,改变了我们的日常生活。

3月29日,由量子位举办的中国AIGC产业峰会在北京举行。本次峰会以「Hello,New World」为主题,AIGC领域学界、产业界的专家学者共襄盛举,共同探讨生成新世界的过去、现在和未来。

昆仑万维CEO方汉受邀参会并发表演讲,分享昆仑万维在AIGC领域的布局和行业探索。站在从业者角度,方汉认为预训练大模型能力决定AIGC能力上限,并大胆预测“AIGC将彻底改变艺术创作的生产范式”。

▲方汉发表演讲▲

以下为方汉演讲的核心观点

UGC内容存在两个定律

AI会导致人类职业发展出现两极分化

ChatGPT的出现将AIGC的范畴泛化了,今天我的分享更多偏向于对AIGC原有含义即人类娱乐内容的生成方面进行探讨。

对于用户创造UGC内容的平台,如小红书,知乎、抖音、快手,用户创造内容的门槛每降低一倍,用户创造内容的数量就会增加10倍。这是UGC内容创作的第一个定律。

例如,在手机摄像头出现之前,人类拍摄视频一定是靠专业的摄像机和数码相机,但是自从手机出现之后,它将摄像门槛拉低,人类创造的视频数量极大爆发,在抓住手机摄像头和4G爆发之后,形成了快手和抖音,中国UGC领域迎来了巨大突破。

第二个定律,C端工具商业逻辑其实是社区,B端工具商业逻辑是功能完备性。C端的工具不只是为了做工具,而是让大家生产出来的内容通过社区分发,如用快手、抖音拍视频,这是C端工具逻辑。B端工具的商业逻辑,以功能完备性来获得用户的青睐,如Adobe的PhotoShop全家桶、微软Office全家桶。

AI技术的进展,将对内容生产领域产生巨大影响。不得不承认,现在AIGC对存量知识的理解与表达还远没有到100分水准,但到80分没有任何问题。如果人类的水平也只是80分,我们的工作一定会被AIGC替代,80分以上的人将去管理AIGC操作员,完成曾经需要腰部作者完成的工作。

未来可以预见,头部工作者的产量将极大提升,作为AIGC操作员的底部工作者的生产能力也会得到极大提升。我认为,腰部工作者大概率会被淘汰——腰部工作者要么力争上游做头部工作者,要不就老老实实成为AIGC操作员。

AIGC三种商业路径互为补充

预训练大模型能力决定AIGC能力上限

在AIGC领域,文生图领域出现了三种完全不同的商业模式:

1、stability.ai→开源生态

2、Midjourney →专业SaaS生态

3、Adobe Firefly→传统工具生态

这三种商业路径在AIGC领域,不论是文生图、文生图像、文生音乐、小说创作等都会长期存在,三种模式互为补充。

▲AIGC涌现三种商业路径对比

C端用户会倾向于使用Midjourney完成工作。如现在的电商从业者,大量使用 Midjourney 进行电商广告素材创作;Adobe firefly契合一些传统B端企业的需求,他们会使用Adobe Firefly来作为创作工具;stability.ai是一种开源模式,特别适合在这个领域进行创业的中小企业,通过开源模式来进行改装与改进,满足长尾需求,这是另外两个模式永远没有办法提供的功能。

开源大模型是商业闭源大模型的有力补充和替代大家可以把ChatGPT想成早期的Windows,Windows存在是整个电脑商业软件的一个基石,也是绝大多数人的生产工具。Linux通过30年的努力把自己变成Windows的替代,Linux开源大模型也一定会出现。

只有开源模式可以满足用户的长尾需求。全世界所有的云厂商、大型互联网企业都以Linux为自己的服务底座,因为所有人要满足自己的长尾需求的时候,只有一个选择,就是用 Linux 进行改装。所以只有开源模式才可以满足中小企业的增长需求。

Stable Diffusion的出现比OpenAI DALL·E2晚了整整6个月。它在性能上、质量上都低于DALL·E2和 Midjourney,但依然有众多用户选择使用,因为它开源,进步速度难以想象。

它催生了ControlNet,T2I-Adapter、Composer,以及LoRA训练技巧,可控生成作为 AI 创作最后一道高墙,极有可能在可预见的时间内有进一步突破,从而极大地降低用户的创作成本,提高创作的可玩性。距离 ControlNet 开源仅仅过去两周,其官方Star就已经超过 1 万,这种热度无疑是空前的。

开源社区也极大地降低了用户的使用门槛。如Hugging Face平台提供了基础模型权重以及通用的模型训练框架diffusers,Stable-Diffusion-WebUI开发了完善的一套Demo平台,Civitai贡献了海量风格化LoRA权重。

我们还要注意,不能只盯着目前AIGC进展,认为预训练大模型已经突破传统AIGC范畴进入AGI领域,各种AIGC工具能力仍然受到预训练大模型限制,尤其GPT-4大模型出现之后这个现象更加突出,我觉得做AIGC领域的企业,对大模型的需求仍是非常强烈的。

AIGC大量污染原创内容

版权问题、信息伪造问题迫在眉睫

技术的进步,会导致AIGC出现几个大问题。

首先,AIGC发展起来之后,优质内容是不是更加稀缺?因为AI生成的内容会大量污染原创的内容。

第二,如何解决大模型底座导致的偏见?OpenAI、ChatGPT生成的内容是存在偏见的,怎么解决大模型底座导致偏见对于内容生成上的问题,这是个值得关注的问题。

第三,版权问题、信息伪造问题,这方面要做的工作非常多。Adobe的Firefly提出了新的模式,它与作者达成了协议,通过model的收费给内容作者分成。在版权、信息伪造等方面,从监管到行业自律,我们可做的事情非常多,而且迫在眉睫。

关于未来AIGC的展望(仅指娱乐内容AIGC),我认为,首先AIGC对整个社会最大的意义是低成本终极解决方案,这一点毋庸置疑,所有人类都有消费内容、产生多巴胺的权力;第二,AIGC会涌现新的范式,彻底改变艺术创作的生产方式;最后,AIGC会推动内容生产的极大发展,使得VR和元宇宙变得更加可行。

· END ·

● 昆仑万维方汉:GPT-4的出现是人类进化史的第二次进化 2023年是硅基生命的元年

AI的iPhone时刻到了 ChatGPT成为人类能力的放大器

GPT-4来了,少数聪明的机构已经提前用上GPT-4了!

宣布与OpenAI合作,昆仑万维旗下Opera浏览器将引入更多AIGC功能

外媒报道昆仑万维ChatGPT进展 生成式AI大有可为

●看看AI眼里的春天


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1