随着大模型技术迎来颠覆性突破,新兴AI应用大量涌现,不断重塑着人类、机器与智能的关系。
在昆仑万维「天工一刻」系列栏目中,我们将邀请学术专家、行业领袖对大模型产业热点、技术创新、应用案例进行深度解读,同时分享转载优秀的大模型行业文章,以飨读者。
2024年2月,Sora横空出世,一举打破了整个AI行业对于大模型文生视频技术的想象天花板。在全球热议之中,有关Sora、AIGC、中美AI差距、以及整个时代的AI红利,成为了人们的焦点话题。
本文原刊于中国网。在文章中,昆仑万维董事长兼CEO 方汉分享了关于“Sora对于内容产业意味着什么?中美的AI差距究竟有多大?AI产业的红利在哪?”等问题的思考。
2024年春节期间,由OpenAI发布的AI视频工具Sora就震撼了世界,其逼真的画面细节,以及远超同类水平的物理理解力、画面连贯性、主体稳定性,使得Sora瞬间引爆了全球。
首当其冲的是内容行业。
Sora一经发布,创意软件巨头Adobe股价应声暴跌7.41%,市值瞬间蒸发超百亿美元,创下500天内最大跌幅,网络上处处充斥着“插画师失业”“剪辑师失业”“作者失业”的焦虑气氛。
可另一方面,海量AI辅助创作的文案、图像、视频却又如雨后春笋般疯狂涌现:三天出版AI绘本、1小时速成AI有声书、一周手搓AI《西游记》……无数人通过AI辅助内容生成挖到了AIGC第一桶金。就在2月26日,CCTV-1正式开播了中国首部文生视频AI动画片——《千秋诗颂》。
图片来自:央视网
Sora对于内容产业意味着什么?中美的AI差距究竟有多大?AI产业的红利在哪?面对OpenAI,中国AI从业者还有机会吗?
“AI不仅是一个技术密集型行业,更是一个资金密集型的行业,投入非常大。OpenAI有了五年以上的工程积累,让其他公司在追赶的时候非常吃力,而且它不开源。”昆仑万维董事长兼CEO方汉说。
“但是,任何先进的技术,想长久保守机密非常困难。技术一定会随着时间推进而加速普及。技术上的门槛和工程上的经验,很快会被抹平。”方汉补充道。
昆仑万维董事长兼CEO 方汉
在这场AI浪潮中,昆仑万维的角色无疑是特殊的。
与大量“拿着锤子找钉子”、业务难以落地的AI创业公司不同,作为一家业务覆盖全球一百多个国家和地区,全球平均月活跃用户近4亿,手握AGI与AIGC、信息分发、社交娱乐及游戏等大量应用场景的上市公司,昆仑万维有着足够多的“钉子”亟待被解决,也有足够多的数据、用户、资源、以及GPU。
2023年8月,昆仑万维推出国内第一款AI搜索引擎“天工AI搜索”,奠定了中国AI搜索鼻祖的地位。
可另一方面,无论是社交、音乐、游戏、还是内容平台,这些昆仑万维赖以生存的主营业务,正是受到AI冲击最大的赛道。
对于昆仑万维而言,AI不是一场口头的“转型”,而是一场“Go Big or Go Home”的存亡之战。
“我不认同Sora就是AGI(通用人工智能),Sora跟AGI没关系。但这是文生视频的重要节点,它把这条路跑通了。很快,视频生产的成本将会大幅降低。”方汉说。
在内容生产行业,有这么一条规律:如果内容制作门槛降低1倍,那么内容创作者的创作数量将会增加10倍。
这是一条被产业多次验证过的定律。以短视频举例,随着通信技术从3G、4G迈向5G,再配合上手机处理器、摄像头、以及OS、触摸屏等一系列的技术创新,视频拍摄的门槛不断降低,短视频内容行业迎来惊人的爆发。
“一旦把(视频制作)门槛降下来,全民都在创作视频,UGC内容创作平台上的海量内容就会把PGC平台给淹没”,方汉说。
同样的故事正在AIGC领域悄然上演。
200元一张的淘宝模特图变成了0.02元的AI生成图片;经过专业调校的AI有声书足以以假乱真;在小红书上买4.9元的AI壁纸,半年涨粉大几万;AI孙燕姿一度成为B站上的“流量密码”……
甚至就在最近,李一舟《每个人的人工智能课》一年内卖出约25万套、网红艺术家“曾bobi”被指使用AI作画冒充原创等事件,都从侧面证实了AI生成内容的火爆。
2024年1月5日,昆仑万维发布了公司全新使命——“实现通用人工智能(AGI),让每个人更好地塑造和表达自我。”
图片来源:“天工AI智能助手”APP生成
这其中,“塑造自我”指的是通过AI实现个性化的终身学习、“表达自我”指的则是通过AI把人类创作门槛降得足够低,让人们更充分地实现自我表达。
“此前做视频的成本太高了。Sora出现之后,所有传统视频工作流上的人都会受到比较大的冲击。而且对内容行业的冲击最大,包括短视频、广告、影视等等。”方汉判断道。
随着AI的发展,内容行业将首先重塑、随即UGC的内容生产量迎来大爆发、而且会有AI时代的新型创作平台涌现。
“AI时代的终极应用一定是免费的To C内容创作平台。谁能最先跑通这个商业模式,谁就是下一个Tiktok。”方汉说。
一个困扰国内外几乎所有AI创业者的问题是,OpenAI似乎没有“边界”。
一直以来,OpenAI在AI文本领域始终“遥遥领先”。ChatGPT与GPT-4的推出让OpenAI在文本领域始终保持着SOTA地位,无人可出其右(SOTA,State of the art,常用于表示特定机器学习领域表现最好的模型或方法)。
在AI图像领域却不尽然。此前,Midjourney一直是OpenAI的有力竞争对手,谷歌Gemini更是直逼GPT-4V的领先地位。
这一直被外界认为是OpenAI的“边界”所在,也是各大创业公司的机会所在。
然而,Sora的推出让OpenAI绕过图像,一举夺下了AI视频的SOTA“圣杯”,再次向资本与看客强调了自身垄断性的领先地位,并通过“7万亿美元筹资AI芯片”计划赚足了人们的注意力。
SOTA带来的不仅是资源,还有对顶尖AI人才的吸引。
“OpenAI现在能招到硅谷最好的人。所有人都要先去试一把,然后再考虑其他公司。”方汉感叹地说。
方汉将这种在人才与资源上的垄断性地位概括为“SOTA红利期”。
SOTA红利期,指的是在核心技术或细分领域达到SOTA地位,从而能以近乎“收割”的姿态吃到最大的市场红利。
所有巨头都有过SOTA红利期,曾经最好的人才在微软、之后在谷歌、后来在Mata……如今在OpenAI。
没有人能永远SOTA,但永远有人成为SOTA。
当前,OpenAI凭借着在基础模型的突破性跃迁,吃下了全球最大的AI红利。
在昂贵的“烧钱运营”与密集的融资需求之间,OpenAI在短期内不能出现任何掉队的迹象,必须在几乎所有基础模型领域保持SOTA,才能坐稳“神坛”。
不过,OpenAI并非无所不能,人类历史上也没有任何一家企业能够永远保持高速发展。当前,在语音、图片、具身智能、小样本模型等算法领域,以及AI音乐、漫画、社交、自动驾驶等应用领域,还存在着大量空白生态位,等待着不同企业收获“垂类SOTA红利”。
大SOTA有大红利,垂类SOTA也有垂类红利。在尚未被超越的这段时间,SOTA企业必须像OpenAI一样,紧紧抓住红利窗口。
当前,昆仑万维已经构建了AI大模型、AI搜索、AI音乐、AI Story、AI游戏几大业务矩阵:是国内模型技术与工程能力最强、布局最全面的人工智能大模型企业之一。
“作为一家中等体量的科技公司,我们入局大模型早,目前基座模型能够做到全国前五。但是,在AI音乐、AI漫画技术领域,我们一直是国内的SOTA。”方汉说。
当前,昆仑万维面向国内市场推出了“天工AI智能助手”APP,面向海外市场则手握AI漫画、AI音乐、AI游戏Club Koala等多款面向C端用户的AI产品。
虽然公司极少在国内宣传海外业务,但其在海外已经取得了不俗的成绩。2023年前三季度,昆仑万维海外业务收入占比84%,业务已覆盖全球100多个国家和地区,全球平均月活跃用户近4亿人。
昆仑万维自研AI游戏Club Koala
昆仑万维旗下的AI游戏Club Koala是一款加入了UGC体系的派对游戏,玩家可以在其中自由设计游戏地图、关卡、虚拟形象。最吸引人的是,玩家可以在游戏中与拥有“自我意识与记忆”的AI NPC角色互动。这些AI NPC通过Atom系统控制行为,各自拥有不同的性格、愿望、回忆。该款游戏将在今年3月面向海外市场推出Beta测试版本。在海外,昆仑万维依托旗下信息分发及元宇宙业务Opera原生浏览器AI助手Aria,推出了一系列前沿AI功能,帮助海外用户提高效率并释放创造力。Aria已在包括欧盟在内的180多个国家和地区上线,用户突破百万大关。
在过去的一年里,昆仑万维的AI业务用“紧锣密鼓、如火如荼”来形容已经不足够了。
2023年4月,昆仑万维推出自研千亿级天工大模型;8月,昆仑万维推出国内第一款AI搜索引擎——天工AI搜索,成为国内AI搜索鼻祖;10月,开源天工Skywork-13B系列大模型;12月,发布AI Agent开发平台天工SkyAgents;2024年2月,发布新版MoE大模型“天工2.0”。
在此期间,昆仑万维的算法与产品都以周为单位飞速迭代,AI团队的规模迅速扩张到近千人规模,办公楼里人满为患,大半数会议室都被改成了工位,产研团队的楼层时常半夜里仍灯火通明,“每天都有新人入职”。
这种强烈的紧迫感一方面源自大模型技术的日新月异,另一方面也源自对行业的判断。
“2024年,大模型的窗口期就会关闭。如果做不到,就会出局。2025年行业格局会变得非常清楚。最大的变量就在2024年。”——在一次公司内部分享会中,昆仑万维创始人周亚辉曾经这样说过。
当前,基础模型赛道越来越“卷”,准入门槛也越来越高。正如前文所言,AI是一个资金密集型的行业,企业的前期投入非常大。当前,亿元投资、千卡储备,都只能勉强摸到基础模型的门边。在这个算力比黄金还要昂贵的时代,没有提前入局的企业,在GPU全球紧缺的大背景下,拿着钱都买不到卡。
昆仑万维是属于最早入局的那一批。
在23年Q3财报中,昆仑万维透露,截至季度末,公司此前采购及租赁芯片已到货约6000张,另外还有约 3000 张芯片待交付;同时,公司已投资了AI算力芯片公司北京艾捷科芯,完成“算力基础设施—大模型算法—AI 应用”全产业链布局。
除了产品团队、研发团队、算力储备的不断扩张外,2023年期间,昆仑万维武汉建立起了一个庞大的数据团队;并力邀AI知名学者颜水成教授加入,创建了总部位于新加坡的2050全球研究院。
对于昆仑万维而言,“All in AGI与AIGC”,做基于大模型的UGC平台,这是一场必须打赢的战役。
从Transformer、到Stable Diffusion、到RAG与MoE;从ChatGPT、到LLaMa、到Midjourney与Sora。在人类历史上,科技从未像今天这样,以一种令人眼花缭乱的速度刷新着个人认知,颠覆着每个行业。
最近在硅谷,一个称呼悄然流行——“后GPT时代(Post-GPT World)”。
后GPT时代,代表着人类对AI技术的探索、审视与反思;代表着人机关系底层逻辑的颠覆与重塑;也代表着新一代生产力的崛起。
也许,它还将代表着文明与冲突的范式发生改变。
在风靡全球的科幻作品《星际迷航》中,作者构建了这样一个世界,在遥远的未来,爱好和平的人类同众多外星种族一同战胜疾病、种族差异、贫穷、偏执与战争。跨越种族的生物通过万能翻译器相互交流与理解,人们携手探索宇宙,再弱小的文明也能够守护住自己的语言、文化与信仰。
“AIGC内容算法跑通、内容创作门槛降低之后,小众文化可能会更容易守住自己的信仰。”方汉说:“以前小语种是很难有自己文化传承的,因为创作者的人数少导致内容产能不够,慢慢就会被遗忘。但是AIGC内容创作工具出现之后,内容生产力迎来质的改变,少量创作者也可以用自己的语言、自己的文化去创造大量内容。我想看制作精良的电影大片,不会只能看英文的,我可以选择我自己文化的内容。”