年初Sora内测版出现之际,外界一度担心视频生成工具的普及,可能会杀死剪映这类视频剪辑工具的发展空间。10个月过去,事实证明,剪映们不仅没有被Sora杀死,反而还愈发得到了公司内部的重视。
近期,36氪《智能涌现》爆料称,剪映和即梦所在项目组,已经力压豆包,成了字节在AI领域的最优先级工程。
几乎同一时间,Sora正式版的发布,为字节的上述决定又侧面提供了有力注脚。
奥特曼和张一鸣,带领各自的公司,汇聚在“大力出奇迹”的方法论共识之下:在ChatGPT上被验证过的模型性能缩放法则(Scaling Laws),被奥特曼移植到视频领域后,被证明其“大力出奇迹”的策略仍然有效,即增加模型的大小将继续提高性能,进而有了Sora的诞生;在今日头条和抖音上被实践过的“大力出奇迹”方法论,如今又被张一鸣带到了AI领域,从而有了当下字节AI后来居上的对外表现。
但距离字节赢下这场AI竞赛还为时尚远。即便强如Sora,也面临ROI难题。相比年初内测版本的60秒视频生成时长,Sora正式版的视频生成时长被缩减到了5-20秒,且视频生成的数量也有所限制。
为了尽可能扩大收入,在Sora正式版发布之际,奥特曼还带来了一个订阅费高达200美元的ChatGPT Pro版本,以允许用户无限量使用o1模型和高级语音模式等。
如果想要彻底实现理想状态中Sora的样貌,即无限制的视频生成数量和视频生成时长,在奥特曼看来,前提之一便是储备充足的算力资源,仅仅是重塑全球半导体行业就需要筹集7万亿美元。
对于想要全力追赶视频生成赛道的字节而言,AI大模型这场比赛,可能比过去任何一场竞争都更考验着张一鸣在资源投入上的决心和毅力。
提前10个月转岗剪映的张楠,押对了AI这一增长法宝,并从一众内部竞争中暂时脱颖而出。
此前,有外媒报道称,字节从去年以来,就开始在内部组建多个小型AI产品团队,每个团队由10到15人组成,以开发新应用程序并相互竞争,来争取字节的资源支持力度。
如果将融入AI的剪映也视为一个AI产品,那么张楠无疑在字节AI赛马中占据了人数优势。2月7日宣布辞去抖音集团CEO一职的消息中,张楠称自己未来将把精力聚焦在剪映的发展上。彼时,界面新闻报道,过去一年,张楠已经把绝大多数精力倾斜到剪映相关业务上,并亲自带队寻求在AI辅助创作上有所突破,即将推出一个AI生图和视频的产品。
3个月后,张楠交出了自己转岗后的首份作业——支持图片和视频生成的即梦AI,后者成了张楠再造下一个抖音的机会所在。
根据《智能涌现》报道,字节管理层判断豆包等AI对话类产品可能只是AI产品的“中间态”,长期更理想的产品形式,大概率需要更视觉化的用户体验、更低的用户使用门槛。被提升产品优先级的即梦,被内部寄予了打造AI时代“抖音”的重任。
对即梦的上述重视,或许更早就已显现。11月,字节正式发布视频生成模型PixelDance和Seaweed时,即梦便拿下首发资格,成为公众免费体验的主要入口。
除了张楠再次迎来一个证明自己的机会之外,更重要的是,对于当下营收增速趋缓的字节而言,AI也有望成为其未来的新增长引擎。
据《晚点LatePost》报道,今年前三个季度,字节中国区单季度广告同比增速从40%左右跌至17%以内,过去两个季度均没有达成既定目标。
2021年11月,从张一鸣手中接任字节CEO半年后的梁汝波,开始重组组织架构,成立六个业务板块:抖音、火山引擎、大力教育、飞书、朝夕光年和TikTok。
但从去年11月以来,除了以火山引擎为代表的云服务尚保持业务和团队稳定外,字节其余业务板块相继遭遇发展阻碍——大力教育之外,朝夕光年为代表的游戏业务大裁员,飞书开始精简组织,TikTok也正面临美国封禁危机。
眼下,随着抖音这一增长引擎也开始变得动力不足,如何为字节这艘巨舰找到未来航行的新燃料,已成为一个不得不提前思考的问题。
OpenAI所掀起的AI大模型浪潮,成了一众互联网公司谋求新增长的良方。字节也不例外。
在奥特曼遵循Scaling Laws法则,用大力出奇迹的策略相继完善OpenAI产品布局之际,处于追赶状态的字节,也开足马力,将大力出奇迹的方法论,用到了AI上面:基础模型上,先后推出了豆包通用模型、豆包·角色扮演模型、豆包·语音合成模型、豆包·声音复刻模型、豆包·文生图模型、豆包·语音识别模型、豆包·视频生成模型等;产品上,相继布局了豆包、Cici、Coze、星绘、猫箱、豆包爱学、即梦等,涵盖了AI智能助手、AI社交、AI工具和AI教育、AI视频等主流应用赛道。
从ChatGPT上线到Sora正式版推出的2年时间,字节从AI大模型的落后生,一跃跻身国内一线梯队,张一鸣成了推动字节质变的那个关键先生。
2022年11月ChatGPT发布之后,百度、阿里等国内大厂相继在去年三四月份推出自研大模型文心一言和通义千问,但直到去年8月份,字节才对外亮相了云雀大模型(豆包大模型前身)。从2023年4月起,百度、阿里、腾讯相继通过旗下云服务对外提供大模型接入服务。直到一年后的2024年5月,字节自主研发的豆包大模型才开始通过火山引擎正式对外提供服务。
AI进展缓慢的现实,一度引得梁汝波在1月底新一期的All Hands(员工面对面)上,批评道:“公司层面的半年度技术回顾,直到2023年才开始考虑GPT,而业内做得比较好的大模型创业公司,都是在2018年至2021年创立的。”
改变从2023年开始。当年5月初,《中国企业家》杂志曝出,张一鸣正忙于研究OpenAI的一系列论文,并且常常读至深夜,“他想搞明白,太平洋对岸究竟发生了什么”,一位接近他的人士说道。
除了研读论文,张一鸣再次找回了当年创办今日头条时的状态,开始化身公司头号HR。据外媒报道,字节内部人士称,虽然已卸任公司CEO一职,但张一鸣一直在积极参与公司的AI战略,并亲自监督从竞争对手公司招聘中国AI工程师和研究人员。
由此,字节围绕AI开始内外排兵布阵:对内,2023年1月,组建首个大模型团队,并在去年12月组建AI新部门Flow,找来朱骏和朱文佳等负责业务推进;2月份张楠从抖音转岗剪映,也在某种程度上彰显出字节内部希望提速AI的迫切之心。
对外,字节正不惜重金挖AI人才,相继招揽了谷歌原 VideoPoet 项目负责人蒋路,零一万物原预训练负责人黄文灏,以及阿里通义大模型原技术负责人周畅。
尤其是对周畅的招揽。有消息称,字节跳动为争取周畅付出了8位数的年包工资。周畅的跳槽,也由此引发了一场字节和阿里两家公司的纷争。12月初,界面新闻报道称,通义前员工周畅因违反竞业协议跳槽字节,已遭到阿里起诉索赔。
这都成了张一鸣大力发展AI路上的插曲。一如昆仑万维创始人周亚辉所言,“去年字节的AI战略是不及格,但完全不影响今年的满分表现……这符合我对这个组织快速迭代能力(卷死人能力)的预期。”
与移动互联网时代相比,AI大模型时代,模型训练和推理成本构成了每一个入局玩家必须面临的增长陷阱。不断被OpenAI拉高的AI竞赛场,也将持续考验着张一鸣的投入决心。
无论是技术迭代,还是顶尖人才的招募,背后都需要真金白银打底,这都迫使身处大模型领域的厂商,必须尽快走向商业化。
那些实力不济的大模型玩家,在这场烧钱游戏中,或者被淘汰出局,或者被大厂收编。波形智能卖身OPPO的案例,成了这一残酷竞争的最新注脚。更早之前,明星创企Inflection、Character.AI、AI Agent独角兽企业Adept,纷纷迎来被大公司变相收购的命运。
商业化手段有限,叠加大模型训练和推理费用高昂,入不敷出的国内部分头部大模型玩家,此前甚至被传出退出预训练的消息。即便不想放弃预训练,一些大模型玩家也开始转变策略,开始放弃在国内烧钱做To C市场的策略,转向全力发展更容易见到回头钱的ToB领域。
商业化天花板有限,也成为字节内部将重心从豆包转向剪映和即梦的一大原因。
据QuestMobile数据,截止2024年10月,在移动端AI原生应用方面,豆包、Kimi智能助手、文小言月活跃用户分别为4839万、1650万、1179万。
即便顶着国内AI产品月活第一的名头,但豆包的用户时长并不乐观。《智能涌现》给出的参考数据中,豆包每周用户人均使用时长仅为10分钟左右。
更何况,最近几年的字节,也在告别扩张,开始不断强调“去肥增瘦”。
今日头条、抖音相继成功后,字节“大力出奇迹”的方法论,首次触礁发生在教育业务上。随着教育业务的收缩,字节由激进转向收缩。接替张一鸣出任字节全球CEO的梁汝波,更是直接用“去肥增瘦”为公司定调。
去年以来,字节“大力出奇迹”方法论更是频繁遇阻,相继裁撤两大重点业务:游戏板块朝夕光年大幅裁员,仅保留少量人员运营已上线项目、探索创新方向;VR板块PICO近2000员工,超过半数或转岗或被裁。
眼下,对大模型的大举投入,成了验证字节大力出奇迹方法论的一次新考验。
《字节内部判断AI对话类产品天花板可能不高,提升剪映即梦优先级》智能涌现
《中国大模型生存战:巨头围剿,创业难熬》晚点LatePost
《Sora会“杀死”剪映吗?》字母榜
《河马爱学并入豆包,字节打造AI产品全家桶》Tech星球
《QuestMobile 2024年AI智能体市场发展观察》QuestMobile
本文来自微信公众号“字母榜”(ID:wujicaijing),作者:赵晋杰,36氪经授权发布。