当前位置:首页|资讯

腾讯混元技术负责人刘威离职创业,又一巨头暂缓Sora的故事

作者:周鑫雨发布时间:2024-11-19

文|周鑫雨

编辑|苏建勋

《智能涌现》从多名独立信源处获悉,原腾讯AI Lab计算机视觉中心负责人、混元大模型技术负责人之一刘威于近日离职。

此外,AI Lab计算机视觉中心暂时由AI Lab副主任俞栋管理。

对上述信息,截至发稿前,腾讯官方暂无回应。

多名从业者对《智能涌现》表示,刘威已经在新加坡创业,瞄准的还是视频生成领域

原腾讯AI Lab计算机视觉中心负责人、混元大模型技术负责人刘威。图源:腾讯AI实验室微信公众号

在腾讯,具有“杰出科学家头衔”的刘威,最为人所知的身份是腾讯混元大模型的技术负责人之一。

此前,他曾任腾讯广告多媒体AI中心总监,带领团队基于混元大模型,研发了广告多媒体AI技术矩阵,提高了腾讯的广告转化效果和广告制作效率。

种种迹象表明,在验证落地场景和商业模式前,腾讯对视频生成的投入还十分谨慎。

一名从业者表示,图像、音频是目前腾讯多模态研究的重点:“技术成熟,成本可控,而且比较容易找场景。”比如,2024年11月,微信公众号最新版本上线了“朗读音色”功能,用AI实现了音色克隆。

“在腾讯,目前CV研究的主力在混元团队。但总体而言,腾讯对视频生成的人力和资源投入还不是很大。”上述从业者表示。

另有相关人士表示,腾讯AI Lab计算机视觉中心所配备的人力向来很少,刘威创业后又带走了多名成员,“总体而言,AI Lab对视频生成很佛”。

有关是否大力投入视频生成模型,如今中国互联网公司已经分成了泾渭分明的两派:

大举投入派,以字节跳动和快手为代表。2024年6月,快手发布了效果轰动一时的“可灵AI”;同年9月,不甘人后的字节一口气发了两款视频生成模型:Seaweed和PixelDance。

这些公司的特点在于,具有丰富的视频数据资源,以及能立刻与视频生成技术相结合业务场景。

而另一暂缓投入派,如百度,则对目前视频模型的商业回报,持有较为消极的态度。

此前《智能涌现》曾独家报道,在2024年Q3总监会上,百度董事长兼CEO李彦宏明确表示,Sora这种视频生成的投入周期太长了,10年、20年都可能拿不到业务收益,那么无论多么火爆,百度都不去做。

而腾讯对视频生成模型的态度天平,也正在向保守和观望倾斜。在明确落地场景和商业化回报之前,“类Sora”的视频生成模型还不会成为腾讯挺进的领域。

欢迎交流!


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1