9月24日下午,字节跳动旗下云服务平台火山引擎在深圳发布基于自研豆包大模型的视频、音乐生成模型和同声传译模型。其中,两款视频生成大模型——“豆包视频生成-PixelDance”“豆包视频生成-Seaweed”同时面向企业市场开启邀请测试。
阿里价格跟我们一样了
“阿里大模型的价格终于降到跟我们一样了。”9月24日下午,火山引擎总裁谭待在接受媒体采访时表示,大模型降价,刺激了企业调用各家模型的需求,因而激活了国内AI应用层的创新。
5月,豆包大模型公布时以低于行业99%的定价,掀起国内大模型降价潮。阿里的Qwen大模型、腾讯的混元大模型等纷纷跟进。
谭待指出,这本身并不是单纯在打价格战,把应用做起来本身就需要厂商把成本降到合理的价格,“行业降价后,成本不再是创新的阻碍,下一步要做的是提升模型质量和性能,而且要越来越多元,软件也就越做越好,能利用的场景越来越多,解决实际需求。”
其实,推理成本仍然是大模型的生死关。
当下,用户付费意愿和意识尚未被培养起来,大模型盈利遥遥无期,所以,推理成本就决定了该产品和公司能够在行业里立足多久。或者直白地说——剩者为王。
来盘点国内下相对主流的大模型。
面向个人用户端,阿里的通义千问、腾讯的腾讯元宝、科大讯飞的星火大模型等都没有实行付费,仅百度的文心一言推出了VIP收费功能,价格还有点小贵,月费49.9,年费588.8。数字挺吉利。
图片来源:文心一言官网
专用大模型领域,收费模式已经相对普遍,美图秀秀推出的WHEE、快手推出的可灵AI等,采用了使用次数购买、会员充值等模式。原因也很好理解,相比纯文本的推理生成,图片和音视频的成本就高多了。
终于和可灵对上了
新款豆包视频模型能根据文字指令生成写实、超现实、漫画、动画等多种风格的视频,与市面上其他视频模型的视觉效果类似。
“在很多人看来,通过抖音和剪映这么长时间对视频的理解和积累,豆包一定能在视频生成这一块做得非常好。”谭待介绍,豆包视频模型得益于字节跳动对视频大模型技术研发的不断投入,模型的出现又能为视频的创作带来提升。
豆包视频生成模型的技术能力主要来自抖音官方剪辑工具剪映。剪映在3月底推出名为“Dreamina”的网站,内测AI视频生成功能,后更名为“即梦”。8月,独立APP“即梦AI”上线,用户可通过一定点数换取视频生成机会,最多可生成3秒左右的视频。
目前,新款豆包视频生成模型正在即梦AI内测版小范围测试,未来将逐步开放给所有用户。
此次豆包视频模型发布,可灵毫不意外地成为了最主要的参照对象。
可灵AI,由快手在今年6月6日推出,快手称其为“全球首个用户可用的影像级视频生成大模型”。
据9月13日快手科技披露,可灵AI已累计服务超过260万用户,生成5300万张图片、2700万个视频。
快手近期还发布了可灵AI导演共创计划,邀请李少红、贾樟柯、叶锦添等九位电影导演制作AIGC电影短片,快手高级副总裁盖坤预计,一年左右视频生成大模型能达到个人制作影视剧的成熟度。
图片来源:可灵官网
目前,可灵AI,免费用户每日登录,即赠送66灵感值(1元=10灵感值,相当于6.6元)66灵感值,能生成330张图,或者6个5秒普通视频。
透过豆包视频模型,笔者联想到了一段轶事。
年初,有一款文生视频应用爆火,叫作“PixVerse”,该应用背后是一家中国的创业公司“爱诗科技”,创办人是字节跳动前 AI Lab 总监王长虎。从用户的反馈来看,也确实给力,今年1月份正式上线,2月份月活已经超过了百万。
根据AI产品榜数据,PixVerse8月访问量272万,位列视频生成类AI第十名。
或许,这款应用的诞生,和豆包视频生成模型进度不及同行,也有一定关系。
智能时代的来临
如今,AI研究者们,已经不满足于让AI仅具有语言智能,通过理解人类语言,来实现生成文本、音频、视频,还打算赋予AI空间智能,乃至将AI推向更多领域。
9月13日,被称为AI教母的华人科学家李飞飞宣布推出AI公司World Labs(世界实验室)。World Labs同时宣布,已获得2.3亿美元融资(约合人民币16.32亿元)。
World Labs是一家空间智能公司,致力于构建大型世界模型(LWMs)来感知、生成3D世界并与之交互。空间智能可以应用在创作、设计、学习、AR/VR、机器人等领域。
9月18日,宁德时代董事长曾毓群,在接受挪威主权财富基金主席Nicolai Tangen访谈时,表示宁德时代正在尝试使用人工智能技术找到下一代革命性材料。
9月23日,OpenAI CEO 奥尔特曼(Sam Altman)罕见地发表了一篇长文博客,标题为《智能时代》(The Intelligence Age),引发了广泛关注。
首先,他说了AI的现在。他说我们现在已经能够完成很多前辈们认为是不可能的事情。AI 将为人们提供解决困难问题的工具。
其次,他描绘了AI的未来。他做出预测,超级AI有可能在未来几千天内完成。
再次,他认为“AI 模型很快就会成为自主的个人助理,代表我们完成特定任务,比如替你协调医疗服务。”
最后,他用这样一句意味深长的话收尾——“我们今天所做的许多工作,在几百年前的人们看来都是浪费时间的琐碎之事,但没有人会在回顾过去时,希望自己是一名点燃街灯的灯夫。”
结语
5月,字节跳动的豆包,以价格屠夫的姿态杀入AI大模型行业,其他巨头“心不甘情不愿”的跟随降价。
如今,豆包视频生成模型的推出,让更多用户期待起来。抖音用户,或将有望体验到豆包“短视频段子”带来的快乐。
大模型的“价格战”告一段落,但大模型的性能之争,才刚刚开始……
欢迎在评论区留言交流~
免责声明(上下滑动查看全部)
任何在本文出现的信息(包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等)均只作为参考,投资人须对任何自主决定的投资行为负责。另,本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议,亦不对因使用本文内容所引发的直接或间接损失负任何责任。投资有风险,过往业绩不 预示未来表现。财经早餐力求文章所载内容及观点客观公正,但不保证其准确性、完整性、及时性等。本文仅代表作者本人观点。