△OpenAI官网上试用者用Sora制作的相关视频。
3月25日,美国人工智能研究公司OpenAI在官网展示了部分艺术家、电影制作人关于Sora如何帮助他们把想法转变为现实的使用反馈。“就像Sora一样擅长创造看似真实的事物——让我们兴奋的是它能够创造完全超现实的东西。“Sora的部分试用者表示。
此前,OpenAI发布的人工智能文生视频大模型Sora一经面世便引发广泛关注。OpenAI首席技术官在接受外媒采访时称,Sora预计将于今年晚些时候正式向公众推出。与此同时,她表示OpenAI计划最终可能加入音频功能,并允许用户编辑生成视频内容。
一阵关于人工智能的行业热潮再度被掀起。
围绕大模型展开的竞争正来临
据OpenAI公司早前介绍,人工智能文生视频大模型Sora使用的Transformer架构,可根据文本指令创建现实且富有想象力的场景,生成多种风格、不同画幅、最长为1分钟的高清视频。其独特之处在于时长和分辨率上的大幅超越,以及强大的文本理解和细节生成能力。
△OpenAI官网上Sora相关内容。
“Sora的创新本质上是组合创新。Sora对所合成视频中时空子块这一最小单元进行组合,组合爆炸原因可以产生千万种不同的被合成内容。”浙江大学人工智能研究所所长吴飞对《中国报道》记者说。
北京邮电大学人机交互与认知实验室主任刘伟告诉《中国报道》记者,Sora展现的不仅仅是文生视频技术的好坏,更是作为“升级版GPT”背后所展现出的强大的数据、算力与算法。
刘伟称,从源头来看,人工智能是以数据为核心的大数据驱动,而西方在数据源方面是领先的。Sora实际上并没有使用太多与过往不同的新技术,但它所使用的视频生成方式对算力要求却极高。目前国外基本运用几十万卡甚至百万卡对模型进行训练,一样模型的前提下卡越多模型训练得越好。至于算法层面,当前国内的大语言模型、多模态模型使用的仍是西方架构,因此当前我们的大模型基础并不牢靠。
北京师范大学新闻传播学院院长张洪忠教授认为,自1956年达特茅斯会议上提出人工智能概念到2022年10月前,人工智能技术发展相对缓慢。2022年10月ChatGPT出现以后,其所代表的大语言模型一下子把人工智能技术推向了全新的高度,这代表人工智能技术全面进入到各个方面。
麦肯锡在2023年发布的《生成式人工智能经济潜力》报告中预测,生成式AI在未来为全球经济每年能带来2.6万亿美元到4.4万亿美元的增长,可能每年为全球经济贡献“一个英国的GDP”。
“大模型将成为国际竞争的焦点,其核心节点是谁掌握大模型谁就最先迈入第四次工业革命。”中国科学院大学经管学院教授、国家创新与发展战略研究会的副理事长吕本富表示。
△机器人攻关团队科研人员在多模态人工智能系统全国重点实验室调试机器人。
“当前,我们与西方国家的技术差距是非常大的,我们需要找到适合我们实际发展的路径。”刘伟表示,人机环境系统智能是一种可能。首先,它需要把包括开发者、使用者、管理者、维护者等所有人的力量整合在一起。其次,尝试将具有适应性的多模型或者垂直性的小模型与人结合。最后,创造一种开放的环境,将这三者结合起来。简单来说,就是通过计算机技术和人工智能算法,使得计算机系统能感知、理解和适应环境,以及与人进行交互和合作。
“除此以外,我们还需要加快AI场景落地,形成一定的商业闭环,这样才能有助于产生新的生产力和市场创造力。“刘伟说。
生产自动化下人与AI需共同进化
人工智能技术的每一次突破总会将话题重新引到人与技术的对立关系上,我们对AI的焦虑从未停止。“人是否会被机器替代”成为技术发展道路上绕不开的难题。
Sora一经面世,视觉、影视行业便被认为是第一批直面这场技术冲击的行业。“在目前影视行业中,一切需要人力重复劳动、低成本运营的工作都很容易、也需要被更智能的科技工具替代。”北京三多堂传媒股份有限公司创作副总监兼执行总导演朱允对《中国报道》记者表示。
科技一旦进入应用层面,成本降低,市场化运营机制下,没有哪家单位和企业会拒绝更廉价、效果更好的新产物,那么人就站在了技术的对立面。”知识产权归根结底不可能属于一台机器。要么创造智能,要么创造智慧。有多少影视工作者能在其中升级换代,接受和顺应新一代科技赋能的进展,继续谋求一席之地。这不仅是影视工作者面临的问题,也是所有人需要共同面对的问题。”朱允说。
△总台制作的中国首部文生视频AI系列200集动画片《千秋诗颂》。
麦肯锡报告数据显示,生成式AI取代人类工作的时间被提前了10年,在2030年至2060年间(中点为2045年)50%的职业将逐步被AI取代。许多涉及沟通、监督、记录以及与人与人之间互动的工作活动都有可能通过生成式AI实现自动化,这也在一定程度上加速了教育和技术等职业工作的转型。
目前,ChatGPT和Sora等人工智能(AI)系统可对人类全量知识进行整合,这显然对以知识传授为主的教育理念提出了巨大挑战。“未来教育需从传统的知识传授转向注重能力提升,形成提出问题、设计问题、利用根据和迭代反馈的能力。”吴飞告诉记者。
该报告还预测,到2040年,生成式AI可以使劳动生产率每年增长0.1%至0.6%。生成式AI可以大幅提高整个经济体的劳动生产率,而将生成式AI与其他技术相结合,每年可以使生产力增长率达到0.2%至3.3%。
员工在学习新技能时需要培训,有些人可能需要改变职业。如果可以管理员工转型和其他风险,生成式AI将为经济增长做出实质性贡献。
“未来将是人与AI共同进化的时代,人类始终是人工智能高度、广度和深度的总开关和决定者,也是人和人造物的协调者。”吴飞对记者表示,每个人要了解人工智能、利用人工智能、遵守人工智能伦理,善于提出问题、设计场景和利用工具,也是我们每个人在从信息化时代迈向数智化时代需要不断学习和加强的能力。
生成式AI的“潘多拉魔盒”正被打开
人工智能的本质在于算法和数据处理,“Sora 训练的数据源来自哪里”成为大家颇为关心的问题。
OpenAI首席技术官米拉·穆拉蒂在接受外媒采访时被问及Sora 训练的素材是否包括 YouTube、Instagram 和 Facebook 上的视频,她并未给予明确回应,只称 Sora 的训练数据来自公开可用和授权的数据。
近年来,因训练数据引发的版权问题并不少见。小红书旗下的AI绘画产品Trik AI曾未经授权使用画师的原创作品作为训练数据,生成了与原作高度相似的图片,因而被画师们以著作权侵权为由告上法庭。
“如果软件是开源的,有些灵感不但发起者能看到,其他在线者也能看见并汲取;如果闭源,版权问题大概率会从会员费或者条款上有清晰体现。”导演朱允表示想要做出原创的动力从不是在“他人”的笔下获取,“尊重原创,尊重自己。”
“是管还是放?”的尺度把握是一个难题。大多数模型的训练目的在于通过最终AI产品的推广与应用实现商业盈利而非学习或科研。“在管控和放开之间要做一个平衡。”刘伟表示。
△一位参会者经过首届人工智能安全峰会的宣传展板。
不久前,欧盟启动了一项针对大型科技公司使用生成式人工智能(AI)的调查,要求这些科技公司提供更多信息,说明它们各自针对与生成式AI相关风险采取的应对措施,例如AI产生的幻觉(提供虚假信息)、深度伪造的病毒式传播等。
技术应用中的传播虚假信息、侵害个人信息权益、数据安全等问题频频出现。新技术发展的同时,法律体系何时能及时跟进?
近期,欧洲议会以压倒性票数通过了全球首部AI法案《人工智能法案》,法案中对人工智能系统的定义和适用范围进行了明确界定。欧洲媒体预测,法案预计6月生效。欧盟率先为AI立法能否为推动各方在AI监管领域合作正等在现实印证,但人工智能立法势必全面提速。
我国AI应用也正处于有法可依但并不完善的阶段。早在2017年国务院印发《新一代人工智能发展规划》中就提出,要于2030年建成完善的人工智能法律法规、伦理规范和政策体系。全国网络安全标准化技术委员会2024年发布的《生成式人工智能服务安全基本要求》从语料安全、模型安全等多个维度规定了生成式人工智能服务在安全方面的基本要求。
“确保人类‘守法’、机器‘守德’。”全国政协委员、陕西省高级人民法院副院长巩富文在今年全国两会期间提出应审慎修改著作权法、制定人工智能促进法,在国家层面设立多部门参与、具有权威性,能快速有效响应、实现敏捷治理的人工智能伦理委员会。
撰文:《中国报道》记者 刘雪云
图片来源:新华社、央视新闻
责编:张利娟
编审:赵珺