南都讯 记者伍曼娜4月12日上午,中国科学院深圳先进技术研究院(简称“深圳先进院”)举办“探Sora真相,论AI未来”人工智能沙龙讲座。本次活动邀请到人工智能领域的专家学者围绕人工智能领域前沿技术进行了深入探讨和分析,并讨论了Sora对AI基础技术的推进作用。
人工智能影响材料、生命、信息和医学等领域发展
中国科学院院士、深圳先进院副院长郑海荣,数字所所长李烨出席,近百位科研人员和学生参加此次活动。 此次活动由深圳先进院先进计算与数字工程研究所、中国科学院与香港地区多媒体技术联合实验室共同主办,深圳先进院数字所多媒体集成技术中心主任董超主持。
郑海荣院士在致辞中提到,人工智能带来科学研究范式的改变,正在深深影响材料、生命、信息和医学等领域发展。我们应以极高的敏感度去思考如何与人工智能技术相融合带动相关领域的变革。希望通过今天的交流与合作,能够促进非人工智能领域的研究学者拥有人工智能的意识和思维,助力开拓学科的新疆域。
香港中文大学副教授李鸿升在《图像生成和视频生成前沿技术探索》主题报告中,介绍了实验室团队在面对生成模型评估困难、生成图像文本跟随性差、生成视频一致性差、生成模型推理速度慢等多重挑战时开发的一系列工作,包括文生图模型评估方法HPS(Human Preference Score)、增强生成图像的文本依从性方法CoMat、增强生成视频的一致性方法Motion-I2V、扩展图像生成模型至视频生成方法AnimateLCM等。“视频生成模型的开发是一个庞大的系统工程,应对这一挑战,算力资源和人员组织架构都需要集中规划,技术的开发需要有系统化的数据工程。”
腾讯科技高级研究员王鑫涛在《视频生成探索及MINI-SORA的初步研究》的报告中提到,视频生成正日益受到学术界和工业界的关注,随着OpenAI Sora的发布,视频生成技术的潜力和挑战越来越明晰。他回顾了视频生成技术的发展路线,以及Sora的出现为视频生成技术带来的启发与思考。“这是最好的时代也是最‘坏’的时代,我们见证了人工智能技术的不断突破,同时也必须一次次突破认知才不至于‘望洋兴叹’。”
推导Sora世界自成一体的“物理定律”?
在圆桌对话中,5位人工智能领域的科学家们探讨了Sora对AI基础技术的推进作用,以及人工智能技术发展背后的思考。
谈及视频生成模型的应用场景时,华为技术有限公司高级工程师蔡颖婕说道:“最直接的是在创作场景方面的应用,Sora表现出的良好一致性和一部分对物理世界的理解能力,让其有希望成为数据仿真器,解决自动驾驶等任务中的部分数据问题,有利于提高安全性。”
那么,Sora是如何模拟和理解物理世界的?“数据在Sora中起到了很大的作用,其中可能存在一部分使用了游戏物理引擎仿真的数据,再加上自然图像大数据的训练导致Sora能在一定程度上理解物理规律,产生符合人类认知的画面。”李鸿升分析道。
王鑫涛同样认为数据在Sora中占据十分重要的地方,他认为网络模型本身的学习方式或许与人类学习的模式不一样,模型从大量数据中学习可能也可以自适应地理解某种规律。
“物理规律是人类对于世界的某种‘压缩’,将一系列的物理现象浓缩到几个公式来统一表达,某种程度上说,‘压缩’即智能。”香港中文大学助理教授薛天帆补充道。
董超从另一个角度提到,如果从Sora输出的结果中,能推导出某种一致性规律,那么即使可能与真实世界规律有偏差,也算是Sora世界中自成一体的“物理定律”。
“无论什么样的技术都是从人出发,最终也是反馈到人类身上。我们应该更多关注人本身,创造出有利的科研环境,让一线的从业者和科学家们保持创造力和好奇心。技术需要被人掌控并回归人类本身,才能让前沿技术带来正向价值、有利于社会发展。”活动的最后,董超说道。