ICCI NEWS-前沿动态 |AI逆天进化！视频自己跟拍运镜，光影堪比王家卫！

作者：重大文创院-ICCI发布时间：2024-02-18

OpenAI

转载自：英国那些事儿公众号（侵权必删）

去年四月，纽约一家名为Runway AI的公司推出了一项技术，让人只需在屏幕上输入一个句子就可以生成视频。

当然彼时的效果仍不尽如人意，一眼就能看出是AI。

没想到仅仅过去10个月，类似的技术就已经来到了全新的高度。

AI，又进化了。

今天OpenAI官宣了新产品Sora，号称可以生成“最长60秒的视频，其中包括高度丰富的场景、复杂的运镜、感情鲜活的多个人物”。

从目前OpenAI给出的演示视频看，这宣传词还真没多夸张......

1.“大雪天，美丽、繁华的东京。镜头越过繁华的街景，跟随至几个人，他们享受着美丽的雪景，在附近的商摊购物。漂亮的樱花瓣和着雪随风飘落。”

细看仍然能看出一些问题：人体比例过于细长、两位主人物走的是个死胡同、有些樱花没有树枝飘在天上......

但讲实话，这都是看第二遍之后才能发现的细节。第一眼看上去已经相当可信了。

估计再优化优化，就已经可以给那些不会画画的导演做分镜用了......

2.“几头巨型长毛猛犸踏着积雪的草地走向镜头，随着踏步，它们身上的长毛在微风中飘扬。远处是白雪覆盖的树木和壮观的雪山。”

“午后的光线伴随着几缕云和远处高悬的太阳，发出温暖的光晕。较低的机位、优美的摄影和景深，捕捉到了这群巨大且毛茸茸的哺乳动物。”

这个除了“AI味儿”比较明显之外甚至挑不出什么毛病。

3.“一位时尚女子走在东京街头，道上到处都是暖色的霓虹和动态的城市标志。她身穿黑色皮夹克、红色长裙、黑色靴子，手拿黑色皮毛，戴太阳镜，涂红色唇膏。”

“她走得自信而随意。街道潮湿，反射出五颜六色的灯。镜头里还有许多行人走来走去。”

这可能是最震撼的一个，时长来到了一分钟，证明宣传语所言非虚。

配上一段小提琴，再加个红红黄黄的滤镜，旁白再来段什么“某年某月某日，东京。街头很冻，霓虹一直在闪，好似永远不会熄灭.......”

直接王家卫了。

这一分钟能找到的最大瑕疵在15~16秒处，人物左右脚突然交换了，但瑕不掩瑜。它很轻松就解决了“拍镜面怎么能不拍出摄影机”这一千古难题。

4.“一段电影预告片。讲述一位30岁太空人的冒险故事，他头戴红色羊毛织成的摩托车头盔。头顶蓝天，脚下盐碱沙漠，影院风格，以35mm胶片拍摄，色彩鲜艳。”

这一段是OpenAI故意整活，设计了一个针织帽头盔，搞得很出戏。但这段真的挺牛的，你甚至能看出一些镜头语言.......

一开始的越肩接怼脸特写用来介绍主角，飞船内外交替呈现，后面越切越快传达紧张感——它都会蒙太奇了......

最离谱的是提示词只给了故事梗概、风格上的限定，上面这些拍摄手法全是它自己“悟”出来的，太科幻了.......

5.“一个渲染得很华丽的珊瑚礁+纸艺的世界，到处都是五颜六色的鱼和海洋生物。”

6.“一段动画场景，一个矮小、毛茸茸的怪物跪在一根融化的红烛旁，近景。”

“画面应该是3D写实风，重点在灯光和材质上。情绪基调是好奇、奇妙，小怪物要张大眼睛和嘴巴，凝视着蜡烛的火焰。”

“它的姿势要传达出一种天真和俏皮的感觉，好像是第一次探索周围的世界。暖色调和夸张灯光的使用，进一步加强了画面的舒适温馨感。”

5和6一样，都是非写实风，感觉纯是OpenAI在秀肌肉，告诉人们“Sora不光能生成真实画面，还能做动画”。

也是，反正对于AI来说写实和动画没啥区别，反正都是从0开始生成的.......

以上就是OpenAI在推特上公布的6个演示视频，但他们官网上还有更多，篇幅所限就不再一一列举，感兴趣的话也可以自己去搜搜看。

其实除了开头提过的Runway AI之外，谷歌、Meta这两个大公司也尝试过“文本转视频”技术，但效果没有一个能接近Sora的。

其他公司的技术都只能生成大概十几秒，只有Sora能达到一分钟。

另外，Sora是一次性生成整个视频，而不是一帧一帧的生成。

这很大程度上保证了画面的连贯性，也就是说一个东西暂时出画面了，再回到画面来，还是同一个东西，而不是像下面这样连续变化，变着变着就诡异得没法看了：

据OpenAI的工程师说，Sora这个名字来源于日语的“天空”，寓意差不多是“创造力突破天际”，现在看来，他们的期望多半要成真了。

目前Sora还是个测试版，可用性已经肉眼可见，天知道正式版会强成什么样.......

今天外网已经炸了，诸多媒体都已经报道了此事，“OpenAI”和“Sora”也已经登上了推特热搜：

但由于近一两年AI造成的各种骚乱：模仿声音诈骗、无成本造谣、版权问题、挤压工作岗位......大多数网友对Sora持比较悲观的态度。

不是嫌它不好用，是怕它太好用了。

“这太可怕了，还会偷走人们的工作，更不用说它可以用来干各种各样的坏事。”

“喔天哪，以后到底啥才是真的......”

“真是想不到它能用来干什么坏事呢呵呵”

“你们这些科学家太忙于想着‘能不能’的事，却忘了停下来想想‘该不该’......”

“下一个十年，将会是彻底疯狂的。”

甚至目前的Youtube一哥Mr.Beast也出来半开玩笑地表示：

“Sam（指OpenAI的CEO Sam Altman）请别让我成流浪汉了...”

另一位Youtube头部数码博主MKBHD也表示：

“我.....我有好多好多疑问”

再加上美国大选已经近在咫尺，很多人担心Sora会成为谣言的温床，干预到本次大选.....

“安息吧。本次大选。”

网友的担忧不是没有道理的。毕竟很多中老年人是真的会相信“视频不能P”。

再说就凭演示视频这个质量......它真的只能骗到中老年人么？

Sora还有一个功能是基于一张图生成整个视频，往好处想，这可以用来填充老视频缺失的帧；

但往坏处想，就真可以“开局一张图，剩下全靠编”了。

早在2023年5月时，推上就曾经有人发过一张“五角大楼炸了”的AI图，当时传播范围挺广，很多人信了，最后还被CNN报道了：

现在的Sora生成的视频比这一张图更“可信”，潜在的引发骚乱的能力也更强了。

不过我们也不必太过担忧，OpenAI表示Sora也不是没有缺点，它最大的毛病有两个：

第一是理解不了因果关系，比如让它生成一个人咬饼干的视频，但咬完饼干可能没有咬痕；

第二则是缺乏空间意识，有时会混淆左右，不理解人和物体如何与场景交互。

等正式版发布，也许这些问题能得到解决，但相应地，引发骚乱的可能也会变大。

OpenAI也清楚这一点，所以他们目前还没有把Sora放出来，而是找了一群学者专家合作，想法设法地找寻Sora可能被滥用的点。

然而从过去几年发生的事看，他们恐怕很难把所有口子都彻底堵上，总会有人尝试给AI越狱，不是想防就能防得住.......

所以下面这位网友预想的场景，也许真有实现的一天：

“我被抓了，法庭上展出了‘视频证据’，里面是我在犯罪，一件我这辈子都没犯过的罪。”

就在两天前，OpenAI对我们最熟悉的ChatGPT做出了改动，现在它的“记性”更好了。

比如在《纽约时报》的这篇报道中，记者跟GPT聊天说他有个女儿叫Lina，马上五岁了，她喜欢粉色、喜欢水母。

等下次再跟GPT聊天，记者让GPT为女儿生成一张生日贺卡，它就直接调用了以前的信息：

这说明它记住了以前的聊天，变得更像个“人”了......

似乎来到2024之后，OpenAI加快了推进AI的脚步，Sora的出现就是一个明证。

一方面，Sora的前景让人十分期待，用来“拍电影”不行，但一分钟之内的短视频它足以胜任；

另一方面，超低成本的造谣也是明摆着很难解决的问题。

OpenAI究竟是在创造科技进步还是在打开潘多拉魔盒，也许最终就只能交给时间来评判了......

ref:

https://www.nytimes.com/2024/02/15/technology/openai-sora-videos.html

https://twitter.com/OpenAI/status/1758192957386342435

声明：我们致力保护作者版权，如涉及版权问题，请及时与我们联系，我们将第一时间做出处理。

近期资讯

新托福tpo真题150，刷完躺着过托福115+

新托福tpo真题150，刷完躺着过托福115+ 托福真题，是每个备考托福的小伙伴们必不可少的复习资料！这次收录了全新的新托福阅读词汇150题。题目是根据真实考试的格式和难度水平编写的，可以帮助我们更好更快更准确的了解考试内容和形式！ . 但是如果不会刷题，再好的tpo也没用。刷了这么多的以后，我才探索出正确的做法是了解tpo及其难度，然后了解自己目前的备考阶段，选择不同的题目步骤化联系。 . 这次的收录里面还标注了题目难度还有目前阶段应该去做的题目，真的太方便太好用啦！ . 一边做题一边整理pdf，等到考

托福上岸锦鲤 2024-12-29

iphone提词器在哪里

秒提词 app：iOS 用户的专业提词神器在如今这个信息爆炸的时代，无论是短视频创作者、直播达人还是演讲高手，一款好用的提词器对于 iOS 用户来说都是必不可少的。而秒提词 app，无疑是您在众多提词器应用中的最佳选择。 iPhone 有提词器吗当然有！iPhone 本身虽然没有自带专业的提词器功能，但通过下载安装秒提词 app，您就能轻松拥有强大的提词功能，满足您在各种场景下的提词需求。 iOS 提词器在哪里 iOS 提词器就在您的 App Store 中。只需打开 App Store，在搜索栏输入

秒提词 2024-12-29

POLY_LAB 2024-12-29

为什么说数字化采购是一场革命？

语言和文字的出现使人类的协作得到大幅提升，并最终使人类从大自然竞争中胜出。蒸汽机与电力，解决了人力瓶颈，使人类进入工业社会，可以进行大规模生产。在互联网与数字化技术的推动下，让人类加速度的形式进入数字时代。今天，人们的衣食住行已很难逃离数字场景。对企业而言，理解数字化的价值与必要性，对拥抱变化、抓住转型机遇、参与数字化进程至关重要。01数字化已上升为数字经济，成为国家战略随着全球竞争加剧，经济进入新常态，打造数字经济新优势成为新的经济增长点。国家十四五规划中明确提出“加快数字化发展建设数字中国”。规划进

优链智达 2024-12-29

佛山盛迪-吉利中国星用户中心开业盛典圆满落幕

闪耀中国星，共启新盛景。12月28日，在佛山市华南汽车城，吉利汽车佛山盛迪中国星用户中心焕新启业，盛大启航 [图片] [图片] 作为中国领先的汽车制造商之一，吉利汽车品牌使命历经“造老百姓买得起的好车”、“造最安全、最环保、最节能的好车”、“造每个人的精品车”三个发展阶段的变化，从始至终都未曾动摇过以用户为中心，为用户造车的初心。佛山盛迪也始终秉承“追求卓越追求完美”的服务理念，以客户非常满意为最大已任，努力地为客户提供极致贴心的人性化服务，每时每刻为客户创造难忘的体验。 [图片] 12月28日上午9:

汽车云活动 2024-12-29

姜宏锋：采购降本的5项障碍

采购降本，是什么？是老板心中若隐若现的猜疑？是销售业绩不力的借口？是管理层压力下每年确定的课题？是供应商每年的噩梦、改进的压力？是采购人员内心的煎熬、专业的考卷、简历上的荣光？谈到采购降本，企业人往往又爱又恨，当然爱者少之又少，恨者十有八九。但企业无法回避这一课题。一是现在企业外部环境艰难，存量市场残酷内卷。市场不佳，采购成本太高就成了本企业销售不力最好的理由，所以管理层与采购必须给出降本回应。二是采购支出占企业支出的大头，采购省下的都是净利润，采购降本对利润率提升具有明显的杠杆效应。一家

优链智达 2024-12-29

手机信号屏蔽器在监狱管理中的应用【中科星】

监狱作为特殊的管理场所，对手机等通信设备的管控至关重要。北京中科星月科技有限公司生产的XYPB-205C手机信号屏蔽器，能够全面覆盖监狱区域，有效屏蔽手机2G/3G/4G/5G信号及WIFI信号，防止囚犯利用手机进行非法活动。该设备具有智能识别功能，能够区分囚犯与狱警的手机信号，确保狱警的正常通信不受影响。某大型监狱采用中科星月的设备后，成功降低了囚犯利用手机进行犯罪活动的风险，同时屏蔽了WIFI信号，提升了监狱管理水平。

北京中科星月科技 2024-12-29

瓷音未来Mars Air BRIEF耳机评测：颜值与音质的双重盛宴

在繁忙的都市生活中，音乐成为了我们不可或缺的伴侣。无论是通勤路上的片刻宁静，还是运动时的节奏带动，一款优秀的耳机总能为我们带来更加沉浸式的体验。今天，我要为大家带来的正是一款集颜值、音质与舒适于一身的开放式耳机——瓷音未来Mars Air BRIEF。这款耳机以其独特的皮革晒纹颜值、瓷音未来品牌的通透调音风格、LDAC高解码与大尺寸跑道型喇叭、定向聚音技术以及四麦通话与双设备连接等特性，赢得了众多音乐爱好者的喜爱。接下来，就让我们一起深入评测这款耳机吧!一、皮革晒纹的颜值：优雅低奢，尽显品味瓷音未来Mar

搞机么 2024-12-29

ICCI NEWS-前沿动态 |AI逆天进化！视频自己跟拍运镜，光影堪比王家卫！

推荐体验

相关资讯

ICCI-NEWS-前沿动态｜OpenAI颠覆世界：GPT-4o完全免费，实时语音视频交互震撼全场

ChatGPT之父称AI风险堪比核能丨前沿抢先看

中国AI视频大模型Vidu惊艳亮相，性能堪比Sora

AI绘画前沿应用分享，看看大神们的模型应用有多逆天

免费AI绘画之神Leonardo.Ai--堪比Midjourney

近期资讯

新托福tpo真题150，刷完躺着过托福115+

iphone提词器在哪里

生物医药创新论坛来袭！2025生物医药创新技术与应用发展论坛3月济南举办

航拍中国第三季笔记（宁夏）

打印模型不要再手动拆分啦，让他一次生成！

为什么说数字化采购是一场革命？

佛山盛迪-吉利中国星用户中心开业盛典圆满落幕

姜宏锋：采购降本的5项障碍

手机信号屏蔽器在监狱管理中的应用【中科星】

瓷音未来Mars Air BRIEF耳机评测：颜值与音质的双重盛宴

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响