当前位置:首页|资讯|Sora|AGI

周鸿祎:Sora看起来是个吹风机,实际上是个剃须刀

作者:杨子超发布时间:2024-03-04

原标题:周鸿祎:Sora看起来是个吹风机,实际上是个剃须刀

李一舟的事儿启发了360董事长周鸿祎。

他认为现在的AI已经从科技话题变成了公众话题,所以有必要做一个AI科普课,缓解大家的焦虑,而且这个科普课秉承着周鸿祎一贯的原则:免费。

于是在2月29日,也是四年一遇的特殊日子,周鸿祎免费课第一讲《预见AGI》来了。子超坐在第一排认真听讲,还被周鸿祎点名了不下8次:“比如杨子超尝试PUA大模型……比如杨子超……”能成为周总的教学案例,被百万人围观,子超倍感荣幸。

回到课程本身,在子超看来,这个时间点确实需要一位科技圈的大佬来跟大家讲讲AI。生成式人工智能的发展速度让各行各业都变得焦虑,尤其Sora的横空出世,更是让一众影视从业者们集体失眠。周鸿祎的这场免费AI课,来得非常及时。

这门课程光一个人讲还不够,周鸿祎还计划发动 360内部人工智能研究院的产品经理、技术专家配合,另外准备邀请一些行业AI专家参与。从宏观到微观,彻底治好大家的AI焦虑。

课程开始,周鸿祎首先分享了自己的学习方法:“当我进入一个新领域的时候,我要先学框架。中国有句古话,一叶障目或者只见树木不见森林。无论是云计算、大数据、网络安全、物联网,包括人工智能,新技术层不出穷,你需要有一个整体的把握。整体把握住了,就不会出现大的方向偏差。”

所以比起如何用AI工具写一段文案或者生成一张精美的图片等“术”的一面,周鸿祎更在意AI“道”的一面。子超深表认同,因为道是本质,术则是万变不离其宗。

Sora为什么这么强

在最近刷屏的几段视频里,Sora展示出了逼真的视频生成效果。

洁白的雪地上,几只小狗在肆意玩耍,蹭了一脸的雪。

为什么说Sora对Pika和Runway形成了降维打击呢?周鸿祎认为,Pika和Runway,还有Stable Diffusion类,原来这种文生图、文生视频的产品没有对这种世界运转、交互规律的理解和常识的积累。换句话说,它知道自己画的是个猫,也知道自己画的是个狗,但是不知道猫跟狗互动起来会怎么样。比如说,狗在雪地里走的时候,爪子是怎么样的,它对这些是没有认知的。所以这种只用像素来渲染的工具,做图是没有问题的,但是做复杂的视频是肯定不行的。

Sora能够生成出这样的视频,这意味着它一定理解了某种常识,理解了现实世界里面一些常见物体的交互关系。比如水倒在桌上会形成水渍,雪是松软的,篮球打到篮筐会弹回来。

再往前推理一步,Sora的常识从何而来呢?周鸿祎认为应该不完全是GPT灌给它的,单通过文字描述,就像给一个从没见过雪的人描述雪,然后让他画一个雪和狗的交互,即使连真人也很难做到。

所以周鸿祎推测,通过视频训练,Sora获得了一定的理解力。Sora做出的视频都比较符合我们对世界的认知,是和这个世界的运转规律,与人类观察世界得来的常识一致。但因为防止杠精,所以要再进行两点格外说明:

第一, 理解了规律,不叫理解了物理公式。一个小孩儿从来没有学过牛顿定律,但并不妨碍他观察一个东西从桌子上垂直下落到地上。

第二, Sora生成的视频里依然有些不太对的东西,周鸿祎认为是由于训练量不足,因为毕竟现在算力有限。但瑕不掩瑜,不能因为某些小的缺点,就把这个技术贬低为只是一个产品的创新而已。

这也是OpenAI将Sora定义为“世界模拟器”的原因,模拟世界必先了解世界,而了解世界不一定只是了解语言,也要了解世界基本的规律。很明显,目前的Sora已经理解了一些世界的运行规律。

周鸿祎认为,Sora还解决了人工智能训练数据不足的问题。当大量视频都能作为训练的知识输入,这是什么概念?甚至如果连视频都用完了,我们还可以接摄像头。可以类比特斯拉的自动驾驶,特斯拉车上的摄像头大量记录各种路况、车内、车外的信息,这些信息都是人工智能训练的素材。

Sora打开了AGI的大门

子超在2014年写过一篇《谁是中国最好的产品经理》的文章,当时子超的答案是周鸿祎。而周鸿祎最喜欢的产品经理,竟然是周星驰。

课上,周鸿祎给大家放了一个周星驰的《国产零零漆》里面的片段,周星驰正在展示自己脑洞大开的特工装备:“看起来这是一个剃须刀,实际上是个吹风机;看起来是个吹风机,实际上是个剃须刀。”

周鸿祎认为,这可以类比GPT和Sora。透过现象看本质,GPT看起来是个聊天机器人,但它实际解决了机器和人的交流问题,解决了AGI的第一步,即机器和人的沟通问题。而Sora看上去是一个视频生成工具,但其背后实现了对世界的理解和世界的模拟,解决了机器跟世界互动的常识问题。

如果拿人类的大脑来举例,GPT(LLM)好比左脑,解决了语言、逻辑和记忆的问题;Unconditional Diffusion是右脑,解决了形象、创意和美术的问题。Sora把左右脑都统一了起来,离真正的人脑更近了一步。这也是为什么周鸿祎看到Sora后预言AGI的实现,将缩短到两三年。

周鸿祎眼中,AI发展有五个阶段:

第一, 小模型阶段,能力单一,无法泛化,无法做到理解,只能干点活儿,就像原来的人脸识别。所以早期的人脸识别公司为什么没有掀起工业革命,虽然他们做的也很辛苦,但是很不幸出现在人工智障阶段。

第二, GPT出现,AGI迎来拐点,机器实现与人类的交流。

第三, Sora的出现,打开了AGI的大门,能够认知世界,跟世界互动。周鸿祎认为未来五年, Sora会加大算力,加大训练,跟具身机器人结合在一起,加速智能的提升。

第四, 强人工智能阶段。现在机器已经能看懂一些常识了,也能交流了,那还缺什么?还缺对这个世界的一些力量的感知,比如说加速度和重力,机器人摔了一跤怎么办,机器人要用什么力量打碎一个鸡蛋?

第五, 能够总结出来世界的规律,比如牛顿看到苹果从树上掉下来,能够总结重力的公式,这已经超越地球上绝大多数人了,因为一万人中也出不了一个牛顿,这就叫超级人工智能。

周鸿祎开玩笑说,为了让自己的预言能够成功,希望大家对AGI的要求不要太高,第三、第四个阶段都可以定义成AGI,即AI能够像人一样的沟通交流,分解任务、执行任务,对世界可以进行观察、学习和模仿。

现在每天这么多新成果不断出现、交流、共享,大家不用重复发明轮子。包括像苹果、英伟达这样的公司,可能要拿出上千亿美金投入到AI的发展里,那接下来的发展加速度不言而喻。

Figure机器人演示

子超其实对AGI的看法更为激进一些,随着Sora发布后,今年AI将有两个领域会出现2C应用大爆发。一个是AI的内容生成领域,对短视频、动漫、电影、游戏等整个内容生态是一个大的颠覆,最极致的是AI生成游戏,人人皆可生成互动式内容;第二个是AI+IoT,也就是AI赋能智能硬件、PC、手机、新能源汽车以及具身智能机器人,最极致的是赋能具身智能机器人,真正开启人类的AGI时代。特斯拉的擎天柱机器人和刚刚融资成功的硅谷新宠Figure机器人都在这个领域,相信很快会有成熟的产品推向市场。

AGI能够实现我们期望的美好未来

周鸿祎在很多场合都提到了“AI信仰”,呼吁企业家们抓住机遇All in AI。他特别反对制造悲观情绪的论调,比如人工智能让大家都失业了,人工智能要毁灭人类了。在他看来,人工智能不会直接导致失业,还会提供更丰富的从业场景,懂AI会成为职场优势,未来属于会正确使用大模型的人。

“为什么我们不能看看美好的东西呢?人类发明了蒸汽机,创造了很多新的职业。电气化、计算机,每次都会有负面的渲染,但是最后这些工具让人类获得了更好的生活水平,更好的生产力。”周鸿祎说。

为什么要发展AGI?周鸿祎认为,今天人类寿命的延长,医疗水平的改善,生活水平的提升,究其根本在于物理、化学、数学等基础学科的研究,根本底层技术的突破。但目前基础科学的进展遇到了瓶颈,AGI可以成为人类研究世界最有力的工具。原来的一些生物学家花几十年才能研究一个蛋白质的折叠结构,但通过AI,很快的能够算出几百个折叠结构。

包括英伟达CEO黄仁勋鼓励大家学习生物学,研究大脑的运作机制,以便更好地研究人工智能。反过来,人工智能的工程化的方法也可以帮助生物学取得突破,让人类更好地攻克癌症,更好地完成基因的改造。

花那么多算力、发展AI的目的,绝不是给大家逗个乐子、做个视频,而是让整个世界变得更美好。周鸿祎认为,AGI的发展需要突破基础科学的瓶颈,同样,AGI的发展也会反向推动基础科学的发展。

周鸿祎说:“今天人工智能还不光是提高生产力,我觉得如果提高整个人类的科研水平,比如能源上实现自由,生物学上实现让人体更加健康,我觉得这是每个人幻想的、期望的一个美好未来。”

附:以下是子超筛选了部分周鸿祎在AI免费课里对大家感兴趣的话题的精彩解答

问题1:

因为人工智能的不断发展,子超也会思考当下孩子们为什么还要去学习,学习对未来有什么用?反正未来一切都是人工智能了。为了迎接AGI时代,孩子们当下学习什么才有用处呢?

周鸿祎:

第一,我觉得大家对GPT还是有误解,小孩儿如果不用各种知识来进行学习,就像不经过训练一样,没有办法在大脑里形成新的神经网络的连接,是不可能凭空创造出想象力的。一个人要有想象力还是要见多识广。尽管这些知识在搜索里可以查到,大模型也可以回答你,但是小朋友学习一定必要的知识,通过这些知识来作为一种预训练的方式,还是非常重要的。

第二,人的大脑的工作过程跟GPT训练非常像,读书就是预训练,做题就是微调。师父批评你一些想法不对,就是校正、对齐。所以,包括通过一些考试或者做题来让你更容易使用自己知识的这种能力,我认为也是必要的。

我比较反对说因为有了GPT工具,人就啥也不用学了,只要会指挥GPT就可以。因为人工智能的发展是在降低使用的门槛,工具面前人人平等,人与人之间的差别在于才华、想象力和创造力。

所以,我觉得小孩儿的学习还是非常重要的,只是说不一定要读那么多只考试的那几门课,一定要广泛地阅读,越是在人工智能时代,越要广泛,跨学科,跨领域地阅读,读各种书,这是第一个建议。

我跟俞老师讨论,他认为有些人工智能小孩儿应该用,有些不应该用,比如我们做的很多工具,小孩儿自己不思考答案,直接搜答案,这会非常有害。它带来两个害处,小孩儿都是即时满足,他没有任何耐心去花时间思考这个问题怎么解决。比如说,有一道题,做题的过程就是就叫微调,你花半个小时考虑不出来,你就把你大脑里很多知识又重整了一遍。如果我直接就能找到答案,用GPT写的作文直接代替我的答案,这种是致命的,这种小孩儿长大了也会被人工智能淘汰,因为用人工智能工具的其他同学会比他更聪明。

但是,人工智能工具如果换一种用法,如果我们不要基于大模型直接给他找答案,而是把大模型能够取代老师,能够变成一种追问、反问、问答、交流,在解题过程中,像老师一样,让小孩儿通过跟GPT做交流,我觉得这种工具是值得大家去开发的。所以,GPT在教育上不能直接使用,我认为还有很多可以创作的空间,现在的一些教育软件,直接小孩儿拍照解题,纯粹就把小孩儿往死里害。

当然,整体来说,我个人觉得,有了计算机之后,有了互联网之后,有了GPT、Sora等工具之后,如何能正确的使用这种工具,对小孩儿整体还是帮助大的。比如画画来说,你可以先做一个构思创意,让计算机帮你完善,或者计算机出一个创意,你来完善细节,变成人和计算机合作来作画。所以,家长更要去了解AI的优点和缺点,这样你才能很好地引导小孩儿。

问题2:

如何理解“AGI理解世界”这个定义?

周鸿祎:

如何定义飞,鸟的飞是怎么定义的?鸟是有翅膀的。那飞机的飞是直接就飞起来了,那请问飞机的飞叫不叫飞?按照杨立昆他们的说法,那不叫飞,因为你没有安上翅膀。但人类按照装上鸟的那种翅膀的方法制造飞行器,也没有飞起来。我认为,机器的工作基本器械和人的大脑不一样,但是逻辑上工作原理一样,它能准确地回答问题,能理解世界,这就叫理解了。

问题3:

Sora的问世是不是标志着国内纯技术的研发的初创团队机会变得更渺茫了?因为迟早大家都会有一个预期,未来可能会被OpenAI降维打击。

周鸿祎:

第一,我觉得创业公司应该稍微要抬头看看路。为什么要关心宏观层面的事情?我见过太多的创业公司在某一个技术细节上觉得自己有点收获。但是,如果你挡在OpenAI这种巨头发展之路上,那肯定要被干掉的。

第二,核心技术上,如果说能在一些垂直领域能够有一些深入的独特的技术积累,我觉得应该还是不错的。但是,你应该想一想,今天的AI不是一个技术诀窍就能决定的,即使你有了Sora的技术诀窍,依然需要足够的算力、足够的数据、足够的训练的反馈,这些如果超出你拥有的资源肯定也不合适。

所以,我觉得如果有核心技术,杀鸡用牛刀,还是找重度垂直的场景结合。因为OpenAI在核心技术上不断做大的通用大模型,它不可能在应用领域,在垂直领域做得很深入。

杨子超:超声波创始人、发光小程序创始人、爱部落轻日记社区创始人、超级商业认知商学院创始人、和牛商业创始人、中关村创业博物馆创始捐赠人、知名互联网意见领袖、天使投资人。

拥有12年的互联网产品经历,曾做过门户、B2C、C2C、导航、社交、FM、周刊等产品。担任清科集团旗下沙丘大学导师、《创业家》黑问社区明星导师、2014ELIFE校园黑马创业大赛的北京赛区导师、2016年武汉青桐汇、合肥合创汇投资人评委、2017-2018搜狐汽车年度大选评委嘉宾、2018年Hackaday360产品创新挑战赛决赛专家评审团评委、新浪网2021科技风云榜年度盛典元宇宙分论坛主持嘉宾、微博2022新智者大会元宇宙分论坛主持嘉宾、新智者Talk特约主持嘉宾、2023首届新智者价值榜专家评审。09年自英国回国后做过云计算、社交网络、大数据等多个创业项目,积累下很多创业经验。

超声波旗下的超声波俱乐部目前成员涵盖了超过100位AI领域的顶级创业者,连接超过1000位AI领域的创始人、CTO、产品经理和风险投资人。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1