文丨Congerry
Sam Altman 暗示 GPT-5 即将出现!
3月19日,麻省理工学院(MIT)人工智能研究员兼播客 Lex Friedman 对 Sam Altman 进行了一场长达两个小时的专访。
Sam Altman 针对当前围绕OpenAI的多个热门话题进行了详细回应,包括董事会的变动与挑战、Ilya Sutskever、与Elon Musk的诉讼风波、Q*、Sora、GPT-5、7万亿美元计划以及自己对AGI的未来展望。
接下来,看看Sam Altman 都说了些什么。
GPT-5什么时候发布?
近期,OpenAI在人工智能领域的主要竞争者之一Anthropic,推出了其最新的Claude 3 系列模型。
其中最强的 Claude 3 Opus 模型在包括本科水平的知识(MMLU)、研究生水平的推理(GPQA)、小学数学(GSM8K)等基准测试上的表现,已经完全超越了GPT-4。
Lex Friedman 问了大家都很好奇的问题,那就是“OpenAI打算什么推出GPT-5?”
Sam Altman的回答很直白:我不知道。这是诚实的回答。
但是Sam Altman 补充说,我们将在今年发布一款令人惊叹的大模型。我不知道会叫什么名字。
未来几个月,我们会发布很多不同的东西。我觉得那会非常酷。我认为,在我们讨论类似于 GPT-5 的模型叫这个名字,或者不叫这个名字,或者比你期望的 GPT-5 差一点或好一点之前,我认为我们还有很多其他重要的东西要先发布。
当被问到“这个大模型有哪些最大的挑战和瓶颈需要克服?是在计算方面吗?是技术方面吗?”
Sam Altman 回应说,总是所有这些。你知道,什么是最重要的解锁方式?是更大的计算机?是新的秘密?还是别的什么?是所有这些东西的结合。我认为,OpenAI做得非常好的一点是......这其实是Ilya的原话,但我想说的是:"我们把200个中等大小的东西加在一起,变成了一个庞然大物。"
Sam Altman 这段回答含糊其辞,但是意味着 GPT-5 需要在多个方面取得进展,而不仅仅是单一的计算能力或技术突破,而是通过集成和优化许多中等规模的创新和改进,最终实现模型性能的巨大飞跃。
Sam Altman 透露 GPT-5 的创新是分布式的,不同的团队和个人在技术的不同方面进行创新,而这些创新最终被整合到一起,形成一个大型的、复杂的系统。
Q*是什么?
去年11月,OpenAI董事会发生内乱,Sam Altman被董事会扫地出门。当时,有传言称此次变动的原因与OpenAI内部一个代号为Q*的项目相关。
专访时,Lex Friedman 直接问 Sam Altman :“Q* 是什么?是Open的核武器吗?”
Sam Altman 用幽默的方式进行了回答,“我们还没准备好谈这个。我很想有一个秘密核武器,但是现在还没有。”
Sam解释说,OpenAI不擅长保守秘密,我们一直在进行各种研究。他提到,OpenAI认为在这些系统中实现更好的推理是一个重要的发展方向,尽管他们还没有找到解决方案,但对此非常感兴趣。
ChatGPT在爆火建立在GPT系列大模型不断迭代的基础上,Lex Friedman 很好奇:Q* 或其他系统是否会出现类似 ChatGPT 的飞跃?
Sam回答说,从他们的角度来看,技术进步感觉是连续的,而不是跳跃性的。他提到OpenAI的策略是迭代部署,而不是秘密开发直到达到GPT-5。他们认为人工智能和惊喜不搭配,世界、人们和机构需要时间来适应和思考这些事情。
OpenAI的目标是让世界关注进步,认真对待通用人工智能(AGI),并在被迫匆忙决策之前考虑适当的系统、结构和治理。
Ilya Sutskever去哪儿了?
自OpenAI宫斗之后,被认为是始作俑者的Ilya Sutskever除了在OpenAI 与马斯克的诉讼中以署名的方式出现过一次,就再无消息。
外界十分好奇 Ilya Sutskever 在宫斗时看到了什么以及他去哪儿了?
“你认识 Ilya 很久了。很明显,他也参与了这次董事会之类的闹剧。你现在和他是什么关系?”
Sam Altman 说,我爱Ilya。我非常尊重Ilya。关于他现在的计划,我没什么好说的。这是他的问题,但我真的希望我们能在我职业生涯的余下时间里一起工作。他比我年轻一点。也许他的工作时间会更长一点。
“有一种说法是他看到了什么,比如他可能看到了 AGI,这让他内心非常担忧。伊利亚看到了什么?”
Sam Altman 否定,Ilya没有看到 AGI。我们都没见过 AGI。我们也没有建造 AGI。我认为Ilya让我喜欢的一点是,他非常认真地对待 AGI 和安全问题。
Sam Altman 还说,最近我和Ilya一起参加一个晚宴,他正在和一只小狗玩耍,心情很傻,非常可爱。我当时就在想,天哪,这并不是外界看到伊利亚最多的一面。
当然,OpenAI宫斗的记忆没法抹除。
Sam Altman 承认,董事会的变动让他在信任他人方面变得更加谨慎,但他并不担心变得过于愤世嫉俗。他强调了与他每天一起工作的团队成员的信任和尊重,并认为被这样的人包围非常重要。
Sora 是世界模型吗?
今年2月16日,OpenAI推出了继ChatGPT之后的又一神作,文生视频大模型Sora。OpenAI 将 Sora 视为“可以理解和模拟现实世界”的基础模型,这是实现通用人工智能 (AGI) 的关键一步。
Lex Friedman 与 Sam Altman 探讨了Sora相对于GPT-4对世界的理解,以及在训练过程中使用的视觉补丁(visual patches)与语言标记(language tokens)的不同。
Sam Altman 认为,尽管这些模型在某些方面存在明显的不足,但它们对世界的理解比大多数人认为的要多。他提到,Sora在处理遮挡(occlusions)方面表现出了对三维物理世界的深刻理解,尽管这并不意味着它拥有一个完整的三维世界模型。他强调,这些模型正在不断进步,从DALL·E 1到2到3再到Sora的发展轨迹就证明了这一点。
Sora是如何训练同样是一个谜题。
Sam Altman 称 Sora 主要是自监督式学习,使用大规模互联网视觉数据,也融入了一些人工标注的数据,但是具体数量未透露。
Sam Altman 承认,在发布系统之前,需要解决效率问题,以满足人们对规模的期望,并且他们正在努力避免可能的负面应用,如深度伪造(deepfakes)和错误信息的传播。
7万亿美元计划系谣言
今年2月,Sam Altman被曝出正从中东地区筹集总计高达7万亿美元的资金,以支持OpenAI的一项半导体计划,并与英伟达展开竞争。
但Sam 接受专访时表示,我从来没有说过“我们要筹集 7 万亿美元”之类的话。
但是 Sam 不否认算力的重要性。
Sam Altman 提到了计算资源将成为未来的宝贵商品,并强调了为了实现更智能的AI系统,需要大量的投资来增加计算能力。他认为,与手机芯片市场不同,计算资源的需求将类似于能源,世界对计算资源的需求将取决于其成本。
而算力将消耗大量能源,Sam Altman 认为核能,尤其是核聚变,是未来能源的关键。他还提到了对核裂变的兴趣,并希望世界能够重新拥抱这项技术。
Sam还谈到了与谷歌的竞争。
Altman认为OpenAI不会简单复制谷歌搜索引擎,而是要探索更好的信息获取和综合方式,ChatGPT就是一个示例。
关于商业模式,Sam Altman 表示他个人不喜欢广告,并且OpenAI目前的商业模式不依赖于广告收入。他认为,没有广告的商业模式是可持续的,并且公司正在寻找如何在不牺牲用户体验的情况下整合广告的方法。
董事会风波与马斯克诉讼
Sam Altman 将OpenAI去年11月的董事会风波称为:人生中最痛苦的职业经历,混乱、可耻、令人不安,还有其他一些负面的东西。
“不过,我也很高兴它发生得比较早。我以为在 OpenAI 启动到我们创建 AGI 之间的某个时间点,会发生一些疯狂的爆炸性事件,但可能还会有更多疯狂的爆炸性事件发生。我认为,这仍然帮助我们建立了一些复原力,并为未来的更多挑战做好了准备。”
由此可见,Sam Altman对于这件事情的发生早有预感,只是时间不确定。
Sam 预计在追求 AGI 的道路上将会有更多的权力斗争。他强调了在组织结构、董事会构成和人员配置方面进行迭代的重要性,以尽可能地缓和权力斗争。
在谈到新董事会的构成时,Sam 提到,旧董事会的规模在一年内缩小了,他们增加了一些新的成员,这些新成员具有更丰富的董事会经验。
他还提到了在选择新董事会成员时的一些标准,包括非营利组织专业知识、公司运营经验以及法律和治理专业知识。
另一件让Sam Altman苦恼的事情可能就是马斯克。
三月初,马斯克万字长文起诉 Sam Altman 和 OpenAI,要求 OpenAI 开源还得赔钱。
Sam Altman表示他不确定Elon Musk诉讼的真正原因。他回忆了OpenAI的早期,当时他们只是作为一个研究实验室开始,对语言模型和API等产品化方向并没有明确的认识。
随着时间的推移,OpenAI意识到需要更多的资金和不同的结构来发展,因此进行了一系列的调整,这些调整可能看起来令人质疑,但Sam认为每一步的决定在当时都是合理的。
Sam解释说,Elon Musk认为OpenAI会失败,并希望完全控制它以扭转局面。OpenAI团队希望继续沿着现在的方向前进,而Elon希望将OpenAI变成一个他可以控制的营利公司或与特斯拉合并。由于双方意见不合,Elon选择离开。
Sam提到,如果能够回到过去,他会选择一个不同的名字。OpenAI的一个重要任务是将强大的技术免费提供给公众,作为一种公共利益。他们不通过免费版本运行广告或以其他方式进行货币化。
关于开源的讨论,Sam 认为开源模型肯定有一席之地,特别是人们可以在本地运行的小型模型,需求巨大。
“我认为会有一些开源模型,也会有一些闭源模型。在这方面它与其他生态系统没有什么不同。”
这句话可能意味着,Sam Altman 认为 OpenAI 现在闭源是合适的。
对于AGI的看法
Lex Friedman问:“你认为我们、你和我们人类什么时候才能造出 AGI?”
Sam Altman:“我以前很喜欢猜测这个问题。后来我意识到,我认为这个问题很不成熟,人们对 AGI 的定义也大相径庭。因此,我认为更有意义的做法是,讨论我们什么时候才能建立起能够实现 X、Y 或 Z 功能的系统,而不是模糊地讨论我们什么时候才能跨过这一里程碑。AGI 也不是终点。它更接近于一个开端,但比起上述任何一种,它更像是一个里程碑。但我想说的是,为了不回避问题,我预计到本十年末,甚至可能更早,我们将拥有相当强大的系统,我们看着它,会说 "哇,这真是了不起"。如果我们现在就能看到它, 也许到那时我们已经调整好了。”
Lex Fridman 提到,即使像ChatGPT 3.5这样的系统,如果展示给90年代的人,他们可能会认为这是AGI。但Sam Altman 认为,尽管ChatGPT 3.5可能改变了人们对未来的期望,但它并没有真正改变世界。
Sam Altman 表示,他个人非常关心的一件事是,当系统能够显著提高世界科学发现的速度时,那将是一个巨大的进步。他认为,真正的经济增长来自于科学和技术的进步。
Sam Altman 强调,他不认为任何一个人应该对OpenAI或AGI拥有完全的控制权。他认为需要一个健全的治理系统,并且不希望超级投票控制权集中在一个人手中。他提到,尽管董事会在法律上有权力解雇他,但实际上并没有发生。他坚持认为,不应该由任何一个人控制AGI的发展,而是需要政府和社会制定规则。