生成式 AI 的爆火,让硅谷的钱寻找到了新方向。Open AI 去年先后推出的绘画模型 DALL- E 和对话机器人 ChatGPT,成为了 AIGC 浪潮中的引领者。
前不久,微软决定向 Open AI 投资数十亿美元,新一轮投资也让其估值达到 290 亿美元。似乎又回到了上一次 AI 给人们带来无限想象的时候。
OpenAI 的创始人山姆·阿尔特曼(Sam Altman),则成为了这次 AI 新浪潮绝对的代言人。
OpenAI 创始人山姆·阿尔特曼(Sam Altman)
如果要举出当下离 AI 技术革命最近的人,山姆·阿尔特曼(Sam Altman)必然是其中之一。
2017 年,他在 Medium 上写道「我们已经来到同进化的阶段ーーAI 的影响、作用并感染我们,我们改进 AI」。那时候,他仍担任创业孵化器 Y Combinator 的总裁,并和伊隆·马斯克、彼得・蒂尔、雷德・霍夫曼等人一起投资了 10 亿美元,共同成为 Open AI 的创始人。
又过了两年,他将工作重心转移到了 AI,担任 OpenAI 的 CEO 直到今天。
去年秋季,投资机构格雷洛克(Greylock) 举行了一次 AI 主题峰会。在一场与 Open AI 创始人之一的老友雷德・霍夫曼,以及在坐观众的交流中,山姆·阿尔特曼分享了对于未来的预测:AI 大模型技术,将成为继移动互联网之后,未来最大的技术平台;而以聊天机器人为界面,加上图像、音乐、文本等多模态模型的发展,将诞生大型企业。
甚至有一些更激进的预测,比如 AI 科学家将学会自我迭代,它不仅仅降本增效,而是为人类带来新知,增加人类知识的总和。不过如果了解他早些时候的想法,便会觉得这样的预测并不出乎意料,他曾说,人类以超群的智力为傲,或许在 AI 看来,「我们和黑猩猩之间的差异几乎不值一提。」
他形容「我们正处在AI的悬崖边上」,他感到巨大的惊喜和危险都近在咫尺。不过,坚信科技的发展会带来人类进步和经济增长的他,选择保持乐观,为一个更美好的未来努力。
这是当天对话主要内容的编译,提问有些来自雷德・霍夫曼,有些来自现场观众,不再单独标出。
雷德・霍夫曼与山姆·阿尔特曼在活动现场
Q:就大模型的API(application programming interface,应用接口)而言,真正的商业机会是什么?如何在它们上面创建独特的业务?
A:目前为止,在这个领域里,可以做一个极好的文案业务、教育服务或者其它。但还没看到有人追求继谷歌之后的万亿美元级(产业)。我觉得就要发生了,可能会成功。或者谷歌会自己做。不过我猜测,随着未来几年语言模型质量的提升,作为搜索产品的谷歌会遇到第一个严肃挑战。
人们太早嘲笑许多趋势,人性化聊天机器人界面这个时候真正起作用了。聊天机器人挺好的,只是太早了。现在它可以工作了。新的医疗服务能以这种方式实现,可以拥有很好的建议或者新的教育服务,这些会是非常大的公司。
不久就会有多模态模型,这将开辟新的事物。这将是一个巨大的趋势,大型企业将以此作为界面建立起来。更普遍而言,这些非常强大的模型将成为真正的新技术平台之一,移动手机以来我们还没有真正拥有过这种平台。之后总会有新公司大量涌现,所以会很酷。
Q:作为大型语言模型 API 的服务提供商,关键是什么?如何创建一个持久的差异化业务?
A:我认为将会有一小部分的基本大模型。但现在发生的是,一个公司制作了一个大语言模型 (API 可以在此基础上构建),中间层会变得非常重要。我对所有试图培训自己模型的创业公司持怀疑态度。我觉得不会一直这样下去。但将会发生的是,有一批新的创业公司采用已有的大模型,并对其进行调整,不仅仅是微调。
会有很多方式,创建医学模型、或者把电脑当作朋友之类。这些公司将创造很多的长期价值,因为他们将有一个特殊版本。不必创建基本模型,他们可以只为自己或与人共享来创造。它们有独特的数据飞轮,随着时间的推移不断改进。我认为中间那一层会创造很多价值。
Q:一个大型语言模型初创企业,如何区别于另一个大型语言模型初创企业呢?
A:我觉得应该是中间层。从某种意义而言,创业公司会训练自己的模型,只不过不是从头开始。他们将采用基础模型,这些模型经过大量的计算和数据训练,然后在这些模型之上进行训练,为每个垂类创建模型。
他们所做的 1% 的训练对于应用来说真正重要。我认为,这些创业公司将会非常成功,并且与众不同。这是创业公司能够做的关于数据飞轮的事。这可能包括一段时间内存在的 prompt engineering(提示工程)或基础核心模型(core base model)。我认为这会变得过于复杂和昂贵,而且世界上也没有足够的芯片。
注:提示工程是指将任务的描述、或者提问放在输入中,让 AI 模型输出理想结果的调试过程;ChatGPT 走红之后,提示工程师这一岗位也被人所关注。
Q:五年内,大多数用户与基础模型交互的方式是什么?prompt engineering 将是许多组织的内部功能吗?
A:我不认为五年后我们还做 prompt engineering,这将被整合进所有地方。无论用文本还是语音,取决于上下文,只需要语言接口,让计算机做你想做的任何事情。也许生成一个图像还需要做一些 prompt engineering,但这仅仅是让它启动做这个复杂的事情,或者只是做我的治疗师,帮助我弄清楚如何让我的生活更美好,或者为我使用我的电脑,做这件事情或其他事情。我认为基本的接口将是自然语言。
Q:当有一个伟大的视觉思考者,他们可以从 DALL-E 中获取更多,因为他们知道如何更深入思考,知道如何在测试中迭代循环。你认为这是大部分这类事的普遍真理吗?
A:百分百确定。重要的是思想的质量,和对你想要的东西的理解。所以艺术家仍然会在图像生成方面做得最好,不是因为他们在图像最后加上了这个神奇单词。因为他们能用我没有的创造性的眼光来表达。
DALL-E2 生成的作品|来源:kasendorf
Q:最令你惊讶的是什么?如果没有意识到事情已经发展到这一步,你认为会有什么样的惊喜呢?
A:人们现在所犯的最大的系统性错误,就是他们会说,「好吧,我也许持怀疑态度,但是这种语言模型真的会起作用,当然,图像和视频也会起作用。但它不会为人类产生新知。它只会做其他人已经做过的事情。还是很棒。这还是让智力的边际成本非常低,不能治愈癌症。它不会增加人类科学知识的总和。」我认为这将被证明是错误的,让目前该领域的专家最感到惊讶的地方。
Q:无论是建立在 API 之上,还是科学家使用 API,有哪些地方的科学会加速,以及如何加速?
A:其中之一是专注科学的产品,比如 AlphaFold。这些都会增加巨大的价值,你会看到这种方式越来越多。我想如果我有时间做点别的事,现在就会兴奋地找一家生物公司。
还有另外一件正在发生的事,就是使我们更有效率的工具,它帮助我们思考新的研究方向,编写一大堆代码,这样效率就可以提高一倍。这种对一个工程师或科学家的净产出的影响,将是人工智能对科学贡献的惊人方式,它超越了显而易见的模型。CoPilot 就是一个例子(注:GitHub 和 OpenAI 合作开发的一个 AI 工具,帮助程序员在编程过程中自动补全代码)。还有更酷的东西。这将是技术发展、科学发展方式的重大变革。目前,这两个是是巨大的,带来加速的进展。
但我认为人们开始探索的一件大事是——我不想使用这个词,因为我觉得它有一种好的使用方式,另一种更可怕——AI可以开始成为 AI 科学家,并自我迭代。作为 AI 开发者,首先能把自己的工作自动化吗?这能帮助解决不知道如何解决的、困难的「对齐问题」(alignment problems)吗?说实话,我认为这就是未来的发展趋势。
我坚信,人类进步和长期经济增长的唯一真正驱动力是促成科学进步的社会结构,然后是科学进步本身。我觉得我们会做得更多。
Q:「对齐问题」可能值得解释一下?
A:建立一个非常强大的系统,如果它不按我们的意愿行事,或者它的目标与我们的冲突,就会变得非常糟糕。
因此,对齐问题是:我们如何建立做最符合人类利益事情的 AGI(Artificial General Intelligence 通用人工智能)?如何确保人类能够决定人类的未来?
我们如何避免意外和故意误用,前者是没有预料到的错误,后者是一个坏人使用 AGI 造成巨大伤害;内在而言的对齐问题是,如果这个东西变成一个生物,视我们为威胁怎么办?
我们对如何在小范围内解决对齐问题有一些想法,已经能够使 OpenAI 最大的模型(表现得)比想象的要好。我们对下一步做什么有些想法,但不能诚实地看着任何人的眼睛说,看到了 100 年后将如何解决这个问题。但是,一旦人工智能足够好,我们可以问它,「嘿,你能帮助我们做对齐研究吗?」这将是工具箱里的一个新工具。
Q:我们之前的一次谈话是,能不能告诉 agent(注:AI 中的一个概念,通常指环境中的智能主体),「不要种族歧视」?
A:当然。一旦模型变得足够聪明,真正理解了种族主义是什么样子,以及它有多复杂,你就可以说,「不要成为种族主义者。」
Q:「AGI」这个术语已经被广泛使用。有时困惑来自于人们对 AGI 有不同定义。你如何定义 AGI,怎样知道我们什么时候实现它?
A:有很多有效的定义。但对我来说,AGI 基本上相当于可以雇佣作为同事的中等人类。它们可以做任何你喜欢与电脑后面的远程同事做的事,包括学习如何成为一个医生,学习如何成为一个非常有能力的程序员。
一个普通人能做好很多事。我认为 AGI 的一个技能不是任何特定的里程碑,而是学习解决问题的元技能,它可以去做好你需要的任何事情。超级智能则比全人类加起来还要聪明。
Q:如何看待像 GPT-3 这样的基础技术,对生命科学研究进度的具体影响?生命科学研究中速率限制的因素是什么?我们无法超越这个限制,因为自然法则就是这样?
A:我认为现有的模型还不够好,不足以对该领域产生重大影响。至少大多数生命科学研究人员这么告诉我。他们都看过了,觉得目前在某些情况下能有点帮助。我觉得这会改变的。在这些领域中,将会有新的 1000 亿到 1 万亿美元的公司诞生,这些领域不多。
生物技术的发展速度仍然有限,人体试验需要很长时间。所以有趣的是,在哪里可以避免这种情况?我见过的最有趣的合成生物公司是那些能够让生物周期变得超快的公司。这对 AI 有好处,AI 会给你很多好主意,但你还是要测试它们,现在就是这样。
我非常相信创业公司,如果有低成本和快周期,就可以作为一个初创公司,与现有的大公司竞争。我不会选择心脏病作为这家新公司的第一个目标。不过用生物技术制造东西挺好。另一件事是模拟器还是那么糟糕。如果我有一家生物与 AI 相结合的创业公司,肯定会设法在这方面努力。
分子效果图|来源:ANIRUDH on Unsplash
Q:你认为登月计划(指 AI 的进化)在未来几年中有什么值得人们关注的地方?
A:从更有确定性的事情开始。我认为语言模型将会比人们想象的走得更远。很多人都说计算机用完了,数据用完了。但是我认为在算法方面还有很多进展,我们将会有一个非常激动人心的时刻。
另一件事是,真正的多模态模型将起作用。因此,不仅仅是文字和图像,而是一个模型中,你拥有的每一种形式,都能够轻松地在事物之间流畅移动。会有不断学习的模型。现在如果你使用 GPT,它会停留在它被训练的时间。你用得再多,效果也不会好。我想会改变的。所以我对这一切感到非常兴奋。
如果想一想,仅凭这一点能解锁什么,以及人们能用来开发什么应用程序,那将是一个所有人的巨大胜利。是一个巨大的进步,一场真正的技术革命——如果这一切都发生了的话。但我认为,我们也可能继续在新范式上取得研究进展。我们对正在发生的事感到惊喜。我认为所有这些问题都关于新知识的产生(我们如何才能真正促进人类进步?) 我认为会有系统帮助我们。
Q:谈一谈目前被广泛讨论的领域,例如,AI 和核聚变。
A:我们在讨论,有没有人在说「我正在将这些强化学习模型用于核聚变或其它什么」,而且就我们所知,它们都比聪明的物理学家的发明糟糕得多。
一件不幸的事情是,AI 已经成为一个流行词(buzzword),这通常是个很糟糕的迹象。我希望这并不意味着这个领域即将分崩离析。但从历史上来看,这对于新的创业公司来说是一个非常糟糕的信号。我认为这是个人们会说一切都是「这个加上 AI」的领域,很多事情都是真的。我确实认为这将是这一代最大的技术平台。
我们喜欢在前沿领域做预测,预测和理解规模理论(scaling laws)是怎样的(或是研究之后),然后说「好,这个新事物将发挥作用,就根据种方式来预测推演。」
这就是我们尝试运营 OpenAI 的方式,很有信心的时候,就做眼前的下一件事,拿出公司 10% 放手探索,这已带来了巨大的胜利。
我怀疑五年后是不是还用 transformers。我希望能找到更好的办法。但 Transformer 显然是非凡的。因此,我认为,重要的是要始终寻找将在哪里找到下一个全新的范例。我认为这是做出预测的方法。不要什么事都关注 AI。我能看到某些东西在起作用吗?我能看到它是如何变得更好的吗?当然要留出空间,你不能计划伟大,但有时研究发生突破。
Q:AI 应用在非常重要的系统,例如金融市场,将会发生什么?
A:AI 将渗透到每一个角落。我对未来十年的基本模型是,智力和能源的边际成本将迅速趋于零,而且幅度之大令人惊讶。
必须假设这将涉及到几乎所有事情。当整个社会的成本结构发生变化时,就会发生翻天覆地的变化。这种变化以前发生过很多次,人们总是容易低估这些变化。我不会对任何变化不大,或没有应用的东西做出高信心的预测。
Q:AI 可以为人类创造者提供工具,拓展创造力。那么,让创造者更有生产力\AI 用创造力自己去做每件事的界限是什么?
A:至少目前看到的不是取代,主要是增强。在某些情况下,它正在取代。但对于这些领域的人们想从事的大多数工作来说,它是增强。这种趋势将持续很长一段时间。可能展望 100 年,它可以完成整个创造性工作。
我觉得有意思的是,如果 10 年前问人们,AI 将如怎样带来影响,多数人会很有信心(地说),首先它将取代工厂的蓝领工作,卡车司机等,然后将取代低技能的白领工作,然后是高技能、高智商的白领工作,比如程序员。也许永远不会取代那些创造性的工作。现在的发展正好相反。
这里有一个有趣的提示:预测是多么困难。更具体而言,我们并不总是很清楚(甚至对于自己而言)什么技能是困难或容易的,哪些使用到大脑或者不使用,控制身体是多么难。
Q:你认为 AI 不会改变生活的哪些方面?
A:所有深层生物学的东西。我们仍然会真正关心与他人的互动,仍然会享受乐趣,大脑的奖励系统仍然会以同样的方式工作。我们仍然会有同样的动力去创造新事物,为愚蠢的地位竞争,去组建家庭等。所以我认为人们在 50000 年前关心的东西更有可能是 100 年后人们关心的东西,而不是 100 年前。
《银翼杀手2049》剧照 | 图片来源:豆瓣
Q:在未来的 20 到 30 年里,随着人工智能的不断发展,会出现主要的社会问题吗?我们今天能做什么来缓解这些问题?
A:对经济的影响是巨大的。如果它像我认为的那样,一些人做得非常好,一些人做得不好,社会就不会容忍这种情况。所以要弄清楚什么时候会扰乱这么多经济活动,即使 20 年或 30 年后还没有完全扰乱。我认为很明显是会发生的。
新的社会契约是什么?我推测,必须弄清楚,怎样考虑公平分配财富。涉及 AGI 系统,这将是一个带有领域属性的商品,涉及治理,我们如何集体决定它们能做什么,不做什么等。找到这些问题的答案将会是一件大事。
我乐观地认为,人们会想办法度过自己的时间,并感到非常满足。我觉得人们担心的方式有点傻。我相信人们做的会非常不同,但总是能解决这个问题。我确实认为,财富、机会和治理的概念都将发生变化,我们如何解决这些问题,将是巨大的(事情)。
我们进行了世界上最大的 UBI 实验(Unconditional Basic Income,无条件基本收入)。五年计划还剩下一年零四分之一的时间。这不是唯一的解决办法,但我认为这是一件伟大的事情。应该再尝试 10 件这样的事情。我们还尝试了不同的方法,从我们认为将受到最大影响的群体那里获得意见,并看如何在周期的早期阶段行动。最近我们探索了如何将这项技术用来重新培训那些早期将受到影响的人,也会尝试做更多这样的事情。
注:无条件基本收入,指没有条件、没有资格审查,公民可以定期领取由政府或特定组织给予的一笔资金。
我想,没人知道我们正处在 AI 的悬崖边上。人们会说「要么会很棒,要么会很糟糕」,你得做最坏的打算。说一切都会好起来,这并不是一个策略。不过你可能会有某种感觉:我们将到达一个美好的未来,并且尽所能的努力工作,为之奋斗,而不是一直从充满恐惧和绝望的地方采取行动。
https://greylock.com/greymatter/sam-altman-ai-for-the-next-era/
https://moores.samaltman.com/
https://medium.com/wordsthatmatter/merge-now-430c6d89d1fe
本文来自微信公众号“极客公园”(ID:geekpark),作者:凌梓郡,编辑:靖宇,36氪经授权发布。