ChatGPT 与其之后不断涌现的大语言模型(LLM)迅速席卷了整个时代。随着计算机对人类自然语言的领悟程度突飞猛进,我们与计算机的交互方式正在迅速而深刻地改变着,这也即将带来一场既广泛又具有极强创新性的商业模式转型。
近日,真格基金管理合伙人戴雨森与拾象科技进行了一场对谈,以投资人的角度切入,话题从大语言模型技术漫谈开去,经由商业应用与 OpenAI 带来的启发,一直讨论到 AI 与人类交互的哲学思考。
以下是他们的讨论提要:
相信这次对谈不仅会对投资人和创业者有所启发,所有关注科技变革与商业的求知者,都能从中获得不同的视角与新的收获。如果这篇文章也让你产生了表达欲,欢迎在评论区和我们交流~
大语言模型关键判断
底层模型的价值和能力边界是什么?
拾象广密:
就像 Windows 一样,当年微软往上做了 IE 浏览器、Office、MSN。目前模型的能力和边界还不明确,但它也会持续往上做, 未来可能会拿走整个价值链大头。以前企业内有 ERP、HR SaaS 等等,未来可能会出现“大模型+周边多个小模型”共存的模式。
Yusen:
那么,你认为能力主要还是在模型端体现,模型端会承担 heavy lifting 的工作,应用端更多是一个输入输出(IO)或者是界面(Interface)的角色吗?
拾象广密:
我认为模型只是大脑的提供者,如果要应用的话,还需要看其他方面,比如是否在垂直领域积累了很强的专有数据、形成了网络效应等。
Yusen:
你的观点是,为了维护应用的竞争力,必须拥有大量模型之外的资产来捍卫能力端,否则应用可能会被模型所取代,对吗?
拾象广密:
是的。 我们在早期投资应用,应该思考清楚模型的边界是什么,哪些应用不会被碾压。我们认为: 有专有数据的、有网络效应的、有规模效应的,以及涉及机器人等硬件的,不容易被大模型取代。大家可以关注这几类公司:1)在硬件机器人,尤其是消费级机器人领域有提前布局的,可以使用新 AI 技术让机器人使用体验变得更好的;2)能持续积累独特数据的;3)有网络效应的,即大模型能不能再造一个微信、陌陌。
Yusen:
没错。因为目前 ChatGPT 只能解决相对普遍的问题,很难应对更细致且精确的问题。但是在工作中往往需要更精确的答案。尽管 AGI 非常强大,但其仍存在局限性,例如可能无法构建类似于微信的熟人网络。大型模型面临着难以逾越的层级障碍。这是大型模型的内在问题,可能需要技术突破来解决。与互联网不同,AI 存在许多层级,但跨越这些层级并非自然而然的过程。
图源:拾象科技
操作系统和大模型之间的差别是什么?
Yusen:
Windows 操作系统形成当前格局的过程中,伴随着很多开发壁垒,开发者需要与特定平台绑定,以产生强大的网络效应。大模型目前还没有出现类似现象。
拾象广密:
是的,其实大模型的迁移成本没有操作系统高。
Yusen:
对。因为操作系统竞争的核心在于用户分布在哪个系统上,为了吸引用户,开发者需要针对 Windows 开发应用。与此相反,基于浏览器的应用可以通过任何浏览器获得用户。这方面更类似于公有云,因为应用程序可以在任何云平台上运行,无需关注底层基础设施。
拾象广密:
是的。还有一个和 Windows 的区别是,操作系统和应用之间的数据不互通,而模型和应用之间迭代性更强,黏性也更强。而且,应用的爆发对模型迭代是很有帮助的。
LLM 究竟带来了什么变化?拾象广密:
第一,可以让我们采集更多非结构化数据。大语言模型能把我们说的所有话转化成各类数据。未来人类和企业的行为将会为模型提供更多数据沉淀,存入企业的数据库,用来做更多分析;
Yusen:
原来采集的数据得经过大量的人工清洗才能使用。现在只要把数据放进去,模型自己就能理解。
拾象广密:
第二,交互方式的多元化、简洁化。ChatGPT 目前还是用文字对话,未来可能会有语音对话,甚至用手拖拽、滑动。在内容形式上,除了文字,还有可能返回图片、视频等其他各种形式的内容。
Yusen:
ChatGPT 很像一个助理。以前的交互是用户教计算机做事情,现在不用教,它自己就可以学习、做事。比如我说“我渴了”或“我想买张机票”,以前是菜单操作,但未来它也许可以自己搞定。交互会变得越来越简单,它的做事能力也会越来越强。一些高维度、复合型的事情交给 AI 来做会更好。
图源:拾象科技
大语言模型应用层思考
AI Native 的应用应该是什么样?
拾象痕痕:
AI native 应用究竟是什么?其核心特点在于,它并非仅仅将现有模型简单地嵌入应用中。无论是面向消费者(ToC)还是面向企业(ToB)的软件和服务,AI native 应用必定会对它们进行深度重构。
Yusen:
从我听到的信息来看,AI native 应用对软件和服务的重构过程中体现出几个很明显的能力。
此外,在中国,公有大模型的私有化部署问题尤为重要。一个人对大语言模型的输入可能会直接转化为其他人的能力。
拾象广密:
这是一个很大的问题,私有部署之后,模型迭代的速度是慢于开源和 OpenAI 的。私有部署的模型能力很强之后,竞争对手可能会基于更强的模型做部署者本来的业务。
图源:拾象科技
「创新者的窘境」
拾象广密:
在大模型的发展下,未来的应用服务供给可能会发生较大变化。应用提供商不再基于安卓、iOS 开发应用,而是直接把供给通过某种形式对接给 AI 助理们。
Yusen:
这是典型的“创新者的窘境”。如果用户首选 ChatGPT,应用构建者则需在 ChatGPT 内部开发。但是,如果我是应用负责人,我不愿为 OpenAI 提供便利,因为这将影响我的核心业务。然而,如果不适应 ChatGPT 并在其中寻找商业模式,我的应用可能会被淘汰。
拾象广密:
是的,以美团为例,它如果很想做出一个生活助理,但又不愿被 Siri 这样的超级助理取代。这就引发了关于人们需要多少个助理的讨论。
Yusen:
所以这是一个高频打低频的终极答案?
拾象广密:
有可能。如果高频打低频是成立的,那其实对低频助理是很不利的。 到时候 OpenAI 有可能会把虚拟世界的助理取代掉,因为它会把 APP、 SaaS 系统重新组合。所以谁能走在流量前端才是更重要的。
Yusen:
最有可能的情况是,凭借 ChatGPT,OpenAI 能够在竞争中脱颖而出。或许 ChatGPT 可以同时调用多个接口,实现跨应用整合。然而,这需要一个开放的生态环境。各方愿意分享对整个系统最有利,但同时也不能忽视各方可能再次建立壁垒、设置障碍的风险。
科技巨头如何将 LLM 与业务结合?
拾象程天一:
目前的二级市场上市科技公司、科技独角兽在和 LLM 结合中找的场景,可以大体分为四类:
如今,在大规模推广给用户并测试自身定价策略是否有效的公司仅有四家,分别是面向企业市场的 GitHub 和 Notion,以及面向消费者市场的 Duolingo 和 Snapchat。
现在这些公司的整合方式没有令人眼前一亮的,都是比较直觉性的结合。在商业层面,大家也不偏向激进进攻,更多是通过集成保护订单胜率和现有定价。
Yusen:
这会不会成为一个典型的鸿沟跨越过程中的鸿沟?在初始阶段,大家都比较乐观,认为有了 AI 就可以起飞,因为早期采用者对未来充满期待,所以会形成很高的预期。但后来可能会发现事实上并非如此,进而陷入鸿沟。
拾象程天一:
是的,因此二级市场公司基本上没有因为与 ChatGPT 整合而股价大幅上涨,Duolingo 涨得比较多也是因为业绩表现实打实不错。
图源:拾象科技
OpenAI 组织架构给我们的启示?
坚定不移的 AGI believer
拾象广密:
OpenAI 团队对 AGI 的信仰非常坚定、纯粹。其他公司做 foundation model 更多是想做一个厉害的机关枪,兼并更多的市场和业务。但 OpenAI 不同,它在认真探索一个强大的 AGI,所以它成为了 AGI 领域的定义者。
自下而上推动创新
拾象广密:
OpenAI 早期做游戏、强化学习,后来走向了 transformer 和大语言模型,然后是 ChatGPT。一方面,ChatGPT 是一个从下而上的产品,先由项目组提出,而后引起整个公司的重视。另一方面,对 AGI 的信仰,让整个公司确定了主路线图——探索 AGI 的边界能力。
Yusen:
很多探索边界的公司会变得像一个研究组织。而 OpenAI 为了把产品做好,反而刻意降低对边界的探索。比如 GPT-4,他原本可以做很多意想不到的操作的,但他们反而选择把它做得更好,这个转变非常厉害。
强技术背景+敏锐商业嗅觉的团队
拾象痕痕:
Sam Altman 认为 Greg Brockman 是最好的招揽人才的人,早期近 60-70% 的人都是他招进来的。几位联合创始人凑齐了业内最好的工程师+科学家+企业家,团队人才密度高,每个人都是六边形战士。OpenAI 也网罗了 GoogleBrain 和整个硅谷最好的 AI 人才;微软也有对 OpenAI 大力支持,比如微软 CTO 和 EVP Kevin Scott,是第一个接触 OpenAI、将其带入微软的人,Sam 曾在第二次创业做 Loopt 就想招揽他去做 CTO。
拾象广密:
OpenAI 从一开始就不只是做研究,他们一直在做产品,并且定期都有给用户和开发者的产品。他们知道商业支持是必须的,用户使用数据对优化模型非常重要。这几位早期创始人的背景和纯科学家有较大差别,都有很强的商业嗅觉。
图源:拾象科技
哲学发问
什么知识应该被公有化?
Yusen:
我们输入给 ChatGPT 的内容可能会直接变成公共知识,也可能被竞争对手看到。有些信息属于严格私有,如个人支付信息;而有些信息则是公开的,例如 Wikipedia。这中间也存在一些模糊地带。
拾象广密:
对,但我觉得还有一个问题,即便有些信息没有变成公有,但能力有可能变成公有——你长期训练你的助理,他的项目判断能力就会变强,模型能力变强了,别人用这个东西的反馈也会变好。
Yusen:
可能某些情况下,我并不愿意将我的信息加入其中。例如,假设我是一位作家,拥有自己独特的写作风格。如果我将手稿存储在 Google 和 Facebook 上,它将一直存在于网络中。在 LLM 时代,可能每个人都能模仿我的文风进行创作。
AI 是否会有自主行为?算法和人的安全要怎么保护?
Yusen:
目前 ChatGPT 的主要功能依然是阅读。虽然现在 AI 可以帮助我们浏览网络,但尚无法帮助我们发帖。如果它能够自发地执行许多任务,可能产生很多可怕的后果。AI 现在具备一定的自主行为能力,但它是否能够独立执行任务、是否能够帮助人们大规模、高速度地完成任务,将产生重大影响。
拾象广密:
举例来说,Zoominfo 推出了一个很实用的功能,它可以自动生成针对客户的邮件,CRM 系统直接将这些邮件发送出去,并跟踪这些回复的潜在客户。我觉得这也有一点类似于发帖。
Yusen:
GPT-4 在安全方面强调,不希望 GPT 具备长期规划能力,因为如果赋予它一个目标,它可能需要获得许多控制权,从而可能导致不可预测的结果。因此,现在的 ChatGPT 仍然遵循“你说它做,你不说它就不做”的原则。尽管它可能具备长时间、自主地执行任务的能力,但目前的安全措施不允许它长时间地、自主地执行任务。因此,未来大型语言模型的安全性将变得非常重要。
拾象广密:
安全一定是很重要、很值得投的。不只是算法上的安全,还有人的安全。未来最大的安全公司可能是保险公司,比如我买这个助理的一年使用权,最后出了事可能由保险公司来垫付。
另外,版权也是一个重要问题。Midjourney 也遇到过版权问题,所以上市公司如英伟达、Adobe 就不敢用有版权保护的图片去训练模型,于是效果可能不如 Midjourney,但好处就是他们可以在 ToB 领域服务一些大客户。
拥有超级助理的未来,到底 AI 和人谁能更懂你?
拾象广密:
以后的 AI 公司都是助理服务公司。未来有了助理后,可以直接对着手机说帮你做什么事,减少很多打开 APP 和 SaaS 系统的时间。APP 这种形式可能会被打散,不再有 APP 间的壁垒。而且,大语言模型对于供应链比较强的公司是有促进性的,复杂的供应链要做反向优化,像适应以前的搜索引擎优化(SEO)一样去适应助理的优化。
Yusen:
助理的搜索引擎优化(SEO)确实非常重要。比如,我们办公室的助理需要决定选择哪家外卖服务或物流公司,这其中涉及线下资源和实体服务。未来,像 ChatGPT 这样的超级流量入口可能会成为新时代的搜索引擎。
拾象广密:
假如 ChatGPT(或者中国的 ChatGPT) 变成了一个 1 亿活跃助理的超级流量入口,那么很多供给都会主动去适配它。那时还可能会形成新一代的网,以前是人和物的网,现在包括人和助理、助理和助理,将会是一个更复杂的网络。
Yusen:
但是,我们是否能确保 AI 助理的记忆和能力得到清晰划分?我的助理能否成为保护我的信息的壁垒?还是会在云端为所有人服务?就像电影《Her》一样,同时跟所有人恋爱。
更多被投新闻
依图科技 | Momenta | Nuro | 云天励飞
禾赛科技 | 晶泰科技 | 地平线 | 燧原科技
亿航智能 | 思谋科技 | 青藤云安全 | 爱笔智能
沐曦 | 驭势科技 | 芯耀辉 | 森亿智能 | AutoX
格灵深瞳 | 曦智科技 | 来也科技 | 星亢原
黑湖智造 | 领创集团 | 非夕机器人
芯行纪 | 灵明光子 | 优艾智合 | 炬星科技
东方空间 | 循环智能 | 诗云科技 | 赛舵智能
潞晨科技 | 芯控智能 | 氦星光联 | 悠跑科技