当前位置:首页|资讯|AIGC|ChatGPT

AIGC“尖峰系列”|李大海:我们将进入群体智能新时代(现场问答)

作者:源码资本发布时间:2023-12-12

原标题:AIGC“尖峰系列”|李大海:我们将进入群体智能新时代(现场问答)

今年上半年的ChatGPT东风,急速拉开了极具想象力的AIGC创业浪潮。国内涌现了一批大模型相关的创业公司,如今半年过去了,关于大模型、关于AI的讨论进入了另外一个阶段:从“聊概念、谈未来”进化到了“说产品、看落地”。在技术底层逻辑被验证和广泛接受后,AI创业者们在反复验证基于大模型的应用产品落地,而那些行业外的创业者则仍在观望,这些落地产品到底能给行业、给企业的具体经营业务带来多大程度的变化?

近期,「码脑做客·私聊会」上,源码资本联合亚马逊云科技,特别邀请了面壁智能联合创始人兼CEO、知乎合伙人兼首席技术官李大海,分享了自己对AGI的看法,并提出从单体智能走向群体智能的发展趋势,他还指出了AI智能体的六大典型特性,并在中国大模型相关创业方面,与众多创业者做了交流。

李大海毕业于北大数学系,曾是Google 中国创始成员之一,后在云云网任工程技术负责人、在豌豆荚任搜索技术负责人,具有连续十多年的创业经验。他目前除了担任面壁智能CEO外,同时作为知乎合伙人、首席技术官,带领超过1500人团队,在顶尖技术体系搭建、战略规划、技术管理和商业化落地方面有丰富经验。

以下是现场问答环节的主要内容:

提问:如何看待Open AI新开的发布会以及以后行业的发展?

李大海:中国和美国是两个故事,大概一两个月之前,一群大模型公司的CEO们聚在一起交流,大家发表了观点之后,最后有人提问:“我们应该想清楚大语言模型是一个技术还是一个产品。”

这个问题我当时没有想清楚,后来想清楚了,在中国和美国它的答案不一样,在美国大语言模型就是一个产品,在中国大语言模型是一个技术,Open AI发布了之后,它可以给中国几个方向,但不能完全解决中国的问题。

很简单,咱们在座的创业者很少有在做企业服务的。做企服的兄弟们,过去几年还是挺苦的,应该是2022、2021年企服有一波投资的高潮,现在回头来看那波能活下来的公司应该还是比较少的,因为中国ToB市场的企业服务市场非常碎片化,效率不高,Open AI能够用API的方式获得非常好的业务增长和很好的毛利,这个事情在中国基本上不太成立,现在中国的大模型公司,很多公司都有自己的API,但毛利基本上是负的,并且肉眼可见也不会是一个很大的市场,后面的原因我相信大家都能够理解,如果是这样的情况之下,中国和美国的商业模式就不一样。

一个好的跨时代的产品其实是伴随着背后有一个跨时代的技术,再有一个非常好的应用场景,与之相匹配的商业模式,这几个东西是互相依赖的,早年谷歌就是因为找到了搜索广告,点击付费的模式盈利;而另外一个是脸书,脸书的社交平台作为产品非常成功,它的推荐技术跟产品结合非常好,它也因为这个事情上市了,但股价往下走,因为它的商业模式变更了。后来在这个基础上把Facebook新的模式找出来,这个模式结合在一起就变得非常好。中国现在的情况是还在找模式的过程,中国的大语言模型对应的商业模式不像Open AI,Open AI是一个模式,在中国不能成为主要支撑中国公司发展的模式,我认为两个国家的土壤不同,所以我们得有自己的答案。

提问:我认为在今天的阶段,实际上大语言模型还是像着幼儿的智力水平,可以交流但严肃依赖它其实不太现实。在这个基础上我很想听到行业上的看法,你认为这个智能未来会发展到什么水平,我个人有一些悲观的,摩尔定律也到头了,人类已有的知识量、工程量就这么多,也就训练的语言模型的规模大概也就是这样了,有没有可能再往上增长,或者智能还能再往上增长?

我们做ToB的市场,在中国如果API不是一个好的模型的话,在做这个市场的时候已经做了一些应用,去推的时候有一个很大的问题,用户很难部署这个东西,为我的应用部署一个模型这个事情几乎是不靠谱,我的应用20万,部署一个模型一年需要200万,他不可能再为我的应用应用再部署一个模式,是否打算做这个市场,如果打算做这个市场,这个市场未来是什么样子?

李大海:第一个问题,个人是乐观的,我认为AGI是个革命。我们看工业革命整个持续时间接近上百年,信息革命如果从第一台计算机问世算起的话,其实已经经历了大几十年的时间了,AI的革命也不是短时间的事情,至少第一版的ChatGPT是AI时代的蒸汽机,还有很多的问题需要解决,我足够有信心。

在过去几年中,我们见证了模型规模的指数级增长,每年以十倍的速度膨胀。这种持续的演进并非偶然,而是技术涌现规律的必然结果,是所谓的‘暴力美学’。达到模型基本可用这一里程碑之后,我们目睹了增长速度的策略性减缓和成本的优化,这是一个既可行又合理的转变。

数据方面,单纯从文本角度看,我们似乎已经挖掘到了互联网数据的底线。但作为前谷歌搜索引擎的工程师,我深知可被爬虫获取的只是数据海洋中的一小部分。在搜索引擎的世界里,我们称之为‘深网’,人类社会中的有用的数据远不止这些。另外,超越文本,更大量的多模态数据尚待挖掘,学习的空间极其广阔。数据的天际线远未触及,算力的挑战,反而激发了我们对摩尔定律的新理解。随着数据量的不断膨胀,问题已不仅仅局限于单位算力,而是整体计算能力的提升。总的来看,我们对未来的发展保持着乐观的态度。

至于API,它代表了客户的能力和需求,意味着他们有寻求和利用API的意愿和能力。但在中国,解决‘最后一公里’问题至关重要。这并不一定要通过私有化部署来实现,API可以作为一个工具提供给用户,但这不是终点。我们还需要在中间环节进行大量的交互,需要有专人进行系统集成。这样的集成可以以更经济的方式促进交互。我相信,这两种方法是可以相辅相成的。

提问:刚才Agent之间的沟通对话,通过很多人正在用,包括咱们的数据。第一,这里面有什么特别有价值的东西能分享一下?第二,它们之间的交流对话是否有可能自己会产生一些创造性的东西?目前这个阶段个人认为还是很难创造出有创造性的东西。

李大海:有价值的事物,关键在于我们要怀着敬畏自然和顺应自然的态度。很多时候,我们可以从观察人类的协作方式以及商业设定中获得有益的启示。具体的方法包括如何利用工具和反思技巧来提高质量,以及如何换一种视角进行沟通,这都是我们的宝贵经验。

另一方面,你提到了Agent之间如何创造出有创意的东西。创意通常是由群体共同合作产生的,有时候人类的思维可以看作是从他人那里获得思路片段A,再从别人那里获得思路片段B,然后经过个人思考后添加了C,从而形成了自己的独特想法。实际上,创造力往往涉及排列组合的过程,大模型在这方面通常表现出色。它们生成的内容并不是直接从某个原始、预训练的文档中一字不差地复制过来的,而是通过将已知信息组合、打破、重新组合而成。这种过程确实具有创造性,就像人类有时会从错误的记忆中产生出一些有趣的想法一样。

提问:Agent,其实是跟大模型能力紧密相关的,我们也知道现在大模型也是快速发展,Agent里面比较复杂的点在于任务拆解,是比较难的一个问题,任务拆解可能跟大模型发展能力又很相关,可能做了很多的事情,最后发现大模型一升级什么能力都有了,原来有很多的产品可能都不需要做了,你如何判断哪些事情是大模型会做的,Open AI会做的,比如你提到现在要解决记忆的问题,情感的问题,知识归因的问题,成长的问题,知识库的问题,哪些是大模型应该解决,哪些是应该大模型上面解决的?

李大海:首先,当涉及创业时,最核心的问题是要明确用户价值是什么,以及如何精准地将这个用户价值传递给他们。这是大型模型公司或Open AI无法完全胜任的。不论你是要帮助中国的抖音创作者还是解决某个领域的具体用户痛点,通常这些问题不能仅依赖大型模型或仅靠它们的能力就能解决。通常需要将模型与各种技术叠加在一起,有时模型可以覆盖其中的一部分,从而减少一些工作量,但最终交付给用户的完整产品,模型无法完全取代。

其次,我们需要思考技术发展的时间限制。任何技术,例如我们发布的一个模型,它的领先地位都不会持续太久,因为技术的演进非常快。因此,除了解决特定问题,我们还需要考虑如何在技术优势的基础上建立其他优势。这个问题同样至关重要,即如何将技术和产品优势转化为其他方面的优势。

提问:我有三个问题:1.从Agent来说本身基模不同,带来Agent的什么不同?你刚刚说我们也是从3.5到面壁自己的模型。

李大海:基座模型不同肯定在能力上有差异是肯定的。另一方面我们要换自己的模型,这样才能够让你的模型随着上层运用产生数据闭环,刚换的时候我们模型相比3.5要略差一些,但我认为这个差距还好,还是有很多不错的应用能够做出来。

提问:这个基模带来的差异是差异多大?

李大海:这是有非常多的细节,在Agent需要模型能够非常严谨跟进你需要的输出模式,可能不够跟进,这样效果就会变差,以及代码生成能力,我发现我们的模型 CPM很多方面会比ChatGPT3.5更好,但某一些方面会差一些。

提问:底座通过API连的,因为很多大厂像AutoGPT也正在做,其实咱们也算有基模的创业公司,有很多独立的创业公司专门以Agent为方向,本身这两个从发展的方向上来说是怎么样的前景和格局?

李大海:在这方面,我认为模型公司往往更容易获得商业成功。从另一个角度来看,为什么开发AI不使用ChatGPT的模型,而是选择自己开发模型呢?这是因为自己开发的模型可以更好地适应复杂的任务。虽然并不是每个人都需要开发基础模型,但对于像Agent这样复杂的应用来说,自主开发模型可以使模型的数据循环更加高效。当然,现在OpenAI也提供微调的功能,可以基于其模型进行微调,但我认为从商业角度来看,完全依赖它可能会存在一些风险。

提问:这个风险指什么?

李大海:比如Open AI自己出了一样的框架,那你怎么办呢?

提问:我认为商业风险未来是否还有创企在这里面做的点,如果几大公有云虽然集中性很高了,但多云管理的平台,三方公立还是有市场,如果类比那么Agent到底是自己有基模的创企自己做的还是怎么样?

李大海:实际上,我们应该讨论的是基于Agent的应用,这样会更有优势。如果你将自己看作是Agent框架的一部分,处于中间位置,下面有LLM层,上面有应用层,那么在中间的价值链可能会非常薄弱。个人认为这不是一个好的模式。但如果将Agent与应用结合起来,拥有具体的应用场景,并通过这些应用场景构建自身的优势,那么这种方式可能更加可行。

提问:第三个想跟您探讨的是,Agent肯定会带来很多新的空间,它对于传统的软件或者说这种类型的行业或赛道,哪些会颠覆掉,哪些会插上想象的翅膀会让它更快?

李大海:我认为未来的公司可以分为两种,这也是一个投资人朋友的观点。我想分享一下,我认为未来的公司基本上可以分为两种:一种是"+AI",另一种是"AI+",并且致力于颠覆现有格局。颠覆可以是自我颠覆,也可以是被其他公司颠覆。我们应该考虑加入AI后会产生哪些变化,这样更有利于思考未来的发展方向。

提问:我有一个小的细节问题,现在有很多大模型出来,大模型除了打榜之外,在你们内部有没有比较具体量化指标评估出来这个模型好还是不好?

李大海:如果评估不是出于追求排名或其他不实的动机,同时在评估过程中注意避免数据污染,那么所获得的数据将更为可靠,可以用来判断模型的表现优劣。

提问:量化的评测标准是什么?

李大海:有很多不同的评测级。大模型以应用来做评测是最实际的。

提问:我想表达的是内部有没有相对比较清晰的量化指标,因为训练要一轮一轮的量,你要知道第二轮比第一轮好,应该有一个量化的指标。

李大海:现在有大量开源的评测题可供使用,这些评测题可以通过机器评估,因此具有客观性指标。与此同时,我们自己也开发了一套越来越复杂的主观题,涵盖多个领域,需要人工评分,这样的评分成本相对较高。评分通常以分数形式表示,例如特别满意为2分,比较满意为1分,不满意为0分,然后综合得出总分。

提问:我不知道你们评的SFT的潜力,还是直接出结果的潜力?指通用的模型基础能力、知识能力、逻辑 能力,还是指专业领域的SFT的能力以及性能?

李大海:专业领域SFT的领域,通常来说就是模型越大能力越强。这是我在知乎的一些实践,当你有200万高质量的数据的时候,一个7B,一个10B,一个13B,不管什么模型你用SFT几乎是一样的,你的数据足够好,模型就不重要了。

提问:我问一个最后一公里的问题,我们正在企业营销帮助企业做最后一公里的AI Agent交付的问题。我们在单个的Agent、单体智能我们感觉在很多场景之下可以帮助企业优化场景,对比非常明显,付费意愿也很强烈,像XAgent的框架,框架很酷,我们也非常兴奋,尝试的一些,相当于从模拟个人变成模拟一个组织,能够做更多的事情,但从实际结果来看,目前阶段还是非常初级的结果,企业不关注过程,还是直接关注结果,和现在相比还没有特别大的明显优势,从具体应用场景、变现以及实际产出的角度来看,这种还需要什么样的发展以及多大的距离才能到企业应用级的结果,或者说一些关键的卡点在哪里?

李大海:更具体一些,多体智能之间的交流需要更长的记忆,而大型语言模型则要求更高的性能。这是一个相当重要的考虑因素。如果这些方面的工作不够出色,可能会受到限制。例如,如果我们处理超过7个智能体的交互,由于 LLM 的上下文长度问题,效果可能会下降。另外,群体智能是模拟人类社会流程的很好的模型。从这个角度看,它有潜力在创建新的人工智能流程方面发挥作用。我认为这是它的价值,它的潜力很大。当然,目前如果其它方案有更好的效果,那就先使用效果好的,不必太过纠结。

提问:我觉得Agent的想象空间是非常大的,我们想最完美的情况,将来我们会有一个超级终端,手机会变得不这么复杂,像AI智能一样,有任何需求告诉它,为了达到这种非常完美的状态,我们会有过渡,现在考虑具体的场景希望Agent可以操作美团API以及京东API,帮我定好目的地的机票,它直接回复我一切办妥,刷脸直接登机以及入驻酒店,全程都不需要再接触这个所谓现在的互联网概念,这个空间想象确实非常大,会彻底改变您所谓的人机关系,如果要做的话,具体操作的时候,我觉得京东或者美团像现在这种已经占据市场数据用户的,怎么会愿意把自己的数据以及API给你让你去操作,这个如何过渡?

第二个问题,其实手机厂商有很大的优势,因为操作系统在他们的手里面,像苹果有推出这样的Agent,大多数的创业者都有非常大的优势,为了达到这个ROA的世界,创业者都有哪些机会?

李大海:我觉得创业者永远要去找具体而下沉的场景,创业者要忘掉Open AI.

主持人:从去年到今年为止,Open AI其实挂了非常多次,而Agent也有偶尔的挂,而Open AI兼职已经挂的不能再挂了,基于它做产品,也是无论ToB还是ToC,要SOA的,包括我们使用国内各种提供API的SaaS大模型公司的产品,如何保证我的产品SOA是靠谱的?

李大海:如果是这种问题,没有什么好答案,就是服务降级。在正常的成熟公司里面其实都要做灾备,也应该做破坏性检查,如果大模型服务不可用了,那你的整个服务应该是降级而不是灾难性的让用户完全不能用了,这是一个工程问题。

面壁智能

面壁是从清华大学计算机系NLP实验室孵化出来的大模型公司。公司创始团队由行业经验丰富的创业家、业界 AI 技术领头人、知名NLP领域科学家和学者等联合构成。核心技术团队成员来自国内自然语言处理研究顶尖实验室,均具有知名大学博士和硕士学历,在国际国内权威期刊会议发表论文百余篇,获得多项专利授权,科研和技术实力处于国内领先水平;另有行业产品和商业化经验丰富的高端人才联合加入,引领大模型的场景与领域应用落地。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1