剑指「智能体」

作者：钛媒体APP发布时间：2024-08-23

ChatGPT

文 | 王智远

关于ChatGPT做搜索的新闻，我一直挺感兴趣。

上个月25号，OpenAI在当地推出了一个新产品，名叫“SearchGPT”。官方说，产品能给用户提供带链接的搜索结果，用户还可以继续问问题，系统会根据上下文给出回答。

我看到消息后，马上申请内测。但一个月过去，官方还没给我权限；现在网上办法多。我就通过特殊朋友渠道，弄到了一个测试账号，体验了一把。

体验之后什么感觉呢？

一句话总结即： perplexity AI解决不了的问题，SearchGPT也解决不了。

比如：AI幻觉。一千个观众有一千个哈姆雷特，不同的人看同一信息可能得出不同的结论。就算是同一个人，今天看到的东西和明天可能理解也会有所不同。

这就像AI面对复杂、多变的人类思维一样，如果AI不能真正地“站在你的角度”去理解问题，感受你的感受，那它很难独立地给出人们真正想要的答案。

因此，除非AI能达到这样高级的理解和适应能力，不然，AI永远无法避开幻觉问题。所以，怎么办呢？

来看看另一个新闻：

不久前，Twitter上有个名叫@iruletheworldmo的用户频繁爆料，谈到Project Strawberry（草莓计划），这是OpenAI的一个项目，以前叫Q-Star。

这个计划目标是让AI变得更聪明，更能自主。 简单来说，他们希望训练出来的AI能自己处理很多事，不太要人来监督。

这意味着，AI将能自己搜索信息，深入研究问题，甚至自己创造数据，这样就能减少对人类的依赖。也就是说，AI可能会变得更像人，更会思考。

这条推文引起了不少人的关注，大家都在猜到底是不是OpenAI内部信息，但还没等到官方回复，就有人跳出来了，这人叫Div Garg，是MultiOn公司的创始人。

他说：

OpenAI的“Q”还没正式出来，但我们已经推出了一个新的智能体，叫“Agent Q”，并且邀请大家来试试，很多人怀疑他在利用OpenAI的秘密项目来做广告。

我查了查，发现MultiOn这家公司确实在2023年接受了OpenAI、DeepMind等公司、高管个人的投资；所以，让人不禁猜想，OpenAI做的搜索项目，和他们到底有没有关系？

好吧。姑且，不论这事，来看看MultiOn这家公司。

MultiOn专门做AI智能体，目标是，通过智能体帮助人们完成日常任务，比如： 网页浏览、网购和邮件处理，他们希望构建一个能在数字世界里，能自主完成复杂任务的AI系统。

这么一看，两者之间确实有些相似。相似在哪呢？

我们换个角度：

请问，你解决不了AI搜索幻觉的问题，还要不要解决？作为普通人的我们当然觉得，要。必须解决。其实，单一视角往往会限制我们。

系统科学家罗素·艾可夫(Russell L. Ackoff)，在作品《问题解决的艺术》中提到：

复杂问题往往源于问题定义本身，如果能够以新的视角、新框架重新定义问题，有时能发现原本看似复杂的问题，其实有更简单的解决之道，或者，原本的问题根本就不需要以传统的方式解决。

也就是说： 解决一个复杂问题，最好的办法是，绕开把它转成一个非问题。

举个通俗的例子：

想象一下，你家厨房每次做完饭都一团糟。通常，你可能会选择在烹饪后进行一次大扫除，这样虽然能清理干净，但每次要花费大量时间和精力。

如果你换一个角度来看就不一样了。类似，重新组织厨房物品，把常用的厨具、调料放在容易拿到的地方，不常用的东西则收好。

改进烹饪流程，做饭时，边做边清洗用过的器具，甚至，在操作台上放一个垃圾桶，用于临时收集厨余和垃圾。

这样，是不是做饭过程中就能持续保持厨房整洁了？这就是，非问题化；重新定义问题和调整处理方式，使原本要解决的问题变得不再是问题。

那么，这和搜索与智能体之间有什么关系呢？来看看，OpenAI首席执行官Sam Altman在2024年4月25日斯坦福大学的演讲。

他说，AI实现通用人工智能（AGI）要经过五个阶段：

一级：能够进行对话交互的人工智能；二级：系统能够解决博士级别的问题。三级：系统能够代表用户工作几天；四级：人工智能能够开发创新。五级：人工智能系统可以执行组织的工作。

他并指出，目前OpenAI处于第一级，接近第二级。

考虑到进展，请思考一下，这样一个AI行业巨头，如何从当前阶段过渡到更高级阶段，比如“三级或四级，或者说，如何让弱人工智能到强人工智能？让技术更能满足每个用户第一场景使用情况？

答案很明显：AI智能体。

因为，智能体是过度解决问题的最好办法。想象一下，在理想状态下，面对亿万用户时，如果能够展示数千万个AI解决方案，来帮助大家解决各种问题，那么，无疑是最有效的。

毕竟，每个人都能找到符合自己需求的解决方案，极大提到了解决问题的效率和质量。

为什么是智能体？

昨天，一个朋友抱怨说，买房后要还贷款，未来几十年每月都要还几千块钱；他让我帮忙算一算，到目前为止，他一共还了多少本金和利息，如果他想提前还款，根据现在的政策，可以节省多少钱。

这种复杂的问题我怎么能解决？于是，我把它给了豆包。

我先描述基本情况，让豆包记住，然后，再把其他想法和诉求告诉它。大概几十轮的对话后，豆包帮我详细计算了出来，并生成一份大约600字的详细分析报告。

这份报告包括了完整的背景信息、我的具体诉求、计算过程和对比分析等。

你用过豆包，或者其他可以和AI对话的工具么？不知道你有没有发现，现在此类对话工具，连续上下文逻辑能力变强了。

我再说一个贴身经历：

最近几天，经常接到一些奇怪的电话，涉及内容如贷款、房产购买、京东优惠等。

这些电话中，上来就问需要、不需要、行或者不行。我发现，对方语气很像真人，但当我给出它们设定范围以外的问题时，它无法回答了。

这说明，智能体已经在不知不觉中融入了日常生活，它们，能够在特定的环境中模仿人类的互动方式。

所以，一个完整智能体，能够充分与环境互动，这包括智能体自身和它所处的环境两个部分；就像人类在物理世界中的行为一样，智能体在其“外部环境”中也能执行任务。

说白了，我可以与它交互，也能设定好指令，界定范围，让它帮我完成目标。

对比下来，是不是不难看出，智能体无疑是绕过AI搜索中幻觉问题、并成功商用的有效方式之一？

为什么这么说？

你想想看，考虑传统AI搜索和提问时，AI搜索直接给出答案，这种答案比较扁平化，不具备连贯性。 换言之，你提出一个问题，AI直接给你一个结论，结论会引用来自多个信息源的数据。就结束了。

智能体工作方式不同。

它不仅对单一问题做出反应，还会引入外部信息，在一连串多轮问答中，会反复接受来自你的信号，通过这种互动，它更能理解你的诉求。

在解决问题之后，它能生成一篇简短的文章、总结方案，把整个互动过程指标串联在一起； 很明显，智能体不是一个简单的AI提问、总结工具，是一个完全符合每个人需求的系统。

因此，智能体能完美绕过AI幻觉，毕竟过程中，你不满意时，能一次次纠正它的错误。

纵观国内市场，目前谁在做智能体呢？我查阅了一下，据说有超过4500家，比如：大家耳熟能详的百度、科大讯飞、云从科技、字节跳动和腾讯等。

所以，谁在做智能体，这个问题不好解答。与其这样，不如换种思考方式： 智能体类型有哪些？我们通过类型看各家所在的生态位。

我盘点结果是：

智能体（Agent）平台大体上分为两类： 一类基于知识库和数据库的。就像聊天机器人（Chatbot）这种简单的平台； 另一类是用来解决更复杂问题的。这种平台有多工作流编排的能力，比较高级。

国外Orkes Conductor、ControlFlow by Team Prefect、和 Flyte等平台，就是专为复杂工作流和数据处理设计的。

这些平台主要用户包括数据科学家、工程师、开发者，他们用平台来建立和优化复杂的工作流程，提高数据处理的效率和自动化水平。

国内也有类似的平台。像扣子Coze、百度智能云的千帆AgentBuilder、科大讯飞的星火智能体平台，还有腾讯的元气和阿里云的AgentScope等。

他们利用大模型搭建 AI 原生应用工作台，给开发者提供 RAG、Agent、GBI 等应用框架，赋能他们开发出来文生文、对话、文生表等垂直应用，以帮助企业和个人解决问题。

我根据对象、流程和代码复杂程度，把它细分成三类：

面向公众和非开发人员
面向开发者的平台
企业级开发平台

第一种，主要偏向低代码平台，不要你懂太多编程。

像GPTs这样的工具，提供很标准的操作界面和流程，主要用来做基于知识库的聊天机器人。给你一个模板，你按步骤填信息就行，不用自己调整太多东西。

字节跳动的扣子（国内版），就是被设计来帮助人们轻松创建下一代的AI聊天机器人。

第二种平台功能更强大，可以让开发者用各种API、第三方库，还能自己编写代码和调整参数，来精细控制智能体的行为。

Coze海外版很受欢迎，它的功能全面，支持很多高级操作。像百度、阿里和亚马逊也提供这样的平台，让开发者可以用各种AI模型来做更复杂的应用。

企业开发平台，专为企业设计，重点是帮助企业自动化他们的工作流程。

比如：

实在智能的TARS-RPA-Agent和壹沓科技的“数字员工团队”CubeAgent，它们是用来自动化企业日常操作的。

还有国外的Torq和国内澜码科技的AskXbot平台，也提供了大模型结合企业知识库的解决方案，帮助企业自动化处理更多复杂任务。

三种类型各有千秋，这么说，是不是更清楚一些？那么，站在AI搜索和智能体中间来看，智能体属于那种呢？

04‍

解答该问题，不妨站在行业结构视角看。我盘了一下，智能体（Agent）行业结构有四层，分别为：基础工具层、运营平台层、开发工具层，以及服务与培训平台层。

组件是做智能体必不可少的基础。有各种智能模块、记忆模块，比如语言模型、数据库，还有一些安全工具和通信工具，就像盖房子的砖块和水泥。

运营层，包括制作Agent组件的厂商和各种运营集成平台。如GitHub这样的Agent框架发布平台，它们提供必要的环境和服务，支持智能体运行。

开发层相对容易理解了。

像Agent工具集成平台AgentLego、或提供专属云环境及沙盒环境的平台等，它们使开发者能够构建、测试和部署智能体。

值得一提的是，像NexusGPT、Relevance AI等平台，它们提供数字员工Agent的训练服务，目的帮助企业把智能体整合进现有的工作流程中，或者帮助个人创建能自动完成任务的AI团队，这反而是目前很多企业刚需。

国内也有类似的公司。例如：

金柚网的梧桐数字员工、壹沓科技的数字员工平台1Data Agent，以及实在智能的RPA Agent。

这些平台的特点是允许用户通过聊天，轻松与智能体互动，管理和优化各种业务流程，使智能体理解和执行复杂任务，让日常更高效。

不论怎么说，从短期发展看，智能体要解决两个问题：

一，丰富通用工作流和场景工作流，类似于AI搜索下的大搜，还要在处理数据训练、多轮对话的准确性上下功夫。

二，让智能体成为知识专家，形成可持续的服务能力。有点像针对特定领域进行深入挖掘。

比如，假设我是做消费品营销的，如果有一个专门的智能体，它学了很多关于社交媒体趋势、消费者行为的知识，那么，它就能真正帮到业务。

当然，智能体在其他行业也在不断爆发，像游戏，金融、医疗等，总体上说，基于LLM的能力，下一步基础智能体必将是绕不开的一步。

总结

让它光思考，远远不够。

想实现真正全面AGI，得把对话模型变成基本智能体，让它参与到实际使用中去；就像人们常说的，从实践中来，到实践中去一样。

所以，AI生成避免不了幻觉，但智能体的轮番交互，可以微调，可以解决具体问题，至少，使用场景下，这是闭环的正向反馈动作。

剑指「智能体」

推荐体验

相关资讯

剑指「智能体」

剑指AI，马斯克暗度陈仓

剑指谷歌，OpenAI将推出‘SearchGPT’

剑指OpenAI 马斯克详解xAI

剑指美国科技巨头：欧盟《人工智能法案》本月生效

近期资讯

途顺数控取得断桥铝滚压复合机专利，实现对断热隔热条与断桥铝复合的迅速冷却

上海合亚精密取得一种组合式压筋折弯模具专利，便于工件冲压入冲压槽中

文成县昌泰电力有限责任公司申请一种利用配体竞争配位调控多金属基普鲁士蓝类似物的晶体形貌的专利，所得产物纯度高

江苏拢研机械取得用于法兰的扩孔机专利，解决了法兰扩孔易偏移的问题

台州闪能申请锰酸锂正极材料专利，有效提升锂离子电池循环性能

中国石油天然气申请一种 SAPO-11 分子筛及其合成方法与应用专利，该合成方法可以有效抑制杂晶的生成并能提高单釜产率

山西和创鑫取得防堵冲孔模具专利，避免冲孔槽内壁残留碎屑磨损冲头保证冲孔质量

珈钠能源申请钠离子电池硫酸铁钠复合正极材料制备方法专利，提高界面稳定性

广州建丰稀土申请一种大比表面积电子级氧化镝的制备方法专利，应用广泛

山东德成铝业取得一种空调箔冲压装置专利，便于快速散热和避免冲压误差

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响