在人工智能的快速发展浪潮中,大模型虽然取得了显著的成就,但也随之面临了一些挑战和瓶颈,如高昂的训练成本、泛化能力的局限以及对大规模数据的依赖等。这些问题促使业界开始寻求更高效、更专业且能够解决特定问题的解决方案,智能体因此成为了新的焦点。
何为智能体
智能体是大模型应用的主要形式之一,通过训练和优化,结合特定领域的知识和技能,展现出在特定任务上更优的执行能力和更广泛的应用潜力。它们能够在各种场景中自主感知环境、做出决策并执行任务,为用户提供更加丰富和个性化的服务体验。
近日,蚂蚁集团基于蚂蚁百灵大模型推出国内首个服务型的AI独立App“支小宝”,通过链接支付宝生态,“支小宝”可通过对话快速订票、点餐、打车、查询附近吃喝玩乐等,说句话就能办事;“支小宝”还拥有场景感知系统,能根据用户的生活习惯和使用场景,智能推荐专属的服务。
智能体在创新服务体验、提升服务效率、激发新商机上具备极大的潜力。近日,黄山风景区携手支付宝共建“黄山空间智能体”,打造了国内首个“全程AI伴游”景区。通过支付宝AI能力所创建的“黄山智能体”,可根据游客的空间定位变化,由AI主动伴随提供攻略、讲解、 叫车、周边美食、商家推荐等服务,提升游客旅游体验。
浙江卫健委则联合支付宝推出了数字健康人“安诊儿”,目前已经实现了预约挂号、在线取号、排队叫号、扫码支付、报告查询、居家护理、复诊续方等线上服务的“一站式”串联,能在就医各环节主动推送消息指引:诊前,根据患者症状实时引导挂取号;诊中,主动帮助患者导航带路、报告查询、医保支付;诊后,为患者建立健康档案,实现长期健康管理。另外,“安诊儿”将不断进行知识学习和迭代进化,在医疗健康方面提供更多智慧化服务。
智能体正逐渐渗透到日常生活的方方面面,展现出其在创新服务体验、提升服务效率以及激发新商机方面的巨大潜力。外滩大会现场,蚂蚁集团大模型应用负责人顾进杰做了详细介绍,一是高效连接服务,智能体可与支付宝支付、搜索、小程序等20多项经营工具和阵地打通,让AI连接真实商业服务;二是多场景分发,智能体可实现商家小程序私域、支付宝App、支小宝App、H5、浏览器插件等线上的多点服务分发,也能打通IoT、智能车机等线下场景;三是聚焦专业智能体,在出行、政务、餐饮、医疗等重点行业坚持开放,与行业伙伴及专业机构携手共创。
由此可见,智能体作为生成式人工智能的一种产品形态,是当下大模型应用的核心方向,其具备自主感知环境、智能决策并执行任务的能力,能让大模型长出“手和脚”,为用户提供更丰富的服务。如何从“百模大战”推进到智能体创新,也逐渐成为行业关注的焦点。
大厂抢摊智能体生态
业界对智能体的特别关注,不仅源于其在技术层面的突破,也因为它们在商业化和产业化进程中的重要作用,预示着人工智能应用的下一个重要发展方向。大模型时代,智能体就像移动时代的App,有多种多样的形态和交互形式,基于大模型提供的对话、翻译、搜索,甚至图片生成等通用能力,加上自有语料库,企业可以打造出专属的智能体,直接连接用户,提供个性化的服务。
OpenAI在今年1月推出了GPTs(定制版的ChatGPT)和GPT商店,用户无须编码就可创建自己的GPT,从而构建智能体平台生态。百度则在今年4月份上线了文心智能体平台AgentBuilder,支持零代码、低代码两种模式,商家用几句话就能生成智能体。
在5月,腾讯公布的基于混元大模型的一站式AI智能体创作与分发平台“腾讯元器”亮相,企业和开发者可以基于腾讯元器直接创建智能体,使用腾讯官方的插件和知识库,还能将这些智能体一键分发到QQ、微信客服、腾讯云等渠道上。
近期,支付宝也推出智能体开发平台“百宝箱”,让商家机构和开发者实现AI能力的“开箱即用”——通过支付宝“百宝箱”,商家机构可调用蚂蚁百灵等多个主流大模型的能力,使用海量第三方API和插件,做到0代码、最快1分钟创建智能体,并借由支付宝平台实现“一个智能体、多端快速分发”。此外,借助大模型能力与行业知识引擎的融合,支付宝“百宝箱”也面向行业提供一系列的智能体行业解决方案,并支持与生态伙伴的深度定制。
对此,香港科技大学校董会主席、美国国家工程院外籍院士沈向洋在外滩大会上表示,“未来超级应用方向就是AI Agent,ChatGPT很了不起、很强大,但与Agent不一样。AI Agent时代的到来,不会是一个神奇而强大的模型突然代替了所有的工作流,涉及到技术、工程与市场的不断磨合,最终以超预期的服务呈现给人类。”
专家怎么看智能体发展
在人工智能的浪潮中,智能体作为技术进步的代表,正逐渐从理论走向实践,从实验室走向现实世界。清华大学智能产业研究院副教授李鹏认为,智能体不仅促进了领域知识的有效吸收,同时也得益于领域知识的加持,在特定任务中展现出更优的执行能力。
他表示,为了提升智能体的交互理解能力,核心在于借鉴大型语言模型的成功要素:海量数据、更庞大模型及高效训练策略。针对开放领域的智能体,数据的丰富性尤为关键。不论是数字环境、模拟环境或实体环境,研究焦点集中于两方面:一是创造更多样化、复杂且逼真的场景,以模拟真实世界的广泛挑战;二是优化数据采集过程,降低成本,提高从环境中提取有效信息的效率。这一系列环境构建与优化的趋势,无疑将极大地推动智能体技术的进展。
香港科技大学校董会主席、美国国家工程院外籍院士沈向洋沈向洋表示,AI Agent从愿景到落地的过程中,需要始终以需求为圆点,深刻理解模型的能力,并构建一个AI深度参与的工作流程。
清华大学人工智能研究院常务副院长、欧洲人文和自然科学院外籍院士孙茂松表示:“通用人工智能,应该就是一个副驾驶。但如果是副驾驶的话,特别是从产业的立意,觉得副驾驶不过瘾,干不了太多事,所以希望它在某些方面成为主驾驶,但是通用人工智能做主驾驶是不可能的。那么,专业智能体有可能从副驾驶位置向主驾驶过渡”。
然而,孙茂松告诉动点科技记者:“通用大模型是半成品,真正到垂直领域去做好,那就需要大模型的研发人员和专业领域的专业人才紧密协作,根据需求对大模型某些关键部件进行改造,这样才能做好。”
他对专业智能体的发展持审慎态度:“商业化这块也不容易,因为专业领域也是高度复杂的,我觉得在现在的专业智能体还是属于探索的初级阶段。现在是可以去试的,你可以想象应用的场景,在里面去试,我相信会有一些企业试通了,有些可能不那么顺利。”
由此可见,智能体的发展是一个复杂而多维的过程,它不仅需要技术上的突破,还需要对行业需求的深刻理解,以及在实践中不断优化和调整。智能体的未来将是一个不断进化和适应的过程,它将随着技术的进步、行业的发展和用户需求的变化而不断演变。在这个过程中,跨学科合作、持续创新和对应用场景的深入理解将是推动智能体技术发展的关键因素。