参会者在2024互联网岳麓峰会现场与AI数字人“小麓”互动。新华社记者 陈泽国摄
在江苏省无锡市百度智能云千帆大模型(无锡)创新中心,工作人员在展示视觉追踪机械臂控制技术。陆启辉摄(人民视觉)
“可以给我设计一个北京一日游计划吗?”近日,2024世界智能网联汽车大会现场,在极狐阿尔法S5上体验北汽AI智能体的李先生,感觉自己有了一名随叫随到的“出行顾问”,“只需一句语音指令,AI智能体就能自动规划好路线,方便极了”。
近年来,AI(人工智能)大模型技术的涌现,掀起新一代AI研究热潮,而今,AI智能体(AI Agent)正成为行业新热点。从智能汽车中的语音助手到网络直播间的数字人主播,AI智能体正以其独特的自主性和交互性,深度改造应用生态,持续构建智慧生活新图景。
重塑人与机器的互动方式
顾名思义,AI智能体就是具备AI能力的一个智能实体,其可能是硬件装置,也可能是软件系统。它能够感知环境、进行决策,并依托AI能力执行动作,最终实现特定的目标任务。
“通俗来讲,AI智能体就像一个有智商、有情商、能理解、会帮忙的‘小助手’。”北京通用人工智能研究院先进技术中心副主任陈浩表示,这个“小助手”不仅能理解人类的语言,还能通过学习和分析数据来不断提高自己在特定领域的技能水平。
为何AI智能体能成为行业关注的热点?其与大模型技术的关系是怎样的?
字节跳动豆包大模型相关负责人接受本报采访时表示,AI智能体是基于大模型技术出现的,AI智能体“有手有脚”,可以自己干活、自己执行,而大模型就是它的“大脑”。
但AI智能体是更“立体化”的智能系统,除了提供大模型广泛使用的语言交流服务,AI智能体还能根据上下文进行智能推理和情感分析,并模仿人类行为进行相应的操作。
比如,下达“帮我做一道菜”这项任务指令,“大模型厨师”只能输出一份食谱并指出需要哪些食材;“AI智能体厨师”则不仅能提供食谱,还会根据指令人的口味偏好和营养需求,选择最合适的食材自动下单购买,甚至能够监控烹饪过程,确保食物的质量和口感。
“传统的人机对话往往受限于固定的模式和预设的规则,难以实现真正自然的交流。”百度集团资深副总裁梁志祥指出,依托大模型在理解、生成、逻辑、记忆方面的四大能力,AI智能体已经能够模拟出更加贴近人类真实对话的方式,这使得“人机交互”变得如同“人人对话”一样流畅自然。
事实上,获益于大模型的通用性和可扩展性,AI智能体的使用门槛得以大幅降低。无论是大型企业还是中小企业,甚至是个人开发者,无需新硬件或大量额外的训练数据,都能快速搭建起自己的AI智能体应用。
前不久,百度“文小言”大模型App推出“一句话创建智能体”的新功能。每个人可以根据需求创建专属于自己的AI智能体,其性格、音色、身份设定都取决于用户的个性化选择。创建者可与“专属智能体”进行视频对话、英语口语练习,还可以模拟求职面试等。据相关统计,百度文心智能体平台已吸引了10万家企业、60万名开发者,覆盖了上百个应用场景。
“未来,如果用户使用及生成自己的AI智能体都更加便捷,这将真正释放AI智能体的价值。”梁志祥说,“下一步,我们将把AI智能体精准、高效地分发给更多的用户,让每个人都能成为AI智能体的‘开发者’。”
应用场景持续拓宽
当前,一系列AI智能体技术正在蓬勃发展,应用场景持续拓展。
“一年半以前,北汽极狐就开始着手研究AI智能体,主要应用于研发效率提升、标准化语言编译以及用户服务等多个方面。”北汽研究总院智能网联中心主任冯硕介绍,AI赋能的驾驶舱告别了机械式、固定指令式“人机问答”的旧模式,可实现灵活性、定制化的“智能交互”,例如,AI智能体会根据驾乘人的工作习惯安排日程表,捕捉驾乘人的喜好、情绪推荐音乐、电影等。
当识别出驾乘人过度疲劳时,AI智能体会迅速生成包括预订车位、调节车内环境、设定休息时长等在内的服务方案,为用户提供更加安全的智能驾驶体验。“未来,AI智能体还有望搭载‘一句话订外卖’等功能,更方便驾乘人使用。”冯硕说。
与此同时,AI智能体技术也在快速发展并逐步落地到各种小型终端设备中。
“豆包豆包,寺中这个罗汉是谁?”“这是摩诃迦叶,释迦牟尼的十大弟子之一……”自媒体运营者小范回忆道,在国庆假期参观浙江台州国清寺时,他与耳机Ola Friend之间常有这样的问答。
据了解,Ola Friend是字节跳动旗下豆包大模型发布的首款AI智能体耳机,除了常规的声乐播放功能,还能在信息查询、旅游出行等场景为用户提供即时帮助。
豆包大模型相关负责人介绍称,Ola Friend可随时化身为用户的“私人导游”,并且用户还能根据兴趣点进行“追问”,如逛画展时,用户可以就某件具体的展品让Ola Friend帮自己介绍,再延伸追问该展品创作者的艺术风格、其他代表作品等,在一问一答中获取更多知识。
今年以来,越来越多的手机厂商也纷纷加入AI智能体布局。vivo近期发布了名为PhoneGPT的手机智能体,能够基于用户意图准确操作手机应用以完成任务,如打电话、发短信、订餐厅等,极大提升用户体验;华为将智慧助手小艺升级为系统级智能体,不仅问答能力再进阶,而且具备更强的感知推理能力;OPPO则推出了“1+N”智能体生态战略,由AI超级智能体和AI Pro开发平台组成,旨在提供更符合用户偏好的个性化服务模式。
在商业服务场景中,AI智能体正与消费者进行深度互动。
百度电商数字人直播平台“慧播星”5分钟就能生成一个带货智能体,不仅可以24小时在线,且整个直播间实现了完全智能化、无人化。数字人主播和数字人副播各司其职,及时回答消费者提问,展示和讲解商品时配合流畅自然,对来不及口头回复的问题,还有AI助理进行文字回复。
“因为有了数字人直播智能体技术,电商直播行业的成本高、时间受限、质量不稳定等难题得到有效缓解。”梁志祥称,截至目前,“慧播星”已累计帮助数万家商家实现收益增长,平均带来62%的商品交易总额的提升。
当前,AI智能体还在其他诸多场景中得到应用,如编程、内容创作、工业制造等,展现出强大的应用潜力和市场价值。
带给未来生活更多可能
不少业内人士认为,AI智能体将是未来趋势所在。
腾讯发布《2024数字科技前沿应用趋势报告》认为,大模型将走向多模态,AI智能体有望成为下一代平台。国际管理咨询公司埃森哲在《技术展望2024》报告中称,96%的企业高管认为AI智能体将在未来3年内为其所在企业带来重大发展机遇。
业内人士表示,在可预见的未来,AI智能体将帮助多个行业构建起以“人+AI数字员工”为核心的智能化运营新常态。例如,在医疗领域,AI智能体可以协助医生进行诊断、治疗和健康管理;在交通领域,AI智能体可以通过分析数据和实时路况,为交通管理和规划提供科学依据;在教育领域,AI智能体可以提供智能辅导和自适应学习系统,帮助学生更好掌握知识。
专家指出,随着机器学习和深度学习技术的不断进步,AI智能体的特性和学习能力还将变得愈发强大,未来将更好地适应复杂多变的现实世界,为社会发展带来更多可能。
尽管AI智能体技术为未来生活带来了更多可能,但目前其仍然处于起步阶段——已出现的AI智能体仅能完成较为简单、固定的工作,且应用功能同质化严重。
有观点指出,AI智能体的发展瓶颈之一在于目前的大模型缺乏足够的推理能力,无法在没有人工介入的情况下真正解决复杂的问题。大模型技术本身就因算法等因素存在不可预测的先天缺陷,容易为AI智能体带来一系列安全隐患。
除了技术风险,AI智能体也面临伦理和隐私等问题。业内人士表示,AI智能体在提供服务的过程中会收集大量数据,有可能导致个人隐私信息的泄露,比如AI智能体可能会根据用户的购物习惯推断出他们的某些私人爱好。这种“窥探”行为,无疑是对用户隐私的侵犯。
专家认为,目前需尽快根据智能体的功能用途、使用时限进行分类管理,尤其对高风险智能体的开发生产及应用部署进行持续监管,并及时制定相关法律法规,改进现有互联网标准,从而更好地预防智能体引发的各种风险。(本报记者 刘乐艺)
《人民日报海外版》(2024年11月01日 第08版)
责编:金泳辰、姚凯红