智谱出圈 AI助理从0到1 我们离“贾维斯”还有多远？

作者：财联社发布时间：2024-11-02

智谱出圈 AI助理从0到1 我们离“贾维斯”还有多远？

财联社

2024-11-02 08:35发布于上海上海报业集团旗下《财联社》官方账号

全文2571字，阅读约需8分钟，帮我划重点

划重点

01AI助理如智谱AutoGLM、微软的OmniParser和谷歌的Project Jarvis等，正逐渐改变我们的日常生活，提供更加便捷的服务。

02目前，AI助理在订票、点外卖等日常场景中已能充分解放用户双手，但距离像贾维斯一样的高级智能体仍有很大差距。

03由于技术限制，AI助理在处理复杂任务时仍需用户参与决策，且可支持的App范围有限。

04未来，AI助理的发展将面临数据隐私与安全问题、自主决策的伦理困境、责任归属问题等挑战。

以上内容由腾讯混元大模型生成，仅供参考

《科创板日报》11月2日讯（编辑宋子乔） “你好，贾维斯。”“随时为您效劳，先生。”

漫威电影《复仇者联盟》中，钢铁侠与AI智能管家贾维斯的亲密互动，呈现了一个高级智能体该有的模样。

当下，大模型对复杂任务的推理能力增强、视觉处理能力提高、计算机控制能力展现，加之更流畅的人机交互，为高级智能体的发展提供了更好的基础。

智谱AutoGLM为代表AI助理工具，只需接收文字/语音指令，就可以模拟人类操作手机、解决日常琐事，目前可支持微信、淘宝、美团、大众点评、小红书、高德地图、12306、携程等App的常规跨页面操作，在订票、点外卖等日常场景中充分解放用户双手，这在资本市场掀起一阵硬件智能化风潮。

微软、谷歌等科技巨头同样在畅想科幻电影照进现实的画面，致力于开发AI助理（AI Agent），让AI能自主操作手机、像人一样完成复杂的推理任务——

微软近期低调开源了AI工具OmniParser，其可帮助用户创建个性化智能体，以操作个人计算机；10月22日，微软宣布在Dynamics 365中集成10个自主AI Agent，支持OpenAI最新模型o1，具备自主学习能力，可自动执行跨平台复杂业务；9月，微软推出了一款名为Windows Agent Arena的基准框架，同样属于AI助理开发范畴。

据The Information报道，谷歌计划在12月预览其大型动作模型“Project Jarvis”，该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。

10月22日，Anthropic为大模型Claude迭代了新功能——Computer Use，让AI可以像人一样操控电脑。Claude3.5 Sonnet是首个支持计算机控制的模型，能够模拟人类操作计算机，包括移动光标、点击按钮和输入文本。

苹果选择将Siri与ChatGPT集成，实现更智能的人机交互，另有网友发现苹果已经默默发布了Ferret-UI的两个实现版本（分别基于Gemma 2B和Llama 8B），这是苹果今年5月发布的一个可让AI理解手机屏幕的技术。

华为则公布了一项可让AI像人类一样操作手机的新研究成果，相关团队提出了一个手机控制架构：Lightweight Multi-modal App Control（轻量级多模态应用控制，简称LiMAC）。

OpenAI也开源了多功能协同AI Agent——Swarm，可创建多个智能体协同工作，以更高效地完成任务。其GPT o1模型增强了推理能力，使其在复杂问题的解决和用户交互的自然性方面均有显著进步，亦使其更加适用于AI Agent场景。

值得注意的是，近日，OpenAI CEO阿尔特曼在一次互动访谈中分享了自己对AI助理的看法。他认为，AI助理能够像一个聪明的同事一样，与用户一起合作完成项目。阿尔特曼同时提及AI助理的定价——该服务不是按接入AI助理的个数付费，而是根据回答问题所需的计算量定价。

巨大商业空间酝酿中

AI助理的应用场景涵盖B端和C端，可扮演智囊、管家、代理人等多重角色。

作为个人助理，它可以进行日程管理、信息查询、任务自动化；在制造业、物流、医疗、教育等领域，通过自主学习和优化，AI助理可实现智能监控、数据分析、流程优化、决策支持、互动交流等高级功能。

对于使用者而言，企业可用它实现降本增效，个人可用它提高工作、生活效率。

随着应用场景落地，更大的商业空间正在酝酿中。对于AI助理服务的提供方、搭载AI助理的硬件生产商、连接AI助理的应用方，新的盈利模式有望从中孕育——

接入AI助理的手机会不会销量更好？手机厂商是选择自研AI助理还是接入第三方服务？与第三方开展合作的模式是什么？将如何分成？当你需要买东西，AI助理会打开哪个电商平台？引流依据是什么？

产业端，苹果、荣耀、三星等终端厂商近期开始发力、落地基于AI助理技术的边端AI功能。其中，近日上线的荣耀Magic7系列首发YOYO智能体，荣耀CEO赵明对YOYO助理说了一句话，便成功下单2000杯咖啡。据介绍，Magic 7系列搭载的AI助理，其智能水平达到L3等级，不仅可完成帮忙发文件、智能填表、购物比价等基础操作，并且可根据用户指令完成关闭自动续费、购买饮品、规划旅行路线及订票等多项跨应用操作。

在硬件厂商言必称AI的时代，AI助理或成为终端智能化的突破口。

中信证券表示，AutoGLM等终端AI助理技术将带来更短路径的交互形式，接受语音指令并自动完成复杂操作的能力将为消费者带来极大便利，其有望成为AI终端的亮点功能并吸引消费者升级换代。

华泰证券也表示，AI助理是通往AGI的核心基础，AI助理落地带来多个层次的产业机遇，其中，Agent+终端有望推动人机交互变革，除了在终端销售量价方面的变化外，可能对终端应用的商业模式产生更加深远的影响。

另外，AI助理与具身智能/人形机器人、区块链、5G等技术将碰撞出怎样的火花？将如何帮助构建智能体社会与群体智能？这些问题一同成为了描绘产业蓝图的画笔。

沉浸于未来构想之时，更冰冷的问题立于当下：AI助理到底有多少用处？

AI助理还没有那么“聪明”

与Siri、小爱助理、天猫精灵、小度等“前辈”相比，AutoGLM等AI助理的确更加人性¬¬¬¬化、响应更精准、能处理更复杂的任务、学习能力更强。

其中，交互性、自主操作这两大亮点让AI助理出圈，比如AutoGLM只需用户一个吩咐就能网购、点外卖、订高铁票，甚至发微信、抢红包、评论朋友圈、整理笔记并生成攻略、总结论文。

但与人们期待的“贾维斯”相比，这些AI助理们的脑子还远远不够用。以智谱AI为例，尝鲜者反映的典型问题包括：

需要更加精细化的指令，不会比价，AutoGLM为你买的东西可能不是最优价格；无法很好地应对突发情况，如广告弹窗等；能打开的App有限，据了解，目前AutoGLM可适配微信、淘宝、美团、小红书、大众点评、12306、携程、高德地图共8款应用。

Claude的Computer Use存在类似的问题。一个有意思的案例是，某工程师使用该工具给整个团队点外卖，未指定具体要吃什么，接到任务的Claude仅用1分钟就下单了披萨，3个披萨共花掉95美元，一则网友吐槽被推上首条评论位：3个披萨95美元是犯罪。

这意味着，尽管AI助理可以为你省去操作步骤（打开App，点选页面），但它并不能完全自主地、“完美地”解决问题，用户依然需要做思考、参与决策。

结语：我们和高级智能体之间仍有很远的距离

技术上的问题需要时间解决，围绕AI助理落地，还有一系列非技术因素，比如数据隐私与安全问题、自主决策的伦理困境、责任归属问题、算法偏见与歧视等。

安全是一个重要议题。为了实现更深度的操作，AI助理需要获取用户手机的无障碍权限、与企业其他系统（如ERP、CRM）集成，实现信息共享和协作。

隐私泄露的情形如何避免？拥有高自由度的AI如果做出了错误判断，问题的责任方是谁？

如何在便利与安全之间找到平衡，将是未来AI助理发展必须面对的挑战。

（科创板日报宋子乔）

查看原图 188K

智谱出圈 AI助理从0到1 我们离“贾维斯”还有多远？

智谱出圈 AI助理从0到1 我们离“贾维斯”还有多远？

巨大商业空间酝酿中

AI助理还没有那么“聪明”

结语：我们和高级智能体之间仍有很远的距离

推荐体验

相关资讯

智谱出圈 AI助理从0到1 我们离“贾维斯”还有多远？

我们离钢铁侠的贾维斯还有多远？——深度体验ChatGPT代码解释器

我们离AGI还有多远?

从单模态到多模态，自主AI离我们还有多远？

从ChatGPT到AGI还有多远？

近期资讯

中华商务联合印刷（广东）有限公司取得一种纸张转盘分配装置专利，可自动整理散乱的纸张

云南电网输电分公司取得基于深度编解码融合网络的 SAR 遥感图像水域分割方法专利

湖北鲍尔曼科技取得一种钙锌稳定剂的匀速送料装置专利，拦截上料时扬起的浮尘以便于维护良好的工作环境

东莞市微控智能科技取得轮式供料机专利，解决现有供料机取料问题

常茂（大连）新材料有限公司取得可避免固体球料下料破碎下料装置专利，避免球料下落时摔碎

数码港：即日起扩大数码转型支援先导计划至旅游及个人服务界

潍坊特钢集团取得一种冶金用叶轮给料机专利，方便后续对安装板进行拆卸

范德兰德物流自动化系统（上海）有限公司取得一种机械手爪和码垛系统专利，提高空间利用率

比绿能新材料取得一种人造石墨负极加工装罐机专利，使人造石墨负极粉末实现粉末粒度均匀的效果

无锡理奇智能装备取得一种粉料无泄漏自动对接装置专利，能够实现移动容器和固定容器之间自动对接，粉料无泄漏，同时减少中间管道连接，节省布局空间

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响