“具身智能”,AI的最终载体?
想象一下,有朝一日我们与ChatGPT的交互过程,不再是通过网页的聊天界面,而是与站在面前的一个“实体”进行直接交谈。最为通俗的代表,就是一个智能机器人。
在许多全球科技大佬的畅想里,AI技术发展的下一个目标,就是将这一充满科幻意味的场景变为现实。
▲(图源/视觉中国)
5月份,全球GPU芯片龙头英伟达创始人兼首席执行官黄仁勋在ITF World 2023 半导体大会上讲到,人工智能下一个浪潮有望是“具身智能(Embodied AI)”。这是一种能够理解、推理并与物理世界互动的智能系统。换句话说,具身智能意味着AI终将打破现实和虚拟的边界,成为可见、可感的真实主体。
不仅是黄仁勋,知名华裔科学家、斯坦福大学终身教授、计算机视觉经典数据集ImageNET开发者李飞飞,也将工作重点转向了具身智能。她认为具身智能有望推动AI技术从现有阶段,向有能力执行多步骤复杂类人任务的重大转变。
国金证券研报这样评价这个AI产业发展的新目标:具身智能机器人有望成为AI的最终载体。而从技术演进的角度来看,这个让人与AI在物理世界之中“重逢”的愿景,已然有了成为现实的基础。
具身智能机器人的技术原理包括感知层、认知层、执行层三大层面。
此前已实现大面积应用的工业机器人等产品,主要根据控制系统发出的指令信号控制机器人主体完成任务,依赖于机器人的执行层。如今在感知层,谷歌的视觉-语言模型PaLM等AI技术,可以进一步提升机器视觉能力;在认知层,ChatGPT(基于GPT-3.5模型)、GPT-4和其他层出不穷的大模型,可以将机器人对现实世界的理解能力推升至新阶段。
也就是说,具身智能机器人可以像真人一样,在环境中交互感知,自主规划、决策、行动并完成相应任务。
效率软件企业印象笔记高级副总裁乔迁告诉「市界」,具身智能的趋势,也符合其对大模型落地应用的观察。今年3月初,印象笔记刚发布了自研大模型大象GPT,并在4月将大模型引入全线产品。
他讲道:“相较于以网页对话窗口为入口,通用大模型和具体工具产品、物理产品的结合,具有更大的实用意义。以印象笔记提供的思维导图工具为例,此前用户在使用这类较复杂的功能时可能需要提前构思较长时间,但借助AI工具可以一站式地生成思维导图。这种结合将大模型的能力充分展现给了每一个人,满足了千人千面的实际需求。”
受此消息影响,近日来,机器人概念股震荡拉升,仅5月24日,就有多只股票涨停。
人形机器人迎来曙光
从理论上来说,具身智能的载体可能是任意形态的机器人,比如自然语言控制机械臂、无人机等,但并不止于此。李飞飞认为,具身智能的载体应该是任何可以探测和改变自身环境的智能体,“具身”的含义不是身体本身,而是与环境交互以及在环境中做事的整体需求和功能。
不过,在种种智能体中,许多行业领袖已经开始将目光投向了人形机器人领域,也就是模仿人类外观与行为的机器人种类。
2022特斯拉AI日上,特斯拉人形机器人Optimus(擎天柱)首次亮相。在5月17日召开的特斯拉2023年度股东大会上,人形机器人Optimus再次亮相,并展示了其最新的流畅行走、协同行走、识别并记忆周边环境等功能。
马斯克对Optimus寄予厚望,据其称特斯拉人形机器人在技术上“与车同源”,价格比车更低,将很大程度上改变人类生活。马斯克预计,Optimus机器人的需求可能会达到100亿个甚至更多,远超过人们对于汽车的需求。不过,Optimus的正式上市还没有明确时间表。
另一边,马斯克曾参与创立、接连推出了ChatGPT和GPT-4等大模型的研发团队OpenAI也开始押注这一市场。
今年初,挪威机器人公司1X Technologies宣布完成A2轮融资,共筹集到2350万美元,并在此轮融资中获得了OpenAI旗下创业基金的领投支持。
5月23日,《科创板日报》报道称,据该公司CEO透露,其开发的人形机器人已经在美国和欧洲投入使用。
此外,国内市场亦有优必选、小米、蒂艾斯科技等企业涉及了人形机器人投资与研发。
▲(图源/华西证券)
华西证券研报写道,人形机器人是继智慧城市、智能驾驶之后AI的下一波浪潮,长期来看,保守估计到2030年全球人形机器人市场规模可达万亿级别,是继智能驾驶电动汽车后又一空前蓝海。
从事智能机器人研发的工程师聂波则告诉「市界」,其认为人形机器人市场还需要更多技术沉淀与商业探索,“近期大模型的潮流给我们行业带来了新的活力,我们也在关注这方面的落地应用,致力于促进AI认知交互能力能够实现跃升。但是距离人形机器人能够真正走入寻常百姓家,需要产业软硬件技术的协同探索。我认为这是一个急不得的事情。”
聂波分享道,现阶段人形机器人商业化大多落地在B端场景,比如商业展会、政务服务等等,但如果想要满足陪护、日常家务的精细化操作等需求,产业不仅需要进一步精进软硬件技术,还需要成本结构的优化。
“我认为相比智能驾驶,人形机器人的整个行业远不够成熟,但是ChatGPT、文心一言这类大模型的出现,让产业看到了创造一个更聪明的机器人‘大脑’的可能性,未来可期”,聂波总结道。
(文中聂波为化名)
作者 | 董温淑
编辑 | 董雨晴
运营 | 刘 珊