当前位置:首页|资讯|人工智能|自动驾驶|汽车|ChatGPT|大语言模型

行业报告 | 具身智能推动AI新浪潮

作者:BFT白芙堂机器人发布时间:2023-06-13

原创 | 文 BFT机器人


01


核心观点


具身智能有望成为人工智能的重要解决方案


具身智能是指有身体并支持物理交互的智能体,如机器人、自动驾驶汽车等。非具身智能指没有物理身体,只能被动接受数据的人工智能,例如 ChatGPT,尽管大语言模型可以让其做到体验友好的语义交互,但其多模态感知和行为交互能力有限,所以还不是人类理想的智能体。


具身智能+机器人将有望成为 Al 的重要解决方案。


2023年5月,在特斯拉股东大会上,CEO 马斯克展示了Tesla Bot 流畅行走,抓取物体与识别环境等最新研究成果,具身智能的关键在于机器人能够通过视觉识别身边物理环境并做出决策和行动,而 Tesla Bot 已经在逐步实现这些功能,此外,马斯克推测未来人形机器人 Optimus 需求将达 100 亿台,远超汽车需求量,并称人形机器人会是今后特斯拉主要的长期价值来源。


具身智能有望带动核心零部件受益


传感器、执行器与计划控制是具身智能的三大基本要素,机器视觉则是具身智能与外界的互动感知的重要一环。


具身智能核心技术壁垒和价值环节主要聚焦核心零部件:减速器、伺服系统和控制器,其中减速器在机器人中成本占比最高达 30%,其次是伺服系统 (20%)和控制器(10%),机器视觉是在机器人和自动化设备中代替人眼实现高精度检测,识别,测量和定位引导等功能,随着机器人,工业自动化技术等领域的发展,GGII 预计至2025年机器视觉全球市场规模将超过1200亿元。


算力: Al下一个浪潮将是“具身智能”,Al 芯片需求有望率先扩张


AI 芯片是用于加速人工智能训练和推理任务的专用硬件,主要包括 GPU、FPGA、ASIC等。


随着 AI 应用的普及和算力需求的不断扩大,Al 芯片需求有望率先扩张,根据IDC预测,中国AI算力规模将保持高速增长,预计到2026年将达 1271.4EFLOPS,CAGRA (2022-2026年)达52.3%,预计2025年人工智能芯片市场规模将达 726 亿美元。


02


具身智能——人工智能的最终解决方案

  • 1950年,图灵在《Computing Machinery and Intelligence》中首次提出了具身智能的概念。在之后的几十年里,受到当时技术的限制,具身智能并没有取得很大的进展,然而随着 AI、芯片等科技产业的蓬勃发展具身智能已经成为一个有望实现的,人工智能的最终解决方案。


  • 具身智能——Embodied Al= 具象AI= 具身智能,是指有身体并支持物理交互的智能体,如机器人、自动驾驶汽车等。一个具身智能(EmbodiedAI)机器人需要: 首先听懂人类语言,之后分解任务、规划子任务,移动中识别物体,与环境交互,最终完成相应任务。相对的,非具身智能指没有物理身体,只能被动接受数据的人工智能,例如ChatGPT,尽管大语言模型可以让其做到体验友好的语义交互,但其多模态感知和行为交互能力有限,所以还不是人类理想的智能体。


  • 具身智能能够像人一样主动地与环境交互感知。引用上海交通大学教授卢策主题演讲《具身智能》中提到的两个例子:


1、下图中两只猫,一直猫被绑起来,只能看这个世界,另一只猫可以主动去走,被动的猫是一种旁观的智能,而主动的猫是具身的智能,到最后,这只旁观的猫失去了行走能力;2、第三人称智能需要人类喂数据告知它这些图案是盒子,但第一人称智能是通过自己的亲身体验认识到什么是盒子(可以打开,可以装东西 )。


图1:旁观智能VS具身智能(来源:上海交通大学教授卢策主题演讲——《具身智能》)

图2:第三人称只能VS第一人称智能(来源:上海交通大学教授卢策主题演讲——《具身智能》)

图3:PIE方案:具身智能的解决方案之一(来源:上海交通大学教授卢策主题演讲——《具身智能》)


  • 具象感知 (Perception): 交互感知,自动挖掘、定义具象概念。可以通过两种方式实现:


1、全感知: 构建一个大规模的数据库,包含我们所操作的这个世界模型(world model)的各种各样的知识,跟操作相关的知识,包括外形、结构、语义,以及 48 个真实世界关节体类别等;


2、具身交互感知:各种内容交互的感觉带来的全新感知,通过牛顿定律和数据驱动的结合,不断修正误差从而得到正确的模型。


具象想象 (lmagination):自动具身任务模拟,仿真引擎构建。通过名为 RFUniverse 的仿真引攀,这个仿真引擎支持 7种物体(比如关节可移动的、柔性的、透明的、流动的……)、87种原子操作的仿真。当研究人员把物体输入,模型会在仿真引擎中进行想象操作。


具身执行(Execution):误差。多传感器合作,自意识执行误差。研究人员通过构建一个元操作库,调用各种元来解决执行的问题。通过半自动的data collection and labeling,能够非常快速地产生20亿个抓取点位,再进行训练,把「grasp」这个问题分解为where(去哪里抓)和how(怎么去抓)的贝叶斯问题,分别估测网络。


图4:全感知:物理属性检测(来源:上海交通大学教授卢策主题演讲——《具身智能》)


  • 具身智能+机器人有望成为AI的重要解决方案,传感器、执行器与计划控制是三大基本要素。传感器包括本体感受传感器、触觉+视觉+声音传感器、机器视觉等;执行器包括减速器、伺服系统、微电机等;计划控制部分包括控制器、工控系统、AI 系统等,传感器与执行器数量较多,具身智能核心技术壁垒和价值环节主要聚焦核心零部件: 减速器,伺服系统和控制器其中减速器在机器人中成本占比最高达 30%,其次是伺服系统 (20%)和控制器(10%)


  • 2023年5月17 日,特斯拉召开2023 年股东大会,展示了--直备受关注的人形机器人 Optimus 进化情况,在机械关节控制方面,特斯拉机器人电机扭矩控制,力度控制更加精确灵敏: 在感知方面,该机器人环境感知和记忆能力提升不仅可以看路,亦会记路; 在学习方面,Optimus可根据人类动作范例,进行端到端动作操控。特斯拉创始人兼首席执行官马斯克表示:未来Optimus 的数量可能将达到 100 亿以上。

图5:特斯拉Optimus(来源:特斯拉)


03


算力硬件层——具身智能的底层土壤


  • 2023年5月,全球 AI 芯片龙头英伟达的创始人兼首席执行官黄仁勋在ITFWorld2023 半导体大会表示,AI下一个浪潮将是“具身智能”。


    同时,他也介绍了英伟达的多模态具身智能系统 Nvidia VIMA,其能在视觉文本提示的指导下,执行复杂任务、获取概念、理解边界、甚至模拟物理学,这也标志着 AI 能力的一大显著进步。


  • 算力硬件层是构成AI产业的核心底座,主要包括AI芯片、AI服务器等。AI芯片需求有望率先扩张。Al 芯片是用于加速人工智能训练和推理任务的专用硬件,主要包括 GPU、FPGA、ASIC 等,具有高度并行性和能够实现低功耗高效计算的特点。


  • 随着AI应用的普及和算力需求的不断扩大,AI芯片需求有望率先扩张。根据IDC预测,中国AI 算力规模将保持高速增长,预计到 2026 年将达1271.4EFLOPS,CAGRA(2022-2026年)达52.3%。在此背景下,IDC预测异构计算将成为主流趋势,夫来 18 个月全球人工智能服务器 GPUASIC和FPGA的搭载率均会上升,2025年人工智能芯片市场规模将达726亿美元。

图6:中国AI算力规模及预测(来源:IDC)

图7:全球AI芯片市场规模及预测(来源:IDC)

图8:AI芯片竞争格局(来源:中泰证券研究所整理)


04


机器视觉——具身智能的“眼睛”

  • 若要实现具身智能与外界的互动感知,机器视觉也是必不可少的一环。


  • 机器视觉是在机器人和自动化设备中代替人眼实现高精度检测、识别、测量和定位引导等功能,助力企业构建数字化车间、打造智能工厂。


  • 从机器视觉产业链角度来看,机器视觉行业产业链环节较长,上游由机器视觉系统硬件和软件算法构成,中游为设备商和系统集成商主要负责软件的二次开发和设备制造,下游应用场景和行业广泛,工业是目前中国机器视觉行业最大的下游应用领域,工业领域的销售额占比为 81.2%。具身智能有望成为下一个快速发展的下游应用。


  • 机器视觉行业随工业自动化技术的演进逐步升级规模化应用,全球市场来看,GGII预计至2025年市场规模超1200亿元。

图9:机器视觉产业链(来源:前瞻产业研究院)

  • 国内视觉龙头有望充分受益于具身智能发展。国内两大机器视觉龙头均深度布局。

根据中国机器视觉产业联盟(CMVU)调查统计,现在已进入中国的国际机器视觉品牌已近 200 多家(如康耐视为代表的核心部件制造商,以基恩士为代表的则同时涉足机器视觉核心部件和系统集成),中国自有的机器视觉品牌也已有 100 多家(如海康等),机器视觉各类产品代理商超过 300 家(如凌云光等)。


10:海康威视机器视觉布局(来源:海康威视

  • 从视觉业务规模的角度看,2021 年,各大厂商均有较为亮眼的业务增速,尤其国产厂商,海康机器人机器视觉业务2021 年实现超过 100%的增长,国内业务规模超过基恩士、康耐视,位居第一,其他国产厂商如奥普特亦有较高的增速。

图11:2021年中国机器视觉整体市场内外资企业竞争格局(来源:GGII,前瞻产业研究院)报告参考:中泰证券报告编辑:BFT机器人


  更多精彩内容请关注公众号:BFT机器人

本文为原创文章,版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1