近期地方相关人工智能行动方案落地,人工智能有望赋能机器人,机器人产业链有望受益。尽管目前人形机器人还面临着技术不够成熟、应用场景不足及成本较高等问题,但是随着特斯拉人形机器人以及AI大模型的快速发展,展现出了人形机器人产业化的可能性和潜能,人形机器人市场规模有望在2035年超过1500亿美元。
人形机器人相较工业机器人结构更为复杂,运动模块成本占比高达整机的50%,未来产业化将催生运动模块相关零部件的需求。国产机器人产业链有望在自动化、智能化的浪潮中,凭借产品性价比优势获得广阔的发展空间。
01
人形机器人商业化发展历程
人形机器人即具有与人类似的外观和运动方式的智能机器人。人形机器人应当能“在人工作和居住的环境工作,操作为人设计的工具和设备,与人交流。”这意味着人形机器人具有一定的自主性,拥有普通工业机器人不具备的技能,甚至在工作中还能给予人类一定“亲切感”。
从2015年DARPA Robotis Challenge,到2019年人形机器人各种科研项目被砍,业内普遍唱衰,再到2022年特斯拉带动的百花齐放,人形机器人产业处于螺旋式向上的发展之中。波士顿动力的Atlas、Tesla的Optimus、小米CyberOne、ihmc的Nadia,Agility Robotics的Nadia、日系Asimo与HRP-5P都在探索人形机器人的商业形态。下面对人形机器人发展过程中有代表性的产品进行了梳理:
1.第一台人形机器人WABOT-1(1973年)
1973年日本早稻田大学加藤一郎带领团队研发出世界上第一台真人大小的人形智能机器人——WABOT-1。该机器人有肢体控制系统、视觉系统和对话系统,胸部装有两个摄像头,手部装有触觉传感器。
2.本田E系列机器人(1986~1993年),奠定稳定行走基础
本田推出E系列双足机器人,E0到E6,走路速度由慢变快,从走直线到在台阶或坡地上均可实现稳定行走,为下一步P系列类人机器人的研发奠定了基础,是机器人历史的里程碑。
3.本田P系列机器人(1993-1997年)&ASIMO(2000~2011)
1993年本田开发第1个仿人机器人原型P1,2000年P系列中的第4台也是最后一台机器人P4诞生,通俗称呼阿西莫(ASIMO)。2011年推出的第三代ASIMO身高1.3米,体重48公斤,行走速度是0-9km/h,2012最新版的ASIMO,除具备了行走功能与各种人类肢体动作之外,还可以预先设定动作,并依据人类的声音、手势等指令,做出相应动作。他还具备了基本的记忆与辨识能力。2018年本田宣布停止人形机器人ASIMO的研发,专注于该技术的更多实际应用。
4.HPR系列机器人(1998~2018)代替建筑行业的繁重工作
这是由日本经济产业省和新能源与产业技术开发组织赞助,川田工业株式会社(Kawada Industries)牵头与国立先进工业科学技术研究院(AIST)和川崎重工株式会社共同研发的通用家庭助手机器人的开发项目。项目起始于1998年HPR-1(HondaP3),先后推出了HPR-2P、HRP-2、HRP-3P、HRP-3、HRP-4C、HRP-4等多个人形机器人。目前最新的机器人HPR-5P于2018年发布,该机器人身高182cm,体重101kg,全身总共37个自由度,旨在替代建筑行业中的繁重工作。
5.波士顿动力(1986~2023):腿足式机器人运控技术最前沿,军事化应用特征明显
波士顿动力最早因研发的Big Dog而被世界闻名,公司发布了Big Dog、Rise、Little Dog、PETMAN、LS3、Spot、Handle、Atlas等多个机器人,从单足、多足机器人到人形机器人,有着明显的军事化应用的路线特征。波士顿动力是一家典型的技术驱动的公司,从机械结构、算法步态控制、动力系统耗能等方面对机器人持续迭代更新,核心在于发展腿式机器人以适应不同环境的使用,技术关键在于动力学研究和机器人平衡态的控制。
6.Digit系列机器人(2019~2023):具备行走能力,专注物流领域商业化
Digit系列是Agility Robotics公司在物流领域商业化的尝试,公司是从俄勒冈州立大学(OSU)拆分出来的机器人公司,致力于研发和制造双足机器人,前后开发了MABEL、ATRIAS、CASSIE、DIGIT系列足式机器人。其中CASSIE可实现4m/s的惊人配速,是腿足式机器人在快速行走能力上里程碑式的成果。2019年,Agility推出了人形机器人Digit,在Cassie的基础上加上了躯干、手臂,并增加了更多计算能力,支持负载18kg的箱子,可进行移动包裹、卸货等工作。
7.小米“铁大”机器人(2022)
21年小米曾发布一款机械狗Cyber dog,是其在足式机器人的首次尝试。2022年8月,小米首个全尺寸人形仿生机器人Cyber One亮相秋季发布会。Cyber One身高177cm,体重52kg,艺名“铁大”,能感知45种人类语义情绪,分辨85种环境语义;搭载小米自研全身控制算法,可协调运动21个关节;配备了MiSense视觉空间系统,可三维重建真实世界;全身5种关节驱动,峰值扭矩300Nm。
8.特斯拉Optimus机器人(2022年):推动人形机器人商业化
Optimus原型机亮相于2022年特斯拉AIday,身高1.72m,体重57kg,可负载20kg,最快运动速度8km/h。目前Optimus研发进展迅速,仅8个月机器人已可实现直立行走、搬运、洒水等复杂动作。
9.交互型机器人索菲亚(2015)和阿梅卡(2021),面部表情拟人化的尝试
索菲亚(Sophia)是由汉森机器人技术公司(Hanson Robotics)开发的类人机器人,2015年面世。索菲娅皮肤由Frubber仿生材料制成,基于语音识别、计算机视觉技术,可以识别和复制各种各样的人类面部表情,并通过分析人类表情和语言同人类对话。阿梅卡(Ameca)由英国领先的仿生娱乐机器人设计和制造公司——工程艺术有限公司(Engineered Arts)打造,具有12个全新的面部致动器,经过面部表情升级后,能对着镜子眨眼、抿嘴、皱眉、微笑。阿梅卡能够自由进行几十种仿人类的肢体运动,被认为是“世界上最逼真机器人”。
下面我们选择了7款有代表性的人形机器人,从驱动、感知、控制器三个方面进行技术路线梳理:
02
人形机器人前沿进展及市场空间
人形机器人目前仍难以实现规模化发展,主要受限于三方面:1)AI落地的能力,即AI需要与应用场景共振,以适应不同的应用场景需求;2)技术上的限制,人形机器人是技术难度最高的智能机器人,是机械设计、运动控制、人工智能等领域高精尖技术的综合体现;3)制造成本仍然是限制人形机器人推广的关键掣肘。
1.应用方面
目前,全球人形机器人行业仍处于早期阶段,应用场景还在不断开发,理论上,人类从事的简单工作均可由人形机器人代替,大致可分为工业场景和消费场景。以Ameca为例,由于发展方向更偏向智能交互,且不能移动,因此Ameca更偏向于消费市场,比如展览、教育、实验室、博物馆、旅游景点等。
在工业中,人形机器人或可应用于工业机器人难以使用的领域,包括仓库管理/物流管理领域以及简单但人力负担较重的领域,例如移动货物上下楼梯。在家庭环境中,人形机器人要面对更多样化的应用场景和对象识别,以及需要更复杂的导航系统等。总体上,消费级应用的设计难度要大得多。根据Goldman Sachs Research,人形机器人有望分别于2025-2028、2030-2035年在工业场景和消费场景实现经济可行性。
比较之下,工业场景也许是可移动人形机器人迈向产业化的第一块阵地。工业场景,既有需求,可以将人类从繁重、危险的“4D”工作中解放出来;又具备一定通用性,适配部分工业场景领域分散、各自规模较小的问题。同时,在经济性上,相对于C端客户,工业场景的支付意愿、能力也更高。
2.技术方面
在技术方面,全球最先进的人形机器人大致有两种发展路径,一类人形机器人已经掌握了机动性和敏捷性动作,对应的典型代表是波士顿动力的Atlas人形机器人。另一类则在情感表达、交互和认知方面有优异表现,对应的典型代表是英国公司Engineered Arts的Ameca人形机器人。尚没有人形机器人能同时做到这两点。
3.成本方面
在生产成本方面,根据Macquarie Research,早期人形机器人的硬件总成本约为4万美元。具体来看,传感器和芯片成本约1万美元、惯性测量单元和扭矩传感器5,000美元、伺服电机和电机驱动器1万美元、精密减速器8,000美元、电池和电池控制系统2,000美元系统、其他部件(包括机身材料)约5,000美元。
实际上,目前最先进的人形机器人售价甚至达到数百万美元,比如ASIMO机器人的单台成本高达250万美元;波士顿动力机器人Atlas单台成本同样超过200万美元,小米人形机器人的成本也需要每台大概六、七十万元。因此降本将是人形机器人商业化推广的必由之路。而在马斯克的设想中,未来特斯拉人形机器人Optimus的定价将在2万美元/台,说明还有充足的降本空间。
4.随着AI的快速发展,人形机器人产业化有望迎来加速
AI技术使得人形机器人能够更好地理解和适应环境,具有更高的自主决策能力和智能水平。例如,人形机器人可以通过深度学习算法和识别人类语言、面部表情等信息,从而实现更加自然的人机交互,ChatGPT的发展亦有望加速这一进程。
2023年以来各企业相继推进AI+机器人布局。2月,微软团队披露正在探索如何将ChatGPT扩展到机器人领域,旨在让人类用自然语言控制机器人等硬件平台。3月,ChatGPT研发公司OpenAl领投挪威人形机器人公司1XTechnologies(前称为Halodi Robotics)。3月底Engineered Arts展示了接入GPT3.0和GPT4.0后的Ameca,情绪表达能力进一步提升。4月,腾讯Robotics X实验室公布最新机器人研究进展,首次展示在灵巧操作领域的成果,推出自研机器人灵巧手(TRX-Hand)和机械臂(TRX-Arm);北京小米机器人技术有限公司成立,经营范围包含:智能机器人的研发、人工智能行业应用系统集成服务等。5月,在特斯拉2023股东大会上,马斯克展示了与车同源的人形机器人Optimus的全新型号。1XTechnologies披露其人形机器人EVE自今年4月以来已在美国和欧洲投入实际工作(担任保安)。
前面提及的英国公司Engineered Arts研发的Ameca结合了AI与AB(Artificial Body)技术,底层系统是机器人操作系统Tritium和工程艺术系统Mesmer。前者类似大脑,主要负责智能化和各个机械结构之间的联动,后者负责展现拟人化的情绪表情和肢体语言,这也是Ameca的核心所在。
5.市场空间:潜在市场规模超万亿人民币
人形机器人主要目标是在某些场景上代替人工,潜在市场空间大。以中短期来看,我们认为家务、安保及代替欧美等发达国家工厂缺口等可能为早期潜在应用场景:1)家务应用方面,以特斯拉公布机器人性能来看,可以完成浇花等简单家务,未来随着进一步完善,有望代替部分家政人员;2)安保领域,OpenAI提供ChatGPT为EVE机器人提供软件支持,让其有望在安保领域应用,尤其是保安、监狱、养老院等领域,因此我们认为安保领域有望成为潜在应用场景;3)代替工厂缺口,海外发达国家劳动力成本高,以德国为例,最低时薪为12欧元(2023年6月21日欧元兑美元汇率为1.092,换算为13.1美元),若机器人一年工作300天,日工作24小时,换算成人工费用为9.43万美元/年。若特斯拉机器人量产目标价能达到2万美元,相比发达国家人工成本而言,Optimus使用成本较低,有望替代部分空缺劳动力。
仅以计算家庭、安保场景和部分发达国家职位缺口场景下的潜在市场空间,这些潜在市场规模为2231亿美元(价格以2万美元单台测算),市场规模超过万亿人民币:1)假设仅计算家庭、安保、部分发达国家替代工厂职位缺口需求;2)家庭方面,目前扫地等服务机器人渗透率较高,应用场景相对较容易实现,因此假设渗透率达到10%;3)安保领域,由于安保领域主要应用场景是监控和巡视,相较工厂场景实现较为容易,考虑发达国家人力成本较高,假设渗透率达到15%;4)替代发达国家工厂缺口,考虑目前工厂缺口人数,由于工厂环境较为复杂,初始从搬运等简单环节的需求渗透,因此假设渗透率为5%。
03
人形机器人核心模块
1.机器人三大核心模块:感知模块+交互模块+运控模块
2.感知模块:激光雷达是绕不开的核心,多传感融合必备
激光雷达是扫地机器人、服务机器人最佳的选择,精度高、并且能实时获得地图,自主避障,不需要收到光源影响。在目前主流的前沿机器人身上已经装备了激光雷达模块,如Atlas和pepper等。从2016年开始,国内主流的扫地机器人企业都已经开始加装激光雷达。例如银星智能、科沃斯、福玛特等企业。
3.交互模块:特斯拉FSD技术实力业界领先,机器人可复用
在交互层面,特斯拉FSD搭载了基于神经网络的Telsa Vision视觉处理工具,实现对车辆行驶环境的解构分析。在分析决策层,特斯拉也引入了强化学习的算法。基于视觉的神经网络技术已经在特斯拉电动车FSD得到实战验证,有望借助于Dojo加速训练芯片实现升级。目前特斯拉已完成了横跨美国绝大多数道路的数据采集,每辆特斯拉每天采集的数据近4GB,累计采集数据达1.5PB,有助于帮助机器人实现更复杂“自动驾驶”快速落地。
4.运控模块:关节能力不能匹配运动规划,目前的技术短板所在
莫拉维克悖论提出的现象,正是当前机器人所遇到的挑战。莫拉维克悖论是由人工智慧和机器人学者所发现的一个和常识相佐的现象——和传统假设不同,人类所独有的高阶智慧能力只需要非常少的计算能力,例如推理,但是无意识的技能和直觉却需要极大的运算能力。
完成复杂环境的工作任务需要仿人机器人具有快速作业的能力。正如前文所述,当前社会对于机器人的最主要的需求,来自代替劳动者从事危险和无聊的工作,这就涉及到在室内和野外的复杂环境中进行作业活动,维持运动能力的稳定性非常重要。快速作业需要仿人机器人具有输出能力足够的关节,同时在运动中满足一定的位置、姿态,还要保证一定的速度。这种快速的运动形式对仿人机器人关节驱动控制、动作轨迹规划和两者的匹配提出了很高要求,尤其在任务要求复杂多变的动态环境条件下,快速作业能力不足很容易使仿人机器人失去稳定性。
(1)关节能力不能匹配运动规划,是目前的技术短板所在
运控模块和运动规划方法,是一个动态匹配的过程。过去算法能力较弱的时候,运动规划方法是主要矛盾;当前AI能力提升,运动规划得到进步,关节的灵巧程度则需要提高以匹配运动技巧。例如当前每根手指的自由度增加了,从而对于关节驱动能力有了更高的要求,是当前的技术短板所在。
(2)抗压和灵敏性如何兼得,依然是技术难点
从承压能力角度而言,谐波齿轮传动方式弱于液压驱动,但从灵敏度角度而言,液压弱于谐波齿轮传动。以谐波齿轮传动方式减速驱动关节的仿人机器人的实用化面临着难以解决跳跃、快跑带来的足底大冲击等问题。而液压驱动下,即使最大压力按公称压力2~3倍计算,也难以抵抗仿人机器人相当于人跳跃、跑步时3~7倍于自重的冲击力,同时可能伴随着液压油易泄露,压力增高将降低可靠性以及噪声与振动等问题。足底压力传感器、脚部六维力-力矩传感器也面临着因大冲击力而超量程的安全问题。
手部关节灵活度和协调性最高,对于训练的要求极高。人手是数百万年进化的最显着成果之一,拾起各种物体并将它们用作工具的能力是使我们能够塑造世界的关键差异化因素。对于在日常生活中工作的机器人来说,与我们的工具及其周围环境巧妙互动的能力至关重要。如果没有这种能力,它们将继续仅在工厂或仓库等专业领域有用。虽然教有腿的机器人如何走路已经有一段时间了,但事实证明,有手的机器人通常更难控制。有手指的手有更多的关节,这些关节必须以特定的协调方式移动才能完成给定的任务。具有精确抓握和运动的传统机器人控制方法无法实现人类认为理所当然的通用精细运动控制技能。
(3)深度学习+上亿次的训练,才能获得灵巧的的手
解决这些问题的一种方法是应用深度强化学习(deepRL)技术来训练神经网络来控制机器人的关节。借助深度强化学习,机器人从反复试验中学习,并在成功完成指定任务后获得奖励。不幸的是,这种技术可能需要数百万甚至数十亿个样本来学习,因此几乎不可能直接应用于真实的机器人。
(4)虚拟环境模拟,是机器手实现上亿次训练的必由之路
机器人模拟器,它使机器人能够在模拟宇宙中接受训练,该宇宙的运行速度比现实世界快10,000倍以上,而且遵守物理定律。我们需要一只更复杂、更昂贵的机械手,一个装有精确运动控制传感器的立方体,以及一个由数百台计算机组成的超级计算集群,就可以用来完成上一次的训练。
04
AI的终极载体:人形机器人
1.自然语言处理技术,提高了机器人的表达能力
随着AI的发展,机器人在与人类进行交互过程中,具备更加智能化的处理能力后,能更好地适应不同的环境和任务,以及更好地与人类进行协作。
(1)在使用自然语言处理技术之后,人形机器人能够更好地理解和处理人类语言
使用语义分析和情感分析技术,可以让机器人更好地理解人类的意图和情感。人形机器人的语言系统将类似更加智能的语音助手,在AIGC帮助下,人形机器人可以更好地理解人们的意图和情感、识别人们的语音指令,并根据人们的语气和情感,提供更加个性化的服务。未来应用场景可以是替代面向客户的销售工作者,例如智能客服。通过自然语言处理技术,智能客服可以很快理解客户的意图和情感,从而更好地解决客户的问题。例如,当客户表达不满或愤怒时,智能客服系统可以自动调整语气和表达方式,以更好地缓解客户的情绪。
(2)AIGC还能根据不同的用户偏好,提供个性化的表达方式
它能够根据用户的输入、提示和个性化需求,来自行生成相应的表达方式,或者针对不同的用户群体提供不同的语言风格和表达方式。例如,使用口语化的语言和俚语来增强表达的个性和亲和力,或者利用比喻和隐喻来表达观点和情感,不仅可以帮我们完成创作草稿,还是激发灵感的初步设计。
(3)AIGC能不断更新和优化机器人的语言库
机器人的语言库是其表达能力的基础,不断更新和优化语言库可以让机器人更好地应对不同的语言场景和需求。例如,收集和整理常用的语言表达方式,以及针对不同的行业和领域提供相应的语言库。
未来,当人类需要让机器人完成一项任务时,只需要简单地描述任务的要求,机器人就可以根据GPT的处理能力快速理解任务,并执行相应的动作,带来机器人领域的变革。
2.人形机器人作为具象的实体,是AI的绝佳载体
从本质上讲,AI的发展出发点是希望模仿人类智慧,并且也正在随着大模型和算法的发展,越来越接近人类智慧、越来越接近图灵测试的奇点。因此,最终AI也需要一个十分接近于人类的表达载体,来释放它的全部潜力。
(1)人形机器人能够丰富AI的表现方式,例如动作和表情
除了传统的语音交互、图片交互,人形机器人让AI能够提供更多的交互方式,例如表情、手势等,极大地延展了AI的表达领域。例如,Engineered Arts在机器人表情展现上表现优越,给人工智能很大的发挥空间。2021年12月2日,英国机器人公司“工程艺术”Engineered Arts研发了号称“现今世界上最像人类的类人型机器人”Ameca,拥有丰富的表情和肢体动作。
(2)人形机器人是AI的一个绝佳载体,承担起AI的输出窗口的作用
这款机器人,除了像极人类的外表,它最重要功能就是为各种人工智能技术提供一个真实的平台。用户可以根据需要从库中快速加载预先保存的姿势、声音、动画和子序列,只需使用计算机鼠标或触摸板,单击并拖动机器人的功能,就能实现丰富的面部表情。
(3)目前,Engineered Arts的表情由预先编程设定,未来AI能有优化空间
尽管Engineered Arts的机器人面部表情拟人度极高,但依然是通过预先编程的模块来实现表情的。通过触摸屏界面,使用者触发它说“你好”或让它执行预编程的序列。未来AIGC有望让机器人的表情更丰富、更加具有及时性和自发性,改变只有预先编程表情的现状。
(4)当前的二次开发需要通过编程软件实现,未来自然语言编程有望让普通用户参与开发
过去,基于不同的场景进行训练和调试是专属工程师的工作,未来,ChatGPT有望根据用户的自然语言为机器人场景和表情需求生成代码,人们有望能够更轻松地与机器人互动。
05
AI+人形机器人应用及龙头布局
1.微软:NLP大模型快速进步,普通用户有望直接调试底层模型
机器人的流畅行动是经历了千百次的程序员调试才完成的,昂贵且低效。尽管语言是我们表达意图最直观的方式,但我们仍然严重依赖手写代码来控制机器人。当前的机器人训练需要将任务要求转化为系统代码的工程师或技术用户。这意味着工程师需要编写新的代码和规范来纠正机器人的行为。总的来说,这个过程很慢(用户需要编写低级代码),而且昂贵(需要对机器人技术有深入了解的高技能用户)和低效(需要多次交互才能使事情正常工作)。微软团队一直在探索如何改变这一情况,并使用OpenAI的新AI语言模型ChatGPT使自然的人机交互成为可能。
微软表示,未来用户有可能借助AI帮助机器人进行调试。过去,基于不同的场景进行训练和调试是专属工程师的工作,但现在,用户有望参与到这个过程中。根据微软最新的论文:“目前的机器人需要专门的工程师不断编写新的代码来修正机器人的行为,而我们使用ChatGPT的目标是让非技术用户参与到修正过程中,通过高级语言命令与语言模型交互,无缝部署各种平台和任务。”如果付诸实践,AI有望帮助编写新代码和规范来纠正机器人的行为,因此允许了不懂技术的广大用户提供反馈,轻松地与机器人互动,直到用户对机器人的处理解决方案满意为止,再将这个代码部署到机器人上,一个调试就结束了。
未来人们有望能够更轻松地与机器人互动和实现调试,丰富应用端发展。用户将无需学习复杂的编程语言或有关机器人系统的详细信息,就能够轻松地与机器人互动。通过遵循一套设计原则,ChatGPT就可以为机器人场景生成代码,在没有任何微调的情况下,来控制不同形状的机器人来完成各种任务。这种新的调试形式,能够推动机器人和人形机器人的应用端百花齐放,利好产业链的发展。
具体的实现步骤是,通过自然语言对于API的函数库进行调用。
首先,微软定义了一套高级机器人API或函数库。该库可以指定特定机器人,并且映射到机器人控制堆栈或感知库中的现有实现。这个步骤中,为高级API使用描述性名称非常重要,这样ChatGPT就能推断出它们的行为;接下来,微软为ChatGPT编写一个文本提示,它描述了任务目标,同时还明确说明高级库中的哪些函数可用。提示还可以包含有关任务约束的信息,或ChatGPT应如何形成其答案(特定编码语言,使用辅助解析元素);最后,用户可以随时评估ChatGPT的代码输出,最终调试结果将直接部署到机器人上。如果需要,用户可以使用自然语言向ChatGPT提供有关答案质量和安全性的反馈。当用户对解决方案感到满意时,可以将最终代码部署到机器人上。
2.谷歌:多模态训练模型进步,提高机器人训练准确性
语言和行动的鸿沟,阻碍了搭载AI的机器人像人一样行动。AI天生是语言的巨人和行动的矮子,以当前ChatGPT的技术水平来看,它能够轻松处理自然语言、和用户相互调侃打趣,能完全地通过图灵实验,但它却无法进入现实生活去拿起一双筷子、去处理真实世界的问题。
谷歌机器人在多模态训练中,展现出更高的识别准确性。谷歌研究团队在预训练的语言类大模型中嵌入图像、状态、感知等多类型数据,可以做到让机器人超越文本思考,并推理物理世界以帮助完成机器人任务。PaLM-E模型不仅具备通用化语言能力,还能执行视觉问答、感知推理、机器操作等复杂的任务,在实验室阶段取得了良好的效果。
在近期发布的PaLM-E模型中,机器人训练数据可以来源于虚拟场景。在PaLM-E的训练的过程中,研发人员构建了高度仿真现实空间的虚拟场景,在其中可以自由设置各种情况的发生。较大规模、较高质量的三维空间感知和状态数据,成为PaLM-E模型具有较强空间感知能力并最终实现机器操作的前提,有望降低训练成本。
3.英伟达:使用数字孪生技术在虚拟环境训练机器人,加快机器人训练速度
过去,机器人的流畅运动需要海量数据进行训练,造成了较高的成本和进入壁垒。一般来说,机器手臂在操作过程中,动作的方向、角度、力度都需要在各类情形下反复训练才能达到较高的精确度。因此,真实场景中的训练强度、数据规模,直接影响了机器人运动的流畅性和精度。同时,通过各类传感器在真实场景中采集的数据的数量有限,且难以覆盖长尾场景,造成了机器人的训练成本较高的问题。
近期,在AIGC之外,更先进的数字孪生技术也在持续赋能机器人的训练过程。近年来,谷歌、英伟达和腾讯,都不约而同地将"在虚拟环境进行调试和训练"作为降低机器人调试时间、提高训练效率的解决方法。
英伟达的IsaacSim给机器人训练,带来了效率和准确率两方面的提升。
第一,标记识别准确率提升。根据公司的GTC2023发布会,通过Isaac Sim中的Omniverse Replicator ,Amazon Robotics成功生成了大型逼真合成数据集,将标记检测成功率从88.6%提高到了98%。
第二,训练效率大幅提升。使用Omniverse Replicator生成的合成数据还加快了开发速度,将所需时间从几个月缩短到了几天,因为与仅使用真实数据相比,Isaac Sim能够以更快的速度迭代测试和训练模型。
4.腾讯:利用Al和游戏技术建模,帮助四足机器人Robotics X Max不断成长
腾讯正在将游戏技术,运用到对于机器人的智能系统的构建和建模中。2022年6月27日,腾讯游戏学堂联合腾讯互娱旗下START团队、腾讯Robotics X实验室,宣布发起游戏驱动机器人加速智能学习项目,利用AI和游戏技术帮助腾讯多模态四足机器人Robotics X Max不断成长。Robotics X Max是腾讯Robotics X实验室首个全自研的足轮融合多模态四足机器人,四足模态下的外形像真狗(以下简称机器狗)。该项目结合游戏技术,正在构建一套不断进化的智能系统,从虚拟到现实解决机器人的智能控制与自主决策问题。
该项目可以基于高效物理模拟技术,把机器人的训练放在虚拟环境中。该项目的一项核心游戏技术,是基于动力学的高效物理模拟技术,能够利用无限接近真实的虚拟环境打破物理世界的局限性,将机器人的训练场搬至虚拟空间,提高机器人的训练效率。游戏是模拟现实世界的最佳场所,也是最好的虚拟模拟和训练环境。利用在游戏中被广泛使用、积累了丰富技术优势的高效物理模拟技术,在游戏中可以快速搭建不同拟真虚拟训练场景,参照现实中的运动数据,让机器狗Robotics X Max在复杂地形中完成行走、奔跑、相互协作等训练。基于智能体动作生成技术,机器狗的运动轨迹规划将会更加自然流畅,能够实现更细颗粒动作的智能生成、控制、决策,使动作表现体现高度智能。
机器人在虚拟环境中训练效率更高,一个原本要几年的训练过程甚至可以被缩短成几小时。通过游戏中的智能体动作生成技术和实时物理模拟技术,不仅可以让机器狗“更加聪明”,动作更加真实、智能、适应复杂环境的变化,还可以让它“学得更快”,提升其在虚拟环境中的训练效率,大力缩减其在现实世界完成训练的过程与时间,实现高效训练的目标,一个原本要几年的训练过程甚至可以被缩短成几小时。
在算力允许的情况下,该项目可以更大幅度地缩减机器人训练所需的训练时间。腾讯游戏团队披露了该技术用于提升机器人智能化训练效率的最新进展:目前已经实现单只机器狗经过CPU优化后效率提升20倍,且同时训练的机器狗数量越多,训练的效果越好。当同时存在50只机器狗训练时,训练时间实现百倍提速。未来,在腾讯游戏技术团队的助力下,将进一步结合GPU加速技术,实现虚拟环境中机器狗训练效率的飞跃提升。
预计未来机器人训练的成本有望大幅下降,推动人形机器人的产业化实现更多可能性。过去,人形机器人的训练受制于三方面——数据、算法和算力,唯有特斯拉在独占鳌头,一方面,Dojo提供了强算力,节省了训练的时间,另外,D1芯片的性能功耗比比较强,但最核心的还是,特斯拉的自有工厂是天然的训练场,对每一个动作进行成千上万次的训练、实现性能的优化。
如果能够实现在虚拟环境中的训练,各类主机厂都能够参与其中。如果虚拟环境的训练能够达到较好的效果、不再要求大量的实际场地,那么人形机器人的训练过程将被极大简化,从而机器人参与玩家更多,应用端将有更为丰富的可能性,是对于整个人形机器人产业链的利好。
5. 特斯拉入局,人形机器人远期市场空间大
2021 年特斯拉首次公布人形机器人项目,2022 年 特斯拉正式公布首款人形机器人原型,展示了 Optimus搬运箱子、为植物浇水、在汽车工厂中移动金属棒等可能应用场景,人形机器人迭代升级速度较快。2023年5月,特斯拉CEO埃隆•马斯克在大会现场介绍了特斯拉人形机器人Optimus的全新型号,展示了人形机器人抓取物体的能力,运控能力进一步提升,人形机器人已经拥有电机扭矩控制、环境探索与记忆、基于人类跟踪运动的AI训练以及物体操纵能力。
从最开始提出人形机器人概念,到原型,再到拥有一定抓握能力和操纵能力,特斯拉在人形机器人领域迭代迅速,未来产业化有望加速。
06
AI+人形机器人趋势下中国产业链机遇
1.机器人核心模块呈金字塔结构,科技公司撬动运控零部件机遇
特斯拉、微软等科技公司在顶层数据和开发上实现跨越式突破,为产业链带来发展机遇,利好机器人整机及关键零部件的生产销售。
(1)运动控制模块产业链需求增长
随着机器人更灵活,运用的关节数量更多,因此运动控制模块是产业链机遇明确的环节。特斯拉公布其机器人配套了全身40个运动执行单元,其中上肢和躯干28个,腿部12个,仅手部就有12个,催生了对于运动控制模块的大量需求。运动控制的零部件环节,三大核心零部件包括控制系统、伺服系统、减速器:
1)控制系统
机器人本体厂商的核心竞争力,壁垒在于算法部分,涉及到对下游应用领域的工艺理解,主流整机厂商大多选择自主生产,国产厂商大多选择外购或者收购整合来解决。
2)伺服系统
由驱动器和伺服电机组成,驱动器壁垒在于算法,有驱控一体化的趋势,伺服电机的难点在于小型化,其下游应用也较为广泛。
3)减速器
纯机加工零件,与其他部分协同性较弱,且技术壁垒极高,本体厂家均选择外购,进入意愿很小。
运动控制模块中,毛利率最高的核心零部件分别是减速机(传动装置)、伺服(驱动装置)和控制器(控制系统)。
(2)预测人形机器人的运动控制模块占到物料成本40%左右
普通的工业机器人的成本构成中,运动控制核心零部件(控制器、伺服电机、减速机)占到了成本的6成左右。由于人形机器人的感知层要求更高,传感器相比工业机器人更多,占比提升。我们结合工业机器人的成本结构,考虑到人形还需要皮肤等外表功能件,假设人形机器人中的硬件成本构成结构为:运动控制零部件(控制、驱动和执行模块)占到40%,传感器占比30%,结构件和功能件占到30%。
(3)参考工业机器人,本质是“硬件+软件”的组合,硬件通常外购
机器人产业链由零部件厂商、机器人本体厂商、系统集成商、终端用户四个环节组成,本体厂商处于核心地位。工业机器人的软件部分涉及到机器人的控制以及对下游工艺的理解,需要做到可复制的同时满足不同客户的需求,这是本体厂商的核心竞争力。而硬件的生产需要规模效应,通常采用外购的方式。
(4)非核心部件,机器人公司外购概率大,例如波士顿公司正公开寻求供应商
根据The Robot Report,波士顿动力因为没有合适供应商,目前自研伺服阀,但副总裁Saunders在演讲中公开表示,作为机器人公司并不想自研伺服阀,希望能有供应商向他们提供合适的零部件。因此,对于特斯拉,我们也合理猜测,摄像头和算法等核心部件,特斯拉将发挥其供应链及技术优势,进行汽车供应商平移或自制供应;对于减速器、伺服等技术要求较低的驱动部件,特斯拉或寻求外部供应。因此,在工业机器人领域具有技术积累和产能优势的厂商可能首先获益。
2.减速机:高精度的关节传动装置,技术壁垒高
减速机作为机器人的核心精密零部件,技术壁垒高。减速机的主要工作原理为通过机械传动装置实现对原动机的减速增矩,是影响机器人性能的核心因素,在高精度场景中尚未存在替代方案,技术壁垒较高。同时,研发投入和固定资产投入都较高,绿的谐波从研发到成品花了10年的时间,初始投入大(根据招股书披露,其磨床原价约200万元,滚齿300万元),是典型的高壁垒的行业。
谐波减速机应用领域广泛,一半以上应用用于工业机器人。可用于工业机器人、航空航天、数控机床、半导体设备等领域。以全球谐波减速器龙头哈默纳科(Harmonic)为例,根据HD年报的披露,2015-2019年HD下游需求中来自工业机器人的占比在50%以上。
谐波减速器用于工业机器人的轻载场合,精度高、结构简单,实现同样的减速比,重量有明显优势。对于工业机器人来说,使用过程中不需要特别高的速度,而需要比较大的力矩来带动负载,因此需要减速器来达到降低速度提高转矩的目的。机器人对减速器的要求包括抗冲击性、长寿命、低振动、高刚度、高精度、高效率、轻巧紧凑等,一般使用谐波减速器和RV减速器,谐波主要用于轻载,RV主要用于重载场合。
根据GGII,新增的工业机器人需求是减速器产业发展的主要驱动力。此外,减速器本身有额定的使用寿命,需要定期更换,即存量市场的更换亦是需求方向之一。工业机器人的工作寿命一般为8-10年,期间减速器作为传动、承重部件,磨损不可避免,其使用寿命通常在两年左右。因而,当前保有的工业机器人维修保养亦需要大量的减速器替换。
GGII数据显示,2021年中国工业机器人减速器总需求量为93.11万台,同比增长78.06%。其中增量需求82.41万台,同比增长95.05%;存量替换量为10.70万台,同比增长6.57%。自2020年二季度开始,受益于机器人市场的回暖,减速器市场迎来新转机;2021年市场迎来需求高增长,减速器市场正式回归“黄金时代”,大部分减速器厂商均迎来业绩的增长。随着数字化进程的加快推进,机器换人将受益其中,预计未来几年减速器市场增长的确定性进一步增强,到2026年市场总需求量有望超过270万台。
一般来说,机器人的每个关节都需要配置一台减速器,不同的机器人有不同数量的关节。灵活度越高、关节越多,所用的减速机越多。而且负载不同,所用的减速器也不同,重载的关节多使用RV减速器,轻载关节一般用谐波减速器。
特斯拉机器人配套了全身40个运动执行单元,假设使用20个谐波减速机。正如前文所说,特斯拉的40个运动执行单元包括中上肢和躯干28个,仅手部就有12个,如果考虑使用谐波驱动,假设其中20个是轻载需求,则需求个数如下:15个谐波减速机,10个行星减速机,2个RV减速机,市场空间可观。
谐波减速机的市场空间有机会获得较大增长。假设人形机器人从工业级别产品发展到消费品级别的产品,在10万台、50万台和100万台这三种销量假设下(预计未来10年内),减速机的市场空间增量分别为31亿元、125亿元和175亿元,其中第三种情况下,175亿元市场中75亿元为谐波减速机。根据高工咨询GGII,2021年中国减速器市场空间为93亿,人形机器人将给减速机带来需求空间增长。
竞争格局角度,国产品牌占比逐步提高。国内生产工业机器人减速器的企业数量逐渐增多,且技术在逐步提升,部分厂商已经实现量产并逐步推向市场,在精密减速器国产化的道路上进步明显。根据GGII,2021年谐波减速机市占率方面,绿的谐波和来福谐波市场占有率提升明显,哈默纳科份额进一步略有收缩。2021年RV减速机的市场格局方面,环动科技的市场份额提升明显,纳博特斯克略有收缩,国产份额持续提升。
绿的谐波作为国产减速机龙头,已有服务机器人的配套经验。根据公司招股书,绿的谐波的产品广泛应用于工业机器人、服务机器人、数控机床、航空航天、医疗器械、光伏设备等高端制造行业和领域,其中谐波减速器已经配套国内人形机器人优必选,未来有望承接更多服务机器人机会。
绿的谐波产能提升,有望承接更多订单。从行业发展的一般规律来看,厂商处于供应链管理、成本管控等方面的考虑均会扶持二供。根据绿的谐波招股书,在IPO募投项目达产之前,公司每年谐波减速器产能约9万台,只有哈默纳科谐波减速器产能(178万台)的5%;募投产能达产以后,公司精密谐波减速器产能59万台,约为哈默纳科21年产能目标中位数(312万)的20%。根据公司2021年年报,公司的50万台谐波减速器募投项目还在稳步推进,按募投项目建设计划完成项目建设、设备采购、设备调试等工作。根据公司公告的《投资者关系活动记录表》,截止2021年底公司产能达到了年产30万台谐波减速器的水平。如果未来人形机器人订单激增,绿的谐波有可能承接更多订单,产能建设是很大的挑战。
3.伺服:2021年国产品牌汇川市占率达到第一,规模效应创造竞争力
伺服电机通过实时的负反馈信号来实现更精密的控制,在精度方面优于步进电机,在工业机器人、锂电和光伏制造等领域得到广泛应用。伺服电机转子由驱动器形成的磁场作用,编码器反馈信号给驱动器,反馈值与目标值进行比较,调整转子转动的角度,电机精度决定于编码器的精度。
国产公司汇川、信捷和合川,近年来增长较快,国产伺服份额已经达到20%以上。根据MIR,2017年汇川的市占率5%,2021年市占率已经达到16%,跃居市占率第一的品牌,增速非常高。伺服在新兴制造业占比相对多,而且新型制造迭代快、不看重案例、对价格敏感,推动了2021年国产伺服市占率的大幅度提升。市占率的提升又促进了伺服品质的迭代进步。
汇川的伺服产业链完整,发挥规模优势,吸引服务机器人领域订单。伺服的核心零部件是驱动器、电机、编码器,汇川是国产公司中稍有的产业链完整的公司,可以发挥规模效应。尽管下游配套的是工业自动化和工业机器人,但在规模效应之下成本能够下降,对于服务机器人的客户具有吸引力。
4.传感器:人形机器人需要很多传感器,以保证灵敏度
人形机器人需要很多传感器,来保证足够的信息采集。根据ZC_Robot机器人技术,机器人传感器是一种检测装置,可以使得机器人感受到被测量信息,并且将加测感受到的信息按照一定规律转化为电信号或者其他形式的信息输出,以满足信息的传输、处理、存储等需求。机器人传感器是机器人的必要零部件,其可以将必要的外部信息以及自身状态信息传递给机器人的控制系统,从而为机器人的决策提供必要的条件。机器人的环境感知能力依赖于对于环境信息的采集,因此更智能的机器人需要很多传感器。
根据检测对象的不同,可以分为内部传感器、外部传感器。内部传感器是用于测量机器人自身状态的功能元件,用于机器人感知自身的运动状态,使得机器人可以按照规定的位置、轨迹和速度等参数运动。外部传感器主要是感知机器人自身所处环境以及自身和环境之家的相互信息,包括视觉、力觉等。根据ZC_Robot机器人技术,机器人的主要传感器包括:
视觉:视觉主要包括三个过程:图像获取,图像处理以及图像理解;力觉:力传感器主要分为关节力传感器、腕部力传感器以及手指力传感器等;触觉:触觉可以感知物体的表面特性和物理特性,研究从20世纪80年代开始;接近觉:机器人移动和操作过程中由接近觉可以得到更好的操控效果。
传感器领域下游需求分散,龙头具备规模效应。传感器下游细分很多、制造各不同,是下游差异性较强的行业,较难形成规模效应。国际传感器大公司需要国际化销售、制造外包模式来做大规模、摊薄研发成本。传感器领域的优秀公司基恩士,依靠全球化的规模效应,2019财年共49.37亿美元营收,18.10亿美元净利润,利润率达到37%。根据林雪萍的《中国制造的隐痛:传感器之殇》,基恩士以纯设计(Fabless)起家,设计和销售传感器,同时不定制产品,标准化研发+代工,维持较高的规模效应。
人形机器人的消费品级别需求体量,能够推动传感器细分板块的国产替代加速。对比中国消费领域和工业领域的传感器,中国消费类电子的传感器,由于市场的拉动,近十年已经有了很大的进步,而工业领域卡脖子情况依然非常严重,围绕着控制与测量,尤其是仪器仪表传感器,几乎完全进口。能够形成较强的规模效应的领域,才能够率先实现国产替代。
5.灵巧手环节关键部件
人手能以每秒300度的速度移动,拥有成千上万的触觉传感器和21个主动自由度,是人类劳动最完美的工具。因此,机器人灵巧手的关节越多代表越灵活,能做的操作也越多。
机器人1.0时代的代表“机械臂”主要用于制造和组装流水线,机器人2.0时代的代表物流机器人,通过轮子在提前规划好的路径移动,利用视觉感知获取信息并判断,将物品搬运至固定的位置。这两个阶段的“手”,即末端执行器,可以是带有喷枪、焊枪的工具,也可以是气动吸盘(如波士顿动力Handle Logistic机器人),又或是模仿人手的夹钳(如小米铁大)、三指夹爪等。而机器人3.0时代的手,也许会是布满了传感器,通过感知物体的重量、大小、温度,采取不同的姿势和力度对不同形态的物体实施抓取,并使物体表面受力比较均匀,再加上头部的机器视觉、算法等技术,最终可以像人一样进行更准确的判断。
目前主流的灵巧手有两种方式,一种是内置式,即将驱动、传感、控制等所有的驱动执行零部件都集成在手掌内。另一种则是外置式,即将体积较大的电机驱动器外置在手臂,采用拉线方式从远端控制灵巧手的关节。这种方式和内置相比,成本更低、难度也有所降低。典型代表是英国的shadowhand,特斯拉的Optimus也采用这种方式。
Optimus的设计灵感来自于生物学,每只手拥有5个手指和11个自由度,由5根“经脉”(线驱动)通过齿轮驱动一根金属线来控制手指弯曲,并集成了感应器和锁定装置,以更加节省能耗。手腕则由两根执行器控制,该设计不仅能让手腕转动,还可以做水平的动作。除此之外,特斯拉还需要将4-5kg左右的电驱手臂集成在双足机器人上,这对人形机器人的行动、操作和精巧抓取都提出了更高要求。Optimus机械手具备负重20磅(9KG)和自适应抓取(能够抓取不同形状、尺寸的物体)的能力,因此,使得Optimus的手部劳动力能够胜任工厂的一般工作。
在特斯拉Optimus的灵巧手中,关键部件为空心杯电机和丝杆,国内相关企业包括鸣志电器、鼎智科技等。
07
人形机器人产业链相关公司
1.人形机器人产业链相关公司
2.绿的谐波:高壁垒谐波减速机业务,业绩增速高、毛利率高
公司产品广泛应用于工业机器人、服务机器人。公司2021年业绩大幅增长,主要得益于谐波减速器的市场需求增长,且公司积极进行产能投入,2021年底产能从9万台增加至30万台,预计募投产能达产以后,产能接近60万台,有望承接更多的谐波减速机订单。总体来看公司业绩增速快、盈利能力较为稳定。
3.鸣志电器:步进电机的优质出口企业,产品结构不断优化
公司产品主要覆盖运动控制领域业务,包括步进电机、直流无刷电机、空心杯电机、无齿槽无刷电机、伺服电机,出口占比较高,海外业务常年在40%以上。更高价值量的伺服、无刷电机等产品保持高速增长,产品结构不断优化。总体来看公司业绩增速快。公司近两年的ROE的上行主要来自利润率和周转率的双重提升。
4.汇川技术:优势领域稳健发展,工控之外更有天空
公司在优势领域稳健发展,低压变频器、交流伺服、小型PLC等工控产品市占率稳步提升,持续引领国产替代,增速、市占率、人效等各项表现优于行业整体,龙头地位巩固的同时积极拓展品类、战略转型,多重因素驱动成长。短期来看,随着基数效应逐渐消除、制造业周期复苏,压制因素消除,公司α与行业β有望双击;中期来看,工业机器人和新能源车业务进入收获期,有望稳步贡献利润,随中国制造出海打开全球大市场。长期来看,强管理是公司发展的坚实基础,数字化与能源管理战略迎来制造业转型机遇,传感器、电机等新业务布局打开未来大空间。
08
人形机器人未来方向及突破口
1.人形机器人未来可突破的方向
未来人形机器人的规模化发展至少还需要在以下多个方面有所突破:1)续航时间提高至20小时以上或者能够实现快充;2)机动性和敏捷性需要逐步提高。此外,人形机器人的神经和感官也需要进一步优化,相关技术涉及摄像头、力反馈、视觉和语音传感器以及其他传感器;3)计算能力需要继续提高,以保证人形机器人能够避开障碍物、筛选完成任务的最短路线、对问题做出快速反应;4)训练和完善人形机器人的工作能力;5)生产成本需要进一步降低,以缩短投资回收期。
2.技术进步将带动人形机器人的需求及其商业化
根据相关数据,全球及中国智能服务机器人解决方案产业的市场规模将于2026年分别达到675亿美元和1558亿元。其中全球人形机器人解决方案市场规模将于2026年达到80亿美元,约占全球智能服务机器人解决方案产业市场规模的11.8%。
3.未来劳动力的短缺将驱动“人形机器人”快速发展
根据相关数据,2022年美国制造业劳动力已有约50万人的短缺,预计到2030年将扩大到200万人,将驱动人形机器人的市场规模在未来的10-15年内达到60亿美元,最初始的需求将来自工业。预计到2030年,人形机器人将能够填补4%的美国制造业劳动力短缺,到2035年能够填补全球2%的养老需求。在最乐观情况下,如果产品设计、应用案例、成本可控性、公众接受度等方面的问题均得到完全克服,预计2035年人形机器人市场规模将高达1540亿美元,并可替代48%-126%的劳动力缺口和53%的老年人护理缺口。
4.电动汽车和自动驾驶的迅速发展为人形机器人提供了可参考的样本
商业市场上最先进的类机器人技术之一是自动驾驶汽车,但人形机器人必须具有比自动驾驶汽车更高的智能和处理能力,因此目前还难以商业化。尽管如此,电动汽车和自动驾驶的迅速发展为人形机器人提供了可参考的样本,同时也使得先进传感器、人工智能芯片和电池等相关技术得到快速提高。
事实上,汽车本身就可以视为一台四轮机器人,而无人驾驶汽车就相当于一台完全智能的“机器人”。根据Macquarie Research预测,人形机器人渗透曲线将与纯电动车相似,预计到2050年,家用市场对人形机器人的需求将成为推动行业规模达到3万亿美元的转折点,意味着在未来30年内,人形机器人对家庭来说可能和汽车一样重要。
马斯克认为自动驾驶正在越发接近广义现实世界的人工智能,同样软件也可以转移到人形机器人身上,并预测如果Optimus达到成熟可用状态,其数量可能将达到100-200亿。