文 | 田哲
编辑 | 苏建勋
在加州华纳兄弟制片厂摄影棚内,数个特斯拉人形机器人Optimus在无辅助的情况下,排队走进会场。会场另一边的展览区,一台Optimus不断为客人递送零食、进行打招呼、猜拳等互动。
这场主题为“We,Robot”的特斯拉产品发布会,公布了包括无人驾驶出租车Cybercab、无人驾驶客货两用运输车Robovan等两款新产品,并展示了Optimus的行动能力。
人形机器人Optimus是特斯拉最重视的业务之一。特斯拉CEO马斯克预计,Optimus将超过特斯拉其他业务的总和,为特斯拉创造数十万亿美元的市值。
马斯克表示,随着未来大规模量产,Optimus的售价将降低至2-3万美元。降本的原因之一在于部分特斯拉车辆的零部件能被整合至Optimus,包括电池、电子设备、电机、软件、AI推理设备等。
他曾给出Optimus的量产时间节点:2025年年初进行小批量生产,率先在特斯拉内部使用,当年年底,特斯拉工厂将应用数千台Optimus。2026年,特斯拉将大幅度提高Optimus产量,并向外部出售。
Optimus行走、视觉能力增强
Optimus于2021年首次推出,今年5月马斯克公布的视频显示,Optimus已具备双手折叠衣服,在特斯拉工厂分装电池等能力。
今年5月,马斯克展示Optimus叠衣服
但今天展示的Optimus显示,它们具备较强的灵活性、视觉能力。
灵活性方面,Optimus已经实现再无需外部辅助的情况下,实现行走、跳舞。
数个Optimus行走
Optimus合作跳舞
在一处零食摊前,Optimus能将指定的零食从桌上拿起,交给对应对象。
取物
视觉方面,Optimus还能实现识别人类的意图,主动与人类打招呼。
打招呼
此外,当面向的人类做出猜拳手势时,Optimus能迅速识别意图并一起玩猜拳。
玩猜拳
对于Optimus进一步规划,马斯克曾表示其将具备会话功能、交谈功能。根据《马斯克传》,2023年4月,马斯克向团队提出开发一款Chatgpt聊天机器人的竞品,所使用的算法和训练的数据集确保政治立场中立。
数据源是X平台的信息流,每天全球X用户发布5亿条推文,包含人类的各种对话、新闻、兴趣、术语等。同时,聊天机器人也能在X与真人对话,测试人类对它的反应。
马斯克对大语言模型聊天机器人的研发充满信心。他曾表示,如果特斯拉和Openai必须交换任务,他们来制造自动驾驶车辆,特斯拉制造大语言模型聊天机器人,特斯拉将成为胜者。
无限接近人类,Optimus要成为人体的一部分
遛狗、取物、打扫房间……马斯克对Optimus的期望远不止如此,他判断通用人形机器人市场需求将超过200亿台,Optimus将走进家庭与工厂,成为人类生活的伴侣,甚至成为意识的载体。
他曾表示,未来Optimus可能会与其脑机接口公司Neuralink配合,人脑接入脑机接口后,就能灵活控制身体上的Optimus肢体。
这需要Optimus的外形与人类相仿,才能自如地实现各种类人操作。《马斯克传》提到,特斯拉将Optimus设定为身高约1.72米,体重57kg,皮肤光滑的双足人形机器人。
灵巧手是人形机器人的关键零部件之一,从手指到肩部,人手共有27个自由度,灵巧手的自由度越高,机器人能执行的动作数量越接近甚至超越人类。然而,自由度提高不仅意味着研发难度大幅度提高,同时也相应增加电机数量,抬高了机器人制造成本。
大部分人形机器人公司选择从研发难度更低的二指、三指机器人起步,自由度多为十余个,只能通过开合执行简单的操作,比如拾起或者松开物体。
特斯拉人形机器人开发团队也曾认为只需研发四指机器人即可,因为小拇指看上去用处不大,但团队出于让机器人外观接近人类、实现更多功能的考虑研发五指机器人。他们将小拇指延长以赋予其更多功能,但每根手指只有两个关节,而不是人类手指的三个关节。
经过一年的迭代,马斯克曾表示Optimus手部自由度将从11翻倍至22,接近于人手自由度,这意味着Optimus能模拟人手的细微动作。
特斯拉也曾遭遇高成本难题。特斯拉有一个电子表格记录了人类手腕三种运动方式:上下挥动、左右移动以及旋转。如果实现其中两个自由度,每个手腕的成本为712美元,若实现全部功能,需增加额外执行器,成本将增至1103美元。最终,团队将特斯拉车上的升降门执行器应用至Optimus,才降低了制造成本。
在任务执行方面,马斯克要求Optimus能够像人类一样,只需通过观察和模仿就能学习完成各种任务。
为此,特斯拉为Optimus配备了数十人的遥操作团队,他们必须身穿动作捕捉装备和VR头显,执行各类指定动作工作,采集AI训练数据。为了让采集的数据更适用于Optimus,特斯拉要求遥操作团队成员的身高必须为1.7米至1.8米之间。
特斯拉机器人团队工程师Milan Kovac曾表示,他们设计、训练和部署了一些首批端到端人形机器人神经网络,这些神经网络可以自主执行需要协调控制人形躯干、手臂和整个手部的任务。经过不断的训练,Optimus已经出现从失败案例中,学会了自主修正能力。
在一些细节方面,特斯拉也尽量让Optimus看上去更像人类。比如Optimus面容看上去是雌雄同体的精灵,从而让Optimus看上去更无害;在观察周围环境时无需转动头部,而是安装多个摄像头。
Optimus外观接近人类的同时,特斯拉团队也试图在人类能力的基础上增强Optimus,比如第二代Optimus腿部线性执行器强度足以吊起一架500kg重的钢琴。
马斯克曾说:“如果你能打造出一辆自动驾驶电动车,那它就是一个有轮子的机器人。同样,你也可以打造出一个有腿的机器人。”
如今,特斯拉在一场以机器人为主题的大会上,推出多款自动驾驶汽车,展示Optimus新动态,宣告公司转型为一家机器人公司,而Optimus将是特斯拉在机器人之路狂飙的主引擎。