当前位置:首页|资讯

具身江湖,成为大疆还是特斯拉?

作者:AI鲸选社发布时间:2024-12-16

对于一年融7轮当红企业智元机器人来说,2024年公司层面遇到的最大的问题,可能是创始人要离职。

这位B站百大UP主“稚晖君”,以及一天只吃一顿饭的创始人,真实名字叫彭志辉。2023年2月,搭档上海交大教授闫维新,正式在上海成立智元机器人共赛。这两位其实都是联合创始人,据悉背后还有华为大佬坐镇。

但台前一直是网红负责人稚晖君,公司高速发展一年后,几个“老板”在发展路线上有了一定的分歧,侧重做资本概念更热的人形机器人,还是做商业化更好的任何智能机器品类?

公司内闹了一圈后,智元高层协商的解决办法也比较折中,彭志辉身份被定为CTO,主要做人形机器人。联合创始人闫维新带着团队做商业清洁机器人。一遍顾着营收,一边顾着理想,这样好在没影响智元的新一轮融资。

其实,机器智能的江湖中,很多家公司都面临着这一问题。“到底要不要做通用人形机器人”?在知名资本如创新工场创始人李开复眼中,智能机器并不一定要做人形:“绝大多数应用场景并不需要人形机器人,炒菜机器人应该长得像锅,吸尘器也长得并不像人。像是波士顿动力那种很酷的、跳来跳去的机器人,真的会有很多应用场景吗?”

但现实是资本蜂拥的具身智能热潮中,大家都在投人形机器人,实际上在赌一个泛化能力出现的明天。特斯拉的Optimus已经迭代到第三代,OpenAI投资的Figure则能和人类对话。这些机器人做出了无数个第一:“第一个拿起苹果”“第一个煮咖啡”等成绩。

人形机器人未来市场潜力很大,数据统计,2024年(截止11月5日)发生46起融资,投资金额共计116.8亿元,融资总计金额翻倍;2030年,我国人形机器人市场规模有望达约8700亿元,这导致大家一拥而上。另据不完全统计,目前市场上有86家人形机器人企业,这些机器人形态各不一样,仿佛都拥有开启未来的能力。

图片来源:茶派科技

对于市场来说,仍有不少具身智能公司在做机器狗、轮式机器人等产品,毕竟人形未来前景好,但活在当下也很重要。成为下一个产品公驱动的公司,对标机器领域的大疆,就是一个很好的模式;他们选择聚焦在具身智能本体,比如核心是四足的宇树科技、老牌机器人企业优必选等,就是该领域的代表玩家。

而对于另一部分具身智能公司来说,打造泛化能力的资本驱动型产品,也是当下最容易拿投资的企业类型。这些创业者则是从“世界模型”入手,推动机器人会思考学习,也就是所谓的“具身大脑”,代表企业有银河通用、星动纪元等,想对标特斯拉的Optimus。

据公开资料,大疆的市场估值在1600亿元左右,这是一个相对成熟稳定的市场;特斯来的人形机器人业务并未独立,但马斯克自己预测,Optimus的售价低至1万美元时,这项业务估值将达到25万亿美元的高度,这是一个挑战巨大的潜力市场。

尽管行业融资还集中在A轮附近,但分化已经从现在就开始。

逐梦最先拿到大笔资金

在ChatGPT等大模型展现出通用智能的曙光后,资本纷纷形成共识,投资人形机器人,赌注下一个拥有FSD的特斯拉。

谁能在这个市场分一杯羹,大家纷纷拿出了看家本领。陪伴型、工厂型、服务型等各种业务机器人如雨后春笋般出现。

“其实对于机器人来说,去帮我倒杯水实现,比翻个跟头更难。”一位机器人从业者说道。

对于前者来说,是包含理解、评估、决策、执行等多个步骤,涉及到的技术跨越太多,北航机器人研究所名誉所长、中关村智友研究院院长王田苗认为,从进化的角度来看,如何协调语言认知智能、行为智能和视觉智能等三个计算空间,并高效地利用真实、优质、海量的数据,高效的输出执行能力,现阶段挑战很大。

但对于后者来说,翻个跟头看似很难,但解决关节电机的问题即可,难度没那么大。

学术派下决心创业,他们想做倒杯水的机器人,成为逐梦“通用机器人”的主力军。

作为清华出来的创业者,在机器人顶会 RSS 2024上,陈建宇的DWL端到端强化学习框架,是全清华大学 3 篇满分论文之一。这让资本相信其具备追逐通用机器人的能力,天使轮获得了1亿元融资,2024年10月份又完成3亿Pre-A 轮融资。

他创办了人形机器人公司“星动纪元”,也是对人形机器人是最乐观的一位,预计未来五年将迎来“机器人的ChatGPT时刻”。

在很多企业底层还在用MPC的时候,星动已经完全端到端AI驱动了,这款模型已在「星动纪元」第六代人形机器人STAR 1中应用。

星动目前努力从强化学习向端到端模型跨越。 通过语言和视觉信号直接生成 动作,一定程度避免信息传递损耗。这让其在上下半身的控制方面都有不错的成绩。星动全自研上半身灵巧手+模仿学习操作保持,是行业中的T0级别。

而作为具身智能最大的追梦者银河通用,成立不到一年就融资7亿元,可谓含着金钥匙出生。银河通用本身很擅长3D视觉,从一开始也在攻克多模态大模型、世界模型等等,更像是特斯拉的Optimus。

银河通用创始人王鹤曾经在一场投资人内部活动中,对波士顿动力看起来很牛的机器人,表达了自己的不屑:“对已知物体进行位姿追踪,在MPC的框架下跟随一条已经设计好的运动轨迹移动,也就是说物体怎么运动是提前设计好了的。它技术的先进性依然在于控制,任务的开放性和物体的泛化性都没有得到体现。”

波士顿动力作为机器人最大的鼻祖,一直沉迷于液压动力,对智能化认知较浅。在这波具身智能热潮中无缘参与,此前因为商业化基因不足,先后被谷歌、软银和韩国现代购买。

所以银河通用从一开始就追求人形,追求泛化能力。尽管人形机器人现在还经常可磕倒,但银河还是将其机器人最主要的场景,送进了货架领域。在美团买药的板块中,银河机器人可以走到货架前,识别出药品并分装,

捡药是个十分要求准确的活,银河的机器人需要学习药品知识,并做到准确分装,这也让美团战投投资了其年度最大天使轮融资。

半推半就地进军人形市场

对于机器人创业者来说,大家都知道通用机器人的前景,但都怕活不到具身智能的奇点时刻,所以很多企业想做下一个大疆,进军人形机器人也是半推半就。

这方面的典型是宇树科技,作为从四轮机器狗起家的机器人企业,经常有出圈的产品演示视频出圈。产品也在电巡和军工领域率先找到了落地场景,同时,做出了春晚和冬奥会等机器狗表演案例企业。

宇树在电机控制和硬件确实是很强,商业化导向很明显。其创始人王兴兴也经常口出爆论,坚决不做人形机器人,甚至“非常欢迎客户用我们的硬件,哪怕把我软件全删了,我们也非常欢迎。”

这导致宇树对于AI的投入十分谨慎,但在近期,王兴兴提到投资人的催促,有客户主动提需求,大模型对AI带来质变等等因素作用下,还是做了人形机器人。“

从2 月立项做人形机器人,8 月就发布了第一个原型产品,只用六个月就做出来了。不仅时间快,而且用人奇少。据悉宇树全职做这个事情的只有三个人,公司涉及到的人也就不到十个人。

对于为什么能这么高效做出来,王兴兴不无自豪地说道:“其实没有太大的难点,可能就是关节电机的扭力要求更高一点。四条腿变成两条腿,每条腿的负载会更大一点。控制算法很多能直接从四足机器人拿过来用。”王兴兴曾对“晚点Auto”表示。

其实,宇树人形机器人采用的是3个手指,相比特斯拉Optimus的5个手指、22个关节来说,确实难度不是一个层级。雅克比机器人创始人邱迪聪对鲸哥谈到:“十个关节、五个关节对我们来说其实是一样的。因为我们有通用的这种算法,可以处理任何数量的关节。”他认为这点没有跨越式的难关,更多是工程上的难题。

有其他行业人士分析,宇树一定程度避开了这个耗费时间的工程。

宇树发布的名为Unitree G1(简称“G1”)的新型人形机器人,最大意义是基础款售价仅为9.9万元。惊爆了市场,特斯拉的“擎天柱”人形机器人目标价位为2.5万美元(约合18万元人民币),而上海智元机器人的期望售价设定在20万元。宇树成了人形机器人领域的“拼多多”。

而对于智元来说,要和宇树打差异化,那就做人形机器人领域的淘宝。不能比你便宜,就比你种类更多。8月份,智元一次性发布5款机器人,轮式和人足形态的机器人都有,还有为开源而生的灵犀系类。

价格来到了20万元,虽然比宇树科技的贵一倍,但是智能化程度也高一些。

现阶段,硬件成本仍然是大头。摩根士丹利最新报告显示:现阶段特斯拉0ptimusGen2总的Bom成本(不含软件)为每台5-6万美元。一家机器狗企业告诉鲸哥,现阶段狗型能做Bom成本占到最终售价的40%,人形硬件成本会更高。

稚晖君认为必须要降到20万才能商业化落地,智元通过自研如关节电机和灵巧手等部件来降低成本。其实,人形机器人智能层面的成本,还没有分摊进去。不赚钱做通用人形机器人,20万元现在是行业低价底线了。

对于智元来说,融资金额太高也是一种无形的压力。所以在走进家庭和工业等场景中,智元还在量产下肢是轮盘的机器人,瞄准的物流和家庭等场景。据悉,单独深圳就有好几家在备货,用的是睿尔曼的机械臂和坤维的六维力传感器。

稚晖君自己就坦言,短期市场上会有各种正、负反馈,但对一家初创公司,最重要的是留在牌桌上。做人形机器人更要坚持得久一些。

2025年行业生存考验期

“今年底或明年初,人形机器人一定会进入低落期。”王田苗不避讳谈人形机器人行业的泡沫。

但这个市场依旧不乏新入局的玩家,近几天,百度IDG1号位李震宇离职后,加盟了创业项目它石智航;小米MIUI核心出来创业的小雨智造,也接连获得了2轮亿元融资;近日, OpenAI前资深算法负责人姜旭也创建「亮源新创」,打造具身智能陪伴机器人。

市场还有资金涌入,支持大家做人形机器人。人形机器人也在重点打造自己的特色,以期在明年还能继续融资。

这其中,侧重做智能的企业,在人形机器人的大脑和小脑领域,做出了不同的成绩。

机器人的大脑和小脑是一种类比,大脑(LLM、VLM)负责通用理解和决策,而小脑则擅长感知接收和基础处理,两者均是机器人技术中不可或缺的部分。

大脑诸如国外OpenAI投资的 Figure 02,国内的银河通用等,都刚刚开始发展,暂时都处于萌芽阶段。魔法原子则算是“小脑 + 心脏”都布局的企业,公司研发的不同系列关节模组,涵盖550N.m 以下的多种力矩需求;还通过全身多任务协调控制算法等技术,提升 MagicBot 的操作能力。

目前,没有哪家公司能在大脑或小脑技术上独占鳌头,所有技术都在不断发展和探索中。

而侧重本体的人形机器人中,重点做上肢还是下肢,大家发展的路径也并不一样。

现在机器人现在能做的事情很多,倒咖啡、炒菜、拖地等任务,都主要依赖上肢。但工业场景是更早落地的领域。

所以另外一条路是去给工业机械臂增加智能,利用工业机械臂重复稳定的优势,将传感器、控制器、大模型、小模型融合在一起,与机械臂结合,应用到工业场景,解决传统工业机械臂无法解决的公差问题、形变问题、柔性生产等问题。“工业对机器人或机械臂的性能要求非常高,通常重复精度需要达到零点几毫米,启动成功率要达到99.9%以上,才能在汽车制造中使用。”智机科技合伙人苏颖对鲸哥表示。

这方面智机科技的装配产品已经完成了一些案例。很多具身智能公司也放出了机器人进工厂的演示视频,包括优必选的walker系列走进工厂打螺丝,上汽集团参与上海智元、深圳逐际动力等。

未来的三到五年,人形能否把“一倍速”的移动、抓取、放置做得越来越好、越来越泛化。其实是商业化落地的关键。这是当前的难点,既需要机器人手部能做很多事,足够泛化,也要求足够精准。

而下肢的部分,也是大家分歧较多的领域。很多人形机器人下盘直接做成了轮式,在他们看来并不需要机器人越野。但双足也是泛化能力的一部分,楼梯等场景在室内也很常见。

逐际动力是标准的渐进式实现具身智能人形机器人的企业,从四轮足、双足下半身、到全身逐步产业化落地,算是侧重下肢发展的代表。10月份发布的多形态双足机器人TRON 1,可以实现双轮足、双足、双点足三种足端切换,售价6.9万元。

逐际不仅下肢研发能力比较强,还推进机器人从相互独立的感知、决策、控制向有机整合的底层基础大模型方向发展。

星动纪元最新的视频,也展示了其下肢实力,室外真实场景下能跑到 3.6m/s,相当于人类跑步配速 438。从沙漠跑动的案例,改善了机器人走步瞒珊的现象。

一位投资人表示,如果下半身进展足够快,轮式人形就只是个过渡形态了。

当然,以上很多是机器人企业展现出来的优点。实际上,在今年北京顺义的机器人大会上,很多人目睹了机器人现场撞墙、倒撒咖啡等等现象,很多还不具备现实能力,甚至型号都还没有量产。

只是不可否认的是,在争相涌现特色的国产机器人领域,是一个快速增长的市场。数据显示,中国已连续十一年成为全球最大工业机器人市场,近三年新增装机量占全球一半以上;制造业机器人密度达到每万名工人470台,十年间增长近19倍;服务机器人在家庭服务、医疗康养等领域实现规模化应用。

而至于“具身智能”的目标何时实现,“正如大家都喜欢谈论GPT moment,但我个人更信奉的是Tesla 的Model S moment。Model S第一年的出货量在 2000 多台,第二年一万台,第五年十万台,第十年一百万台。”灵初智能创始人兼CEO王启斌曾在蓝驰创投内部年会上表示。

宇树卖出了6万台机器人,人形占比并不多;智元给自己人形机器人2025年的目标仅为300台。具身智能的进化速度,预计5年内出现1万台人形机器人公司,人形机器人的发展过程相对model S更慢一点,毕竟挑战也更巨大一些。

但对于市场来说,谁能活到那一天,而不是成为追逐特斯拉道路上的极越呢?

本文来自微信公众号“AI鲸选社”,作者:杨晓鹤,36氪经授权发布。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1