当前位置:首页|资讯|AI大模型

稚晖君版“钢铁侠”来了!6个月造出实机,AI大模型加持,能当保姆能拧螺丝

作者:智东西发布时间:2023-08-18

原标题:稚晖君版“钢铁侠”来了!6个月造出实机,AI大模型加持,能当保姆能拧螺丝

智东西

作者 | 云鹏

编辑 | 心缘

智东西8月18日报道,刚刚,智元机器人(Agibot)正式发布了智元具身智能机器人远征A1,这也是稚晖君创业后跟团队一起亮出的首个重磅作品。

▲远征A1

2022年12月离开华为后,稚晖君与团队在今年2月成立了智元机器人,其成立仅3个月就晋升为“独角兽“,知名投资方包括高瓴创投、BV百度风投、奇绩创坛、经纬中国等,业内有消息称其估值已近百亿人民币。

集华为天才少年、野生钢铁侠、B站百大UP、科技圈知名KOL等诸多光环于一身的AI工程师稚晖君,初登创业舞台,究竟会交上怎样一份答卷,今天答案正式揭晓。

▲稚晖君

这次远征A1并没有在一开始就上台,而是在发布会结尾才来到大家面前,与智元机器人团队进行合影,此次出镜的智元机器人团队成员共有35位。

▲远征A1登台(动图步速有一定加快,并非实际步速)

▲现场登台的智元机器人团队成员

远征A1是一台具有完整人类造型的人形双足机器人。从现场演示来看,远征A1走路的速度并不快,跟小米的“铁大”较为接近,其走路的状态还是比较稳的,不过步幅比较小。

根据现场视频,远征A1可以在汽车产线中从事地盘装配、外观检测。

还可以在工厂中进行3C产品的组装装配、物料搬运,在生化实验室中帮助研究员进行样本制备、样本增扩。

在家庭场景中,远征A1甚至可以在烹饪场景中磕鸡蛋。

还能照顾老人、帮助老人吃药,还能帮孩子辅导功课。

值得一提的是,虽然发布会上提到了各种炫酷能力,但在今天的发布会现场,稚晖君并没有对这些功能进行演示。

在演讲中稚晖君说到,“智元”的寓意实际上就是“智能的人形机器人”,“元”就像人的两条腿。他们团队希望创造出和人一样灵活以及智能的机器人,让智能机器创造无限生产力。

在核心特性方面,远征A1的自由度超过了49个,其关节电机的峰值扭矩可以达到350Nm,并配备了液冷散热结构。其腿部采用反屈膝设计,更适合“干活”。远征A1的手部有12个主动自由度,成本在1万人民币以内。

稚晖君说,未来远征A1可以跳舞、跑酷,并且他们会将其成本控制在20万元以内,真正具备落地商用的可能。

相比之下,马斯克的“擎天柱”人形双足机器人全身有200多个自由度,手部27个自由度,成本预计在2万美元(约合人民币14万元)左右。不得不说,马斯克的擎天柱固然优秀,但成立半年的智元机器人可以做到这样的程度,也值得点赞。

稚晖君提到,团队做机器人从一开始就是本着规模商用去的,在汽车制造、3C制造领域,智元机器人已经和国内龙头企业进行了对接。他感慨称,在不到半年时间里,团队完成了“从0到1”整套完整样机的打造,这样的效率是相当“炸裂”的。

值得一提的是,这还是稚晖君第一次登台演讲,能看出他略带紧张,语速也有些快。

一、瞄准AGI圣杯,要做就做最难的人形机器人

在介绍今天的主角远征A1之前,稚晖君首先跟大家分享了一下他们为什么要做这样一个融合了大模型能力的人形双足机器人产品。

首先,这跟智元机器人创立之初的理念相关,他们团队的目标是要做通用人形机器人和具身智能,AI和机器人的融合正是是他们聚焦的重点。

“具身智能”简单理解就是“有实际的身体并支持物理交互的智能体”,我们常见的人形机器人以及机器狗,比如马斯克的“擎天柱”、雷军的“铁蛋”,都属于这类产品。

在他们看来,人工智能正在向AGI(通用人工智能)圣杯的方向加速发展,大语言模型跟机器人的结合是必然趋势,机器人很快会迎来应用场景爆发的拐点。

稚晖君特别提到,“智元”的寓意实际上就是“智能的人形机器人”,“元”就像人的两条腿。

他们团队希望创造出和人一样灵活以及智能的机器人,让智能机器创造无限生产力。他们要做出能在现实世界中为人类提供劳动力服务的下一代量产型机器人。

稚晖君提到,虽然现在AI已经开始做很多创造性的工作,比如绘画、写作、作曲、聊天,但如果真正想让AI在生活中为我们服务,比如做饭、打扫房间、扔垃圾、甚至是工作赚钱,AI就必须要跟机器人结合起来,这也是他们团队想让AI做的事。

那为什么要做人形机器人呢?在稚晖君看来,人类生活环境都是为人类设计的,人形机器人的使用不需要再对环境进行改造。人形双足机器人是最通用的形态,也会是走入家庭中的终极形态,但是挑战和难度也很大。

莫拉维克悖论提到,要让机器如人类大师般地下棋是相对容易的,但是要让机器人具有如一岁小孩般的感知和行动能力却是相当困难的。

二、超49个自由度,自研电机用上液冷,成本20万元以内

介绍完团队的初衷之后,稚晖君开始详细展开远征A1的技术细节。

在本体硬件设计层面,远征A1的自由度超过了49个,配备了谐波一体关节、直线推杆、无刷行星伺服、空心杯电机等关键部件。

团队根据机器人运行实际需要的关节的参数,去自己设计了电机。其关节电机的峰值扭矩可以达到350Nm,重量为1.6kg。为了达到更高的功率密度和更持久的高功率输出,电机中还放入了液冷散热结构。

腿部形态方面,远征A1采用了反屈膝设计,稚晖君说这个设计主要是为了让机器人有更大的操作空间,更适合“干活”。

远征A1非常关键的手部有12个主动自由度、5个被动自由度,成本在1万人民币以内,配备了基于视觉的指尖传感器。

此外,远征A1的AI算力达到了200TOPS,搭载了RGBD相机、激光雷达、IMU等传感器,在智能方面则支持多模态感知、少样本学习、任务闭环、强人机交互等能力和特性。

值得一提的是,远征A1还进行了模块化设计,可以在下身更换不同的地盘,腿部可以拆卸改装,手部则可以更换其他的工具,例如螺丝刀、电钻,具备了更好的通用性。

除了硬件,算法自然也非常重要。稚晖君说,在运控算法方面,智元机器人团队迭代了三版,他们具有目前业界第一梯队的算法研发能力。

稚晖君也提到,现在有很多行业巨头的机器人已经可以飞檐走壁,在不久的将来,对于远征A1来说,跳舞、跑酷也都不是难题,最关键的是,他们会将其成本控制在20万元以内,真正具备落地商用的可能。

三、AI大模型与机器人碰撞出火花,汽车、消费电子场景率先应用

最后,在机器人与AI大模型的结合方面,稚晖君提到,对于机器人的实际应用来说,硬件本体是前置条件,机器人的大脑是更关键的。

机器人不止需要ChatGPT,更需要一个“WorkGPT”,这对在真实世界中执行复杂任务的通用机器人来说是非常重要的。

根据智元机器人此前曾放出的视频,他们已经让机器人实现了基于大语言模型的机器人行为自动编排和任务执行。

在视频中,研究员通过文字或者语音对话的形式给机器人发送指令,机械臂背后的大模型可以理解这些自然语言指令的意义。理解后机械臂可以根据指令抓拿指定颜色的方块并对方块进行更进一步的操作,比如移动、旋转。

在稚晖君看来,语言和图像大模型对于机器人领域应用最大的价值主要在于两方面。

首先是庞大的先验知识库和强大的通识理解能力,大模型的泛化能力,可以让机器人将既有能力应用到新的场景中。第二个重要价值是复杂语义多级推理能力,所谓的“思维链”。

大模型时代到来之前,机器人都是“专用设备”,如今机器人向通用机器人更近一步。

稚晖君进一步拆解道,智元“具身智脑”包括云端超脑、大脑、小脑、脑干等几部分,分别负责任务、技能级、指令级、伺服级的任务。

比如在技能级模型层面,机器人可以实现自主决策,完成端到端的任务,并通过自主学习,在各个场景中拥有更高应用价值。

根据智元机器人放出的视频,远征A1可以在汽车产线中从事地盘装配、外观检测等工作。

远征A1可以在消费电子厂商工厂中进行3C产品的组装装配、接线粘胶、物料搬运等工作。

在生物医药领域,远征A1可以在生化实验室中帮助研究员进行样本制备、样本增扩。

最后在家庭场景中,远征A1可以照顾老人、帮助老人吃药,还能帮孩子辅导功课。

总体来说,远征A1在实际工业、生活场景中都有不错的应用潜力。

稚晖君特别提到,他们做机器人从一开始就是本着规模商用去的,在商业落地的节奏方面,工业制造会是他们最先接触的领域,例如汽车制造、3C制造,在这些领域,智元机器人已经和国内龙头企业进行了对接。

此外,在生态和开发者方面,智元机器人会建立开放平台,让开发者可以根据智元机器人的平台开发更多产品和应用。

最后稚晖君感慨称,从2月底公司成立、项目立项、组建团队,在不到半年时间里,团队完成了“从0到1”整套完整样机的打造,这样的效率是相当“炸裂”的。

从结尾的视频中我们可以看到很多远征A1测试过程,甚至面对飞踢、拳打,远征A1也不会摔倒。

四、“华为天才少年”稚晖君入场,人形双足机器人赛道火热添柴

此次稚晖君发布机器人新品,受到业内广泛关注,这一方面是因为其本身的人气和过人的技术实力,一方面也是因为近来AI大模型的发展让人们在机器人赛道看到了新的机遇。

稚晖君,一个因为下雨天骑车滑倒,就做出一辆“能够自己行走”不摔跤的自行车的人。

从自带屏幕可自定义显示内容的模块化机械键盘、又萌又硬可以识别手势打开不同程序的桌面陪伴机器人,到用螃蟹壳做的“火星车”,稚晖君一个人在一个十平米的小房间里创造了许多“天马行空”的硬核科技产品。

有人评价他的作品是:外行看了很厉害,内行看了更厉害。

1993年出生的稚晖君,本名彭志辉,22岁本科毕业于电子科技大学生命科学与技术学院,2018 年研究生毕业于电子科技大学信通学院。

他毕业后曾在OPPO研究院AI实验室担任算法工程师,随后在2020年加入华为,从事昇腾AI芯片和AI算法相关研究工作。

2020年华为天才少年总共招收了6个人,稚晖君就是其中之一。

2022年12月,稚晖君从华为离职,2023年2月,智元机器人(上海智元新创技术有限公司)就正式成立了,相距时间非常短。

根据招聘网站信息,彭志辉是智元机器人的联合创始人之一,目前担任首席创新官及人形机器人首席技术官,负责人形机器人产品研发工作。

成立仅半年多,智元机器人已获得高瓴创投、BV百度风投、奇绩创坛、经纬中国投资,并被打上了“独角兽”的标签,有业内消息称其估值甚至已经达到近百亿人民币。

如果按照稚晖君的最终受益股份6.6%来简单估算,稚晖君的“身价”也直接来到了6亿人民币左右。

虽然目前除了稚晖君,智元机器人的团队中有哪些大牛并未公开,但招聘信息称,团队有国内外一线大厂和科研院所相关领域的高级别专家。

智元机器人的招聘岗位包括大模型算法工程师、机器人运动控制算法工程师、硬件工程师、软件开发工程师以及嵌入式开发工程师等。

稚晖君曾在视频中说过,ChatGPT的出现称为40年以来最大的AI革命,在OpenAI和波士顿动力之外,稚晖君希望在未来AI和机器人加速融合的过程中,自己也有机会做出一些微小的贡献。

在他看来,人工智能和机器人就是这个时代的魔法,可以引领我们跳脱出自己肉体的极限,去观察我们的生活和我们的地球。科技就是这个时代的主旋律,而他想在有生之年看看人类的边界能够扩展到什么样的程度。

当然,如今人形双足机器人赛道的发展也面临着诸多挑战。

尽管人形双足机器人已经可以“飞檐走壁”,运动能力拉满,但到了实际商用落地的环节,仍然举步维艰,波士顿动力几次卖身易主,也都证明了这一赛道商业化的艰难。

当下,马斯克搬出了双足人形机器人“擎天柱”,雷军也发布了铁大、铁蛋一系列双足、四足机器人。科技巨头们对于机器人领域的积极探索,也在加速这一领域的产业链成长。

根据马斯克预测,未来人形机器人的市场甚至会超过电动汽车,达到100亿台的规模,届时这一万亿美元级的新蛋糕,势必会成为各路科技公司争夺的焦点。

对于稚晖君和他的团队来说,大模型与机器人的结合既是机遇,也被机器人行业内所有玩家所看到,后续产业内的竞争,势必会更加激烈。

结语:稚晖君交卷,AI大模型与机器人结合,AGI圣杯更进一步

毫无疑问,远征A1的出现,一方面证明了稚晖君团队的技术实力,另一方面也代表着AI大模型与机器人的结合是具备极高应用潜力和价值的。

不论是在工业、学习、生活中,融入AI大模型的机器人都可以帮人类解放生产力。大模型的到来让业内看到AGI圣杯的曙光,而今天大模型与人形机器人的结合,则让这一目标更近了一步。

可以预见的是,在科技巨头纷纷押宝、创企不断涌入的人形机器人赛道,技术和产品迭代的速度会加快,更多的精彩还在后面。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1