当前位置:首页|资讯|华为|百度|AI大模型|融资

华为“天才少年”创业首秀:AI大模型+人形机器人

作者:猎云网发布时间:2023-08-18

原标题:华为“天才少年”创业首秀:AI大模型+人形机器人

来源:猎云精选,文/王非

获百度高瓴经纬等多轮投资,“爆肝”近半年,原华为“天才少年”创业首秀来了!

8月18日上午,人称“稚晖君”、“野生钢铁侠”的彭志辉,作为智元机器人(Agibot,下称:智元)联合创始人正式发布——智元具身智能机器人“远征A1(RAISE A1)”。

据介绍,远征A1身高175cm、体重55kg、最高步速可达7km/h、全身49个自由度、整机承重80kg、单臂最大负载5kg,不仅在形态上与人类相似,更在双足行走、智能任务、人机互动等领域展现出了强大的能力。

据悉,智元计划将整个机器人硬件成本控制在20万元以内,并在明年快速切入商业化落地,首先应用于工业智造领域,随后逐步走向家庭,协助工人、科研人员和家庭成员完成各种任务。

“爆肝”半年,人行机器人实机亮相

4月1日,稚晖君在B站上传了他最新自制的机器人“neZHa(哪吒)”制作视频,这也是他离开华为创业后发布的第一个视频。

根据稚晖君在B站账号上公布的信息,他正在开发一款结合足式机器人和轮式机器人优点的轮足式机器人。他不仅负责硬件模块的设计,还涉及机械、电控甚至部分AI方面的开发,几乎实现了全栈自研。

而这,也被认为是智元新产品的雏形。随后,就是疯狂赶工。稚晖君在5月21日发布的微博中就曾写道:“这几天全员爆肝中,大概就差把家搬到公司了。”

而在“爆肝”不到半年后,智元具身智能机器人“远征A1”迈着稳健的步伐登上发布会舞台完成亮相。

发布会现场,稚晖君介绍了智元自研的一系列核心组件及其技术指标:

核心关节电机PowerFlow

就像人体的关节决定了人做各种动作的灵活性,机器人的“关节”执行器同样如此,一台行动精准敏捷的机器人,其关节必须做到体积小、重量轻、高功率密度、高能量利用效率、高响应带宽、耐冲击等一系列特性。核心关节模组的自研不仅是让人形机器人更灵活、更自由的关键,同时也是让其实现规模化量产、低成本应用的重要门槛之一。

智元自研的PowerFlow使用了准直驱关节方案,实现了低齿槽转矩设计,搭配10速比以内的高力矩透明度行星减速器、共轭同轴双编码器、一体液冷循环散热系统,以及自研的矢量控制驱动器,峰值扭矩超过350Nm,而重量仅为1.6kg。

稚晖君表示,他们还没有测到扭矩的真正上限,估计潜力比想象中高。而且,由于水冷散热的加持,它可以保持更长时间的峰值扭距输出。

灵巧手SkillHand

远征系列机器人旨在融入生产场景并发挥作用,另一个十分重要的核心部件就是灵巧手。智元也发布了面向下一代机器人的高自由度灵巧手SkillHand,这款灵巧手将拥有12个主动自由度和5个被动自由度,成本低至1万元以内;所有驱动内置,并集成了基于视觉的指尖传感器,专门面向精密操作,这款灵巧手会在后续进一步迭代后成为远征系列的标准配件。

值得注意的是,如果场景需要,远征系列机器人甚至可以自主更换灵巧手,比如把手换成螺丝刀。稚晖君表示,这是模块化设计思想在他们机器人中的体现。类似的模块化设计还可以让机器人由腿式变成轮式,这是它通用性的一个体现。

统一软件框架AgiROS

AgiROS是智元自研的一套机器人运行时中间件系统。AgiROS秉持轻量、易用、高性能、高扩展性等原则,遵循现代的开发范式,提供多种语言的接口,以插件形式兼容主流生态,包括ROS、ROS2等机器人开发生态、GRPC、HTTP等云服务生态。

后续,AgiROS将开放源码与社区共建,提供详细的文档与多样的demo,与开发者共建新一代机器人开发生态。

AI大模型加持,参数达百亿级

根据4月初发布的招聘信息,智元开放的社招岗位就包括算法工程师一一大模型LLM。

在招聘信息中,智元还表示,公司的三大吸引力之一就是激动人心的方向:人工智能正在迎来新一轮产业剧变,往AGI圣杯的方向加速迈进,LLM+Robotics的组合已是必然趋势,机器人将在不久的未来迎来应用场景爆发的拐点。

在8月17日举办的媒体沟通会上,智元再次明确表示:“近段时间涌现出很多家人形机器人(公司)。硬件本体因为电驱形式受物理限制,已经到了一个瓶颈期。今后真正的比拼,就是机器人是否更聪明,就是大模型的人工智能能力。”

于是,大模型加持下的远征A1,也成为了外界关注的焦点。

语言任务模型WorkGPT

结合LLM和VLM等AI技术带来的重大突破,智元使机器人能够自主感知环境、理解任务、编排动作成为可能,实现了从ChatGPT到WorkGPT的扩展。

据悉,WorkGPT是一个百亿级参数的大模型。

与传统AI技术不同,智元的WorkGPT充分应用了语言和图像大模型庞大的先验知识库和强大的通识理解能力,你不用告诉它什么是垃圾,它就能自己分辨出来;并实现了复杂的语义多级推理能力,也就是所谓的“思维链”,它可以把复杂的指令分成一个一个的步骤。

稚晖君表示,在大模型时代到来之前,机器人都是专用设备,我们需要针对性地对每一个任务进行调试和部署。现在利用大模型的各种通识能力和举一反三的推理能力,我们可以看到解决这些问题,然后最终走向通用机器人的一道曙光。

具身智脑EI-Brain

智元的具身智脑EI-Brain架构中,把机器人的思维系统分为云端的超脑、端侧的大脑、小脑,以及脑干几层,分别对应机器人任务级、技能级、指令级以及伺服级的能力。

具体而言,“大脑”负责跟我们人类一样进行抽象思考、多级推理,“小脑”负责运动控制方面的一些指令生成,“脑干”负责电机控制、伺服等硬件底层任务。

基于任务数据反馈,EI-Brain具备在机器人任务执行过程中不断自我学习强化的能力。如果端侧模型泛化能力不够,系统可以去连接云端,实现更复杂的任务调度;另一方面,偏向于硬件底层的电机控制等工作都在本地甚至模块中完成。

稚晖君表示,我们定义了一系列Meta skill,在语言操作库范围限定的有限泛化的场景内,机器人可以实现自主的推理决策,然后完成端到端的任务编排。随着能力库不断扩充,机器人能够胜任的任务空间也将指数级增长,最终可以实现全场景的覆盖,切入千行百业。

半年速成“独角兽”,马斯克雷军成竞对

1993年于江西安吉出生的稚晖君,在电子科技大学求学期间就通过视频记录下自己的动手能力。而这,也见证了他一步步收获科技圈知名KOL、B站百大UP、“野生钢铁侠”、华为“天才少年”等光环的旅程。

大学毕业后,稚晖君先是进入OPPO研究院AI实验室担任算法工程师,差不多干了两年。然后便顶着“天才少年”的名号于2020年11月进入华为,拿的年薪是三个档位中最高的201万元,他的对外公开Title是华为昇腾AI边缘计算专家。

在华为,稚晖君差不多也是干了两年。2022年12月,他发文称,在华为的几年非常开心,永远都会视自己为华为的一员,但“君子战虽有陈,而勇为本焉”,所以他要去追求自己热爱和梦想的事业了。

2023年2月27日,上海智元新创技术有限公司正式注册成立,法定代表人为舒远春,稚晖君作为联合创始人之一,担任公司CTO、首席架构师。

工商变更记录显示,智元在创立一个半月后,就吸引了高瓴资本、奇绩创坛入局。随后,差不多又在一个半月后,新增BV百度风投、经纬创投、鼎晖投资、高榕资本等为股东。

值得一提的是,智元还吸引到一批地方国资入股,包括上海焕新一期私募投资基金合伙企业(有限合伙)、上海司南园科私募基金管理有限公司。

截至目前,智元已经完成了天使轮、A轮、A1轮、A1+轮等多轮融资。

伴随高瓴、百度等知名机构的入股,智元的市场估值被曝已达近百亿人民币,约十几亿美元左右,妥妥的“独角兽”。

天眼查App信息显示,稚晖君最终受益股份约为6.6%,以此计算,其身价超6亿元。

英伟达CEO黄仁勋曾表示,“AI的下一个浪潮将是具身智能”;美籍华裔人工智能学者李飞飞也曾表示,具身智能将会成为AI领域的下一个“北极星问题”之一。

具身智能+人形机器人的“风口”已然到来,站在风口的稚晖君,还要面对马斯克旗下的特斯拉人形机器人Optimus、雷军旗下的小米人形仿生机器人CyberOne等一众竞争对手。

稚晖君表示:“远征A1是智元的第一代通用型具身智能机器人,基于创始团队在机器人和AI行业多年的经验积累在半年内所打造,这款机器人未来将可以在各种复杂场景下自主完成移动和操作任务。我们致力于将先进的机器人和AI技术与人类生活以及生产制造紧密结合,未来让机器人成为人类的得力助手。”

为了让远征A1适配不同的应用场景,智元在远征A1设计上采用了上下肢分体的模块化设计,上肢支持灵活更换末端工具,从而满足多种任务的需求。下肢采用双足,轮式,轮足等不同的设计,可实现不同应用场景下最优的机器人配置和扩展。

目前,智元已推进与多家制造业头部企业对接,将远征A1应用于各种实际场景,并计划在未来几年内推广远征A1至更多领域。

未来,智元会逐步开放其开发平台,通过开放协同模式、开放平台接口与能力、开放工具和云平台,为科技开发者提供一个全新的创作平台,鼓励和吸引更多开发者和企业参与其生态系统的建设。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1