第24届中国国际工业博览会于2024年9月24日—28日在上海举行,本届工博会汇聚了机器人行业全年最丰富、最前瞻、最新颖的应用案例,引领机器人及智能制造应用的发展新态势。
纵观本届工博会,柔性化制造能力成为工业企业最为关注的核心。伴随着智能制造的发展,近年来企业为了提高效率,对整个生产流程有了更高的柔性生产要求。这表现为企业生产方式已经开始从结构化走到半结构化,以及彻底无序的状态,而这种非标场景需求,意味着产线经常需要混线,机器人处理并不规整的来料、堆叠碰撞的情况时有发生。
企业通用性生产的要求下,传统编程执行的机器人程序,无疑很难以从单任务切换到混线生产的多任务模式,也难以适配多领域、多节点的智能化生产方式。在此基础上,本届工博会上,不少协作机器人、ARM机器人企业,就尝试借助3D视觉、高精度传感器等新技术,进一步提升产线的柔性化生产能力。
跨维智能本次展示的具身智能方案,无疑让许多工业企业以及机器人企业眼前一亮。
▍具身智能已经悄然落地
作为具身智能规模化商业落地的引领者,跨维智能3D视觉引导机械臂抓取方案,对于相机等硬件要求不高,所采取的都是市场上成熟的相机、计算单元。但基于成熟工业3D视觉的产品矩阵,跨维智能结合其更可控的仿真引擎底层,已经打造出了基于3D VLA (3D Vision Language Action) 大模型的成像感知套件,并正在具身智能领域沿途下蛋,加快工业领域的产品化落地和商业验证。
跨维在工博会上最新展示的具身智能方案,就是基于底层自研的 DexVerse™ 空间与具身智能引擎打造,能帮助智能体快速、低成本、无需上云和高算力,即可完成场景任务拆解(外部大模型接口)、物理仿真、数据渲染生成、自动标注计算、模型设计与训练,再到Sim2Real机器人等执行机构能力迁移全流程,而且实现合成数据准确率更高,让实际智能体工作表现更鲁棒高效,凭借优秀的性能和可靠性已经得到了非常多客户的认可。
使用两组2D相机,配合DexVerse™具身智能引擎实现精准成像与识别抓取
具体而言,跨维智能所提供的具身智能方案,与传统视觉公司的解决方案有着极大差异。传统机器视觉在进行柔性化工业落地过程中,部署代价相当高,如果企业不采取深度学习方案,而是采用原先基于模板匹配的方案,大多需要一个有经验的工程师,在实际项目中不断基于产线情况调参、修改算法规则,或者二次开发,这样才能在面对换线问题时,让视觉有着较高的分辨率和稳定性,并帮助机械臂进行运动姿态和碰撞检测的实时调整,这意味这非常长的部署周期以及较高的成本投入。
而跨维智能的具身智能方案,通过自研的DexVerse™具身智能引擎,形成空间与具身智能大模型套件及纯视觉智能传感器,就相当于赋予机器人提供智慧的大脑和双眼,同时借助训练好的模型,可以在选定的商业场景内驱动机器人本体,以通用的方式完成各种机器人技能操作,帮助机器人做到根据实际产线的工业问题,实现更便捷地解决,而且具备一定的技能泛化能力。
例如产线上的无序抓取问题,在跨维智能的方案中,由于此前在虚拟仿真空间中已经积累海量相关数据,并在虚拟仿真空间中针对100%的合成数据,直接训练出了一个识别率达到99.9%以上的模型,从而才面对相类似产线问题时,仅需通过视觉将产线业务环节的实际情况与仿真进行验证与匹配,即可在现场便捷完成模型的部署与运行。这使得该套方案,在交付周期和效率上,已经有着颠覆式的提升。
据悉,针对不同的工业场景情况,跨维智能这套方案,针对不同的场内情况,从部署到实际应用周期已经缩短到了1~4天。
▍自研底层引擎,打造数据飞轮
机器人大讲堂了解到,跨维智能之所以能够保持产线较高的成功率和部署效率,原因在于其不同于市场上大部分采用开源仿真引擎的公司,跨维是国内为数不多掌握底层仿真引擎工具的国产企业。其团队有深厚的历史沉淀和技术积累,早期就成立了“几何感知与智能实验室”,涉足虚拟仿真这一尚未被大家所熟知的领域,跨维智能也是中国最早将人工智能技术应用于三维等非欧数据的学者和团队之一。
为此,跨维智能的仿真引擎基于面向具身智能的独有技术能力研发打造,这无疑扩大了跨维智能的能力边界和功能范围,使得其从仿真层面在底层更加可控,构筑了其独特的技术护城河。
工业数据优势也是跨维的核心竞争力。由于跨维智能较早切入了较为标准化和相对结构化的工业场景,目前已经成功落地百余场景,并在工业场景跑通了这条具身智能技术路径,通过积累工业场景knowhow以及产品落地的经验,跨维瞄准工业领域较为成熟的产品,形成了独特的数据样本,通过不断地打磨迭代和积累,将共性技术和经验归纳并形成技术体系,尝试在多行业验证,最终快速形成各类工业部件抓取的数据飞轮,让这套具身智能方案具备了跨行业的技术特性和商业落地可行性。
据悉,目前跨维的所有落地项目都已经能使用合成数据训练模型方式进行,遇到部分难度较高的场景,跨维还提供专门的隐私模式实现本地优化模型调度,帮助客户真正做到产线实际配套成功率达99.9%以上。这在全球范围内可能都是绝无仅有的惊人数据。
由于大多数工业场景中,来料有着典型随机性特征,产线物料光照、材质、摆放方式都有着显著区别,长期深耕于此的跨维智能,在几何深度学习、三维建模、空间感知、机器人应用等方向进行了大量交叉创新研究,取得了一系列代表性成果,这表现为跨维智能考虑到了产线上这种细微差异与变化,让数据的性质和目标更为明确。
具体而言,其模拟器由于应用了图形学渲染相关技术,能够针对物体与光源的环境变化,进行预随机算法筛选,从而实现不断对来料进行去随机化,并更新渲染其主要生产材质参数,这个物理仿真和合成数据的Sim2Real 途径,真正做到了千变万化的摆放方式都能快速仿真复现,能够全链条自动化地产生针对具身智能任务的 AI 模型 SDK,数据生成速度与 AI 模型的训练迭代速度同频,而且包括刚体、铰链、软体、流体等在内的任何操作对象,都可以通过精准的物理仿真支持数据生成。
这套具身智能方案,不仅对于抓取对象有着较高的包容性,还对于执行抓取任务的机器人构型、模态有着相当不错的兼容性。据悉,无论是复合机器人还是人形机器人,只要机器人产品能够在跨维智能该套仿真空间中实现抓取的全流程模拟,通过抓取任务的范围和边界鉴定,这种“可验证”的机器人就能很好完成任务,而且保持相当的抓取成功率。
▍迈向更远的未来
在工业场景内,跨维智能也直言,这套智能制造技术体系落地支撑,依然存在一定的瓶颈。
例如在硬件层面,由于机器人本体构型、功能部件方面还不够通用,以及边缘计算的能力还远远不够,很难支撑智能体在边缘测、端测软硬件系统处理复杂的计算,现在很多仿真方案不得不把一些非常大的功能放到云端,造成通信、数据隐私等一系列问题。
在软件层面,虽然AI模型的能力近一两年有了比较大的突破,DexVerse™ 2.0 也已经能够利用大语言模型自动拆解所涉及的机器人技能及子技能。但大语言模型依然有例如因果逻辑链断裂、幻觉等很多技术问题有待解决与优化,多模态大模型的成熟度也还没有达到理想状态,因此一定程度上局限了具身智能的落地。
为此,跨维还在持续深耕包括智能视觉传感器、PickWiz 软件、复合机器人等具身智能产品,同时正在积极研发深度学习技术,希望让智能体未来能够更快、更精准实现陌生任务的自然语言理解、任务识别以及6d姿态估计,最终具备一定异构协同能力和涌现特性,为理想化的柔性产线抓取创造更大可能性。
目前,跨维已经跑通了 “Simulation to Reality” 的商业模式,在汽车零部件、3C 制造、新能源、家电、化工、物流等 30 余个行业中落地,合作了包括广汽、美的、海尔、松下、蓝思科技等在内的众多行业头部客户。跨维智能表示,未来还将与更多产业方合作,开放生态,合作共赢,共同推进中国具身智能与通用机器人产业高速发展,具身智能技术的未来,值得我们持续关注和期待。