当前位置:首页|资讯|ChatGPT

从chatGPT到具身智能还有多少距离?

作者:李智勇发布时间:2024-08-12

最近在北大国发院AI碰撞局上,先是千寻智能的创始人韩峰涛韩博士分享了具身智能当前的商业现实和技术现实,随后在碰撞环节各位嘉宾一起把问题一下子延展到了产品定位、持续竞争力、数据可用性、系统化管理等诸多方面。很有一点一石激起千层浪的意思。正好就基于此说下具身智能这个近来大热的话题。

具身之困

一定程度上过去很长一段具身机器人和AI是两条并行只是偶有交集的路线。AI做脑子、眼睛、耳朵,具身智能主要研究胳膊、腿,在算法上SLAM等对机器人肯定比NLP重要多了。

然后凡是和AI相关的领域命运都差不多都是大摇摆,一会是世界的中心,未来希望,一会因为兑现不了大家的期望就会变成“骗子”。

大量的机器人产品花费巨大后无疾而终。

说两个产品,一个韩博士在分享中也提到过,一个是我个人接触过。

本田Asimo,这产品我直观上比Pepper好多了。但太贵还没用,单个得100万美金以上,2018本田也坚持不动了,直接让它退休了。

如果横着比,Asimo现在看其灵活程度也还比特斯拉的机器人好(看着还是可以,但一台差不多100万美金,虽然比波士顿动力那个便宜,也还是其贵无比)。

另一个小产品叫Jibo,长下面这样:

这产品名字很难听,但2015年时候极度爆火,其实也不能干啥,号称能做18个动作,据说能表达某种情感。那时候我还在360做投资,刚看到这项目还在好奇,国内一家叫东方网力的公司就已经把它投了,投了2000万美金。我先是震惊于国内企业的魄力,然后就发现事还没完,一大堆这个形状的机器人大举出现。这个思路看起来还影响了某个卖4000元以上价格的智能音箱。

2014之后的10年,各种机器人各种倒腾,比如学习Savioke的酒店机器人等,但大多不怎么成功。

如果把机器人的范围拓宽一点,把无人机、自动驾驶也算成机器人的话,那最成功的应该是无人机,甚至可以说比自动驾驶还成功。

为什么具身机器人如此有吸引力

我们说个战争场景,可能更直观的感受这种颠覆性。

无人机对未来战争的改变很可能大于原子弹。

大家看过俄乌战争中顶个大龟壳的改装坦克吧,这不全是被无人机逼得么,没这个老土的壳坦克这种过去很先进的武器在无人机面前就是靶子。只能退化保生存。

无人机最原始的使用方法就是俄乌两方视频里爆出来的一人控制一台,然后靠AI的识别技术进行瞄准往坦克上扔炸弹。进一步就是组团,大家不看过无人机飞行表演么,那种不可能是一个一个控制的,都是一组算法控制阵型和飞行编队,一样可以在军事上用于扔炸弹。

更进一步的是这东西可以变小,常见摄影的无人机已经拳头那么大了,再使使劲就苍蝇那么大

一行李箱就几百上千个,精准打击一样巨大杀伤力。

这时候再配上具身机器人,未来战争形态真的就彻底变了。

先上100万个无人机,分批次把所有要拔除的摧毁。然后上一批具身机器人。按闪电战的思路,这显然也得组团使用,不能单个用。然后战争结束了。此处纯粹是科幻想象,不靠谱的胡说八道,但是不是觉得有种合理性。

这就是无人机+具身机器人+AI在未来潜在的威力,如果把它们从科幻电影解放出来,拉回现实,那会发现施工挖土盖楼可以类似模式,收个庄稼采摘果园可以是类似模式,极端上工厂加物流也可以是这个模式(比较远期)。

OpenAI那个五级分解,最终一级Level5叫组织者,组织的是什么呢?是人类么,大概率不是,你把它放在上面的这个情景下就特别好理解这个级别了。

现在到那儿了?

过去大部全是问题,未来是无限星辰大海,关键就是现在到那儿了?

韩博给相关技术大了个分,比如各种技术都达到现在想象的预期是100分,那机械臂得分最高40,AI得分最少5分。应该是比较精准的技术现实。

如何判断产品,后续进阶路径参见:角色中心式计算:AI大模型颠覆性的起点与终点AI三重劫

这两篇文章里的观点拿一些案例反复验证,都还立的住。因此这里不再重复,只补一点和具身相关的内容。

具身一个新突出问题是为了支持机器人通用性在身体上额外支出的成本往往不创造足够的价值。

如果说大模型公司支撑通用属性核心投入是训练和推理成本,主要在往脑子的通用性上砸钱,那具身智能增加了腿脚、眼睛,往身体的通用性上要花很多钱等。(ASIMO超过100万美金)

当处于早期的时候就比AI大模型还更容易让投入产出失衡。

反过来讲在确定角色边界的时候反倒是不能从便宜产品做,因为怎么都收不回成本,量也不可能大,也没那么好用。

如果说轮式的还有大众化空间,就像扫地机器人那样找一个点切入还可以支撑一定量级,那足式的看起来就真不灵。

总是达不到用无人机喷农药的那种技术与商业的平衡(无人机喷农药大概一亩地6块,一小时能干150~200亩)。喷农药的话早期用人驾驶盯地块,理论上到一定程度可以完全系统控制。

所以真要用起来没准就回到以前我做系统型产品时候开玩笑说的一些产品,比如:

ASIMO那种机器人把前台当好。前台除了一个女生也放一个足够拉风的机器人。别放Pepper那种,太难看了。

韩博说的茶艺的也行,泡茶的时候茶室整个变成一个机器人,来客人的时候机器人来通茶道。(这东西好像但凡是个老板办公室就有)

这些也不解决什么成本问题,就是新奇,酷炫。特斯拉最头上做跑车,大致是这种思路。

这还能避开当前大模型的典型弱点:如果你只有99.99%的精度,那在你的场景下能用么?(上次就因为这个判断工控上大模型就先别整了,需要等等。)

AI之花

航空发动机往往因为大综合被称作工业之花。那AI之花是什么呢?我觉得是具身机器人,但不是单体而是集群。

这朵AI之花的内在形态其实是不确定的。

终结者和大白算是一类,即使穿越了,它也该干什么干什么。不是断网就完蛋了。

黑客帝国里面八爪鱼就不行,那东西没脑子,或者说脑子就负责感知等简单决断,百分百受控于矩阵。

AI群控无人机,无人机摄像头等定位这种组合模式其实是黑客帝国式的。相对容易一点。

终结者式的,扔在那儿自己就该干嘛干嘛风格的无疑挑战更大。

所以这朵花估计会从前者往后者过渡,一点点长起来。

小结

在活动上,有位同学很直言不讳的提到:我看了很多产品和项目,怎么感觉很多是骗子。这就是AI很有意思的地方,它总是在期望和技术现实的巨大偏离中幸存,当年Geoffrey Hinton一样被当成骗子。并且AI属实战绩不佳,过去10几年花了不少钱,也没干出什么像样成果。可一旦它出点进展,世界还是为它疯狂,我有时候甚至怀疑人类对模仿和超越自己有瘾。

这种时候多个渠道信息是其实冲突的,AI到底是形势大好还是马上要危机了呢?

本文来自微信公众号“琢磨事”,作者:老李话一三,36氪经授权发布。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1