当前位置:首页|资讯|AI大模型|AIGC|数字人

人形机器人混战,AI大模型狂卷,上海WAIC最吸睛黑科技一文看尽

作者:智东西发布时间:2024-07-13

作者 | 罗添瑾

编辑 | 云鹏

AI正燃爆上海!

智东西7月5日报道,第六届世界人工智能大会(WAIC 2024)在上海举办。WAIC 2024带着超过1500项展品热闹开场,其中首发新品数量超过50件,现场人潮涌动。

WAIC 2024场馆内外热闹非凡,相较于去年AI模型百舸争流的厮杀,今年的展会更多的是让人眼花缭乱的AI应用和姿态各异的机器人。这些机器人在展会上列阵,组成“十八金刚”,还时不时的向场馆内的观众挥手致意。

各家企业持续发力,AI大模型和应用依旧是主场:腾讯混元大模型推出的“腾讯元宝”可以由用户自己构建智能体、蚂蚁集团研发的支付宝智能助手现场用机器臂制作咖啡、商汤的可控人物视频生成大模型Vimi可实现生成1分钟长视频、阿里云出品的通义灵码可以智能报错、百川智能的AI健康顾问现场展示智能问诊、WPS AI可以实现智能“伴写”。

各类智能终端产品的展出也十分热闹,国创中心首秀青龙人形机器人、复旦大学研发的“光华一号”人形机器人可以读懂人的表情,特斯拉的赛博越野旅行车十分抢眼。在展会的无人驾驶体验区,上汽赛可智能L4级Robotaxi、小马智行第六代L4级Robotaxi等组成了试驾车队,eVTOL智能飞行器、美团的第四代无人机也作为低空智能飞行产品出现在展会中。

WAIC 2024云逛展!和智东西一起解锁展会多重看点就是现在~

一、卷完模型卷应用,AI技能已在“Next Level”

AI大模型和应用这条赛道已经卷的起飞。

在大会上,商汤展示了可控人物视频生成大模型Vimi,商汤介绍,与图片表情控制类技术只能控制头部表情不同,Vimi可以精准实现表情、自然肢体、发型、服饰、背景甚至是光影的变化,并使之协调。

更重要的是,Vimi可以实现稳定生成长达一分钟的单镜头人物类视频,并且保证画面效果。

▲Vimi演示调整任务动作表情(图源:www.sensetime.com)

蚂蚁集团基于蚂蚁百灵大模型推出的支付宝助理于WAIC首发,用户只要下达指令,就能迅速获得相关资讯,并一键直连支付宝生态内挂号、订票、充话费等服务。

▲蚂蚁集团展区内的支付宝智能助理(图源:智东西)

支付宝的AI智能助手还推出了智能点单这一新功能,首批支持星巴克、瑞幸、霸王茶姬、蜜雪冰城等11个茶饮品牌的支付宝小程序。用户通过支付宝智能助理下达指令,比如“帮我点一杯瑞幸的大杯冰拿铁”,AI便会进入小程序自动下单,用户确认并付款后,就能到附近的线下门店取到咖啡。

▲支付宝智能助手展示智能点单(图源:蚂蚁集团)

在“腾讯元宝”展区,现场观众可以与腾讯元宝APP进行互动,通过互动装置,生成个人多风格专属头像。腾讯元宝覆盖工作提效、生活娱乐两大场景,除了提供AI搜索、AI总结、AI写作等核心功能,还提供创意绘画、口语陪练、百变AI头像等有趣好玩的特色应用,以及更多用户创建的智能体。

▲腾讯展区门口的“AI照相机”(图源:腾讯)

岩芯数智Rock AI在大会上特别演示了Yan1.2版本的阶段性成果,展示了Yan架构在更广泛、更低算力设备上的离线部署能力,以及他们首创的”同步学习“实验室示例。Yan1.2多模态大模型离线部署在手机中也能流畅运行,每秒可达20+token输出。通过自然语言输入,小智会理解并处理任务,为用户提供更优质的体验。

▲Rock AI演示图片(图源:岩芯数智)

百川智能在大会上展示了AI健康顾问,该产品依托百川智能的通用医疗增强大模型打造,不仅拥有丰富的医药学知识,并且还具备医生思维。百川智能的通用医疗增强大模型不仅在USMLE(美国医考)的评测中超越了GPT-4,并且在由医生(协和、北医等头部三甲高年资主任、主治医师)和心理学专家作为评测主体,对模型进行多角度评测的真实人工评测中,同样超越了GPT-4。

▲与百川智能AI健康顾问问诊(图源:智东西)

新壹科技在展会上带来了新壹视频大模型2.0版本,这一版本进一步提升了其多模态AIGC模型的核心能力,在视频生产上,从脚本生成、素材生产和匹配、智能剪辑配音到数字人播报,新壹视频大模型2.0让整个流程更加智能,模型的交叉推理能力还可以根据需求快速生成符合场景特点的视频,并且模型还自带丰富的素材库和模板库。

▲新壹科技展区(图源:新壹科技)

从让人眼花缭乱的AI应用来看,AI在为人们“生产力”提速赋能方面已经在变着花样地升级,更多垂类领域已经有了AI的身影。

二、人形机器人霸屏展会,智能眼镜等终端产品同台竞技

人形机器人是WAIC 2024一道十分吸睛的风景。

国创中心的“青龙人形机器人”在WAIC上首次亮相,这是国内首款全尺寸通用人形机器人的开源公版机,支持多模态机动、感知、交互和操作,全身多达43个主动自由度,算力支持400 TOPS。青龙可以进行不同形状和重量的物品识别和抓取能力测试,它拥有高度仿生的躯干构型和拟人化的运动控制能力,能够伸出五指准确地抓起桌面上随机摆放的物品,并放进桌上的篮子里。

▲青龙人形机器人(图源:财联社)

特斯拉人形机器人擎天柱二代(Optimus)首次亮相,据工作人员介绍,Optimus的全身控制能力和平衡性得到了显著的“进化”,第二代Optimus最早于2023年12月首次亮相,相比前代产品,其采用了全部由特斯拉自主设计和制造的执行器和传感器,整体外观设计更加精细,行走速度提高了30%,重量减轻了10公斤,同时平衡感和身体控制能力得到改善。

▲特斯拉擎天柱二代人形机器人(Optimus)(图源:新浪财经)

XREAL带着最新的Air 2 Ultra智能眼镜亮相WAIC 2024,这是XREAL面向全球推出的XREAL Air 2系列AR眼镜的最新成员,尚未在国内开售。可穿戴智能设备颇受关注。该产品还结合了国民级IP和AIGC技术为观众打造了《仙剑纵横宇宙》互动体验。

▲XREAL Air 2 Ultra智能眼镜(图源:XREAL)

联想在大会上展示了它的YOGA Book 9i双屏翻转本,该笔记本内置由天禧大模型驱动的联想小天AI智能体,能够在多个场景中与用户自然交互,提供更精准和个人化的服务。同时该款笔记本升级搭载英特尔Ultra处理器,标配32GB大内存,瀑布屏玩法升级,横屏模式亦可开启,实现了全新双屏的跨屏体验。

▲联想 YOGA Book 9i双屏翻转本(图源:WAIC)

三、走进无人驾驶体验区,“空中出租车”格外吸睛

在展会中还有一个特别设置了无人驾驶体验区,区内不仅展示了无人驾驶Robotaxi、“空中出租车”——盛世龙eVTOL电动垂直起降航空器、无人巴士等产品,还可以体验自动驾驶。

盛世龙是峰飞自主研发的旗舰产品,可以像多旋翼航空器或直升机一样垂直起飞,在空中完成转换飞行后,依靠固定翼飞行模式水平巡航,起降灵活,高效便捷。单次可充电飞行250公里,最大起飞重量达2200公斤。

▲盛世龙eVTOL电动垂直起降航空器(图源:WAIC)

同时备受关注的还有特斯拉的赛博越野旅行车,作为智能电动汽车的代表,展示了特斯拉在自动驾驶和电动汽车技术上的领先地位。赛博越野旅行车是世界上第一款采用48V低压架构的车,它也是首款采用线控转向的量产车型。

▲特斯拉赛博越野旅行车(图源:WAIC)

四、央国企也来卷AI,多个AI+案例参展

要在展会上亮相的还有许多和科技紧密结合的央国企,现场展示了许多依托AI技术赋能实体行业的案例。

中国移动带来“九天基座大模型”及“5G-A×AI新通话”。九天基座大模型是国内首个基于近万卡全液冷国产智算集群、通过国家网信办模型生成式人工智能服务与算法双备案的首个央企大模型,已规模化为政务、医疗、工业等20多个行业提供AI+应用服务。

中信集团将首次展示特钢行业全球首座“灯塔工厂”,在这座工厂采用了大量人工智能技术,可以实时获取生产线状态,通过模型的自学习,获取最优的策略来指导生产。工业互联网智造协同平台则凭借AI大脑实现的X光智能评判,大幅提高了铸件缺陷识别效率和判定准确率,效率提升140%。

结语:AI应用大赛进入白热化

本次大会上的展品大赏,不仅展示了最前沿的AI成果,如超大规模预训练模型、AI融合与量子计算、以及多模态感知和交互技术等,更重要的是,这些技术不再停留于概念演示,而是越来越多地转化为实际的产品与服务。

虽然许多AI应用还处于测试阶段,但展会上许多精妙的设计已经让我们颇为激动,从电商购物、智能对话到大模型、低空经济、车路协同,AI正在飞速改变着我们的生活。未来让我一起期待!


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1