当前位置:首页|资讯|AI大模型

世界计算大会,机器人站“C位”

作者:潇湘晨报发布时间:2024-09-25

本报记者陈张书长沙报道

拍摄一张照片,不仅可以换装,还能通过AI技术生成动画……9月24日,以“智算万物湘约未来——算出新质生产力”为主题的2024世界计算大会在长沙开幕。同期举行的创新成果展聚焦智算、音视频、AI大模型、机器人等新兴与未来产业,集中展示了计算产业的新技术、新产品和应用成果。

“一分钟就可生成视频”

“一分钟就可生成视频。”在湖南音视频装备生态展区,万兴科技工作人员正在向现场观众展示“天幕”音视频多媒体大模型,观众只要拍摄一张照片,输入大模型后,根据相应指令就可换服装、背景,还可变脸、P肌肉,甚至可以形成动画。

“用户可以需输入一个故事梗概,或输入或修改片段脚本就可以控制视频的起始帧内容,并通过大模型能力实现全新视频内容的完整生成。”现场工作人员说。

去年底,万兴科技在其官方视频号发布一条AI创作的短视频《女孩的一生》,引发广泛关注。据悉,该视频颠覆了过往视频创作的拍摄与编辑模式,由万兴“天幕”多媒体大模型提供的强大文生视频能力驱动生成,在短短的一分钟呈现了一个女孩一生的动态画面,充分展现了跨模态的创意和魅力。

“这么长的镜头,可以拍摄很远吧?”在一侧展示的湖南长步道光科技有限公司展示的电影镜头前,观众们正在探讨这款大镜头。

这是两款十分有来头的镜头。现场工作人员介绍,长的是8K全画幅变焦电影镜头组,也是国内第一套针对大画幅摄像机系统而研发的多倍变焦电影镜头组。另一款8K全画幅微距定焦电影镜头组,是全球第一套全系列具备微距功能的定焦电影镜头组。

两款镜头主要应用于影视节目的拍摄,还参与央视春晚、电视剧《底线》、综艺《披荆斩棘的哥哥》、《乘风破浪的姐姐》以及众多纪录片制作。

记者看到,该展区主要围绕音视频采集、制作、传输、呈现四大环节中的软硬件系统级装备和消费电子产品,不仅有湖南国科微超高清编解码芯片,景嘉微电子的国产图形处理器芯片,还有新亚胜商用LED显示屏,充分展现了湖南省培育和发展新质生产力、打造国家重要先进制造业高地、加快构建“4×4”现代化产业体系的丰硕成果,凸显湖南文化和科技融合基础优势。目前,音视频产业已成为湖南“出圈”的代表产业,相关产业营业收入已突破2000亿元。

能像医生一样“望闻问切”

“小康小康,我要做血压测量。”在湖南超能机器人技术有限公司展位上,观众正排着队体验量血压。

记者在现场看到,被唤作“小康”的健康服务机器人身高约40厘米,有着圆圆的脑袋和胖乎乎的身体。体验者把手臂伸进机器人自带的测试筒内,片刻之后,血压测量报告自动生成,还可通过微信把血压结果快速分享给其他家庭成员。

据了解,这台机器人已通过二类医疗检测器械认证,可进行血压、心率、血糖等8项体征测量,每次体检数据生成的健康报告,可让消费者全面掌握身体健康状况。

工作人员介绍,现场另一款超能中医健康机器人,不仅利用了AI技术,还融合了中医精髓,像位医生一样“望闻问切”,可为用户提供智能面诊、舌诊、脉诊、问诊等多元化健康评估,并可进行便捷自助体检。

人形机器人还能帮你煮鸡蛋

应用赋能、智慧终端的成果,离不开核心技术的突破。综合展上,以机器人为代表的核心技术展吸引了不少用户的目光。

在特斯拉展区,Optimus二代人形机器人吸引了不少观众。“这款机器人采用视觉感知方案和神经网络技术,以完成路径规划、物体识别等核心功能,相较一代拥有更大自由度,甚至可以用它来完成煮鸡蛋等精细活。”展区工作人员介绍。

具身智能人形机器人“天工”让大家对于具身智能赋予机器人的能力有了具象化的了解。

作为具身智能应用到机器人上的代表,具身智能可以理解为“具身+智能”,通过赋予AI“身体”,能够与现实产生交互,让AI从仅存于数字世界的软件算法走向真实的物理世界,在物理世界也能呈现模拟人类甚至超越人类的智能水平。

据了解,具身智能的下一个突破,将实现“一脑多形”“一机多用”,其相关应用有望快速扩展至社会经济的各个层面,从工业协作生产到柔性制造,从家务助手到医疗护理,从灾难救援到太空探索,深度融入人类社会。

中国电信湖南公司则充分展示了如何利用基层治理大模型帮助政法部门,比如在矛盾调解中提供AI专业法律辅助服务,通过网格员日常工作收集的数据,运用大模型实现知识关联,为社区管理者提供咨询、决策分析、智能管理等服务,真正辅助基层工作开展。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1