【文/观察者网 陈思佳】7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议在上海举行。本届大会以“以共商促共享 以善治促善智”为主题,重点围绕核心技术、智能终端、应用赋能三大板块,聚焦大模型、算力、机器人、自动驾驶等重点领域。
大会展览面积超5.2万平方米,1000多位全球领军人物出席,500余家企业确认参展,其中市外企业和国际企业占比超50%,展品数量超1500项,展览规模、参展企业数、亮点展品数、首发新品数均达历史最高。
近年来,人工智能加速发展,许多曾存在于科幻作品中的想象正逐渐走进现实。人工智能技术会如何改变我们的生活?对此,华为、百度、科大讯飞、商汤科技等参展企业带来了包括大模型、人形机器人在内的诸多产品,向我们展现了人工智能发展的广阔前景。
2024世界人工智能大会(观察者网)
数十款大模型同台竞技
大模型无疑是当下人工智能技术发展的核心议题之一,也是本届大会的一大焦点。商汤科技“商汤日日新5.5”体系、科大讯飞“讯飞星火V4.0”、华为“盘古大模型5.0”、百度“文心大模型4.0”等数十款大模型都在大会现场进行了展示。
商汤科技5日发布了首个所见即所得模型“日日新5o”。据商汤科技介绍,该大模型综合性能较“日日新5.0”平均提升30%,在数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标实现对标GPT-4o。
商汤科技打造的首个面向C端用户的可控人物视频生成大模型Vimi是本届大会的“镇馆之宝”之一。据介绍,Vimi依托商汤日日新大模型,可以通过一张任意风格的照片生成和目标动作一致的人物类视频,且支持人物视频、动画、声音、文字等多种元素进行驱动。
科大讯飞上个月发布的“讯飞星火V4.0”也是本届大会的热点产品之一。科大讯飞董事长刘庆峰此前表示,“讯飞星火V4.0”已经实现对标GPT-4 Turbo,在文本生成、语言理解、知识问答、逻辑推理、数学等能力上实现超越。
华为“盘古大模型5.0”则在全系列、多模态、强思维三个方面带来全新升级。华为云Marketing部部长董理斌5日在“盘古大模型重塑千行万业”分论坛上表示,盘古大模型5.0通过更多的模态和更强的思维能力,重塑云服务,为开发者、客户和伙伴提供更强大、更丰富的智能化能力。
飞速发展的人工智能已逐渐在一些专业领域发挥作用。合合信息展示了一款古籍修复模型,该公司与华南理工大学团队合作,将AIGC技术应用于敦煌遗书残卷的数字化修复上。当设备扫描样本卷轴后,AI可以通过字形修补、褪色修复、背景补全等方式完成古籍的数字化修复。
猿力科技则展示了大模型在教育领域的应用,该公司旗下的小猿学练机为学生提供了数字化学习体验,能够批改包括简答题、应用题、作文题在内的全题型。
此外,数字人、AIGC等内容依然是人工智能应用的重点。腾讯、阿里等公司均展示了数字人形象和产品,观众可以体验与虚拟形象交流、数字人直播等功能。包括商汤科技“秒画”、燧原科技“燧原曜图”在内的文生图等产品也在大会上亮相。
人形机器人走进现实,“十八金刚”现身会场
伴随着人工智能技术的进步,机器人行业涌现诸多新产品,各大展商展示的机器人成为本届大会关注的又一大热点。会场中由人形机器人组成的“十八金刚”阵列吸引众多观众驻足,大会重点打造的人形机器人专区也展出25款人形机器人。
作为国内“AI+机器人”领域的领跑者,达闼机器人携旗下一系列云端智能机器人产品矩阵亮相本届大会。据介绍,“十八金刚”先锋阵列使用了达闼团队设计的RDK整体动作控制方案,让来自不同企业的机器人同步执行挥手、抱拳等动作。
达闼还展示了人形双足机器人XR4,该机器人具备超过50个智能柔性关节,以及每小时3.5公里的快速移动能力。
傅利叶智能则在本届大会上展示了人形机器人GR-1,该机器人可以模拟人类不同运动方式,实现转头、扭腰、抓取、跑步、跳跃等拟人化运动。据傅利叶智能介绍,GR-1最大关节峰值扭矩达230N.m,具备快速行走、敏捷避障、抗冲击干扰等运动功能,是通用人工智能的理想载体。
特斯拉首发的人形机器人“擎天柱”二代同样是本届大会的关注焦点之一,该机器人身体部分拥有28个自由度、单手拥有11个自由度,关节采用仿生学设计。由于采用了视觉感知方案和神经网络技术,“擎天柱”二代可以完成路径规划、物体识别等,相较一代拥有更大操作自由度。
特斯拉“擎天柱”二代视觉中国
在4日举行的“人形机器人与具身智能发展论坛”上,国家地方共建人形机器人创新中心还首次发布开源通用人形机器人公版机“青龙”。这是国内首款全尺寸通用人形机器人公版机,并同时宣布开源其人形机器人相关技术。
“需要携手合作,推动人工智能健康发展”
人工智能技术发展日新月异,关于人工智能的治理、安全等问题也逐渐成为社会各界关注的新焦点。如何保障人工智能的安全使用?如何让人工智能更好地为生产生活提供帮助?多位专家在本届大会开幕式上分享了他们的观点。
清华大学苏世民学院院长、清华大学人工智能国际治理研究院院长薛澜表示,全世界的人工智能发展存在巨大的鸿沟,不但阻碍全球发展,也对全球治理造成很大的影响。他认为,国际社会需要携手合作,促进企业、政府共同推动人工智能健康发展。
薛澜指出,联合国193个成员国在2015年共同通过了《联合国2030年可持续发展议程》,提出全球要历时15年时间让全球进入到可持续发展轨道。去年联合国有关会议透露,完成目标的情况不容乐观,部分目标甚至出现倒退的情况。
薛澜发表讲话视频截图
薛澜说:“有分析表明,人工智能对可持续发展的169个子目标中的134个有积极的促进作用,也可能对其中59个产生一些不利的影响。我们要从宏观的角度看待人工智能的积极影响和潜在的不利影响。”
他表示,如何推动人工智能的健康发展,尽可能让它收益最大化,把风险降到最低,中国在这些年的实践中已建立起一个相对完整的体系。在产业应用方面,有一系列法律法规来推动人工智能合理发展;针对算法算力以及数据治理也有规则框架;针对具体应用场景,也出台了相应的治理规则。
“我们构建了一个多维度、多层次、多领域、多举措的体系。”薛澜说。
他强调,在全球范围内,人工智能发展还面临很多挑战,“一个国家带来的风险就是全球的风险,所以这些问题我们必须共同努力解决。国际社会现在可以说对安全问题非常重视,但对发展存在的鸿沟,AI鸿沟这方面关注可能还不够。应该说,有很多工作需要进一步地讨论。”
薛澜表示,要通过多途径建立国际交流,加强政府间多边对话机制,用科学的力量助力完善国际机制,促进企业、政府共同推动人工智能健康发展。
上海人工智能实验室主任、清华大学惠妍讲席教授周伯文表示,当前以大模型为代表的生成式人工智能快速发展,但随着能力不断提升,模型自身及其应用也带来了一系列潜在风险的顾虑。
周伯文指出,从公众对人工智能风险的关注程度来看,首先是数据泄露、滥用、隐私及版权相关的内容风险,其次是恶意使用带来的伪造、虚假信息等相关的使用风险,还有偏见、歧视等伦理问题,是否会对就业结构等社会系统性问题带来挑战,甚至在一些科幻电影中还出现了人工智能失控等担忧。
周伯文发表讲话视频截图
周伯文表示,这些风险有的已初露端倪,但更多是潜在风险,防范它们需各界共同努力。他认为,有这些担忧的根本原因在于目前的人工智能发展是失衡的,“我们在人工智能安全方面的投入,是远远落后于性能的。目前世界上99%的算力用于模型的预训练,只有不到1%用于安全优先的考量。”
他认为,人们需要找到人工智能安全优先,但又能保证性能长期发展的技术体系。“我们把这样一种技术思想体系叫做‘AI-45度平衡律’。这是指从长期的角度来看,我们要大体上沿着45度的安全与性能平衡发展,所谓的平衡是指短期内可以有波动,但不能长期低于45度。”
周伯文介绍说,实现“AI-45度平衡率”有多种技术体系,上海人工智能实验室近期在探索一条以因果为核心的路径,并将其取名为可信AGI的“因果之梯”。它将可信AGI的发展分为三个递进阶段:泛对齐、可干预、能反思。
其中,泛对齐”主要包含当前最前沿的人类偏好对齐技术;“可干预”主要包含通过对AI系统进行干预,探究其因果机制的安全技术;“能反思”则要求AI系统不仅追求高效执行任务,还能审视自身行为的影响和潜在风险,从而在追求性能的同时,确保安全和道德边界不被突破。
“目前,AI安全和性能技术发展主要停留在第一阶段,部分在尝试第二阶段,但要真正实现AI的安全与性能平衡,我们必须完善第二阶段并勇于攀登第三阶段。”周伯文说,“沿着可信AGI的‘因果之梯’拾级而上,我们相信可以构建真正可信AGI,实现人工智能的安全与卓越性能的完美平衡。”