2024世界人工智能大会(WAIC)产业发展主论坛汇聚二十余位国内外人工智能及相关交叉领域顶尖专家、业界领军人物、科技新锐力量及产业链各方代表,聚焦大模型、AI基础设施、智能终端等重点领域,着重剖析当下AI产业的全球性战略趋势,深度探讨人工智能应用前景、产业治理、生态建设等热点议题,为打造具有国际竞争力的数字产业集群注入新活力、增添新动能。
本文系论坛圆桌讨论环节实录:
对话:人工智能驱动的新价值链构建
话题引领人:漆远上海科学智能研究院院长,复旦大学浩清特聘教授
对话嘉宾:
闫俊杰MiniMax创始人、首席执行官
张鹏智谱AI首席执行官
许彬国家地方共建人形机器人创新中心总经理
谢陵御风未来创始人兼首席执行官
主持人:接下来,我们特别邀请了几位在各自领域极具影响力和前瞻性的代表,他们将围绕“大模型驱动的新价值链构建”这一重要主题进行深入讨论。
请允许我邀请各位讨论嘉宾上台。我们将邀请MiniMax创始人兼首席执行官闫俊杰先生、智谱AI首席执行官张鹏先生、国家地方共建人形机器人创新中心总经理许彬先生,以及御风未来创始人兼首席执行官谢陵先生。
欢迎四位嘉宾。今天,我们荣幸地邀请到台上的各位嘉宾,他们分别与大模型、机器人技术和低空经济产业相关,这些领域都是目前大家关注的焦点。我们今天的话题将从这里展开,探讨在新的价值链构建中,各方可以贡献哪些力量。
我们今天讨论的重点是新一轮人工智能技术浪潮,尤其是以大模型为代表的技术,它的能力前景如何,以及在各行各业赋能过程中的机遇与挑战。新价值链的形成形态和影响也将是我们讨论的内容。首先,我想请教我们两位从事大模型工作的嘉宾,闫俊杰先生和张鹏先生。
大模型已在语义理解、内容创作等方面展现出巨大潜力。我们曾期望AI能解放人类生产力,让人们有更多时间去追求诗和远方。然而,目前AI似乎还未能达到这样的期望。请问闫先生,您认为未来大模型的能力突破将体现在哪些方面?如何与实体经济更深度融合,为实体经济带来更多赋能?
闫俊杰:自去年以来,随着GPT-4等大型模型的发布,以及国内众多公司的迅速跟进,我们看到了大模型的快速发展。但我认为,目前模型的一个核心问题是错误率仍然较高。例如,GPT-4在许多测试指标上的正确率可能只有60%到70%,也就是说有30%到40%的错误率。
国内模型虽然发展迅速,但整体上仍处于类似的错误率水平。高错误率导致大模型产品多以对话形式出现,因为对话的容错率较高。为何它们不能成为独立的智能体?如果每一步都有30%到40%的错误率,多步操作的错误率会更高,难以实际应用。
我认为,将大模型的错误率从30%到40%降低到3%、4%或2%,是AI从辅助人类到独立完成任务的关键。这需要一个综合性的解决方案,包括合成数据的创建、训练效率的提升、更优网络结构的研究,以及更高效的训练算法的开发。
当模型的错误率降至个位数,接近人类最佳水平时,它在实体经济中的应用将变得更自然。这意味着模型可以独立完成任务,如在设计算法、制定方案等实际生产力活动中,极大地提高效率。
因此,我认为关键不在于单一领域内如何赋能实体经济,而在于让模型本身足够通用,达到极低的错误率,这样它自然能够在实体经济中发挥更大的作用。
主持人:俊杰从技术层面给出了深刻的见解。现在,让我们听听张鹏的看法。除了提升技术效能外,是否有其他方法可以使我们的人工智能、大模型更好地融入传统经济中,为我们带来更多的能力提升?
张鹏:感谢提问,这确实是一个非常好的议题。我们智谱AI在大模型领域已经深耕了四年多,我们对大模型的理解和普遍观点可能略有不同。
我们看到,大模型带来的这一波热潮与以往不同。它不仅仅是识别技术,如人脸识别,这些技术在某些指标上已经超越了人类,但大家并不认为这是AI的终极答案。大模型带来的是一种全新的能力——我们称之为类似人类的认知能力。我们智谱AI的愿景是让机器像人一样思考,而不仅仅是作为一个工具。我们认为,这种思考能力带来的效能提升是至关重要的。
我们希望通过让机器能够思考的演进方向,去赋能实体经济。过去,感知智能时代的AI虽然能产生实际效能,但受限于泛用性不足、成本过高等问题。大模型提供了一个新的机遇,它能够在一个模型上提供泛用化的能力,解决一系列场景和应用的需求,从而解决成本和收益的平衡问题,这是它的本质特点。
因此,我们认为,要利用新一代AI技术和大模型技术赋能实体经济,必须构建更通用、更基础的能力,利用这些能力解决多项问题。然后,用收益的总和除以投入成本,在这个过程中,模型本身的能力水平是最关键的因素。
我们希望模型的能力能够越来越接近甚至超越人类。在这个过程中,下一轮大模型的能力突破点在哪里?准确率是一个方面,但我们通常在限定的评测集或任务中考虑准确率。有些能力,如逻辑性和抽象思考能力,实际上是大语言模型相比传统方法更强的地方。未来,大模型需要在多模态方面取得突破。
为什么要实现多模态?因为现实世界中解决问题需要的信息输入是多模态的,包括自然语言、视觉、听觉,甚至是触觉和常识。所有这些需要综合起来,才能解决现实世界中的常见问题。例如,我们希望AI帮助扫地、做饭、洗衣服,这些任务所需的输入信息是多模态的。这方面的能力突破将带来AI的普惠和更大的可能性,从而将原来的金字塔结构转变为倒金字塔结构,真正放大其价值。
主持人:明白,感谢张鹏的精彩分享。接下来,让我们请教许彬。我们看到具身智能越来越受到关注。当AI被赋予物理意义上的身体后,它能在真实环境中获取信息、理解问题、做出决策,并与现实世界的物理空间进行交互。在通用人工智能飞速发展的时代,大模型与机器人的结合发展未来可能产生什么样的新业态?人工智能又将创造出什么样的新可能性?请许总回答这两个问题。
许彬:没问题。大模型为代表的人工智能技术的发展,实际上会赋能和改变很多行业。正如张总所讲,盘古大模型已经能够为钢铁行业这样的传统行业实现提质增效和赋能。对我们科技行业,如汽车、手机、PC终端等,都会有非常大的赋能和改变。同时,这个过程肯定会产生很多新的业态。
在我看来,最核心的、最关键的或者最典型的业态将会是人形机器人。为什么这么说?一方面,马斯克提到未来人形机器人会有100亿,黄仁勋也提到过未来人形机器人会像汽车一样到处都是。我们也相信未来我们每个人都可能会有一个或者多个人形机器人的助手,这样我们的工作、我们的生活形态都会发生巨大的变化。
为什么是人形机器人?这里面有两个核心的判断。第一个判断是,只有人形机器人才能实现通用的人工智能。第二个判断是,具身智能是通往通用人工智能的必由之路。这有点像中国人讲人生的修为三个阶段:格物致知、知行合一和致良知。实际上,人工智能的发展也可以分为三个阶段:大模型阶段、具身智能阶段和通用人工智能。
大模型的训练和生成是格物致知,即在理论上认识和理解这个世界。具身智能是知行合一,即从认知到实践。最后,通用人工智能是致良知,即达到天人合一的最高境界。
通用人工智能需要通用的数据来训练,包括智能发展所需的海量数据。人类社会所有存在的数据都是为了我们更好地适应生存和发展所需要的。因此,只有人形机器人才能真正感受到人类世界的方方面面,并在这种身体上训练出通用的人工智能。
主持人:刚才我们讨论的更多是概念,那么当我们看到大模型和人形机器人结合时,最终会呈现出什么样的系列产品?它们能为人类做什么?
许彬:未来人形机器人能做的非常多,但在这个过程中,技术发展是逐步的。早期阶段,人形机器人的上肢双臂可以协同完成很多工厂智能制造的工作。随着人形机器人的运动技能和能力越来越成熟,它们可以取代很多简单重复且危险的劳动。
当人形机器人的大脑,包括我们的大模型大脑,发展到非常成熟的阶段时,它们可以帮助人类完成更多需要高智力和高算力的工作。这种改变是逐步分布的。
那么,阶段性的发展是什么样的?未来5年、10年、15年的预期如何?我们对未来充满敬畏。尤其是GPT-4等相关技术出现后,我认为相关技术的发展可能会远远超过我们的预期。我们现在的初步判断是,3到5年内,人形机器人可以在一些工厂智能制造产线上使用。5到10年,它们可能在家庭服务等复杂开放环境下落地应用。
主持人:谢谢许彬总的分享。现在,让我们请教谢陵总。当前,低空经济是国家聚力发展的新产业赛道,各方都在争夺低空经济发展的主导权和先行权。请问谢总,您认为AI在服务千行百业的过程中,对于低空经济赛道而言意味着什么?在多大程度上能为你们带来什么样的改变和提升?
谢陵:在我看来,低空经济中人工智能对航空器的赋能至关重要。我长期从事传统航空制造业,也是工程师出身。最近一年多,低空经济成为一个热门赛道,我们也深入思考了这个问题:低空经济与传统航空制造业有何不同?最大的区别在于,低空经济的主角是智能化、电动化和无人化的航空器。
低空经济是指3000米以下(特别是在1000米以下的空域)的各种有人驾驶和无人驾驶、不同用途的航空器为大家提供服务。包括基础设施建设、飞行器制造运行以及保障等领域。
传统航空器的设计、制造和运行完全以飞行员为中心。
而科技发展实质上是机器替代人的过程,人工智能主要替代人的大脑。我们还需要机器替代人的眼睛、鼻子、耳朵和手脚,即需要机器进行信息获取和执行。所以现在的无人机,包括我们致力于制造低空出行的航空器,设计和未来运行已不再依赖于飞行员,而是更加智能化。
人工智能如何在低空飞行器中发挥作用?我举两个具体的例子:
首先,对于低空飞行器本身,它必须是完全自主飞行的。第一层是自动驾驶,通过传感器和计算机让飞行器具备代替飞行员的能力,实现稳定飞行。这在广义上也是智能,但并非今天我们讨论的人工智能,用一般控制技术就能解决。
稍微扩展一下,就是任务层面的智能。在飞行器领域,有很多关于自主决策、自主任务生成和执行的过程。例如,用飞行器进行森林火灾巡逻时,能否让它自主发现微小火点并决策扑灭?或者进行海上人员搜救时,能否让它自主搜人并抛投救生物资?这些都是自主任务生成和决策的过程。
随着人工智能的发展,我们可以赋予智能化飞行器更多复杂任务的执行能力,解决更多问题。
第二个层面,我们希望低空经济是高密度、高频率的飞行活动,大量飞行器提供各类服务。这将为未来的低空交通管理部门带来巨大挑战。如何管理这么多飞行器,如何进行航线调度?这确实是所有关注这个领域的人所担心的问题。就像我们现在用滴滴打车,有智能化手段分配合理的司机。未来,低空空域管理部门可能需要与民航空域管理部门、地面交通管理部门、气象部门、飞行器制造商、运营商等共同打造智能化的低空空域指挥、管理、调度系统。这套系统无疑需要利用AI技术,这也是AI应用的一个重要方面。
主持人:接下来我们有两个问题要请教四位嘉宾,这是一个共同的问题,请四位嘉宾都准备好回答。由于时间关系,我们接下来可能需要简洁一些。第一个问题是,在大模型服务价格持续下降的背景下,企业如何在激烈的市场竞争中寻找新的发展策略?
闫俊杰:对于大模型企业来说,价格不断下降,是否有新的突破点和方式?作为使用方,在价格下降过程中,是否意味着可以拥有更多成本上的优势,释放更多资金以促进其他方面的发展?我认为大模型价格持续走低是一个正常趋势,因为它本来就应该降低,同时效果也应该变得更好。价格降低的好处是能吸引更多用户,增加在线使用时长,从而增加流量,创造更大的价值。更多基于流量和价值的商业模式正在形成。因此,我对大模型的未来发展持乐观态度。
张鹏:价格下降是技术进步的结果,技术越来越好,成本自然降低。但价格持续走低如果过度,就不利于行业健康发展。真正的价值应该逐级传递,大家在同一个领域不断增加价值,提供更优质的服务,帮助用户创造更大价值。我们创造的价值应该反向传递回来,形成一个正常合理的市场价值链。价格战可能导致行业内卷,短期内用户可能受益,但长期来看,这不符合正常商业逻辑。
许彬:价格因素更多是从商业角度考虑规模化生产。从人形机器人角度,我们更关注大模型的质量、稳定性和可靠性,以及大模型的规模。如果大模型能缩小到足够小,可以集成到机器人本体上,进行更好的控制和决策。我相信随着不断落地应用,价格会降低。价格永远是向下走的,关键在于下降的速度和幅度。
谢陵:我们一直与人工智能企业合作,因为我们的客户非常看重飞行器解决问题的能力,其中AI是关键部分。过去有些AI服务企业报价过高,我们希望价格能降低,以便为更多客户解决问题,销售更多飞机。我们是最合理的受益者。
主持人:最后,请每位嘉宾用一句话或几个关键词来总结,新技术催生新产业并建立新的价值链,这是我们今天讨论的最重要主题。各位认为人工智能的新价值链将具有什么特色?
闫俊杰:我认为价值链的价值不再仅仅是销售技术,而是技术变革为用户带来的价值。无论是技术本身、产品还是商业模式,都应朝着创造价值的方向发展。
张鹏:我认为新价值链的特点是单点突破引发全面突破。AI可能是那个爆发点,引发的突破可能涉及各个行业和领域,创造的价值可能是指数级的。
许彬:未来智能社会中,数据可能是最核心的生产资料和要素。从农业社会到工业社会,再到信息社会,我们创新中心将建立更多通用智能机器人的训练场,以数据赋能行业发展。
谢陵:我们期望AI大模型成为类似卫星定位或蜂窝通信那样的无处不在的通用基础设施。