出品 | 搜狐科技
作者 | 梁昌均
“我们应该更加重视知识和算法,当然也要在算力和数据上努力去追赶。”在ISC.AI2024人工智能峰会上,中国科学院院士、清华大学教授张钹谈到发展第三代人工智能时强调。
他认为,信息产业的发展过程和人工智能的发展过程非常不一样,前者持续高速,而人工智能则是缓慢曲折,原因是人工智能还没有自己的理论,只有模型和算法,且都是专用,因此现在还没有发展出来大规模的人工智能产业。
张钹提到,第一代人工智能是以知识为基础的模型,主要利用知识、算法、算力三个要素。第二代人工智能是数据驱动,三要素是数据、算法、算力。
“这两个模型都是有三个特定的限制,就是在特定的领域利用特定模型解决特定的任务。由于这三个特定的限制,这两个阶段发展出来的人工智能是属于专用人工智能或者弱人工智能。”张钹认为,生成式人工智能时代的AI产业,需要加速发展第三代人工智能。
对于目前火爆的大模型,张钹认为,在考虑基础模型的时候,需要考虑它的三大能力和一大缺陷,即强大的语言生成能力、强大的自然语言对话能力,以及强大的举一反三能力,以及存在幻觉、会胡说八道的缺陷。
“这一大缺陷跟三大能力是同时出现,因为我们要求它有多样性的输出,必然会产生错误,而且这个错误是本质的错误,不可避免,我们不可控。”张钹表示。
从产业发展来看,张钹认为,将来做通用大模型肯定是少数的企业,绝大部分企业主要是三个方向:做垂直领域的大模型,利用开源或闭源模型去做微调开发,以及跟其它工具和技术结合起来,开发新的应用。
张钹认为,现在大模型在应用中会表现出来三个人类没有的缺点:不可控、不可信、不鲁棒,这受外部的影响非常大,导致机器在很多情况下没有判断对错的能力,从而不能自我更新,因为现在所有的人工智能的所有更新进化都是在人类的驱动和帮助之下。
如何解决这些问题,张钹提到了四个方向。一是要做AI对齐,人类帮助它进行改进,就是与人类对齐,需要外部的提示;其次是多模态生成,这对产业发展非常重要,最本质的是文本处理的突破,图像、语音、视频等要做好都需要跟文本挂钩。
第三就是智能体非常重要,必须要把大模型跟周围的环境结合起来,让环境起到提示它的作用,从而实现智能体任意生成。最后就是具身智能,要让大模型与物理世界交互。
“将来如何发展通用的机器人?我认为应该是软件通用,硬件应该多样化。”张钹认为,现在马斯克宣传人形机器人,这当然是重要的一个方面,但将来不止于人形,不同的工作环境下还是需要不同的硬件,所以硬件应该多样化。
他认为,这些方向最重要的是要引入强化学习,要让人工智能在实践的过程中间不断去改进,不断去更新,对硬件、软件都是这样。
张钹认为,发展第三代人工智能有三个重要思想:首先要构建可解释和鲁棒性的AI理论和方法,能够解释所谓的涌现现象;二是要发展安全、可控、可信、可靠和可拓展的AI技术;三是要推动AI的创新应用和产业化。
他强调,第三代人工智能必须把四个要素充分利用起来,包括知识、数据、算法、算力。
“目前美国宣传的是数据、算力和算法,数据和算力放在第一位,然后是算法,根本不提知识。因为他们的数据、算力比我们强得多,所以每次有成果出来都要秀这两个肌肉。”张钹认为,我们应该发挥知识和算法的作用,需要把知识从数据中剥离出来。
“当然我们也要重视数据,因为机器的数据能力很强。我们强调数据是强调机器的作用,我们强调知识是强调人类的作用,我们认为人类的作用要比机器的作用更加重要。”张钹表示。
张钹还强调,中国在算法和算力上面,应该努力去发展算法,这方面我们国家的工作应该比美国做得更深入。“我们没办法,只能在算法上加工。如果学习算法或推理算法能够提高一个数量级,我们所需要的算力会减少十倍。”
X智享生活 2024-11-20
凯茉锐电子科技 2024-11-20
近屿智能 2024-11-19
小明侃家电 2024-11-20