近日,国内第二批AI大模型备案落地,美团、360、蚂蚁等垂直领域的头部科技企业均在列,而这也意味着,国内如火如荼的大模型竞赛开始陆续走向C端,面对公众的考验。
“可以看到,业界的创新仍然在加速,比如近期召开的OpenAI开发者大会,我们相信未来会有新App,新硬件在内的新的人机交互体验,对此,蚂蚁也在积极跟进,同时在做一些小规模的尝试。”蚂蚁集团CTO何征宇告诉南都记者。
何征宇也谈起了当前甚是火热的“百模大战”,对于大模型的出现,他认为这是“历史的必然”,它源于人类对自身的好奇,也建立在人类发展过程中若干次伟大创造的基础之上。
“现在很多人看GPT,会觉得成本很高,不经济不环保,但若干年后再回头看,才会觉得今天的GPT,大模型们迸发的智能涌现现象,乃至于现在所有大模型的训练方法,都像是原始人钻木取火带来的火种那样重要。”何征宇表示。
他还提到,现在在更小的模型规模上也观测到了智能涌现的现象,这也意味着知识的压缩可能是无止境的。产业界也应该在算法优化、工程实现上持续探索,发现更好的产生智能的知识压缩方法。
“不过,在具体的产业应用与落地上,大模型也面临全新的安全挑战。”何征宇说。他认为可以从以下三方面着手应对:
第一,认知一致性对齐。事实上,AI的价值观和人类的价值观存在着巨大的分歧,比如,人知道自己何时在一本正经地胡说八道,但AI没有这样的意识。目前来看,仅靠大模型技术本身不太可能实现这两种价值观的对齐,除非有搜索增强、知识图谱甚至是更多技术的帮助。
第二,决策白盒化。如果要把大模型用到决策系统中,一定要白盒化——也就是当用户基于某种大模型系统做了一笔支付,然后被拒付时,大模型要能像人工客服那样,清晰明了地解释其决策的原因。
第三,交流协同演进。当前市面上有各种通用大模型,也各有特点。要取得进展,需要大模型之间的更好协作——不仅是简单的语料层面,而更要从API层面去打通,使得大模型之间有一个协同演进的机制。
采写:南都记者 杨博雯