今天分享的是人工智能AI研究报告:《中国人工智能产业应用发展图谱2023》。
一、技术局限尚需突破方能释放更大价值
1、知识更新与自主学习能力,目前大语言模型仍然为静态数据驱动的学习范式,无法实现新知识的快速学习与迭代,尤其是涉及到时效数据与专有数据的场景下存在障碍,Open AI正在通过Plugins生态来突破这一局限垂直领域泛化能力,通用任务的卓越能力已经显现,但是进入垂直细分领域与知识体系下,大模型的性能与泛化能力仍然需要增强,行业大模型训练是当前挑战的破局之道之一
2、长期记忆能力,目前正在通过增大上下文容量、数据向量化,以及AI agent等多种方式探索突破巨大的模型训练与推理算力等成本拉低效益比
3、训练与微调成本,该训练成本仅针对企业应用基础模型结合行业知识与数据集进行训练与微调的成本,并非基础大模型训练成本,与上述“垂直领域泛化能力”相对应,该成本仍然为行业知识壁垒显著的企业必须承担的成本,开源基础模型在一定程度上可以降低这一阶段的训练成本
4、推理成本,大模型在参数体量巨大的情况下,仍然存在较高的推理成本,这方面可以通过模型压缩与剪枝等技术的发展进一步降低
5、模型能力与业务场景的适应成本,这部分成本虽然由于人机交互方式的变化显著降低,但是前期仍然需要考虑提示工程在特定场景的磨合成本安
二、全合规可信应用底线尚需刚性保障
1、模型安全与可控制性问题,这是人工智能普遍面临的问题,大模型并不能幸免,包括模型攻防、数据注入等问题;同时,模型能力来自于“涌现”,需要进行模型 能力,尤其是生成结果的可控制,方能进入到生产环境
2、对齐问题,既包括人工智能与人类社会价值观保持一致,也包括与不同国家价值观,不同类型企业经营以及商业法则相匹配等,前者最为关键,这也是目前最为关注的AI不受控制的风险之一,目前在通过RLHF与RLAIF不同方式来实现
3、隐私与数据安全问题,无论是大模型的训练推理,还是对话应用的过程中,都存在过多的隐私暴露与数据安全风险,这有赖于技术突破和监管合规的进一步建立
来源:易观
报告内容节选如下:
资料下载:公众号《侠说》