【2023金融业大模型应用报告】 报告出品方:中国银保传媒
--大模型的涌现能力
大模型的涌现能力,即当规模达到一定水平时,性能显著提高,超出随机水平,定义为“在小型模型中不存在但在大型模型中产生的能力”。
1)上下文学习
假设已经为语言模型提供了一个自然语言指令和/或几个任务演示,它可以通过完成输入文本的单词序列的方式来为测试实例生成预期的输出,而无需额外的训练或梯度更新。
2)指令遵循
通过使用自然语言描述的混合多任务数据集进行微调,能够在没有使用显式示例的情况下遵循新的任务指令,具有更好的泛化能力。
3)逐步推理
对于小型语言模型而言,通常很难解决涉及多个推理步骤的复杂任务。通过使用思维链提示策略,大模型可以利用包含中间推理步骤的提示机制来解决这类任务,从而得出最终答案。
--大模型选用的判定方向-大模型的场景适配
选择合适的解决方案迎合自身的管理与业务需求,以落地效能清晰界定场景使用模型:大模型将能够通过非常快速的扩展、微调,以及精准定位,颠覆包括营销、风控、内容创作、资管、培训、客户服务、电商、广告、社交媒体、搜索引擎等在内的众多场景。这些领域的每一个应用程序都将被重新设计和改写,形成不同的界面(如对话式)和商业模式(如极致千人千面的精准营销)。
a.基础大模型:创造性、体验式
基础大模型主要面向泛知识、泛领域的通识场景,追求交互体验,当前以C端的内容消费为主。
b.行业大模型:可控性、ROI
行业大模型主要面向垂直特定领域的专业场景,容错性相对较低,且追求合理的ROI,以B端的企业服务为主。
--大模型赋能应用场景方向
a.丰富内涵:丰富企业传统场景的业务内容
受制于原有技术条件,企业的数字化建设只能作用于特定业务场景的流程管理,无法深入到执行环节,但大模型的加持使得在具体业务执行环节中辅助或者代替员工工作成为可能,将延伸业务边界,丰富场景内容。
b.能力提升:强化原有AI场景的效能及形式
与原有AI算法进行融合,在机器学习的任务中引入大模型的涌现、逻辑推理和多模抽取提炼能力,以获得更好的任务表现,如搜索引擎优化、个性化推荐等。两类AI技术虽存在技术路径差异,但能够在细分任务上做拆解,进行细颗粒度的技术共生。
c.技术底座:以大模型重构企业级智能架构基座
目前,生成式AI场景主要指以自然语言处理、语音技术、图片解析为核心的对话机器人、数字人等场景,而大模型的出现,意味着技术路径转换和技术能力的增强,大模型可在部分场景和任务中替换原有小模型底座,如对话、抽取、内容理解等,同时也能够基于大模型开发新的场景。
--创新能力的场景泛化-旧场景的升级
金融行业的数字化程度在全行业中相对领先,拥有高价值的领域数据资产,是大模型率先落地的垂直领域之一。大模型将依托其多种能力为金融行业带来原有业务场景的升级,持续丰富业务内涵,提升现有数字化基础的效能与形式体验:
1.行业研究:基于大模型的知识推理能力,让原先的行业研究模型具备理解分析图表、舆情、往年数据等更广范围信息的能力,得出更加可靠的行业研究结论,提升行研报告的均质化水平。
2.智能合约:引入规则信息和利益导向,基于大模型起草或审查合同条款审查合同,快速甄别潜在的利益冲突条款,并加快合同流程,有助于规避潜在风险、提升合同撰写的均质化水平。
--创新能力的场景泛化-新场景的变革
在为金融行业带来传统场景升级的同时,大模型的强大生成能力和多模态信息处理能力会为包括银行、保险、资管、投顾等在内的金融业务带来“迭代式”的场景变革:
1.代码生成:运用大模型编写重复代码,可释放更多科技产能,将人力投入到程序、算法等设计过程,提升金融系统和模型的开发效率,同时优化金融科技团队组织体系。
2.金融信息查询:在中国的金融信息数据服务领域,使用一些数据终端的时候,都是以目录式查询、逐层下钻的方式,而大模型能够创新交互方式,基于金融直接通过问答得到相关数据、指标库和图表等。