金融大模型的四大瓶颈和三层落地框架

作者：零壹财经发布时间：2024-01-26

金融人工智能机器学习深度学习

作者 | 祝世虎

本文作者为光大兴陇信托有限责任公司信息技术部副总经理、数据中心总经理

智能风控的发展陷入了瓶颈，主要体现在数据、模型、成本、对抗等四个瓶颈。

当前，大模型在金融业加速落地，为智能风控建设进一步发展与自我革命提供了有力方法与手段，如何更好地推进大模型在金融业，特别是智能风控领域落地，需要金融行业不断地探索与实践。

1 大模型在金融业的落地

人工智能在1956年达特茅斯会议上被首次提出后，历经了三个阶段：一是“专家系统+机器学习”阶段；二是“数据驱动+深度学习”阶段；三是大模型的通用人工智能阶段。

进入通用人工智能阶段标志着人工智能开始由“小数据、单任务”分析范式向“大数据、多任务”生成范式转变，此时人工智能具备了更强的通用能力、生成能力和人机交互能力。

从大模型的算法来看，《自然》杂志将大模型定义为网络参数规模达到亿级以上的“预训练深度学习算法”。在大模型的工程实践中，由于人类的知识存在于书本、图画等语言中，所以目前大模型的训练素材主要以语言为主，其主要是指大语言模型(Large Language Model，LLM)。

基于语言的预训练算法决定了大模型的智能类型是一种感知智能(基于Bayes公式)，不同于决策智能(基于先验概率)，更不是计算智能(基于计算公式)，智能类型就是大模型的应用边界。

从生产力角度看，人类社会先后经历了农业革命、工业革命、电气革命、信息革命等重大变革，目前正在经历自动化和智能化革命，其主要的生产力就是人工智能，而大模型就是典型的“由电力到智力”的革命，将有效提升社会的平均智能。

从应用角度看，大模型天然具备人机交互能力、语言与代码的生成能力，目前其在金融领域的应用主要体现在三个方面：一是基于人机交互能力的外部智能客服、内部智能服务；二是基于生成能力的智能办公、低代码生成；三是基于效率效能提升的智能机器人、一岗多专的智能员工。

但这些均不是金融领域的核心应用场景，而基于金融的特性，监管科技、合规管理、风险管理、客户管理才是大模型在金融领域的核心应用场景。

2 智能风控的进一步发展需要自我革命

智能风控的发展经历了三个阶段：一是规则驱动阶段，将部分简单高频的人工审批变为基于规则的自动化审批，智能风控进入“专家规则”时代；

二是数据驱动阶段，数据技术激活了算法的发展潜能，也使得智能风控进入“数据+算法”时代；

三是模型驱动阶段，随着大模型对社会平均智能提升作用的显现，智能风控由“基于历史数据的预测”的被动风控阶段跨越到“基于模型对抗”的主动风控阶段。

目前正处于第二阶段与第三阶段的更迭时期，智能风控的发展陷入了瓶颈，主要体现在数据、模型、成本、对抗等四个瓶颈。

一是数据瓶颈。从理论上看，商业银行所采集的历史数据无法有效应对黑灰产的新型恶意攻击；从实践上看，叠加数据治理成本、数据安全风险等，基于特征库的数据价值挖掘对模型分辨率提升的边界效应逐步下降。

面对新业务的发展、新区域的拓展，中小银行对于“小样本、零样本”的建模需求与日俱增。

二是模型瓶颈。传统模型是单任务模型，不同的模型算法可应对不同的任务，以客户画像为例，传统模型是一系列不同算法的小模型，如以统计算法计算银行的九种资产、以网络图谱计算客户关系、以树模型计算客户偏好，其数据分析结果均为固定化的评级评分等；大模型相对于传统模型具有通用优势与对抗优势，不仅可以感知描述客户画像，而且能够进一步感知风险浓度、欺诈态势等。

三是成本瓶颈。传统的智能风控体系成本较高，主要包括人力成本、科技成本、数据成本以及试错成本等。高昂的成本极大限制了中小银行智能风控的发展，而大模型的出现似乎能够解决这一问题。

四是对抗瓶颈。随着客群下沉与黑灰产新型攻击挑战的日益严峻，基于历史数据预测未来的风控逻辑的模式备受质疑，基于传统ABC卡的通用策略也出现效能下降的情况，因此对抗的升级正在改变传统的智能风控体系。

3 对大模型在金融业落地的思考

1.三层落地框架

大模型在金融领域的应用呈现出三层金字塔结构：底层是通用的基础大模型底座，中间层是金融行业级大模型，顶层是各家金融机构的任务级大模型。

基础大模型底座提供的是通用能力，由实力较强的头部AI公司开发，这类公司拥有海量的数据和雄厚的算力；

金融行业级大模型提供的是金融的行业能力，由与金融机构合作的AI公司开发，这类公司拥有金融行业的数据与知识，并且对金融行业的应用场景十分熟悉；

任务级大模型通常是由银行自主开发或与AI公司合作开发的适合自己的大模型，用于执行具体的工作和任务。

2.中小银行构建大模型能力的路径

中小银行的科技投入有限，要把有限的资源放在刀刃上，需要完成三件事：一是数据整合，将银行内部的数据进行整合，并将外部数据作为必要的补充，形成特色知识库；

二是算力合作，中小银行的算力有限，而算力又是“非核心竞争力的专业能力”，因此建议其采用云模型等方式进行外包；

三是模型精调，即结合行内大数据与知识库，以银行的小规模算力迁移大模型能力，打造轻量级推理模型(精调模型)。

3.落地的关键点：自主可控

自主可控是大模型在金融行业落地的关键点，可以从三个层面来实现：

一是硬件层面的自主可控；

二是软件层面的自主可控；

三是生产内容的自主可控，也称为“AI对齐”，即在基础大模型层面通过数据集和教练模型，使AI系统的目标和人类的价值观与利益相对齐。

4.落地的目标：“能力对齐”甚至弯道超车

纵观金融科技发展历程，中小银行与大型银行在数字化等方面的差距越来越大，智能风控的差距更是如此。

对大模型的应用可以使中小银行弥补投入不足、数据不足、算法落后、科技落后等方面的缺陷，实现与大型银行的“能力对齐”，加之中小银行相对于大型银行拥有更加敏捷灵活的机制，因此，中小银行有望在部分风控场景中实现弯道超车。

注：本文刊于《中国金融电脑》2024年第1期

金融大模型的四大瓶颈和三层落地框架

推荐体验

相关资讯

如何突破大语言模型的最大瓶颈

大模型时代到来，人工智能四层架构，三层百度专利储备全国第一

院士预测未来五年 AI大模型三层风险

科大讯飞刘聪：大模型加持，人形机器人将跨越三大瓶颈

广联达：目前已构建建筑行业AI大模型层、工具平台层、产品应用层三层AI技术体系

近期资讯

未来智能COO王超：人工智能新浪潮下，AI硬件如何破局

日喀则和长白山40米射电望远镜启用

华为于W49-W51连续三周夺得中国智能手机市场销量市占率第一名

电视哪个品牌好，五款高品质85英寸电视，年度最佳选择

2024·百姓身边科技事|学校社区融入“智能时代”

新技术可不受位置限制实现无线充电

小米SU7城市销量榜：杭州人买的最多上海、深圳包揽亚季军

深圳：竞逐“低空第一城”

普光气田首座高含硫增压站压缩机组完成首保

全球跑得最快的高铁！CR450动车组样车发布

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响