作者 | 祝世虎
本文作者为光大兴陇信托有限责任公司信息技术部副总经理、数据中心总经理
智能风控的发展陷入了瓶颈,主要体现在数据、模型、成本、对抗等四个瓶颈。
当前,大模型在金融业加速落地,为智能风控建设进一步发展与自我革命提供了有力方法与手段,如何更好地推进大模型在金融业,特别是智能风控领域落地,需要金融行业不断地探索与实践。
1 大模型在金融业的落地
人工智能在1956年达特茅斯会议上被首次提出后,历经了三个阶段:一是“专家系统+机器学习”阶段;二是“数据驱动+深度学习”阶段;三是大模型的通用人工智能阶段。
进入通用人工智能阶段标志着人工智能开始由“小数据、单任务”分析范式向“大数据、多任务”生成范式转变,此时人工智能具备了更强的通用能力、生成能力和人机交互能力。
从大模型的算法来看,《自然》杂志将大模型定义为网络参数规模达到亿级以上的“预训练深度学习算法”。在大模型的工程实践中,由于人类的知识存在于书本、图画等语言中,所以目前大模型的训练素材主要以语言为主,其主要是指大语言模型(Large Language Model,LLM)。
基于语言的预训练算法决定了大模型的智能类型是一种感知智能(基于Bayes公式),不同于决策智能(基于先验概率),更不是计算智能(基于计算公式),智能类型就是大模型的应用边界。
从生产力角度看,人类社会先后经历了农业革命、工业革命、电气革命、信息革命等重大变革,目前正在经历自动化和智能化革命,其主要的生产力就是人工智能,而大模型就是典型的“由电力到智力”的革命,将有效提升社会的平均智能。
从应用角度看,大模型天然具备人机交互能力、语言与代码的生成能力,目前其在金融领域的应用主要体现在三个方面:一是基于人机交互能力的外部智能客服、内部智能服务;二是基于生成能力的智能办公、低代码生成;三是基于效率效能提升的智能机器人、一岗多专的智能员工。
但这些均不是金融领域的核心应用场景,而基于金融的特性,监管科技、合规管理、风险管理、客户管理才是大模型在金融领域的核心应用场景。
2 智能风控的进一步发展需要自我革命
智能风控的发展经历了三个阶段:一是规则驱动阶段,将部分简单高频的人工审批变为基于规则的自动化审批,智能风控进入“专家规则”时代;
二是数据驱动阶段,数据技术激活了算法的发展潜能,也使得智能风控进入“数据+算法”时代;
三是模型驱动阶段,随着大模型对社会平均智能提升作用的显现,智能风控由“基于历史数据的预测”的被动风控阶段跨越到“基于模型对抗”的主动风控阶段。
目前正处于第二阶段与第三阶段的更迭时期,智能风控的发展陷入了瓶颈,主要体现在数据、模型、成本、对抗等四个瓶颈。
一是数据瓶颈。从理论上看,商业银行所采集的历史数据无法有效应对黑灰产的新型恶意攻击;从实践上看,叠加数据治理成本、数据安全风险等,基于特征库的数据价值挖掘对模型分辨率提升的边界效应逐步下降。
面对新业务的发展、新区域的拓展,中小银行对于“小样本、零样本”的建模需求与日俱增。
二是模型瓶颈。传统模型是单任务模型,不同的模型算法可应对不同的任务,以客户画像为例,传统模型是一系列不同算法的小模型,如以统计算法计算银行的九种资产、以网络图谱计算客户关系、以树模型计算客户偏好,其数据分析结果均为固定化的评级评分等;大模型相对于传统模型具有通用优势与对抗优势,不仅可以感知描述客户画像,而且能够进一步感知风险浓度、欺诈态势等。
三是成本瓶颈。传统的智能风控体系成本较高,主要包括人力成本、科技成本、数据成本以及试错成本等。高昂的成本极大限制了中小银行智能风控的发展,而大模型的出现似乎能够解决这一问题。
四是对抗瓶颈。随着客群下沉与黑灰产新型攻击挑战的日益严峻,基于历史数据预测未来的风控逻辑的模式备受质疑,基于传统ABC卡的通用策略也出现效能下降的情况,因此对抗的升级正在改变传统的智能风控体系。
3 对大模型在金融业落地的思考
1.三层落地框架
大模型在金融领域的应用呈现出三层金字塔结构:底层是通用的基础大模型底座,中间层是金融行业级大模型,顶层是各家金融机构的任务级大模型。
基础大模型底座提供的是通用能力,由实力较强的头部AI公司开发,这类公司拥有海量的数据和雄厚的算力;
金融行业级大模型提供的是金融的行业能力,由与金融机构合作的AI公司开发,这类公司拥有金融行业的数据与知识,并且对金融行业的应用场景十分熟悉;
任务级大模型通常是由银行自主开发或与AI公司合作开发的适合自己的大模型,用于执行具体的工作和任务。
2.中小银行构建大模型能力的路径
中小银行的科技投入有限,要把有限的资源放在刀刃上,需要完成三件事:一是数据整合,将银行内部的数据进行整合,并将外部数据作为必要的补充,形成特色知识库;
二是算力合作,中小银行的算力有限,而算力又是“非核心竞争力的专业能力”,因此建议其采用云模型等方式进行外包;
三是模型精调,即结合行内大数据与知识库,以银行的小规模算力迁移大模型能力,打造轻量级推理模型(精调模型)。
3.落地的关键点:自主可控
自主可控是大模型在金融行业落地的关键点,可以从三个层面来实现:
一是硬件层面的自主可控;
二是软件层面的自主可控;
三是生产内容的自主可控,也称为“AI对齐”,即在基础大模型层面通过数据集和教练模型,使AI系统的目标和人类的价值观与利益相对齐。
4.落地的目标:“能力对齐”甚至弯道超车
纵观金融科技发展历程,中小银行与大型银行在数字化等方面的差距越来越大,智能风控的差距更是如此。
对大模型的应用可以使中小银行弥补投入不足、数据不足、算法落后、科技落后等方面的缺陷,实现与大型银行的“能力对齐”,加之中小银行相对于大型银行拥有更加敏捷灵活的机制,因此,中小银行有望在部分风控场景中实现弯道超车。
注:本文刊于《中国金融电脑》2024年第1期