2024年7月3日,2024中国数字经济发展和治理学术年会在清华大学成功举办。本届学术年会聚焦“数据要素、人工智能与数智时代的理论创新”,邀请国内外40余位专家、学者及机构代表进行主旨演讲和交流。来自清华大学、北京大学、中国人民大学、中国科学院大学、中国社会科学院大学、浙江大学、南开大学、上海交通大学、西安交通大学等高校和数字经济相关科研机构及企业代表共400余人出席线下会议。会议通过多个平台同步直播,当天信息浏览量超过十万人次。
北京大学数字金融研究中心副主任、北京大学国家发展研究院教授沈艳以《人工智能在数字金融中的应用》为题进行了主旨演讲。本文根据沈艳教授现场发言内容整理。
沈艳教授作主旨演讲
很荣幸受邀,谢谢叶老师刚刚的介绍。我今天的主题是“人工智能在数字金融中的应用”,并抛砖引玉,提供一些思考。我们的大背景是,2023年10月总书记提出来的五篇大文章当中,特别提到要做好数字金融大文章。
首先,介绍一下什么是数字金融。它是过去十多年当中金融体系里面最重要的创新,主要是利用数字技术为我们在支付、贷款、保险、投资等方面的新金融工具、金融模式,也包括金融基础设施建设。我认为可以从三个维度去理解数字金融的发展变化。第一个维度刻画金融部门,包括货币以及支付、信贷、保险、资产管理以及外汇等相关机构与业务活动。第二个维度是数字技术,涉及到AI、区块链、云计算等等。今天讨论的AI,很多时候是把很多数字技术包含在内探讨,比如在运用人工智能时,也离不开大数据、区块链、云计算、算力等的讨论。第三个维度是商业模式,比如B2C、B2B、P2P、B2G,以及平台本身多边的模式。当我们讲创新的时候指的是什么呢?可能主要是在今天我们考虑人工智能的时候,涉及到的是场景、数据、算法、算力,他们在改善金融服务方面的作用。金融服务包括四个维度:改善金融的触达、提高金融的效率、能不能提升我们的风控,以及金融安全的问题。其中,金融安全的问题既包含程序应用的安全,也包括是否触发金融风险。
我主要从四个角度来简介人工智能在数字金融当中的应用。首先是智能客服。银行常常要面对用户大量的业务咨询,因此往往需要庞大的客服群体。但是,客户咨询在时间上的分布并不均匀,可能很多时候没有人打电话,人员过多构成浪费;但是人员过少又会在高峰期无法快速回应客户的需求,造成客户体验差的现象。另外,年轻人离职率也很高,银行也面临好不容易培训上手的客服用不了多久就流失的现象。某金融集团的智能服务在一年中共有超过10亿次客服的回答量,他们的智能语音服务可以覆盖其中的86%,解决率达到92.3%。这就极大提升了服务效率。然后,客户与智能客服的对话形成新的文本,进一步分析这些文本可以开展智能服销业务,进一步向潜在客户推荐相应的金融产品。2021年实现了1000多亿近2000亿的智能服销的成果。
第二个领域,数字信贷。长久以来,小微企业和个人面临“贷款贵、贷款难”问题,金融存在不够普惠的现象。相较于大企业,中小微企业和银行等金融机构之间的信息不对称更不易于解决。事前防范“逆选择”风险和事后防范“道德风险”,均需要金融机构能以较低成本来做好上述风控。人工智能能够帮助我们在数字信贷方面有所作为。一方面,利用平台可以获取大数据,降低客户获取的难度;基于大数据可以和恰当的机器学习模型相结合的新的风控模型,可以提升事前风控能力、降低逆选择风险。另一方面,平台可以用较低成本获取客户再贷款之后的一些行为和交易信息,这也有助于做好贷款管理,防范道德风险。微众、网商这样的互联网银行,以非常少的人员来服务非常多的客户,这是人工智能用在模型的预测以及还款能力的预测等方面的应用,这也是相对比较成熟的技术应用。
第三个领域,量化投资。量化当中的应用,首先是投资信息的搜集。第二,会通过人工智能的模型对交易习惯做一些学习。第三,做大模型的一些预测,看看能不能够提升数据,做到因子的提取,做到降维。右图是全球用AIML(人工智能标记语言)、人工智能或者是机器学习这一类对冲基金的占比,从2010年到2018年一直是增加的,但是2019年以后就开始下降。收益率做了一个比对,2019年本年以及2019年往前推三年和2019年往前推五年,基于人工智能或者机器学习方法量化方法的影响。最主要的信息,从右往左看,往前倒五年,会看到人工智能+量化总体回报率最高;但三年的时候(收益)就还好,但是好的程度没有那么高了。2019年单年,人工智能、机器学习的模型本身的表现不如市场上原有的传统模型。
近期一个比较热烈的讨论是,GPT4是不是在选股方面可以表现得更好?是不是将来我们就可以直接拿大模型代替投资经理?2024年5月摩根大通发布了IndexGPT,通过IndexGPT可以创建一个主题投资篮子,芝加哥大学的一个研究发现GPT4在选股方面可以超越大部分的人类分析师,可以提供更高的阿尔法和夏普比例,这是非常引发关注的一个研究,但对这一研究发现也存在质疑。最主要的问题是表现好可能是因为训练数据被污染,也就是测试的数据是到2021年,但训练数据是否包含了2021年以后的数据的问题。
对于人工智能在数字金融当中的应用,还有一个很高的期待,就是智能投顾。因为投资的管理,往往财富管理更多是集中在高净值人群上,大众甚至中产阶级往往不能得到很好的服务。那么,智能投顾能不能帮我们解决投资难的问题?中国经过几十年高速度的发展,财富管理有没有可能也更普惠一些,让中产阶级甚至大众都能得到优质的理财服务呢?智能投顾的作用可能要取决于以下几方面问题的答案:第一,真的降低资产配置的成本;第二,要能够为客户真实地定制个性化的服务,能够粘住这个客户;第三,既然它是自助式的智能投顾,客户自己操作的成本要比较低。目前,中国金融机构在智能投顾方面已经有了不少有益的尝试,但仍然存在不少挑战。一是算法本身会有诸多的局限性;二是千人千面对数据以及计算能力都有诸多要求;三是再好也好不过市场的总体环境,市场的总体环境会决定收益率;四是目前的投资者教育不足。我们看到,一些金融机构在投资者教育方面也加大了力度,未来人工智能在智能投顾方面的应用还有很大的空间。
在介绍了人工智能在数字金融的四个经典场景中的应用的时候,我们也要看到其中还存在不少挑战。
第一,算法局限性的问题。知其然不知其所以然,如果用在分析客户情绪、回答客户问题的场景中,也许出错成本不算高。但是,在涉及大量资金的核心业务上,比如对大额信贷资金的发放,完全不懂得算法规律是非常危险的做法。这是因为现有的预测模型往往是基于历史信息,如果未来发生一个重要的结构性的变化就可能带来重大损失。例如2020年对冲基金在疫情中表现差强人意,就和模型无法事先预测到巨大的结构性变化分不开。
第二,数据的局限性。运用人工智能模型的时候,不能忽略数据局限性带来的问题。这是因为数据很多时候不是为了人工智能的目标生成的,往往是这个企业自己业务的一个副产品。企业为了让业务顺利发展会不断调整模型参数,这就导致从数据观察到的变化,究竟是外部环境发生变化还是内部模型变化带来的,无法分清楚,这会进一步加大利用数据做预测的难度。二是数据质量可能达不到相应目标的要求。要防止“垃圾进、垃圾出”,需要在训练模型时,就采用大量高质量的数据。我国虽然是数据要素非常丰富的国家,但是根据国际数据公司(International Data Cooperation)的研究,我国目前的数据主要是娱乐类数据,而工业用的、可以提升生产率的数据占比较低。在采用大模型时,需要考虑到对应的场景是否有足够高质量的数据的问题,以避免“巧妇难为无米之炊”的困境。
第三个问题是人工智能的算法安全,目前还是在一个非常初级的阶段。在算法安全方面,存在通过给大语言模型一些指令,让大语言模型做一些违背开发者规则的事情的现象。例如2023年以“奶奶漏洞”为代表的越狱指令,是一位工程师对ChatGPT说,自己和祖母的感情深厚,现在我祖母去世了,她每天在我睡觉之前都给我念windows序列号。通过这段对话,该工程师获得了真实的序列号。当然后来这个漏洞很快就被弥补,但核心问题是,现有的大语言模型的开发者对于算法安全自身还没有完全的把握。因此,在金融领域中,涉及核心业务的大规模应用应采取谨慎态度。
总结而言,目前人工智能在数字金融当中的广泛应用主要是四个领域,其中比较成熟的是客户服务和数字信贷方面。如果能够处理好算法安全与监管等问题,人工智能在数字金融方面的广泛应用仍有广阔前景。
沈艳,北京大学数字金融研究中心副主任、北京大学国家发展研究院教授。沈艳教授的主要研究领域包括大数据和互联网金融、理论和实证计量经济学、微观金融、社会经济状况等。
未名湖数字金融研究
“未名湖数字金融研究”公众号(idf_pku)为北京大学数字金融研究中心(Institute of Digital Finance, Peking University)的官方微信公众号。
北京大学数字金融研究中心成立于2015年,致力于数字金融和金融科技领域的学术与政策研究。中心发布的“北京大学数字普惠金融指数” 成为学术界引用率最高的测度中国数字金融发展程度的指标。中心研究团队获批国家社会科学基金重大项目“数字普惠金融的创新、风险与监管研究”。中心还积极推进国际学术交流与合作,与国际货币基金组织(IMF)、国际清算银行(BIS)和布鲁金斯学会(Brookings)都分别组建了联合课题组就中国数字金融问题展开深入的研究。