当前位置:首页|资讯|ChatGPT|微软

通往AI的快车道,哪家银行能成功上岸?

作者:BFT白芙堂机器人发布时间:2023-03-14

原创 | 文BFT机器人


核心摘要


1、什么是ChatGPT?


  • ChatGPT是什么?

ChatGPT是将神经网络算法中的Transformer模型从理论变为现实的划时代应用。


  • ChatGPT强在哪?


算力强数据多:近4年,GPT历代模型的开发和训练得到了微软在资金(110亿美元)和算力(打造世界第五超级计算机)上的强力支持,目前能够处理千亿级参数,训练百TB级数据。


训练模式领先:前三代GPT均采取无人参与的预训练机制,ChatGPT新增人类反馈强化训练。


开生成式先河:以算力和训练数据为支撑,ChatGPT能够准确理解各类问题,给予具有一定逻辑的开放式回答;还能够与提问者进行连续对话,不断修正给出的答案,这是前所未有的语言理解和表达能力。潜在价值巨大,未来ChatGPT技术与其他人工智能技术耦合,彻底改变人工智能生态的可能性极大。


  • ChatGPT缺陷是?


语料来源:语料不够充分或完全未覆盖的空白领域,ChatGPT很可能会给出误导性内容;与Bing搜索引擎耦合后,回答问题的准确性是否收到搜索引擎数据的干扰有待观察。


运营成本ChatGPT运营及训练成本高企,恐将制约未来发展。


道德风险:无法避免ChatGPT故意提供虚假或提供带有攻击性的答案。


2、如何改变银行业?


  • 机遇与挑战

银行客服,对于客服、催收等人工的替代,与ChatGPT关联最直接,或将开启深度智能化阶段。


业务前端:对于财富管理、小微客户、个人消费贷款等标准化产品,客户识别有望进一步细化,产品匹配有望更加精准。


业务中端:诸如授信报告、审批报告、贷后管理报告等强格式性案头工作,如能以ChatGPT替代,可有效提高运营效率。


科技基础:银行投入人工智能相关研究需要持续投入资源,特别是要投入支持模型运转及数据计算的算力资源。

  • 合规与成本

数据隐私:银行数据的特殊性决定了应用第三方技术的审慎性,应用技术须考虑本地化、私有化部署模式。


系统稳定:银行不掌握ChatGPT核心技术,很难控制内容输出的正确性,也很难确保系统稳定运行,这在经营中存在很大风险。


本投入:无论是接入ChatGPT,还是自主开发类似功能,均须较大成本投入,是否能够实现预期收益,存在不确定性。


3、哪些银行有机会?

  • 在金融科技持续投入资源的银行


科技人员:披露数据的21家上市银行科技队伍总人数11.6万人,占从业总人数的5%;工行在绝对人数上一枝独秀达3.5万人以上,浦发、招行、工行科技人员占比最高。


科技投入:披露数据的24家上市银行中科技投入近1600亿元,占营收的3%。四大行在科技投入绝对规模占有优势;长沙、平安、招行科技投入营收占比最高。



01 

什么是ChatGPT?


1.1ChatGPT是具有划时代意义的自然语言处理模型


自然语言处理,是人工智能最基础的领域。


“图灵测试”作为人工智能的理论开端,其所提出的验证标准,即在人与机器的问答中,如果人无法判断对方是人还是机器,则可判定机器具有人类智能。为了通过“图灵测试”,人类的探索大致可分为三个阶段:


  • 模式匹配:(1960s-90s)

设置关键词与答案之间的线性匹配关系,如果提问者触发关键词,则向其提供已经预设好的答案。

  • 机器学习:(2000s)

不再预先设置关键词与标准答案,而是向机器提供大量历史资料,由机器自主总结规律、进行会话。

  • 神经网络:(2010s至今)

神经网络属于机器学习的进化分支。原理上是通过建模来模拟人类大脑100亿个神经元的结构。


在2017年以前,主流模型为循环神经网络模型(RNN),处理语言时需要严格遵循语言的先后顺序,无法并行计算且容易出现长句语义理解困难等问题;2017年,Transformer模型被提出,它是对句子中的所有单词进行计算,算出词与词之间的相关度,可以同时学习大量文本。

ChatGPT(结尾的“T”即指Transformer),就是将这一模型从理论变为现实的划时代应用。


1.2ChatGPT的强算力与大数据


ChatGPT最终爆火,离不开算力和数据量的持续升级。

  • 模型实质

所谓语言模型,实质是对词语序列的概率相关性建模,即对方说完一句话或一段话后,判断大概率继续出现的内容是什么。既然是概率相关性,自然是“大力出奇迹”,样本越大,结果就越准确。同时,样本越大也自然就意味着对算力和资金的消耗,从初代GPT到最终爆火的ChatGPT,模型并未发生实质改变,改变的是持续增长的资源投入。

  • 算力支持

2019年,微软为OpenAI(GPT开发公司)打造了一台全球排名第五的超级计算机,拥有超过28.5万个CPU核心,1万个GPU,每个GPU服务器的网络连接能力为400Gb/s,支持GPT模型从初版的12个Transformer层进化到当下超过96个Transformer层,可以理解为有更多的Transformer层就能够在语言与语言之间构建更复杂的逻辑联系。

  • 数据规模

GPT模型处理的参数量从初代的亿级成长到今天的千亿级,预训练数据量从GB级上升到百TB级。

  • 融资情况

如此规模的算力与数据必然需要巨额资金的支持,近4年,OpenAI从微软总计获得融资110亿美元。


ChatGPT自主+人类反馈强化训练


GPT通过自主训练充分发挥模型在效率上的优势,同时在ChatGPT版本中增加人类反馈强化机制,使其结果更贴近人类想法。

  • 自主训练

GPT-1到GPT-3,采用的都是GPT自主训练模式。所谓自主训练,近似于人类考试中的“完形填空”题目,即把一个完整文本的一部分遮住,GPT基于已学习结果进行推测,再与正确答案进行拟合的过程。自主训练过程,配合Transformer模型下强大的并行计算能力,能够高效完成超大数据量的学习和训练,这也是GPT表现优于其他模型的原因。

  • 人类反馈

GPT-3版本上线时,已经颇受业内人士认可,但并未出圈。ChatGPT此次能够破圈,与其采用对话聊天模式不无关系。相应地,在训练中增加人类反馈强化机制,对真实性、无害性和有用性进行评估。


ChatGPT将语言处理推向生成式时代,潜在价值巨大


凭借超强算力,基于超大数据的学习和训练,ChatGPT首次展示了强大的综合性语言材料生成能力。

  • 决策式AI

所谓决策式AI,即根据对历史概率的归纳给出是或否的决策;而生成式AI则需要给人力提供综合式的信息输出。

  • 生成式AI

ChatGPT是第一个功能如此强大的综合性文字生成式AI,它能够准确理解提问者的问题,收集材料后转化为具有一定逻辑的信息输出,它还能够与提问者进行连续对话,根据增量信息给出更准确回答,这是前所未有的语言理解和表达能力。凭借超强算力,基于超大数据的学习和训练,ChatGPT首次展示了强大的综合性语言材料生成能力。


语言即为指令,ChatGPT与其他领域人工智能技术的耦合,或将完全开启人工智能的新时代。

  • ChatGPT+Whisper

OpenAI已经通过提供ChatGPT和Whisper的收费API接口,Whisper是OpenAI开发的语音处理工具,如将ChatGPT和Whisper功能进行耦合,可以得到无障碍的语言交流工具。


所谓的语言,就是指令体系。随着指令体系的智能化,一切智能工具之间的边界或将逐渐模糊,人类与智能工具的关系或将彻底改变,AIGC(AI生产内容)的时代将加速到来。



1.3ChatGPT有哪些潜在挑战?


ChatGPT风头一时无两,其潜在挑战在于语料库的范围及准确性、运营成本高及回答的道德风险等问题。

  • 语料来源

ChatGPT本质上仍是一个基于有限语料范围的概率归纳模型,它并不能对未知的事情像人类那样做常识性推演。与相关领域语料不够充分或完全未覆盖的领域,ChatGPT很可能会给出误导性内容;另外,微软计划将GPT-4与Bing搜索引擎深度耦合,搜索引擎庞杂的数据是否会对GPT-4的学习和训练带来负面干扰,仍需观察。

  • 运营成本

据报道,目前ChatGPT一次模型底座的训练需要500万美元的算力成本,在运营过程中需要大量的算力支持其训练和部署。GPT-4与Bing耦合后,满足来自搜索引擎的搜索需求需要更大量的资源投入,如不解决成本问题恐将制约未来发展。

  • 道德风险

即使引入人类反馈,也不能100%避免ChatGPT故意提供虚假答案或回答带有攻击性的答案。



02

如何改变银行


2.1机遇与挑战:主动革新?被颠覆?


该如何理解ChatGPT可能会带来的潜在变革?像很多人担心的那样,会有大量工作被替代掉吗?


ChatGPT的颠覆,本质上是人类生产力工具的再一次重大升级。就像过去三百年先后有蒸汽机和电被发明出来一样,固然有被这些新的生产力工具替代掉的人,也有更多的人利用新的工具创造了更多的财富。驾驭或是被替代,只在一念之间。银行也是一样,ChatGPT是一次机会,一次全面升级流程的机会;错过则将是挑战,看着其他机构提高效率的挑战。


从银行客服开始,无论是业务前台还是中后台,各项流程都有用ChatGPT重做一遍的潜力。


  • 银行客服

对于客服、催收等人工的替代,与ChatGPT关联最直接,银行应用最广泛,或将开启深度智能化阶段。

  • 业务前端

对于财富管理、小微客户、个人消费贷款等标准型产品,客户识别有望进一步细化,产品匹配有望更加精准。

  • 业务中端

诸如授信报告、审批报告、贷后管理报告等强格式性案头工作,如能以ChatGPT替代,可有效提高运营效率。

  • 科技基础

银行投入人工智能相关研究需要持续投入资源,特别是要投入支持模型运转及数据计算的算力资源。


银行客服:与ChatGPT关联最直接,或将开启深度智能化阶段


诸如银行客服、不良催收等需要与客户进行沟通的内容可预期、重复规律性强的客户交流性工作,与ChatGPT的特点最为契合。


适用范围:银行客户、不良催收等。


  • 工商银行

2021年,利用数字人、智能问答、语音等交互技术,在客户服务前台、业务运营后台等领域加大应用“机器换人”,落地 600+具有数字员工属性的智能应用场景。

  • 平安银行

2022年上半年,AI平台新增模型1,080个,客服机器人场景每日对话量达60万次,问题解决率超90%。

  • 招商银行

2022年上半年,AI智能客服、语音质检、智能审录、海螺RPA(机器人流程自动化)等共实现人力替代超过10,000人。


ChatGPT的成功为已经部署人工智能客服的银行提供了优化模型、提高智能化水平的方向。预计这一类业务都将开启深度使用更加成熟人工智能客户工具的阶段。


业务前端:客户识别及产品匹配有望进一步细化


诸如财富管理这类标准化程度较高的业务,可以利用ChatGPT的数据分析能力,细分客户标签,提高产品推荐匹配度。


适用范围:财富管理、小微客户、个人消费贷款等标准化程度较高的业务。


  • 平安银行

2022年上半年,AI 客户经理累计上线超 1,400 个场景,上半年月均服务客户较 2021 年月均水平增长 63.2%。

  • 招商银行

2021年,招商银行推出智能财富助理“AI小招”,基于大数据技术,通过知识沉淀与机器训练,实现更懂客户和产品,为客户提供收益查询、涨跌分析、市场热点解读、产品推荐、资产配置建议等财富管理综合服务。


将客群更加细分,需求挖掘更加细化,产品需求匹配更加精准。


业务中端:案头工作AI替代,业务运转效率有望提升


诸如授信报告、审批报告等业务中后段强格式性的案头工作,ChatGPT潜在替代性较高。


适用范围:授信报告、审批报告、贷后管理报告等强格式性案头工作。


基于语言生成技术的应用目前暂无先例,仍有待探索。


对于对公营销、授信审批等岗位人员来说,工作中有很大一块时间被消耗在诸如授信报告、审批报告、贷后管理报告这些格式性很强案头材料的撰写上,占用了本可产生更大价值的客户营销、调研等工作时间。ChatGPT对于这一类主要可利用外部公开信息完成的强格式性报告具有天然的适配性,如果能够实现替代,展业效率预计能够实现较大幅度的提高。


科技基础:基础设施重构,算力需持续投入


正如ChatGPT成功的基础一样,银行投入相关研究需要持续投入资源,特别是要投入支持模型运转及数据计算的算力资源。


适用范围:银行科技基础设施建设。


近几年我国主流商业银行大多推动了“系统上云”计划,相应地将原本的主机架构转为有若干服务器组成的云架构。在这一转型中,大多数银行已经初步具备了算力基础,但要在人工智能领域做出突破性创新,仍需要在看清方向后对算力资源的持续投入。


比较具有代表性的银行基础设施转型情况如下:


  • 建设银行

率先实现“多专区多地域多技术栈多芯”布局,提供标准算力规模超 20 万台云服务器,整体规模和服务能力保持同业领先。

  • 招商银行

上云后可支持的应用更多,单位算力成本大幅下降。以信用卡为例,招行信用卡业务上云后,业务成本约节省了60%,算力提升了10倍。


人工智能的突破需要强大基础设施支撑,仍需持续投入及探索。


合规与成本:十字路口上的最大考验


在当前中美科技竞争大背景下,中国商业银行想要直接适用诸如ChatGPT这样高度依赖大数据支撑的技术,存在较大障碍和风险。


从成本和收益的角度来看,无论是接入API还是自主开发类似功能,均存在成本与收益的不确定性。


  • 数据隐私

银行数据的特殊性决定了应用第三方技术的审慎性,应用技术须考虑本地化、私有化部署模式。

  • 系统稳定

银行不掌握ChatGPT核心技术,很难控制内容输出的正确性,也很难确保系统稳定运行,这在经营中存在很大风险。

  • 成本投入

无论是接入ChatGPT,还是自主开发类似功能,均须较大成本投入,是否能够实现预期收益,存在不确定性。


数据隐私:银行数据的特殊性决定了应用第三方技术的审慎性


银行拥有的数据具有高度的隐私性和敏感性,直接应用开源第三方技术存在一定隐患。


  • 主要障碍


  • 客户隐私:使用ChatGPT可能会涉及个人信息的收集、使用和披露,需要遵守相关法律法规的规定并获得客户的授权。


  • 银行隐私:银行的数据不仅涉及客户隐私,还涉及自身的商业秘密,在使用开源第三方技术处理内部数据时,存在核心商业机密被泄露、酿成商业损失的隐患。③地缘风险:中美之间在技术安全、数据安全领域的争端愈演愈烈。今年2月,中方发布《美国的霸权霸道霸凌及其危害》报告,在此背景下,境内银行直接应用ChatGPT前景并不乐观。


  • 实践案例

据报道,美国银行、花旗集团、德意志银行、高盛集团、 富国银行等银行最近纷纷对使用ChatGPT发布了禁令。微软和亚马逊因担心泄露机密信息,禁止公司员工向ChatGPT分享敏感数据。埃森哲也警告员工不要将客户信息透露给ChatGPT。

  • 改进前景

同为人工智能技术服务商的科大讯飞,此前可以为客户提供本地化、私有化部署的产品,以解决技术应用和数据隐私之间的矛盾,或可为解决数据隐私与技术应用的矛盾提供思路,但地缘风险的影响仍有待观察。


系统稳定:内容输出正确性及系统运行稳定性受制于人


银行不掌握ChatGPT核心技术,很难控制内容输出的正确性,也很难确保系统稳定运行,这在经营中存在很大风险。

  • 主要障碍

由于在经济金融活动中的关键地位,监管对银行科技系统有着较高要求。诸如ChatGPT这一类外接应用,银行不具备技术自主性,一方面无法保证其输出内容的准确性,另一方面也无法保证不对其他系统运行稳定性造成影响,存在较大风险。另外, ChatGPT本质仍是依赖语料库的语言概率统计系统,对于语料库不涵盖的内容,极易给出错误答案。

  • 实践案例

据报道,2021年7月15日,某行突发系统故障,业务中断20多分钟,引发故障的原因可能与系统更新有关。

  • 改进前景

投产前需要对内容和系统稳定性进行周密验证。


成本投入:自主与合作,投入与收益之间的取舍


无论是接入ChatGPT,还是自主开发类似功能,均须较大成本投入,是否能够实现预期收益,存在不确定性。

  • 接入成本

目前ChatGPT API接口收费标准为每百万Tokens收费2.7美元(约18元人民币);同属OpenAI公司开发的Whisper语音转文本工具API每分钟收费0.006美元(约人民币 4 分钱)。以建行为例,假设文本转语音成本与语音转文本成本相同,推算建行仅智能客服一项每年成本需要额外投入约3亿元。(不含开发成本和对ChatGPT模型进行专属训练的成本。)建行2021年人均薪酬为33.71万元,如智能客服实际可替代人力少于890人,则效能并不显著。

  • 自主成本

ChatGPT初始投入成本在8亿美元左右,每年电费约1825万美元。考虑到中美电费差异,国内开发与ChatGPT同等功能的资金投入约为人民币初始投入56亿+1.7亿电费/年。(不含开发人员薪酬和维护成本。)但在开发环境、人才能力种种因素制约下,自主开发的类似工具能够收获与ChatGPT的同等效果,存在极大不确定性。2023年3月5日,科技部王志刚部长在两会部长通道表示,ChatGPT是个大模型、大计算、很好的计算方法,同一种原理,但做的质量还是不一样的。

  • 未来前景

大多数银行已有AI技术储备,建议根据业界前沿修正技术方向,在既有成果上继续探索,达成成本与收益的平衡。


03


上市银行:科技人才与科技投入决定科技进步潜力


科技发展需要人力及财务资源的投入,综合当前科技水平及科技投入情况看,平安、招行、工行、建行科技进步潜力较强。


  • 科技人员

在披露科技人员数据的21家上市银行中,科技队伍总人数11.6万人,占从业总人数的5%。工行在绝对人数上一枝独秀达3.5万人以上,浦发、招行、工行科技人员占比最高。


  • 科技投入

在披露科技投入数据的24家上市银行中,科技投入总额近1600亿元,占营收总额的3%。国有四大行在科技投入绝对规模占有优势;长沙、平安、招行科技投入占营收比重最高。





更多精彩内容请关注公众号:BFT机器人


本文为原创文章,版权归BFT机器人所有,如需转载请与我们联系。若您对该文章内容有任何疑问,请与我们联系,将及时回应。



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1