ChatGPT的诞生成为AI界的“iPhone时刻”,其出色的对话能力让其成为历史上用户增长最快的应用。通用大模型在全球引发关注之时,服务于更加细分领域的行业大模型也进入纵深探索阶段。
9月5日, “2023年中国国际服务贸易交易会·中国智能金融论坛”在国家会议中心举办。来自政府主管部门及金融、科技等行业的嘉宾,围绕人工智能大模型在我国金融领域的应用展开了热烈的讨论。
“如果哪一家银行过度依赖ChatGPT或者过度依赖大模型,它可能是一家银行走向衰亡的开始。”原中国银保监会党校副校长、国有重点金融机构监事会正局级监事陈伟钢在会上说,“如何让大模型更好助力金融业高质量发展,在技术应用的初始阶段厘清其中有关技术、监管的问题,显得尤为重要。”
大模型应用落地的最佳选择
银行业作为数据密集的行业,是大模型应用落地的最佳选择。中国邮政储蓄银行金融科技创新部高级信息技术专家朱峰表示,银行业沉淀了海量的结构和非结构的数据,比如交易数据、风控数据、贷前报告、贷后分析等,这些数据质量非常高,这既是大模型应用落地的良好基础,也是发展的内生动力之一。
在北京国家金融科技认证中心有限公司总经理张海燕看来,目前,大模型在金融领域的应用主要有三个领域。一是以智能客服、智能投顾,以及创新交互体验为代表的交互领域;二是在风控领域,辅助风险预判以及舆情分析;三是在生产工具领域,来辅助代码开发、金融咨询生成、嵌入式应用等,这也是目前通用大模型主的应用领域。
以百融云创打造的场景驱动的产业大模型——BR-LLM为例,其主要提供AI开发、智能交互、分析决策三种服务能力。在开发端,不仅适用于金融机构不同开发能力的技术人员,也适用于非技术人员实现自动化开发;在交互端,提供语言理解、多轮对话、语言处理、文本生成“听、说、读、写”四种能力,适用于金融营销、客服等场景;在决策端,为金融全生命场景的智能决策提供更全面的信息,为决策效率的提升注入更为强大的动能。在智能交互方面,百融云创智能语音机器人对客户语音识别的准确率达99%以上;在分析决策方面,BR-LLM能够凭借强大的信息挖掘能力,唤醒金融机构大量沉积的信息,大大提升金融决策的精准度和效率。
“大模型所提供的丰富的业务场景,为决策者提供更优的智能辅助,智能运营效率也得到提升,降低运营成本。”朱峰说。
“最关键的一点是以前我们数字化主要是在软件层面做事,实践业务被软件所定义,我们也应用了一定的判断式的AI帮助我们做数据决策。而生成式AI可以帮助我们实现更广泛的任务,可以帮助我们在决策系统上实现更好的数据驱动,并且期待可以执行越来越多的可重复的脑力劳动。”广发证券副总经理首席信息官辛治运指出。
除较为基本的任务执行应用之外,在创新性和挑战性更高的深度研究分析领域,部分机构也展开了一定的大模型技术的探索。比如,广发证券与华为盘古合作,搭建行业模型,判断企业财报是否存在财务造假,该模型的准确率可达到90%。
准确性和安全性值得警惕
大模型为金融业带来转型机遇的同时,其技术自身的局限性也为转型发展带来一定的挑战和风险。
“大语言模型并不能够解决所有问题。”中国工程院院士、清华大学计算机系教授郑纬民指出,大模型的本质是关联关系,利用海量数据中的语言来支撑,理解和生成内容。模型并不能够真正的理解语言,模型没有时间的概念,模型不懂数据,没有严格的推理能力,如果数据有问题,大模型很难在专业领域发挥作用。
“另外,大模型的不足之处在于模型可靠程度低,可能产生错误回答和不准确的回答,可解释性弱,难以解释决策和生产过程,自身推理能力差,训练成本高,这是模型的缺点。”郑纬民说。
技术的局限是一方面,另一方面如何让大模型能够应用到金融行业实体最核心的业务流程中,真正助力实体经济,对大部分机构都是挑战。中国农业银行研发中心副总经理赵焕芳表示,行内数据不能出集团内部,这是客户的基本要求。不同的行业差距很大,即使在同一个行业,不同的企业也有差距,同样是服务三农,农业银行服务三农的信贷产品,与工行服务三农的产品,它的金融产品不一样,属性也是有所差别,怎么通过行内的数据,来让大模型懂这些知识,训练真正懂金融、真正懂银行、真正懂农行的大模型,需要进一步探索。
如果要实现大模型的高效利用,本地化和个性化的部署是必不可少的。“但这也为机构带来了更大的成本压力。”张海燕说。
与此同时,一项技术所带来的安全风险,也需要监管机构和行业时刻警惕。数据安全问题是与会嘉宾频繁提到的关键词。朱峰表示,由于搭建大模型需要的算力庞大,大部分企业可能都不具备私有化部署的团队,部分企业员工的保密性不强,将企业的工作秘密通过应用方式上传到互联网,包括三星公司泄露芯片的机密事件,三星解密了ChatGPT的应用之后,将内部的数据库对接并咨询工程师芯片设计问题,导致他相关设计图和文稿出现泄露。
围绕大模型中的“数据”问题,朱峰还指出,需要注意到其中的数据霸权和垄断的问题,通用大模型通常使用公共数据语料进行训练,互联网上高质量的中文语料偏少,也缺乏良好的标注,所以目前呈现出来的大模型很多是以西方主流观点为主。
此外,隐含偏见和可能带来的技术滥用问题,虽然在大模型技术诞生之初就已提出,但放在当下去看,依然具有警示意义。“技术可能会生产出有害的内容,也可能会作为舆论攻击的工具。另外,生成内容涉及到侵权问题时,机器是无法担责的。”朱峰说。
尚需加强合作与监管
面对机遇和挑战,政府部门与行业更应合力,一方面推进大模型在行业的深度应用,另一方面提升监管水平,和技术同步发展。
“与普通模型相比,大模型具有更加复杂和庞大的网络结构、更多的参数和更深的层数。但更大规模并不等于更强模型能力。”百融云创AI创新负责人指出,“产业大模型考验的是算力+行业know-how+模型精调的综合能力。其中行业know-how尤为关键,这是专家经验、行业知识、组织能力、工程能力的综合体,而这也恰恰是垂直企业的竞争优势所在。”
搭建共识是技术与行业深度融合的第一步。张海燕表示,大模型需要大算力,当前国内算力市场面临算力供给短缺,国产AI生态不足,机房网络建设等情况,金融机构需要深化与产业各方的合作,来共同推动解决大规模算力部署和应用挑战。
张海燕还指出,大模型需要大合作,银行业需要加快探索引入业界通用的大模型技术策略和实践,通过推进大模型算法在银行业的应用实践,增强大模型能力,从而提升大模型服务金融行业的能力。在此基础上,提升创新能力,大模型要在银行业深化应用,就需要探索形成一套面向银行业的高标准、低门槛的银行业金融大模型应用模式。
“在数据方面,还应持续完善大模型数据工程建设,持续提升大模型数据清洗的工程化能力,高效去除有害非事实数据,助力大模型训练数据质量提升,并从单一的结构化数据转向多模态的全领域数据。”张海燕说。
陈伟钢表示,在这个过程中,早监管、及时监管非常重要。
2022年1月银保监会印发的《关于银行业、保险业数字化转型的指导意见》中强调,把服务实体经济、服务人民群众作为银行业保险业数字化转型的出发点和落脚点。“在确保金融安全的前提之下,我国的大数据和人工智能应用,应该要牢牢把握这个方向。”中国人民银行科技司原司长、中国互联网协会数字金融工作委员会专家委员会主任陈静在会上表示。
撰文:《中国报道》记者李士萌
图片来源:受访者供图
审发:张利娟