北京银行深入践行“一个银行(OneBank)、一体数据(OneData)、一体平台(OnePlatform)”理念,以“双客”体验为中心,以价值创造为导向,深度应用AIGC技术,加快构建知识驱动的大模型应用体系。
2023年,AIGC和大模型产业井喷,推动人工智能加速渗透进百行千业,引发生产力与创造力革命。北京银行坚持以系统化思维,深度应用AIGC技术,全方位布局人工智能与金融场景的深度融合,逐步形成以大模型为核心算法,多模型适配、多任务插件、多源知识互补的大模型应用体系,支持业务部门以AIGC能力重构场景和体验。
北京银行首席信息官 龚伟华
自2023年2月北京银行开始探索大模型在金融领域的应用,2023年4月,上线首个大模型问答工具京智助手,后续经过多次版本迭代,先后引入Vicuna、ChatGLM、百川等开源大模型,将行内知识库与大模型相结合,实现了行内知识的检索问答,并集成外部数据查询、RPA插件,探索大模型在数据查询、任务执行等方面的应用。
2023年8月,在前期建设成果的基础上,北京银行启动AIB金融智能应用平台建设工作,联合11个业务部门,整理了超16万条金融知识,面向理财经理岗、大堂经理岗、客户经理岗、综合柜员岗、远程客服岗提供理财产品查询、业务问题解答、组合金融资讯、客户营销话术、宏观政策研究、行业发展前瞻等实时在线支持。AIB平台逐步构建起前中后台全覆盖的智能应用体系,打造人人能用、人人会用、人人想用、人人好用的AI工具,全面提升业务专业化水平。
大模型应用体系自下而上包括算力层、数据层、框架层、模型层、应用层。具体而言,算力层包括GPU、NPU、CPU、内存等计算资源,支持基于信创AI算力进行大模型训练和推理。数据层建立全行知识库,整合行内规章制度、产品知识、业务流程等信息,加载至向量数据库中进行统一存储和管理。框架层构建大模型推理和训练能力,支持模型精调、模型评估、模型推理、搜索增强、提示工程等大模型基础能力。模型层支持多种行业主流基础大模型部署应用,可根据具体的金融场景和任务,融合金融知识进行模型精调,生成金融行业大模型和场景任务模型,支持根据业务场景需要,择优使用。应用层对接业务场景和应用系统,提供大模型应用服务。
为了更好地与业务场景结合,北京银行在大模型技术实践中采用Agent智能应用、金融知识库、智能检索、模型微调等技术,提升了大模型在金融场景应用的灵活性、可解释性、安全性和可适应性。
建立大模型驱动的Agent智能应用能力,实现大模型能力快速对接。自主研发大模型驱动的Agent智能应用能力,提供流程编排、插件开发、Agent部署等全方位功能支持,Agent具备语义理解、任务规划、插件调用等能力,可支持智能问答、知识检索、数据分析、任务执行等业务场景应用。Agent技术是一种能够实现环境感知、决策制定和执行动作的智能实体,其核心驱动力在于大模型,但除此之外,北京银行还增加了规划、记忆和工具使用等关键组件,这使得Agent不仅能够理解并响应环境,还能根据目标进行独立思考并采取行动,通过可组装能力实现人机协同,从而提升业务价值。
建立多元化金融知识库。采用向量数据库、知识图谱等技术,针对从营销策略、操作规范、监管政策到内部审计等多个关键业务环节,形成一套全面、立体的金融知识图谱体系,确保所有业务决策和内容生成都有扎实的数据基础。打破“数据孤岛”,与各个业务系统实现数据互通,建设北京银行专属的大模型生态,真正做到服务一线、服务业务。
自研数据查询和搜索引擎,提升金融应用的准确性。打造融合正排索引和倒排索引的搜索引擎,能够迅速准确定位并提取大模型所需的金融知识点,基于最新、最权威的数据生成内容,提升内容的专业性和可信度。同时,系统自动引用知识来源,增强了生成内容的透明度和可追溯性。另外,自研Text2SQL算法,并构建指标知识领域的专家模型,以大模型连接指标知识库,解耦底层复杂数据结构,避免“AI幻觉”捏造字段、虚构取数口径,一本正经胡编乱造等现象。
基于信创算力和框架,构建L1行业大模型构建和L2场景任务模型。利用信创算力和框架,针对银行业务特性对大模型进行微调,通过锁定预训练模型的部分参数,加入专门针对行内积累的金融知识库训练得到的旁路矩阵,使模型在保留原有通用能力的同时,增强在处理金融场景问题时的泛化能力和专业适应性,确保生成内容更符合银行业务实际需要,有效服务于复杂业务场景。
银行业作为强监管行业,在政策方面一直遵循高标准和高要求。中小银行机构在进行大模型应用探索时,还面临算力资源不足、训练数据欠缺、算法不安全等诸多问题。
算力资源不足。大模型的训练及推理需要有足够的AI算力支撑,硬件设备的采购和维护需要高昂的资金投入,给金融机构带来较大的成本压力。同时,在高端GPU芯片断供的背景下,金融机构针对中高端AI算力的需求存在较大缺口,当前信创AI芯片的应用生态还不完善,适配涉及CPU、操作系统、云平台、AI框架、加速框架和算法模型等多个层次,适配工作复杂且难度大。
训练数据欠缺。数据是大模型训练的基础,为了切实解决金融业务问题,需要针对具体的任务场景,采用大量高质量、多领域的金融数据大模型进行增量训练。单一金融机构掌握的数据资源较为有限,一定程度上影响大模型应用效果。金融数据敏感性高,在数据分级分类管理、数据脱敏清洗、防止数据偏见和滥用等环节也存在难题。
算法安全度存疑。在安全可信方面,大模型本身存在幻觉问题,其训练数据难以溯源、生成内容不可信、计算过程不可解释,难以直接应用于数据准确性要求高、业务流程复杂度高的金融场景中。另外,在科技伦理方面,大模型还可能引发算法歧视、道德、造假等科技伦理风险,影响金融业的健康可持续发展。
随着金融领域垂直大模型的深入发展,银行业大模型应用将更多地触及银行核心业务。北京银行将紧跟大模型产业发展动态,加强多模态大模型的研究和场景应用,持续在平台建设和场景创新两方面进行探索。
在平台建设方面,持续建设大模型应用平台,统筹大模型算力、模型、数据管理,逐步积累大模型训练数据,提升大模型的安全性,利用Agent能力,实现与行内其他中台能力的快速对接和集成,为各业务线利用大模型访问数据、执行业务流程提供技术支撑。
在场景创新方面,探索大模型在全场景、多领域的创新应用,深度结合信贷、协同办公、精准营销、智能客服等场景,利用大模型技术实现信贷报告生成、智能会议纪要、营销文案生成、客服工单小结等功能,赋能一线降本增效,夯实“大科技”基础,进一步提升数字化转型能力,全面构建以人工智能为驱动的商业银行。
(此文刊发于《金融电子化》2024年6月下半月刊)