当前,AI技术正成为推动世界之变、时代之变的重要驱动力。从金融实践来看,AI已经在金融数字化转型过程中培育形成新质生产力,塑造出数字金融新生态。但与此同时,AI进一步发展也面临许多问题挑战,包括价值对齐、科技伦理、数据保护等。作为一名金融科技从业人员,我就AI未来发展、金融领域应用和科技伦理治理,谈一些思考体会。
交通银行副行长 钱斌
生成式大模型的迅速崛起加速了人类进入智能时代的步伐。过去一年,人工智能围绕算力、数据、算法三个方向加速发展,取得长足进步。
一是集约化将成为算力建设新趋势。2023年末我国数据中心机架总规模超过810万标准机架,算力总规模已达230EFLOPS,其中智能算力规模达70EFLOPS,同比增速超过70%。智能算力激增加速了人工智能产业创新发展,也带来了巨大的电力能源消耗问题。据预测,我国数据中心到2030年耗电量将超过4000亿千瓦时,约为当前三峡电站年发电量的4倍。与此同时,算力设备的冷却将消耗巨大的水资源,研究表明,到2027年全球范围内的AI需求消耗掉的水资源将超过1000万居民1年用水量。提升算力效能、降低能源消耗将成为实现人工智能产业高质量可持续发展的关键。去年12月,国家发改委、国家数据局等五部门印发《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,提出加快打造集信息计算力、网络运载力、数据存储力于一体的绿色安全综合算力体系,实现算力资源的并网调度和集约利用。
二是合成数据将有望成为数据扩充新来源。从文字诞生以来,人类将知识抽象压缩在文字中。如今,人类知识体系被再次压缩到大模型中,形成对世界知识的二次重构。然而,现存的语言文本数据存在大量重复,高质量数据资源稀缺,已成为大模型持续迭代的关键瓶颈。据Epoch AI预测,按照当前数据消耗速度,大模型最快将于2026年耗尽高质量数据、2028年耗尽互联网所有文本数据。而合成数据可以精确复制原始数据集的统计特征,又与原始数据不存在任何关联,具有全面性、多样性、经济高效等优点。从去年开始,全球科技巨头加速合成数据研究并用于新模型开发。今年5月,第七届数字中国峰会发布《大模型训练数据白皮书》,也将合成数据作为解决高质量数据供给不足的新方案。当然合成数据是否能大范围替代真实数据进行模型训练目前还有较大争议。如何突破人工智能领域的数据瓶颈、扩充新的高质量数据来源,尤其是中文语料数据,依然任重道远。
三是多模态已成为算法跃迁新方向。人类在理解世界时,不是孤立地处理单一模态的信息,而是通过视觉、听觉、触觉等多种感官通道综合感知。今年5月,OpenAI发布全新多模态大模型GPT-4o,进一步表现出对人类情绪的感知和表达,让人机交互在一定程度上发生了质的变化。随着AI逐步落地,更多复杂场景需要多模态来支撑,如多媒体创作需要文字、图片、视频之间互相生成和转化,自动驾驶需要实时感知和解析来自视觉、雷达等多种传感器的数据。可以预见,多模态将成为AI技术发展和应用突围的新方向。
人工智能作为当代创新最活跃、应用最广泛、带动最强劲的技术,已自然无缝地与生产生活的方方面面深度融合,展现出赋能百行千业创新发展的巨大潜力。
在产业经济领域,AI技术能够有效牵引生产和服务体系的智能化升级,促进产业链价值链延伸拓展、融合发展。在制造业,通过“数字孪生”创建虚拟工厂模型,实现对工厂的可视化和智能化管理,提高实际生产效率;“黑灯工厂”通过构建无人工干预的全自动化生产环境,实现高效、稳定和低成本的制造过程,引领智能制造上升到全新高度。在医疗行业,AI已应用于健康管理、智能诊断、药物研发和医疗机器人等领域,AI参与的基因编辑已成功编辑人类细胞中的DNA,加速多种遗传疾病精准治疗的发展。
在政务民生领域,AI技术助力数字社会、数字政府建设,以数字化手段促进民生改善和治理能力现代化。例如,上海市以“高效办成一件事”为牵引,打造“智慧好办”政务服务,应用人工智能实现“少填少交智能审”、申请材料政府主动生成。运用AI大模型打造基层社会治理的“新帮手”,面向居民提供各类服务政策智能检索问答服务。运用AI构建城市智慧大脑,引入智能交通系统和无人机移动巡检,准确预测交通拥堵状况,提供智能道路规划,提高城市运行效率。
在国防军事领域,AI技术在军事模拟训练、情报分析和指挥控制等领域的应用,正逐步延伸作战空间,改变传统的战争方式和军事策略,信息通讯、战场感知、无人化等基于高新技术的战斗力建设变得尤为重要。在现代战场,面对无人机的远程攻击,坦克变成了严重落后于时代的战争兵器。今年3月,美国国土安全部发布《2024年人工智能路线图》,探索在国土安全领域开展人工智能应用。欧洲国际防务展中,地面机器人、无人机、制导装备、指挥中心等几乎所有展示的系统都有人工智能的影子。可以预见,未来战争将是作战双方算力、算法、数据的全面抗衡,超算中心和大模型将是新时代的大国重器。
人工智能作为新质生产力的代表,已经在金融数字化转型实践中展示出强劲推动力和支撑力。今年,交通银行在制定数字金融行动方案的基础上,加快“人工智能+”行动方案制定,力争在更深层面、更广范围推进人工智能实践,促进数字金融高质量发展,服务金融强国建设。
一是运用人工智能践行以人为本,推动普惠便捷。为满足人民群众多样化的金融需求,交通银行以“数据+智能”双轮驱动,从信用端、信息端切入,致力提供更普惠、更便利的金融服务。在服务更普惠方面,我们革新服务模式,通过深度学习和大数据分析,对客户进行多维度精准画像,推出基于统一客户信用体系的预授信模式,实现从产品级授信向客户级授信转变、从客户主动申请向银行预授信转变,有效扩大信贷范围、提高融资可得性。我们进一步使用算法模型标签,推动客户产品精准对位,多渠道增加居民财产性收入。在服务更便利方面,我们重塑业务流程,基于音视频、图像识别、生物识别、智能语音等技术,打造客户身份远程核实场景,提供人像比对、人证比对等多项能力,将税融通、普惠e贷、抵押贷、车贷等产品的核实时间从几天缩短至几分钟。我们突出移动优先,加强线上线下融合,打造智能语音客服,呼入业务语音识别率达99%,应用虚拟数字人技术提供全天候服务,持续提升线上渠道对客服务能力和水平。
二是运用人工智能服务实体经济,创造共同价值。交通银行聚焦经济发展的重点领域和薄弱环节,不仅关注企业的短期盈利能力,更着眼于企业的长期发展和创新动力,为实体经济提供更全面、更精细的金融服务。交通银行根据科创企业不同阶段的发展需求,提供全周期金融服务,促进科技成果转化应用,助力发展新质生产力。通过对接国家、地方、园区、企业不同层级数据,打造集成电路、人工智能、高端装备制造等产业图谱,推动科技企业资产数字化、产业链条透明化。在此基础上进一步搭建“1+N”科技型企业专属评价模型,应用于客户营销、产品设计、信贷审批、额度核定、贷后监测流程,已覆盖73万户科技型企业,助力科技型企业做大做强。我们将智能化手段融入绿色金融体系建设进程。推进绿色智能识别,构建企业ESG智能风险评价体系,助力提升绿色信贷精细化管理水平。为绿色产业链属企业提供“一户一方案”服务模式,有效支撑传统产业低碳转型和绿色产业发展壮大。
三是运用人工智能强化风险防控,实现稳健经营。近年来,金融领域的诸多案件表明,犯罪分子的洗钱、欺诈手段越来越多样化,隐蔽性越来越强,客观上加大了银行防控工作难度。交通银行加速推进全面风险管理数字化转型,运用数字技术全面提升信用风险、操作风险、合规风险等领域的风险防控能力。譬如在信用风险领域,我们依托多维度的行内外数据完善客户信用评价体系,构建关联关系图谱,实现信用风险总额管控和穿透管理;通过机器学习技术完善风险监测预警机制,建立信贷逾期预测模型,前瞻精准识别风险资产超百亿元,年回收资产数十亿元。在操作风险领域,我们通过OCR比对、RPA自动核查等手段,有效识别合同造假、抵质押物权证造假等欺诈行为,年自动核查约15万件权证;通过制定反欺诈实时风控策略,拦截疑似电信诈骗交易金额数十亿元,全力守护好老百姓的“钱袋子”。在合规风险领域,通过端到端AI模型的应用,减少30%的反洗钱筛查任务量,单笔任务节省40%的核查及报告编写时间,并通过隐案挖掘等模型有效提升50%的反洗钱上报率。
国家主席习近平在联合国贸易和发展会议成立60周年庆祝活动开幕式发表致辞时提出,坚持以人为本、智能向善,在联合国框架内加强人工智能规则治理。推动问责、公平、安全和可信的人工智能应用,是迎接人工智能时代的必然选择和应尽之责。
一是坚守正确的科技伦理。西湖大学校长施一公介绍,人工智能在3年内就预测出近7亿个蛋白质或大分子空间三维结构,而人类此前积累的全部数量仅约20万个,正是因为人工智能的介入将科研由手工生产变成了工业化生产。另一则新闻是美国重要智库Mitre发布了一张人工智能系统对抗性威胁的场景图,呈现出人工智能应用于从侦查踩点、网络渗透,到维持控守、数据获取,再到秘密传递、后场处理等网络攻击全链条场景,威力之大,超出想象。两个案例从正反两方面,充分表明人工智能运用得当,将造福人类;运用不当,可能引发灾难,其所带来的危害将不亚于核武器,而全世界只有9个拥核国家,但可能会有无数个滥用人工智能的团体,少数人给世界带来灾难的风险在大大增加。可信AI,智能向善,刻不容缓。同样站在金融的角度,我们要防止金融服务过程中的信息茧房、数据偏见、隐私泄露和市场操纵,要防止模型歧视所可能引发的侵权事件,建立模型持续运营机制,对模型输出开展审计,确保AI技术符合伦理法则和社会价值观。
二是加强算力资源整合共享。人工智能大模型所需算力每3~4个月就翻一倍,以新材料、生物制药、金融科技、深海深空等为代表的前沿科技和未来产业,都对算力提出了前所未有的需求。但当前全国范围的算力“小高炉”现象普遍存在,快速增长的主要是低端算力,而围绕大模型、自动驾驶等AI任务所需的高端算力仍然缺口较大,供给端与需求端存在结构性错位,甚至造成能源与资金浪费。建议要研究建立国家级的云计算底座,有效统筹大模型在训练、推理等不同环节所需的算力资源,合理分工,避免人工智能基础设施出现低水平重复建设。在行业层面,要探索建立AI算力云,提供公正、可信、可共享的算力资源,推动实现设施绿色低碳、资源高效调度、算力灵活供给。
三是强化数据供给与数据治理。为了确保大模型的应用效果和可信度,我们需要对训练数据的量和质提出更为严苛的要求。经过多年的信息化建设,金融机构普遍积累了大量结构化数据和数据处理经验,但相对于大模型,还远远不够。在具体实践中,一方面需要着力丰富数据种类、强化数据治理、提升数据质量,建立“业务沉淀数据要素、数据要素转化为数据资产、数据资产反哺业务发展”的闭环机制;另一方面,需要建立高效稳定的数据标注体系,对训练数据进行辨别、清洗、加工,确保数据支撑有力、标注专业统一,为建模提供坚实基础。要全面落实数据安全法律法规与监管要求,建立健全数据分级分类管理和数据全生命周期的安全保护能力,保障金融数据和个人信息安全。
四是推动大模型生态建设,积极开展模型治理。大模型研发具有人才密集、技术密集、资本密集的特性,通常由少数高效能的研发组织主导,目前信创大模型数量已超过200个。一方面大模型研发缺少具有显著创新性的原创理论支撑,导致多数大模型技术路线趋同,同质化严重,一定程度上造成了资源浪费;另一方面在探索“大而强”通用模型的同时,结合具体应用场景研发“小而美”垂直行业模型的资源投入相对不足。建议发挥产业上下游合力,推动产学研深度融合,建立国家、行业基础性规划,加强合作协同,构建自主可控、共生互补、健康可持续发展的良好生态。同时,要大力推进负责任的模型治理,解决AI应用存在的模型决策不透明、难以“白盒化”等问题,确保人工智能合规、安全、有效应用。包括建立模型评估与监测机制,定期对模型进行质量检查、性能评估、运行监控、风险审计,确保模型稳定运行;增强模型安全防护,研究深度防伪技术,建设对抗训练平台,提升模型外部风险防控能力。
五是完善AI工程化人才培养。AI工程化人才是推动AI技术创新和应用的关键人才,在数字化转型中发挥重要作用。积极培育AI工程化人才队伍,一方面要通过自主培养、产学研深度合作等方式,着力造就一支知识型、技能型、创新型的工程化人才队伍;另一方面要通过人才引进、消化、吸收及合理流动,充分激发创新活力。
(此文刊发于《金融电子化》2024年8月上半月刊)