自2022年11月ChatGPT成功推出以来,AI大模型迅速成为当下社会各界关注讨论的热点话题,激发了各机构积极探索AI大模型创新应用。党和国家对通用人工智能高度重视。2023年4月28日,中共中央政治局会议指出“要重视通用人工智能发展,营造创新生态,重视防范风险”。证券行业是信息数据密集型的行业,无疑将迎来AI大模型的广阔应用前景。
深圳证券交易所总工程师 喻华丽
证券行业场景丰富,拥有海量数据资源,数字化与智能化需求迫切,是大模型创新应用的重要领域。具体而言,大模型对于证券市场的重要意义有如下几点。
1.推动证券市场各领域的变革,提升科技赋能水平。大模型所具备的涌现现象和解决多个不同任务的通用能力,为证券市场的数智化建设和创新发展注入新的活力。在大模型出现之前,AI对于投行、投顾、投资、企业运营等赋能比较有限。大模型与这些业务领域结合,重塑证券市场各领域环节的服务模式,开辟新赛道,带来生产力方面的巨大飞跃。
2.重塑市场竞争新格局,提升市场运作新效能。回顾证券市场发展历程,每次技术创新变革浪潮都会打破原有的市场生态与竞争态势,推动新一轮的市场竞争发展。基于大模型和海量数据的生成式AI所具备的强大数据分析和推理能力,有利于激发产品业务与市场创新,为市场参与者提供更丰富的个性化、专业化服务,提升用户体验,从而大大提升市场运作的效能。
3.开启知识体系新范式,提升证券监管与风险防控能力。大模型具备强大的内容生成和分析推理能力,实现了人工智能从传统识别分析到生成创造能力的跃迁,对原有的知识生产和传播方式产生深刻影响。作为一种新的方法技术与手段,监管机构将大模型应用于上市审核、发行承销监管、持续监管等全链条环节,有助于增强监管效能,防范化解金融风险。
正是因为大模型对于证券行业的重要意义,境内外证券机构积极开展大模型探索实践。伦交所于2023年8月对外披露,正在和微软共同创建定制大语言模型,探索将伦交所拥有的大量数据,以安全和专有的方式,与银行客户的数据结合起来。例如,拥有海量专有数据的大银行借助大模型技术设定交易策略,进一步提升风险防范能力。2024年5月,纳斯达克宣布,在其市场监控技术解决方案中利用生成式人工智能简化调查可疑市场操纵和内幕交易所涉及的分类和检查流程。
境内证券基金等机构在大模型应用方面处于前期探索预研阶段,结合自身业务场景需求,设立预研课题,测试大模型平台的解决方案与服务能力。根据2024年证券期货业金融科技研究发展中心(深圳)立项课题数据显示,涉及大模型的专项研究课题就有48项之多。
证券市场应用场景丰富,面对当前大模型创新应用的发展态势,积极探索大模型在证券市场的落地实施,有助于提升科技赋能水平,推动市场高质量发展。
1.大模型分类。根据大模型应用场景的通用化、专业化程度,目前大模型可分通用大模型、领域大模型、任务大模型,各层模型训练数据规模和投入算力逐层递减,专业属性逐层增强。因此,为满足行业业务场景需求,在应用路径上,应引入通用大模型,在此基础上通过行业数据预训练生成领域大模型,然后再对领域大模型进行模型调优,生成任务大模型。
2.实施关键。由于通用大模型、领域大模型、任务大模型适用于不同的应用场景,在模型构建应用时,根据不同的关注重点,需要做好如下方面的实施关键环节。
一是选择好通用大模型。梳理通用大模型能力评测体系,要从文本生成、语言理解、知识问答、逻辑推理、数学能力、编程能力、多模态等角度,建立测试评估标准,组织开展模型能力评测工作。考虑到通用大模型仍在快速发展中,需要重视通用模型的扩展性,并建立模型能力的及时更新机制,以及领域大模型、任务大模型能力的同步更新方案。在大模型厂商选择方面,除了考虑模型能力之外,还需要考虑模型研发配套的平台工具以及与现有行业云设施的兼容性、未来战略合作意愿等因素。
二是构建好领域大模型。基于选定的通用大模型,发挥交易所引领作用,组织行业机构参与领域大模型的定制化共建,形成合力,梳理并贡献领域大模型高质量可用训练数据,协同加强标注提示工程,依托行业云加强大模型环境设施搭建,以及周边系统应用对接,与大模型合作厂商加强行业模型训练调优等工作,提升领域大模型的研发效率。
三是调优好任务大模型。将领域大模型进行私有化部署,搭建内部模型训练推理环境,结合自身内部的应用场景,利用自身领域内的数据对其进行模型调优。其次,要充分利用高质量的内部历史数据,加强内部数据标注反馈与校准,提高任务场景应用精度。此外,加强任务场景提示工程建设,通过问题上下文,获得更高的精确性。
四是开展好检索增强模型调优。针对某些任务应用场景可靠性和及时性要求,还可以引入检索增强模型调优。即基于大模型强大的语言理解能力,可利用它将用户指令翻译成“需对接数据库中的哪些数据源”,再将用户的需求与内部数据库相链接,这样通过检索获取高可靠数据源,由此再与大模型进行交互,利用大模型文本生成能力,获取与用户相配的精准性回复结果。
作为证券行业的重要平台,交易所在行业内发挥着关键的科技引领作用。考虑到大模型建设是一个庞大且复杂的体系工程,研发门槛高、工程大、投入多、周期长,在应用路径规划上,选择合适场景开展探索试点,逐步迭代,分阶段分层次推进大模型应用。
一是加强组织领导,强化统筹规划。做好大模型应用实施规划,建立健全组织体系,紧密协同技术与业务,构建专门的项目实施团队,如技术小组、业务小组等。加强与行业机构的协同,推动领域大模型共建共享,赋能行业智能化发展应用。同时,加强与科研机构和科技厂商的协同,充分吸收外部机构可用的研发成果。此外,在符合国家法律法规要求的前提下,开展大模型的应用实施,确保大模型的设计、开发和应用全过程合法合规。
二是坚持从小切口场景入手,在迫切需求的场景上实现点的突破。交易所大模型应用场景丰富,考虑到大模型落地实施投入大,优先选择具备业务需求迫切、数据样本多、业务容错度高、解释性好、业务参与度高、合规风险小等优势条件的应用场景,开展试点攻关,实现点的突破,并积累大模型调优实践经验及标注反馈数据语料,为大模型在交易所的全面落地应用奠定基础。
三是根据大模型应用实施规划,逐步推进技术平台建设。前期着眼于构建推理平台,后续逐步建设训练平台。考虑到大模型推理平台算力要求低,而训练平台算力要求高,前期将选定的交易所小切口场景与现有厂商的通用大模型进行本地化应用对接,搭建本地化推理平台环境,开展交易所业务场景的试点应用,实现大模型的快速赋能。根据试点应用的效果,逐步建设数据语料平台和大模型训练平台,结合证券市场及交易所数据,训练领域大模型和任务大模型,赋能交易所各类场景任务的业务应用。
当前大模型技术仍处于快速发展阶段,其所展现各种智能化能力仍在不断涌现,未来必将不断提升证券市场智能化运作水平。深交所密切关注大模型发展趋势,视大模型为未来变革性的重要技术,将大模型作为“塑造国际领先的数字化体系”这一数字化战略的重要抓手,重点研究智能体、迁移学习等新技术,不断提高大模型预测推理的精准性,积极扩展应用场景,在交易监管、上市审核等场景开展大模型应用实施,并对生产部署的模型应用效果进行评估,持续优化完善模型能力,助力打造智慧交易所。
此外,紧密携手市场各方参与者开展数据语料治理,共建高质量大模型,打造智能化基础设施底座,并通过深证云部署大模型赋能证券市场各领域环节,促进业务技术的深度融合,构建行业数字化新生态,推动行业科技进步与创新发展,服务资本市场高质量发展。
本文得到国家重点研发计划项目(2022YFC3303305)资助。
(此文刊发于《金融电子化》2024年8月上半月刊)