拜“金”大模型，蛋糕难啃？

作者：亿欧网发布时间：2024-10-10

对于金融行业而言，人工智能并非新客。

上世纪80年代，华尔街的交易大厅里，喊单的声音此起彼伏。喧嚣背后，算法交易悄然兴起。简单的程序开始替代人手，执行预设的交易策略。这是人工智能在金融领域的初次试水，也是技术革新的序章。

进入21世纪，机器学习和数据挖掘技术的成熟，使得金融机构能够更精准地预测市场走势，洞察投资机会。

到了今天，可以明确地说，人工智能将是未来几年参与者提高竞争力的最核心机会，也是最后的机会。

大模型作为推动人工智能发展的关键技术之一，始终吸引着无数目光。九月ChatGPTo1-preview在复杂推理任务上取得重大进步，推理新范式的创新，使得性能得到了显著提升，被视为AI时代的又一个里程碑。

金融机构也在过去这一年与AI的循序融合，逐步摸索出“大模型+小模型”的落地方式，大模型做全面，小模型做精细，能够更好地满足金融业务对高准确性和高效率的要求。

金融领域的大型模型本质上是一种提高效率的工具，需要结合具体的业务环境才能发挥其潜力，也就是无场景就无价值。相较于过去云和自动化相关的技术转型，人工智能其实能以更自然的方式与人进行互补。

从业务流程上来看，金融机构的任务主要是利用大模型重新执行过去由大数据技术完成的工作，在业务价值的释放上，也应当从最基础的客户获取和运营环节入手，逐步优化运营流程，提高效率。

不得不说，简单用AI赋能数字化转型并不能概括这一推动，这将是一次深度的业务变革。

金融机构大模型应用四大模式

随着AI的能力不断增强，能够承担以前需要人工操作的越来越复杂的任务，银行有机会以更快、更好地开展更广泛的活动，用更少的投入做更多的事情。回望过去一年，尽管许多银行在大模型领域的尝试都围绕在“降低成本”，但也涌现出金融业大模型相关应用的四大模式。

一体化的大模型解决方案

由大模型厂商将预训练和微调过的通用大模型或垂直大模型交付给金融机构进行私有化部署。

目前，就金融领域而言一体化解决方案更多出现在中小创新型金融机构，拓尔思-拓天大模型、华为-盘古大模型都在金融领域的解决方案落地较多。其中拓尔思在金融领域的的落地颇受好评，有不少头部机构已经在应用基于拓天大模型研发内容生产智能助手、新一代搜索与推荐等插件。盘古金融OCR大模型与广东省农信联社的单模型覆盖多个通用的文字识别场景案例也已落地。

与大模型厂商联创自研大模型

由大模型厂商提供基础大模型，基于金融机构数据、语料，技术团队共同进行微调，衍生垂直大模型，私有化部署。

最为典型的就是农业银行基于基础大模型，自研大模型小数（ChatABC），也是同业首个自主创新的金融大模型应用，目前已经在智能问答、智能客服、辅助编程、智能办公、智能风控等多个领域进行应用与深度探索。

邮储银行与智谱AI战略协同，推动通用大模型为基础，与金融大行共同研发探索AI落地的场景。

国泰君安与阶跃星辰、财联社共研多模态证券大模型“财跃F1”，赋能客户智能化服务体系。

API接入商业大模型，外挂知识库建设

金融机构选择合适的商业大模型API接口，通过RAG进行知识库管理建设和应用，私有化部署。

知识库管理作为大模型落地的最顺畅路径，目前大部分对于大模型有所探索的金融机构都纷纷有过尝试，多基于开源大模型进行知识库外挂，为从业人员提供内部知识库问题等功能。相对而言更多分布在研究分析需求较大的证券行业。

接入大模型赋能的SaaS、大数据系统、智能助手等等

当下很多软件解决方案厂商自身也在做大模型的技术融合，并且有了一定成果，金融机构选择在某些业务流程上进行AI大模型功能的应用叠加或是采购大模型应用软件，来助力员工效率。

例如，兴业银行、中信银行接入百度“文心一言”主要应用在人机对话的流程场景。银行通过百度智能云调用“文心一言”提供的跨模态、跨语言的深度语义理解与生成能力，提升客户体验，助力员工效率。

金融大模型：既是诱人的蛋糕，也是硌牙的石头

尽管金融领域作为大模型落地的最佳土壤，对于大模型企业而言，面对强甲方属性的银行机构，也频频出现要求高、交付难、维保难等等问题。对于厂商而言，这块金融蛋糕人人都不想放过，但吃下去的确不容易。

百模大战时期，几乎超过60%企业都把金融领域放在了射程内，华为·盘古金融大模型、百度·文心一言、腾讯·混元、科大讯飞·星火大模型、阿里·通义千问、商汤·日日新大模型、智谱AI、百川智能、星环科技·无涯、拓尔思·拓天大模型、360·金融大模型、云知声·山海大模型、月之暗面、Minimax、阶跃星辰等等。

从现实角度看，金融领域的大模型解决方案实际交付并不多，金融业大模型招标项目量也逐步下降。金融领域看起来是一块诱人的蛋糕，但是吃起来却有点硌牙。

以百川智能为例，其一开始看中的主要应用赛道是医疗和金融两大领域。业内人士向亿欧网透露，百川智能内部对于赛道的争议和分歧也比较大。“有说要聚集医疗大模型的，有说金融很重要的。”

从外界观察来看，2024年3月，多家媒体报道，原中关村科金副总裁邓江加入百川智能，作为商业合伙人担任金融事业群总裁职务，负责金融行业解决方案的打造以及合作生态的建立。这足以表明百川智能在金融领域的决心。

但是到了2024年7月份，百川智能确认完成50亿元A轮融资后，对外的声音传递是要“聚焦医疗大模型”。

令人费解的是，2024年9月服贸会期间，邓江以百川智能副总裁身份现场演讲时曾表示，“我们始终在医疗和金融领域做持续的战略投入。百川智能在医疗和金融领域取得了突破性成果，我们的大模型通过美国和中国的医师职业资格考试，而且是很高的分数，证明我们的大模型在医疗知识能力上已经具备了一个医疗毕业生甚至一个医生的水平。另外在金融领域，我们在国内公开评测榜上保持第一梯队，这个评测是非常复杂的，也就是说我们对金融知识的理解也达到了人类的水平。特别是在金融场景，我们已经在很多金融机构有很现实的应用落地，来提供脑力的供给。”

如果仔细看百川智能最近对外信息传递，甚至是王小川本人的声音，我们不难发现，百川智能业务核心围绕着医疗是确认无疑了。以《中国企业家》近期的《独家对话王小川：大模型创业公司，都要走出互联网大厂的射程》报道为例，“医疗”一词出现了35次，而“金融”一次也没有。

在金融领域，有大模型服务厂商知难而退，对于还在牌桌上的企业来讲，未尝不是好消息。从需求本身来看，金融机构持续布局大模型并未暂停脚步。在2024年中报中多数金融机构提及了对大模型的投入与探索，可以说，AI大模型已经站稳金融业的核心赛点位置。

单从金融大行的推动路径来看，大部分倾向于自研大模型，多数已经将大模型纳入长期战略规划，加大技术研发投入，增加数据中心GPU储备，成立专门的人工智能部门或实验室，推动大模型在业务中的应用。

从投入的角度来看，即便对金融机构这样的金主来讲，也是一场“烧钱”之战。

首先，基础大模型的质量决定了垂直应用的精准性与好用度，但当前中国绝大部分基础大模型的技术突破路还很长。以ChatGPT为标杆，国产大模型大部分还在GPT-3.5水平，而从GPT-3.5到GPT-4的训练，保守估计训练一次最少要用到8000张GPU，从GPT-4到今天的GPTo1，必然是万卡集群的支撑，为了应用到金融领域还需要高质量数据再进行微调，初始投入巨大。且大模型的训练和部署需要高水平的技术支持，涉及高端的AI算法和技术人员投入。

大型金融机构可以持续性投入，抢占技术高点，造就金融大模型技术护城河。但对于小型金融机构而言，当前“外挂知识库、大数据智能化分析、SaaS类、AI助手”的方案，成本低且效益高。如果能在适宜的场景落地，也可以助力业务的开拓和人力成本的降低。

当然，从金融从业角度来看，即使金融领域的结构化、标准化、流程化最适合大模型落地，其实也不需要担心人工智能会大规模取代人类。相反，人工智能有潜力增强劳动力，大幅提高处理能力和质量。这种情况下，人类劳动力的角色自然会转移到更高的层次，同时也有更多的精力用于基于关系、面向客户的角色，进而进一步推动金融业的核心目标“以客户为中心”。

从当前市场来看，走到下一个阶段，预估会出现小型银行与中大型银行共享模型，共连应用。更有实力的中大型金融机构作为行业协同的领导者，为偏小型金融机构提供技术输出乃至人才输出。从这一点看，金融系科技子公司或许有可为。