自从ChatGPT掀起通用大模型的发展浪潮之后,AI的题材炒作已经持续了半年左右。但是大模型只是变革的开端,将AI与产业结合才能真正实现生产力的全面跃迁。
因此,近期不少人开始将视线投向大模型在垂直领域的应用上。相比通用大模型带来的无限想象空间,垂直领域的行业大模型因为足够贴合场景,解决的是更为具体的需求,带来的确定性更强。
当然,垂类大模型在领域应用中也面临一些具体的问题,比如怎么控制成本、如何精确对接场景?
对此,百融云创CEO张韶峰在近期的投资者路演活动中以大模型对于智能运营业务场景赋能给出了一些攻略。“智能运营业务作为金融机构数字化转型的关键环节,在大模型加持之下,增添了更为高效的翅膀。”张韶峰表示。
特定行业更需要垂类大模型
作为学院派创业者,张韶峰的关注点一直聚焦于AI领域。他说,在百融云创的创业之路上,先后遇到两次AI产业巅峰时刻,一次是AlphaGo击败世界围棋冠军;另一次便是ChatGPT的横空出世。
两次发展浪潮先后推动了判别式和生成式两大技术派别交替成为主角,在AI技术的演进之路上,百融云创是见证者,更是积极参与者。与此同时,产业革新还伴随着大模型时代的崛起。
尽管大模型向世人诠释了一场耳目一新的变革,但对于金融、医疗、教育等垂类领域来说,大模型的应用仍存在一些制约瓶颈。
例如,即便掌握着更大的参数、更强的算力,通用大模型仍因为行业语料等限制,在垂直领域的运行效果出现边际递减;再例如,“外挂式”的垂类AI大模型往往不具备规模化优势,使得大模型的运营成本高企。
“相比通用大模型,针对特定行业训练的大模型在垂直领域的智能交互中表现更佳。”张韶峰说。在他看来,对于垂直行业来说,模型之“大”并非万能,能够跑通小闭环更需要具备两项关键能力:算法调优与行业积累。
据了解,百融云创(百融云-W,6608.HK)凭借多年构建的AI原生应用经验,基于深度学习Transformer框架,结合自然语言处理(NLP)、智能语音等技术,专门训练了用于金融领域的大模型BR-LLM。
与Bloomberg GPT相一致,百融云创大模型BR-LLM聚焦于对于金融领域的落地应用。为了提升对于金融场景的理解能力,百融云创在自主搭建大模型底层框架基础上,开源数千亿tokens的中文预训练数据集来训练模型,并通过深度微调能支持百亿级参数的训练。
如何将大模型融入垂类应用?
对于垂直行业来说,在做好底层大模型之后,将其对接应用场景才能真正发挥出大模型的势能。业内对此有一个形象的比喻,如果说基础大模型是圣杯,那么后续比拼的应该是其上燃烧的熊熊火焰。
张韶峰以大模型对于智能运营业务的技术赋能介绍称,与通用大模型不同的是,百融云创大模型具备跨模态深度理解能力,不仅能拟人化生产内容,同时,还可以辅助“策略产出”。
据了解,百融云创的智能运营业务产品生态包括智能语音机器人、运营支持解决方案、云端运营SaaS平台等,旨在筛选目标客户,通过智能语音交互进行触达,帮助金融机构激活转化非活跃用户,以及优化信用卡营销解决方案等。
以某家银行的信贷存量客户运营为例,针对银行存量运营策略单一、人员短缺、营销与风险标签缺失、系统串联效率偏低等短板,百融云创对接银行需求,建立“盘活存量+深挖增量”,同时避免高价值客户流失的系统性深度运营策略。
在策略实施过程中,百融云创大模型运用决策树、最优化算法等策略体系纠正传统模型体系的精准度偏差。据了解,百融云创大模型能够从数千万的存量标签中抽取和总结关键信息,将其提炼为具体的特征值,从而解决此前银行大量灰度人群区分度不够的问题。
在此基础上,百融云创大模型会结合行方各系统串联关系和数据埋点情况,剔除无效客群,“蒸馏”出有效需求报告。这些经过用户画像分层的“特征值”可扩展至应用判别式AI技术构建的专属模型之中,用以匹配不同的权益评估,制定不同的经营策略。
“极端情况下,每个客群模块甚至只包含单一客户。”张韶峰表示。
同时,在信贷存量运营的全流程中,都有百融云创智能语音机器人的陪伴,可以为每位客户提供智能营销、智能投顾、智能客服等专属服务。借助与ChatGPT同源的语音识别和NLP等AIGC算法框架,百融云创智能语音机器人可以在最小化的成本下实现多轮高效对话,其在音色、情感等层面与真人高度相似,对于客户语音识别的准确率能达到99%。
据悉,仅仅经过三个月的时间,百融云创便帮助银行存量运营的穿透率提升了250%,存量客户有效贷款申请率大幅提升至70%,这一借助大模型对于银行信贷的赋能力度领先业内。
大模型对场景赋能程度更高
众所周知,大模型的核心技术力量侧重内容生成。但是对于金融等垂直行业来说,在进行深度运营、营销、反欺诈等场景中,仅依赖生成式AI技术并不能满足全部需求,同时还需要多元化AI技术组合来进行策略自动生成、数据回检等。
以AI赋能银行精细化运营为例,张韶峰介绍,百融云创的智能运营技术底座包含三类算法,第一类是分析、判别与策略类算法,主要用来分析客户特征、预测客户需求;第二类是内容生成算法(AIGC),用来生产内容;第三类是实时智能交互算法(包括NLP、语音合成算法、“数智人”生成算法),以实时自动生成文字回复、对话等。
要想让多重AI技术应用于场景中,便需要对大模型进行fine-tuning(微调),以此来激发单点小模型的能量。对此,百融云创的做法并非简单地将大模型套用小模型,因为模型套用会制约底层技术的应变能力,而是依托大模型的基础框架,通过优化、调整特定模型层,以适应具体业务场景的需求。
但同时,业内也有一些疑问,例如,是否垂直场景中的相关业务仅采取传统的模型策略便已足够,引入大模型之后,会否导致成本激增?
对此,张韶峰认为,以金融行业来说,大模型的部署有其必要性,利用大模型的能量不但可以实现金融业务的精准部署和决策优化,同时相关业务的响应速度和处理效率也会大幅提升。
他以智能运营业务为例介绍称,大模型不仅能够实现分层、定制化、人机耦合及系统自我优化等增效目标,同时通过底层调优策略可以集成到其他软交换系统中,从而提供多元场景的运营赋能。
体现在成本控制上,张韶峰认为,基于对用户群体的洞察,大模型为AI开发、智能交互、分析决策的提升注入更为强大的动能。较之小模型,可以焕发更高粘性、更强的复购及转化率,所以虽然看似大模型需要更多的资源投入,从长远来看回报率反而更高。
财报显示,智能运营是百融云创成长最快的一个业务分支。根据百融云创此前发布的2022年年度报告显示,2022年该公司智能运营业务收入同比增幅超140%。今年一季报显示,该业务线的收入较去年同期增长了68%。
国元证券(000728)等机构分析预计,百融云创提前布局AI技术和大模型,并领先于其他竞争对手进行试点,具备绝对先发优势。并且,公司将对金融业的存量运营模式复制到增量运营难度不会太大,因此未来收入增长空间巨大。