招联·数智进化论|实战派如何拥抱大模型?
(图/招联智鹿)
从概念冲击到落地实践,过去一年,国内诸多大模型加速快跑,成果瞩目。而这个注定属于大模型的时代,不过刚刚拉开序幕。
一面是短短一年,已经以惊人速率从ChatGPT大语言模型进化到Sora文生视频模型,AI还在不断刷新给人类带来的颠覆性想象空间;另一面是越来越多使用者和开发者已经逐步“退烧”,回归商业理性,开始思考和探索真正能够落地的应用场景与实际价值。
金融行业亦是如此,在金融业已经高度数字化的今天,行业从业者们正在边走边思考,大模型究竟能为传统业务带来哪些增量价值?面对金融业的高度严谨合规性和大模型的开放不确定性这对天然矛盾,又该如何找到双方能够和谐共舞的适配点并加以高效应用?
在笔者和招联员工的交流中,这些数字金融的幕后创造者,大模型时代的弄潮儿,给出了他们自己思考和实践的答案。
2023年11月,招联联合中山大学发布消费金融行业首个130亿参数开源大模型“招联智鹿”,位列当时国内权威大模型榜单C-Eval第二十名和CMMLU第十名。作为消费金融行业的垂类大模型,招联的这匹“智鹿”能与百度、阿里、OpenAI、清华大学等企业和高校自研大模型同期入榜并不容易。
魏小辉(化名)作为“招联智鹿”大模型的算法负责人,回忆起那集中攻坚大模型的三个月,说:“现在回想起来就是一段平凡的工作时光,无暇考虑太多,只想把握那个时间窗口把大模型顺利落地。”
据魏小辉介绍,他和很多热衷于大模型的技术宅一样,虽然之前的技术方向不是深度学习,但ChatGPT的问世还是激发了他强烈的兴趣和好奇心。“坦率来说,作为金融行业一个垂直领域的专业公司,公司科技能力积累着重在解决业务相关问题,而非互联网大厂那样通用的、广泛的技术储备。大模型出现时,我直觉这是我们有机会实现弯道赶超的重要机会,一直有意识地在追踪、积累相关技术文献。所以,当公司真正决定要做我们自己的大语言模型时,我已经有了200多篇paper深度学习的知识储备,面对新挑战,没有不安,只有跃跃欲试。”
作为监管和行业公认的率先探索纯线上消费金融模式的、标志着行业数字化转型起点的消金公司,招联已经积累了较为扎实的科技核心能力,和较为丰富的应用场景和数据,为其大模型的快速落地奠定了基础。
落地的难点主要在于技术方案的选择和试错。魏小辉表示,颠覆性的新技术意味着其需要使用的算力规格不是上一个时代所能比较的,换言之,大模型势必是昂贵的,同时也是没有标准解决方案的。但作为深耕消费金融赛道的实战派,如何兼顾大语言模型的技术有效性和商业可持续性,关键要在技术方案上做出最理性的选择。经过多轮的团队讨论和训练试错,他们最终找到了最适合消金行业领域的技术方案,后续将以小步快跑的方式,基于实际应用的拓展不断推动模型的迭代。
谈及“招联智鹿”的名称由来,魏小辉告诉笔者,它来自于一场内部论坛的集体脑暴,这个名字获得了一致好评并被采纳。“长颈鹿是招联的吉祥物,它生活在狮子、猎豹占据食物链顶端的非洲大草原,却因为站得高、看得远、跑得快,顽强生存下来。在考验经营风险能力的消费金融行业,希望招联能在这匹AI智鹿的加持下,从数字化向全面数智化继续进化,更敏捷、更矫健,真正实现‘以科技践行普惠,让信用不负期待’。”
(图/图虫创意)
从目前行业内的主流观点来看,大模型更多被视作新一代基础设施,其本身并不直接产生价值。真正产生价值的,是基于大模型底座开发出来的各类AI应用。从这一层面来说,找到适合大模型能力植入,且符合商业可持续原则的业务场景,就尤为重要,这也是当前不少大模型落地难、应用少的症结所在。
Tracy是招联贷后智能业务的团队经理。她告诉笔者,面试那天恰逢招联开业,一晃9年,管理学出身,从四大会计师事务所加入招联的她,岗位从风控转向贷后智能服务,一路成长为不断拥抱变化、探索AI在消金领域前沿应用的实践者,这是她加入招联前从没想过的。
在她看来,大模型虽然很难在短期内对已高度数字化的消费金融业务带来颠覆性改变,但可以大大加速行业数智化的演变进程,并拓宽其触达的边界。
Tracy在2017年就参与了AI对话机器人的开发,这也是招联布局的第一个自研AI应用项目。“有些人并不看好这个项目,毕竟当时的AI落地还处于探索阶段,但最终我们做成了!经过近一年的筹备,2018年中这一项目正式上线生产,经过半年调试,年底我们的AI对话机器人就实现了95%的早期客户还款提醒的客服人工替代,节省了上千万人力成本,真正实现降本增效。”
随着AI对话机器人的不断迭代升级和深度应用,招联贷后服务的数智化程度和服务质量不断提升。比如当前招联已开发出了针对不同场景的多角色、多音色机器人,如“关怀姐姐”、“纾困天使”等,可以进一步针对客户提供适当的情绪价值,比如鼓励暂时遇到困难的客户莫失信心。Tracy告诉笔者,对贷后服务而言,客服人员的管理是难点,在与客户的实际沟通中,很难完全避免客服在特殊情况下因一时失误或情绪失控,进而引发客户的误解和不满。相较之下,AI机器人客服可以很好地规避人的非理性,持续给客户稳定、准确、高质量的服务体验。
大模型的出现对现有的AI机器人意味着什么?Tracy表示,随着AI对话机器人的广泛应用,行业现有的机器人在技术上已基本对齐并且接近能力上限,产品的差异化主要存在于业务经验、数据的积累和产品解决方案的设计层面。大模型的出现将对突破上下文多轮交互和长难句语义理解、处理更为复杂的业务等技术瓶颈提供可能,“换言之,未来我们的机器人会更聪明,天花板被打破了,可以探索更多可能”。
而这种“聪明”,不只是简单的升级,更是升维。据介绍,传统的AI机器人,还是按照设定好的程序执行指令,本质还是以人的智慧驱动机器。但对大模型机器人而言,它具备了自驱的可能性,可以通过自发学习不断迭代。
此外,大模型作为人工的辅助工具,对效能的提升也十分显著。据了解,经模拟测试,相比人工作业,使用“招联智鹿”进行文本标注与生成的效能可提升百倍。比如客服场景下,结合具体会话状态与服务场景,使用大模型实时精准地定制回复话术,可帮助客服节约时间成本近80%。
(图/图虫创意)
不可否认,当前大模型的业务应用只是序章,值得探索与想象的空间依然十分巨大。回到金融行业的命题,在其高度强调严谨、合规的行业特性下,未来的应用场景和探索步伐也需要从业者们有更为全面的考量。
“新技术往往是双刃剑,或者说,现有的大模型技术尚且存在难以完全规避的风险。”魏小辉指出,公认的最大挑战就是大模型的幻觉问题,也就是当你询问大模型一个问题的时候,它会一本正经地告诉你很多答案,但答案中可能隐藏着bug或者事实错误,甚至可能违背了道德伦理,这就是大模型的幻觉,而且它不可控。
魏小辉进一步指出,目前的解决手段主要有两种。一是通过在技术上增加额外的模型,比如利用敏感内容筛查模块来过滤敏感内容的展示,或者把自己积累的事实知识库补充注入大模型,以尽量规避大模型的幻觉。二是通过人工筛查,在业务应用层面,大模型的输出不直接对客,而是辅助和赋能人工,从而保证对客可控。招联的安全措施二者皆有。
“我们一直非常审慎地考虑目前大模型的应用拓展场景,确保大模型应用不直接对客。从某种层面来说,并非步子迈得越快越大就越好,需要在技术创新和风险防范中找到平衡。”Tracy指出。
但这并不意味着大模型的应用空间受限,我们必须看到和肯定大模型的潜力。Tracy举例表示,以对话机器人为例,传统的作业流程是先由机器人倾听客户说话,将语音翻译为文本,再将翻译好的文本交由机器人理解,通过对话管理后生成一段回应话术,最后用TTS将生成的话术说出来。“现在我们可以在文本理解的部分加入大模型,其他环节依然采用传统模式,就能在保证可控的前提下有效提升机器人的理解能力。”此外,大模型还起到了很好的“辅助驾驶”作用,可以在坐席辅助、话术生成和会话小结等工作流程接入辅助人工,极大地提升了作业效率。
“如果把大模型比作人,不断迭代成长本就是它的特性之一,从小学生到中学生、大学生,这个过程需要不断引入更先进的方法和技术,进而提升模型的各种能力。但换一个角度来看,大模型的投入和迭代可以无止境,没有最贵,只有更贵。对于业务垂直的消金行业来说,无穷无尽地卷大模型并不明智,高昂的研发成本如果没有创造出足够的价值,势必会成为企业和用户的负担,违背普惠的初心。”魏小辉指出,所以“智鹿”自诞生就明确了未来的建设思路,一定要基于服务公司业务进一步做专做精的目标,量力而行,逐步覆盖更多业务场景。
对现在和未来的更多探索规划,魏小辉指出,借助大模型加强风险的前瞻预测和精准识别,以及进一步加强AI辅助人工提质增效,是开发者们在大模型1.0阶段面对的重要课题。再下一个阶段,则是AI智能体的探索应用,此时的大模型可以进一步采取动作帮助你直接解决问题。“比如有客户通过电话表达了还款意愿,智能体不仅可以快速理解客户的指令,还能进一步采取动作,通过全流程自动化的操作,帮助客户完成还款操作,后续还能及时反馈交易的结果,这是原有技术无法实现的,若落地将进一步大幅提升服务的效能。”Tracy补充道。
她告诉笔者,作为技术的业务应用方,此时出现颠覆性的技术拐点是令人兴奋的,身处时代的洪流,需要顺势而为。“人终究要找到自己的位置,如果一直做简单重复的工作,现在的舒适区可能很快会被机器替代,就像工业革命被时代浪潮淘汰的旧生产力。但我并不认为这是人工智能技术对人类的挤压和替代,换个视角,这是一个充满可能性的新时代,人的潜能将进一步被AI激发出来。行业与个体一样,敢为天下先,勇于积极拥抱变化的,总能在应对挑战中焕发新生。”
作者
肖一、之初
排版
张心睿
运营
李靖越
监制
罗 屿
编辑
宋 爽