当前位置:首页|资讯

2024服贸会|对话枫清科技创始人兼CEO高雪峰:治理企业本地多模态数据是解决大模型幻觉的第一步

作者:北京商报发布时间:2024-09-14

担任阿里云大数据&AI产品及解决方案总经理时,创业的念头就“长”在高雪峰心里了,这次参加2024年中国国际服务贸易交易会(以下简称“2024服贸会”),他的身份已从大厂高管变成创业公司枫清科技(Fabarta)的创始人。

在大数据和人工智能领域待了20年,他清楚企业数智化转型的需求,也知道怎样解决当下大模型落地的痛点。“要提升大模型推理能力”“增强基于数据关系的推理能力”“通过智能体平台提供推理的思考路径”,服贸会上,在与记者交流的一个多小时中,他反复强调。

枫清科技致力于通过融合图、向量和AI的多模态智能引擎以及数据编织与智能体等技术的融合与探索,推动AI技术在企业级客户中的应用与落地,高雪峰给公司做了一个技术范的定位。简单来说,就是通过各种技术、产品、平台尽可能降低大模型“胡说八道”的几率。不久前,枫清科技和中化信息达成合作,利用智能体服务具体的业务场景。同时,公司的Pre-A+轮融资正在顺利推进中。

大模型的本质还是基于概率的预测

“大模型有强大的能力,但落地时暴露出一系列问题,”大模型狂奔两年,高雪峰说出了同行们的心声,“比如‘幻觉’现象、推理能力不足、解释性差。这些问题导致很多企业面临大模型‘好玩不好用’的困境。”

问题明确,原因何在?他认为与大模型的复杂性、多样性以及企业应用场景的精准性要求有关。

“大模型主要依赖于概率统计方法,通过大量的数据来学习语言模式和统计规律,进而预测下一个词或序列。模型往往通过生成最可能的词语序列来组成回答的内容,而不是真正地思考或分析问题的内在逻辑关系”,高雪峰解释。

正因为如此,大模型在回答复杂逻辑问题时,可能会基于常见的语料模式生成看似合理但并非正确的答案,这就是大模型的幻觉。

“现实世界中的许多复杂决策需要多步骤分解与推理,大模型缺乏有效的记忆机制来跟踪和协调每一个推理步骤,或者是针对特定的复杂问题去拆解推理的步骤”,高雪峰向北京商报记者解释,每一步推理的结果可能影响下一步的输入,而大模型在内容生成过程中的概率预测能力,在多复杂条件下未必准确。

同样是因为大模型过于复杂,让可解释性变得更加困难,技术出身的高雪峰坦言,“专业研究人员也很难理解模型是如何得出某个结论的,普通用户更难以理解模型为什么输出这样的内容”。

“OpenAI刚刚推出了推理能力很强的o1模型,基本上也是在推理框架上面做了更深度的改进,比如思维链机制的改进。在o1之前就有很多研究使用ToT(思维树)、GoT(思维图)等方式来改进大模型的推理能力。这与我们在企业场景当中落地的方向是一致的,只不过我们更多的推理是基于企业本地沉淀的精准知识与逻辑,相比通用的推理能力或者范式,可能更加贴近行业的积累。”高雪峰表示。

数据还是数据

关于数据,高雪峰谈得更多。

“如果训练数据主要来自特定领域或文化背景,模型就可能在该领域内的推理任务上表现较好,但在其他领域或文化背景下表现不佳,泛化能力将明显不足。当遇到不常见或没有足够数据支持的推理任务时,可能会出现错误,”高雪峰向北京商报记者举例,“缺乏对特定行业知识的深入理解,可能导致模型缺乏领域知识,生成不切实际的输出。”

数据时效性和安全可控是另一个问题。他说,预训练当中使用的数据就是模型做内容生成时的所有依据,但是在决策智能领域,大部分需求都对数据的时效性有很大要求。不同的数据全部拿来做大模型的预训练,很难在推理的过程当中去控制什么样的角色不能利用预训练阶段当中的哪部分数据,从而实现数据的安全可控。

回到解决方案,又要追溯到机器学习领域的架构之争:以模型为中心与以数据为中心。“争论的焦点在于,为了提升模型的性能和效果,究竟是应该锁定训练数据并不断迭代算法,还是应该锁定算法并不断迭代用于训练的数据,对其进行清洗和噪音剔除等操作。”

具体到企业场景中,“为了实现更好的效果,应该持续利用客户本地数据来优化模型参数和质量,还是应该让不同的模型能力服务于企业本地经过组织的数据”,提到这一点时,高雪峰回顾了人工智能的三大流派:符号主义、联结主义和行为主义。“当前AIGC(人工智能生成内容)技术是联结主义的巅峰,而大模型幻觉、可解释性差、推理能力弱等问题,恰恰是符号主义流派的逻辑推理技术能解决的。”

让模型服务于企业本地数据

结合技术发展的客观规律,高雪峰提出的解决方案是,让不同的模型能力服务于企业本地经过组织的数据和知识。

为了解释清楚这些抽象的概念,他用了一个词:编织,即通过图与向量和文本数据的融合存储与计算来聚合企业本地数据,利用数据编织平台的能力将企业数据转化为知识,并通过知识运营与智能体平台结合大模型中的泛化知识,来支持丰富的企业智能化场景。

简单来说,就是通过各种技术手段,将企业本地数据和大模型的泛化知识作为大模型判断的基础。

“这种组织架构非常灵活,能够根据场景的不同需求,选择依赖大模型中的泛化知识或结合企业组织好的本地知识”,基于这一点,高雪峰认为,平台建设是核心基础。

这个平台需要具备哪些核心能力,才能支撑不同的智能化场景?

在和合作的头部企业交流、实践后,他指出:最底层是基础设施,其上是对多种大模型甚至传统小模型的管理,同时需要整理行业所需的数据集。但是真正实现企业智能化场景的落地,还需提供知识运维与管理等能力,以及将企业多模态的数据转化为知识的能力,最后通过智能体平台及向上的原生知识库能力,赋能企业级场景。

枫清科技的产品就对应着上述能力,枫清·天枢多模态智能引擎为企业AI智能应用提供便捷的私有化记忆存储服务及强大且可解释的推理能力;枫清·锦书数据编织中台将企业的多模态数据转化为知识;枫清·瑶光企业知识中台将锦书当中的知识与不同大模型当中的泛化知识进行融合,并以智能体的方式赋能上层的丰富应用。

在和北京商报记者的交流中,高雪峰以枫清科技与中化信息的深度合作为例介绍,中化信息通过引入枫清科技的“枫清·瑶光企业知识中台”,针对企业结构化数据和非结构化数据,验证和打造共创方案,将数据转换为知识,利用平台快速构建智能应用,发挥数据的价值,构建企业智能化升级之路。基于双方联合打造的灵活自主可控核心服务矩阵,包括知识引擎和智能体引擎两大关键组件,可通过文档问答、智能问数以及智能体方式串联大模型应用与业务系统,助力应用的智能化,提升用户与业务系统的交互效率以及工作和生产效率。

北京商报记者魏蔚


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1