生成式AI正成为时下科技企业“讲故事”的关键词之一。但从发展上看,无论是“文生文”的大语言模型,还是“文生图”的多模态模型,更多的是辅助人们进行一些简单的办公,或者提供一些娱乐,其面对的群体主要是终端的用户。
消费侧的应用仅是AI大模型的冰山一角,大模型真正的价值则是在行业侧、企业侧的应用,据市场研究机构预测,到2025年,全球生成式AI市场规模将达到100亿美元以上。其中,企业级生成式AI市场将占据相当大的份额,成为最大的应用领域之一。
从行业大佬们的发言中也能看出一些相似的观点。浪潮集团执行总裁、总工程师、浪潮云董事长肖雪曾表示,以大模型“新技术”释放数据“新要素”价值,推动数实融合,赋能千行百业,打破传统生产要素“质态”,提升经济社会发展“质效”,促进社会“生产力”实现新的跃升;IBM 大中华区董事长、总经理陈旭东曾公开表示,企业级AI应用相较于消费侧,有着更广泛的需求和潜力.....
数据质量已成大模型落地关键
随着互联网、物联网等技术的发展,数据资源呈现爆炸式增长。而2023年底多部委联合印发的《“数据要素×”三年行动计划(2024—2026年)》(简称《行动计划》)更是凸显了国家层面对于数据的重视程度。
《行动计划》以推动数据要素高水平应用为主线,以推进数据要素协同优化、复用增效、融合创新作用发挥为重点,强化场景需求牵引,带动数据要素高质量供给、合规高效流通,培育新产业、新模式、新动能,充分实现数据要素价值,为推动高质量发展、推进中国式现代化提供有力支撑。
大模型作为新产业、新动能的一部分,数据也是大模型训练的关键,企业通过收集、整理和分析数据,为大模型提供了丰富的“燃料”。对此,浪潮云总经理颜亮对钛媒体表示,过去,在应用层面,数据很难发挥出共享、流通以外的更大价值,“通过大模型的加持,尤其是行业大模型的不断涌现,整个数据产业将发生质的改变。”颜亮指出。
显然,从现阶段企业数据质量角度来看,企业进行数据治理的水平参差不齐,绝大多数企业数据质量较低。现阶段,对于绝大部分企业而言,企业内部有60%~70%的内部数据未被使用,企业若能将这部分数据加以利用,这些数据将进一步驱动企业业务发展,对此,阿里巴巴集团副总裁、瓴羊CEO朋新宇曾在由钛媒体集团与ITValue联合主办的“2023 ITValue Summit 数字价值年会”上表示,现阶段大多数企业不具备数据驱动的能力,造成了企业数据应用不足的现状,“不过与数据应用相比,缺乏数据治理能力的企业更多。”朋新宇指出。
随着越来越多行业大模型应用的落地,数据的质量和多样性也得到了提升,使得大模型能够更好地适应不同的应用场景。在颜亮看来,大模型在“数据要素×”的战略推进过程中,将起到催化剂的作用,“通过行业大模型的应用,能让更多的企业更快地感受到数据带来的价值,”颜亮如是说,“当更多企业切实感受到数据的价值后,就对企业自身的数据愈发重视,从而进一步推动了企业的数据治理,提升了企业数据质量。”
可信赖、易落地、可持续,行业大模型的三大核心要求
虽然数据是大模型的“燃料”,没有高质量的数据就训练不出优秀的大模型,但是数据质量只是大模型落地的第一步,如何打造一个能用、好用,能一直好用的大模型,是当下企业与大模型服务提供商关注的焦点。
可信赖层面,因为大模型的训练会涉及海量的数据,尤其是行业大模型,需要针对不同企业,不同业务场景,使用企业独有的数据进行大模型的训练。在这个过程中,如何确保企业的数据不出域,确保企业数据安全,成为当下亟待解决的问题之一。对此,颜亮表示,在应用大模型产品的过程中,企业更倾向于本地部署,同时要具备可靠的安全能力,对企业的数据形成有效的保护,“数据安全问题是企业选择大模型产品过程中,首要考虑的问题。”颜亮强调。
无独有偶,IEEE标准协会理事兼IEEE数字金融与经济标准委员会主席林道庄也有着相似的看法,林道庄曾对钛媒体表示,在AI时代,企业面临着更大的网络安全和数据安全的挑战,尤其集中在数据泄露、数据篡改/伪造等数据安全方面的挑战。
针对此,未来,大模型的发展将更加注重数据隐私和安全,企业需要采取一系列的安全措施和技术手段,如加强数据加密和访问控制、建立安全审计和监控机制、采用对抗性防御技术提升模型的稳健性、完善隐私保护政策和机制等。而在这个过程中,诸如加密学习、联邦学习、隐私计算等技术将会成为企业应用行业大模型过程中的得力助手。
易落地层面,在这个唯快不破的时代,简单易用、快速落地的数字技术将受到更多企业的青睐,在颜亮看来,易落地是解决大模型快速在行业侧体现应用价值的关键能力。从现阶段企业应用大模型能力的方式来看,主要有三种,即:嵌入软件、API调用和自建企业级AI平台。
虽然嵌入软件是部署最快的一个,但是差异化能力极低,没法更好地适配企业业务场景,所以从企业角度出发,企业应用API调用+自建平台的形式无论从短期出发,还是从长远角度出发,都是企业应用大模型能力的最佳选择。
从大模型服务供应商角度出发,服务商需要具备一定的基础模型能力,其次要具备充实的算力资源能力,最后还要具备大模型引擎的能力。针对此,浪潮云首席技术官孙思清对钛媒体表示,基于分布式云架构开发的大模型产品将成为行业大模型落地的重要渠道。
孙思清指出,采用分布式的架构可以在模型的预训练环节采用集中式的方式,在交付的时候,通过本地化的能力,结合本地数据,更好地保护企业隐私,即满足了企业对于安全合规的需求,又将模型的能力最大化地激发出来。
可持续层面,绝大多数行业的企业对于业务的持续性有着较高要求,而持续性的要求也映射到这些企业选择数字技术服务业务的过程中,这就对行业大模型提出了稳定性、连续性的要求。对此,颜亮表示:“在大模型训练和使用过程中,不能出现中断的情况。原来我们是为云和数据平台做保障,现在要为大模型平台做保障,要让用户有非常好的大模型体验感,如果推理过程出现持续性的间断,推理速度慢,得不到快速响应等问题,对于企业用户而言,赋能的体验是体现不出来的,而我们依托在全国布局的三个运行指挥中心,可以支撑对用户的持续运营。”
除此之外,可持续性还应该体现在模型的迭代和更新上,服务商所提供的模型不能是“与世隔绝”的,要与时俱进,这一点,采用分布式的架构,采用本地与云端“两条腿走路”的优势也就显现出来了,企业可以根据需求的变化,以及数据的更新,快速的对大模型产品进行更新,从而更好地赋能业务发展。
快速发展的一年
大模型作为驱动新质生产力的重要底座,必将与行业深度融合。而2024年在多方面的共同努力下,对于行业大模型而言将是快速发展的一年,林道庄曾对钛媒体表示,目前,大模型的应用主要集中在“三产”(服务业)居多,主要是辅助人工作,而行业级的大模型有望在服务业相关领域率先落地成熟度较高的应用。从现有的应用情况来看,医疗、交通、政府等多个行业有望率先实现较成熟的应用落地。
以医疗行业为例,通过行业大模型对大量医疗数据的学习和分析,可以自动识别病变特征,辅助医生进行疾病诊断,提高诊断准确率与诊断效率。对此,颜亮对钛媒体表示,浪潮云推出的海若大模型产品就在医疗行业深耕布局,通过诊疗记录、入院记录等信息,直接生成病历,省去了医生填写记录的时间,“最多可为医生省去20%的时间。”颜亮如是说。
无独有偶,林道庄也曾表示,现阶段,中国医疗资源比较紧缺,许多人排了很久的队才能看上病,而医生也很忙,通过大模型的辅助,能帮助医生快速的识别诸如X光片、CT等病历,从而大幅提升医生工作效率,也能降低患者等待的时间。
除“增效”以外,大模型在医疗行业的落地还可以帮助患者和医院实现“降本”,通过自动化和智能化的医疗辅助系统,可以降低医疗成本,提高医疗服务的效率和质量。
另一方面,行业大模型在医疗行业还可以帮助医生优化治疗方案。通过大模型对对患者病情、病史、药物过敏等情况进行综合分析,为医生提供更加全面和个性化的治疗方案,提高治疗效果。
在政务方面,随着数据要素市场化进程的推进,大模型的应用让越来越多的企业迫切的需要更多同行业的优质数据,也间接推动了数据要素市场化的进程。
浪潮云积极探索政务大模型在公文写作、基层减负等场景的落地,实现基层材料整理效率提升100倍,回复准确率提升至75%;除此之外,在金融方面,大模型也有着很多用武之地,金融行业不同于其他行业,其监管要求极高,从技术上看,像贷款审核等业务其实已具备初步落地的技术能力,但因为安全合规的要求,大模型只能在其中起到解放生产力的辅助作用。
现阶段,大模型在金融行业的应用主要还是集中在风险评估和管理,以及知识图谱平台搭建方面。在风险评估方面,大模型可以通过分析大量的历史数据和实时信息,预测市场风险、评估信用风险等,为金融机构提供更加准确和及时的风险管理决策支持。
另一方面,将大模型与知识图谱平台结合,用大模型代替NLP技术,金融机构可以在提升效率的同时,提升风控水平。
从现有的应用来看,医疗、政府和金融是众多大模型服务商重点布局的领域,而其他包括制造、交通、农业、应急等在内的多个行业也有望在今年实现大模型应用成熟落地。
大模型落地方兴未艾。可以预见,2024年,行业大模型必然是各行各业关注的焦点,未来也会有越来越多的应用落地。在新技术的热潮中,企业不会缺席大模型落地应用的探索,但成效不是一蹴而就,夯实根基、理性决策才能穿越技术成熟的周期。
(本文首发于钛媒体APP,作者|张申宇)