“大模型作为技术,要真正被行业所用,解决行业的实际问题,才能发挥它真正的价值。”英特尔公司市场营销集团副总裁、英特尔中国网络与边缘及渠道数据中心事业部总经理郭威在与钛媒体APP的交流中曾多次指出。
距ChatGPT问世已有快2年的时间,这不到2年的时间里,AI大模型正在以前所未有的速度向各行各业渗透。尤其是今年以来,无论是各个大模型厂商,还是甲方企业,都将关注的焦点从模型参数大小上,转移到了大模型如何解决行业痛点问题上,试图寻找一个或多个大模型能在自身行业落地的场景。
从通用走向行业,场景是大模型落地的关键
如果将各大厂商大模型的竞赛分为上下半场的话,上半场,各大厂商纷纷推出通用大模型,通过不断地提升模型的参数,展示自身实力;下半场,当AI大模型受到更多行业侧企业关注的时候,越来越多的小参数模型涌现,行业应用场景自然也成为了甲方企业和乙方大模型供应商关注的焦点,围绕端侧的应用落地成为这个阶段大模型能否真正在行业侧“变现”的关键。
对此,郭威告诉钛媒体APP,英特尔相信,随着AI大模型技术逐步深入行业,模型将会逐渐从通用大模型变成行业专用型的大模型,“在这个过程中,模型的大小肯定会产生变化,”郭威指出,“与此同时,行业模型将结合更多的行业专有的知识,更聚焦某一个或几个特定的场景。”
无独有偶,京东集团技术委员会主席、京东云事业部总裁曹鹏近日在京东云峰会上也公开表示,“通用大模型靠算力堆起来,而产业大模型要靠业务跑出来。”已经有超35万京东自有配送员、超20万商家、超3万医生、超2万采销运营、超1万研发人员,在京东100多个AI场景使用以大模型驱动的应用。
《2024全球数字经济白皮书》显示,全球人工智能大模型的数量已达1328个,这其中中国占比36%。另一方面,IDC数据显示,2022年中国生成式AI占AI市场投资总规模的4.6%。随着生成式AI技术的快速发展,2027年生成式AI投资占比将达到33.0%,投资规模超130亿美元,五年复合增长率(CAGR)为86.2%。
显然,大模型就像先前的云计算时代一样,单论技术而言,中国可能离国际一流水平仍有些许差距,但当我们将目光聚焦在场景上,中国有着丰富的应用场景,而这些场景是AI大模型真正“飞入寻常百姓家”的关键。
从云端走向边缘,大模型如何更好用?
当大模型从通用大模型的大参数,逐步走向行业专用模型的小参数的过程中,大模型也呈现出从云端走向端侧的趋势。IDC数据显示,到2026年,80%的全球企业将使用生成式AI,50%的全球边缘部署将包含AI。
对此,英特尔公司网络与边缘事业部高级副总裁兼总经理Sachin Katti曾表示,人工智能的未来将依赖于开放的生态系统,人工智能的应用正在从数据中心向边缘计算转移。
不仅与此,英特尔公司副总裁兼网络与边缘事业部中国区总经理陈伟也告诉钛媒体APP,从今年的发展趋势上看,单就英特尔的客户而言,今年探索基于边缘大模型落地的解决方案的客户更多,“今年完全不一样。今年基本上可以说一半以上的客户都在探索基于边缘大模型的落地解决方案,也有非常多的实际案例。”陈伟进一步指出。
而在大模型走向边缘的过程中,企业在部署时需要考虑很多因素,比如时延要求、可实用性、微观数据的可调优化,以及信息安全等要求。
不过边缘侧部署大模型仍处于发展的初期阶段,目前市场上可见的部署模式有很多,“通过英特尔的观察,我们看到许多客户正在构建硬件和软件解决方案,并在通用的大模型基础上进行性能优化,这是一种发展迅速的模式。”面对钛媒体APP提出的如何更好在端侧应用大模型的问题时,陈伟如是说。
谈及中国大模型在行业侧落地的趋势与前景时,郭威告诉钛媒体APP,今年以来,已经有越来越多的行业用户落地了不少行业大模型,“去年可能更多的是讲故事的多一些,今年我们看到的行业上落地的案例越来越多,而且都是能切实解决行业痛点的场景。”郭威如是说。
从目前应用上看,在端侧的模型参数要比通用大模型的参数小很多,目前在端侧的模型参数大多在7B~10B之间,而这时候,模型的压缩就成了一件很重要且困难的事。目前主流的模式是,在压缩的同时,将行业专属知识灌进去,也就是俗称的渐进式剪枝的技术方案。
对此,京东云相关技术负责人告诉钛媒体APP,以无人物流车场景为例,通过量级减枝,神经网络搜索的方式,可以压缩两倍左右参数量的同时,不降低模型本身的性能,还可以减少一倍左右的时延。
与此同时,郭威与钛媒体APP分享了他对于中国发展行业大模型的前景的研判,他指出,中国可能在三个方面发展的更快一些。
首先,模型本身在行业应用上的发展。正如前文所述,“单论技术而言,中国可能离国际一流水平仍有些许差距,但中国有着丰富的应用场景”,在行业落地方面,尤其是与应用结合方面,在郭威看来,中国能走得更快一些,“中国市场的一个显著特点就是应用发展迅速,能够较快地探索出解决行业痛点的有效途径。”郭威强调。
其次,模型推理能力的提升。当大模型真正落到行业侧应用时,仅仅依靠模型的训练还不够,要想真正解决行业痛点,模型推理能力的提升尤为重要,而在郭威看来,模型推理能力在今年也会有显著的提升。
第三,在郭威看来,大模型在行业落地方面,需要协调好云端、端侧,以及边缘之间的算力分布,“如果只是垂直大模型的一些标准应用,可能大模型主要部署在云端。但由于行业落地的需要,必然会促使AI算力向边缘和端侧分布。”郭威告诉钛媒体APP。
已有诸多场景落地
正如郭威所述,今年以来,已经有不少的行业大模型的应用场景在端侧得以部署落地。
在教育方面,希沃基于英特尔的技术,联合推出了“AI+教育”的解决方案,借助英特尔®酷睿™Ultra处理器,希沃无需依赖云端计算资源,即可在本地完成AI教学大模型的运行,从而提高系统响应速度和稳定性,确保教学过程中的流畅体验。
在零售业方面,多乐之日通过边缘计算技术,打造了智慧门店解决方案。该解决方案可借助门店已有的音视频采集设备,并通过数据整合及优化的管理平台,针对不同门店需求和特点,为其打造一套专属数智化门店模型,提供从商品陈列、门店服务、门店卫生、员工规范、到人群洞察、客流洞察的不同功能,提升了多乐之日门店运营差异化的管理能力、提高了管理效率、降低了人工巡店成本投入并强化了员工规范的执行,加速烘焙行业的智能化发展。
在医疗健康方面,京东健康基于京东言犀大模型推出了“京医千询”医疗大模型,整合了大量的临床实践指南、医学文献和专家知识,能快速完成在医疗健康领域各个场景的迁移和学习。并基于“京医千询”大模型,面向执业医生推出了包括云诊室、诊后随访、专家联合会诊、临床科研、医生IP品牌孵化、“智能医生助手”工具等在内的一系列解决方案,既优化了医生在线诊疗的效率和质量,也提高了执业安全性。
在安全方面,包括360、奇安信、腾讯云、深信服等在内的诸多安全厂商都基于大模型能力,或推出了安全行业大模型产品,或将AI大模型的能力植入到原有的安全产品之中,面对AI时代,AI带来的日益严峻的安全挑战,实现“用AI打败AI”的目标。
在办公方面,诸多厂商都提出了AIPC的概念,并围绕办公AI助理发力,在AI Chatbot场景中,基于英特尔酷睿Ultra AI PC上能够快速部署大模型,用户能够流畅地使用大模型强大的文本创作、编程、数学计算和逻辑推理能力,享受便捷、安全的本地化智能交互体验;
在处理文档方面,用户可以利用AI PC高效处理邮件、表格数据、自动生成工作文档,提高工作效率,还可以快速起草合同文书、以及利用AI智能分析诉讼案例,提供专业文档撰写能力。
上述仅是目前AI大模型应用比较火爆的几个场景,除此之外,行业大模型还在金融、制造业、勘探等诸多领域已有较为广泛的应用。各行业利用AI大模型的能力赋能业务的时代已经拉开序幕。
数据依旧是逃不开的话题
众所周知,数据是大模型快速发展的“养分”,无论是通用大模型,还是行业大模型,若想实现真正的价值,并降低“幻觉”,数据是一个不可不谈的话题。
就行业而言,行业大模型需要海量丰富的行业专有数据,这部分对于想要利用行业大模型实现降本增效,以及从数字化向着数智化转变的企业来说,就对他们的数据治理能力提出了更高的要求。目前行业应用上来看,企业原有的数据是不足以训练一个完善的企业级行业大模型的,目前主要的解决方式是采用合成数据。接下来,一方面企业需要提升自身数据质量,另一方面,如何选取优秀的合成数据也成为企业需要面对的棘手问题。
另一方面,行业大模型不同于通用大模型的是——行业大模型大多需要实现端侧或边缘侧部署。Gartner预测,到2025年,50%以上由企业管理的数据,将在数据中心或云之外进行创建和处理。
换言之,就是到2025年,在端侧的数据量将超过50%。在这个过程中,随着边缘侧数据量越来越大,数据传输的带宽也是企业需要面对的一大挑战,“虽然国内在整个基础建设传输带宽建设上是全球最领先的,但当大量数据在边缘产生时,仍然可能引发网络风暴,我们仍需要进一步优化网络管理和数据传输策略。”郭威告诉钛媒体APP。
展望未来,Sachin Katti告诉钛媒体APP,AI在驱动数据提升质量的同时,这些数据也将反过来支持AI变得更好,最终会实现良性循环。
显然,大模型已经进入了在行业落地的快速发展期,在这个过程中,企业要遵循“数据驱动,场景为王”的原则,才能让大模型更好地在行业侧落地。(本文首发于钛媒体APP,作者|张申宇,编辑丨盖虹达)