智东西
作者 | 徐珊
编辑 | 云鹏
2023年,科技圈最火的话题莫过于AI大模型,AI大模型已然成为了各大厂商们在新一轮AI浪潮中争夺的入场卷之一。
在聊天机器人ChatGPT引爆的第三次AI浪潮中,微软、谷歌、百度、阿里等科技巨头们纷纷重金砸向AI大模型领域。同时,不少AI界大牛纷纷从研究所走出,开始自己的创业道路,产学研界均高度关注此次AI浪潮所带来的技术震荡。
据不完全统计,到7月15日为止,国内10亿级参数规模以上AI大模型已发布了80个。集体的狂热之下,难免有泡沫浮现。我们发现不少AI大模型在参数上翻倍增长,从数十亿级增长到数千亿级,但是仍停留在研究阶段,短期内难以直接带来实际的产业价值。
国际调研机构IDC预计,国内AI市场规模在2023年将超过147亿美元,到2026年这一规模将超过263亿美元。在巨大的蓝海市场面前,如何将AI大模型发挥出实际的产业价值,成为各家手持大模型的企业面临的关键一考。
百花齐放的AI大模型时代,企业应该如何选择适合自己的大模型?从研究院到产业中,AI大模型还需要克服哪些难关?AI大模型究竟能给产业带来哪些价值?我们和多位产业人士交流后,理清了AI大模型时代落地的关键。
一、拥抱大模型,企业要多问价值
“在第三代AI发展中,推动AI创新应用和产业化成为AI发展的关键。”中国科学院院士、清华大学人工智能研究院院长张钹提到,第二代AI发展正是因为与应用脱轨,导致其很难在产业中大规模的应用。
随着越来越多的AI大模型走出实验室,AI大模型不再作为实验室的项目,而逐渐开始成为产品,其能够发挥的价值愈发被看重。如何更好地将AI大模型发挥出其应用的价值成为其走向市场最为关键的一步。
目前,大多数的AI大模型通过聊天机器人或生成式内容平台的形式展现其在语义理解、多轮对话能力,但对于一些专业问题,仍难给出较为准确的答案,这也是未经过专项训练的通用AI模型常遇到的问题之一。
京东集团技术委员会主席、京东云事业部总裁曹鹏曾举例,像是在聊天场景中,如果接入通用大模型如GPT等,用户对一些搞笑回答可能拥有较强的包容程度,对错误回答一笑了之。但如果像是在金融、医疗等严肃应用场景中,错误的AI回答则会影响用户的财产甚至是生命的安全。
不仅如此,在训练大模型的时候,可靠的数据来源也是影响AI大模型能否更好适配产业的影响因素之一,以提高AI的可信度。
“现在的AI大模型很少有走到商业化进程的。从商业角度来看,大模型的落地才刚刚开始。”一位资深AI产业人士说。他提到目前很多AI大模型公司仅处于发布大模型阶段,其销售和服务业务落地还需一段时间。
在“千模大战”之后,AI大模型开始走向产业,厂商们开始尝试通过AI大模型来训练出适应不同场景的产业AI模型,让通用AI大模型转换成适合产业应用的模型,带来降本增效的成果成为当前不少厂商重点发力的方向。
刚刚结束京东云峰会上,京东明确将产业价值放在首位。京东集团CEO许冉表示,“大模型真正实现自己的价值,一定是在产业应用中”,并提出一个公式:大模型的价值=算法×算力×数据×产业厚度的平方。实现产业价值,才是大模型竞争这场长跑的终点线。
二、打造AI专家,高质量数据、产业基础成大模型接轨产业关键
究竟什么样的大模型能够帮助更多企业更快、更方便地接轨新一轮人工智能的浪潮?曹鹏认为至少要有两大要素,高质量的数据和较强的供应链能力。
在AI大模型变成产业大模型的过程中,其所需要的训练数据不再是通用数据集,其目的也不再是教AI如何拥有更好的认知能力,而是让AI快速在某个领域成为“专家”。想要实现这一步,则需要高质量的行业数据库,才能训练出精度加高,较为资深的AI专家。
但并非每家大模型公司都有能力做到这一点。像是相对一些此前扎根在垂类领域的企业,甚至是刚刚成立的一些创企团队,难以拥有不同场景的产业数据资源,也就很难加入到这场大模型产业落地的竞赛中。
相较而言,曾扎根在产业多年等大厂,如京东、腾讯、阿里等,由于业务覆盖广泛,产业资源积累雄厚,因此原生的、高质量的产业数据集将成为其在大模型产业落地竞赛过程中制胜的关键法宝。
拿京东举例,京东旗下拥有京东物流、京东健康、京东商城等多个核心业务,涉及零售、物流、科技、健康、工业、产发等多个领域。这些场景积累下的每年数百亿条交互数据,就成为训练大模型的宝贵养料。据悉,训练言犀大模型的数据库,就由70%通用数据和30%供应链原生数据组成。
“在数据层面,像是商品的优先推荐、金融产品的选择策略、理财的一些隐藏规则、物流的优化体验等,这些数据相对标准通用大模型存在比较明显的一个差异。”曹鹏提到京东在此次训练京东言犀大模型中,不但使用了训练大模型所使用的标准数据集,还利用京东多年在零售、健康、物流、金融所积累的原生数据集,从而更好地通过特定场景去训练相关产业模型。
企业想要训练出合适落地产业大模型,不但考量企业对产业的认知宽度,还考查企业对产业的认知深度。就像当人们在做某一个判断时,不仅需要从某个问题本身出发,还需要全局考量对整个问题前后的背景、所涉及的情况。
要想将同样的能力迁移到AI上,教会AI拥有“大局观”,则需要长链路、能够协同处理、且动态数据回流的产业基础能力。因为供应链的链条越长,带来的数据相关性更高,相关性高的训练数据越多,模型越大,才越有可能产生产业端的智能涌现。
比如说,在物流领域,当用户想要通过AI做出是否增添新的物流仓库决策时,AI需要从产品供应时间、人力成本、物流成本等等多个供应链角度去思考和评定情况。当AI能够拿到更多的产业信息,对物流整体产业的供应链理解更加清晰,考量的角度越多,其能够给出的判断更加准确。
同时,因为有实地落地场景,大模型在垂直领域的应用还会诞生更多精准数据和产业Know-How,形成发展的正循环。
由此可见,长链路、复杂场景、丰富数据的数智供应链,将会是大模型绝佳的“训练场”和创造产业价值的“应用场”。
三、率先从健康、金融和零售场景突破,京东将大模型送入企业内部
在这场遍及全球的大模型落地之战里,企业对大模型的研发和应用进程离不开产业积累。
过去京东凭借着对供应链的洞察,打通企业、物流和供应链之间壁垒,疏通出一条畅通无阻的发展道路,从此在电商站稳了脚步。这一次,京东也同样凭借其在供应链扎根多年,拥有丰富的供应链数据和行业Know-How,从而直接行业和大模型结合的痛点,打造出不少的大模型落地应用。
在京东云峰会上,京东展示了其基于大模型场景开发的多个应用场景,如物流、金融、零售、健康等,并已经基于特定场景研发出相应的产业大模型。
像是在物流场景中,京东展示了其如何通过京东物流超脑内的仓内智能交互建模,实现对仓库布局问题的智能化原因分析。
当用户输入分析在今年双11大促的布局堵点后,系统通过分析,给出效率堵点为地狼货架数目不够、建议增加一排货架等建议。这极大地减少了传统复盘调研时,所需要花在调研、分析,测试上的成本。
在健康场景中,京东已基于千亿级的言犀大模型训练出相应的医疗大模型:京医千询。该模型将在远程医疗诊断、提供诊断和治疗决策、医疗案例咨询搜索等环节,帮助医疗从业者在远程医疗环境中更准确地进行诊断、治疗和提供咨询服务。
据悉,京医千询大模型内涉及上千种常见疾病,并采用医疗专家团队参与设计的20种质量评价指标来保障其安全性。目前,该模型还在京东内部应用以及优化阶段,将在明年上半年提供服务。
在金融领域,AI营销运营平台可以让用户通过寥寥几句的AI对话,一键在平台上营销活动。过去需要5类职能人员、2000次人机交互的工作量,如今缩短到1人在50次人机交互以内就能完成,整体的营销方案的生产效率,整体提高百倍。
在峰会现场,京东还现场展示了如何借助京东云AIGC内容营销平台,从一张普通的商品图出发,快速生成电商运营需要的商品主图、营销海报图和商品详情图等系列图片。相较过去人工作图,商家们制图成本下降90%,制作周期也从7天缩短到半天。
这些产品什么时候能够真正地服务商家、服务客户?京东针对大模型落地节奏,做出了“三步走”规划。目前,京东云已经基于内部实践构建了通用大模型言犀大模型;到今年年底这段时间,京东将经由高度复杂场景大规模锤炼,迭代出扎实的产业服务;预计在2024年初,会将大模型能力向外部严肃商业场景开放。
可以看到,京东在大模型领域的研发更重视为产业带来的价值。京东正借助其在产业积累多年的技术能力,帮助企业快速找到适合自己的大模型。
结语:扎入产业深水区,京东加速大模型落地
AI大模型开始从扎堆发布,逐渐走向落地应用。AI大模型的落地,将会影响AI在未来3-5年内,将会有多大的市场规模,以及给产业和生活带来哪些深远的影响。在产业数字化的长线背景下,只有将供应链做透,才能将大模型做实,从而为企业带来降本增效的成果。
在京东看来,大模型实现价值是一场长跑,发布大模型在这场实现大模型价值的长跑中,影响甚微。我们也相信只有真正摸索出与产业结合的方式,让技术落地应用,才算是冲过了终点线。
WINTEC亿胜盈科 2024-11-02
u95923657 2024-11-02
金舟音频大师 2024-11-02