走出AI大模型“焦虑症”，政企行业找到了“最优解”

作者：极客网发布时间：2024-07-21

自2022年底以来，随着ChatGPT横空出世并迭代升级，全球各国、各行各业面对AI大模型似乎都FOMO了（Fear of Missing Out，错失恐惧症），动作频频生怕错失机遇。

然而迄今为止，在轰轰烈烈的“炼大模型”过程中，除了英伟达赚得盆满钵满外，其他玩家都还没找到稳定且持续的商业模式。相反，随着参数规模的日益膨胀，模型训练的算力开支越来越高，大投入却看不到产出的情况下，新的“焦虑症”又蔓延开来。

在大模型“军备竞赛”最激烈的美国，资本市场近乎进入“癫狂”状态。这两年来，美股市场只要跟AI相关的股票都涨疯了。苹果一个AI进展发布会，隔天市值就上涨2142亿美元；以微软为首的美股“Big 7”的市值，更是达到史无前例的14万亿，占据标普500的32%，纸面市值与实际价值倒挂，“癫狂”程度史无前例。投行分析师们开始焦虑一个比互联网泡沫更大的AI泡沫即将到来。

在中国互联网圈，巨头们焦虑与美国的差距的同时，开始不断压低每Token的价格，提前开启简单粗暴的价格战。其中，字节跳动豆包大模型将通用模型pro-128k版的推理输入价格定在0.005元/千tokens，较行业锐降95.8%；阿里通义千问将主力模型Qwen-Long的API输入价格降至0.0005元/千Tokens，直降97%；百度甚至宣布将文心大模型的两款主力模型ENIRE Speed和ENIRE Lite全面免费。

一方面是AGI的崇高理想，另一边是ROI的残酷现实，面对AI大模型这班开往未来的列车，不“上车”不行，“上车”后找不到好位置、坚持不到终点也不行，到底该何去何从？

在中国政企行业，一群富有远见的先行者将通用大模型与特定行业的专业知识相结合，打造属于自己的专属大模型，以加速行业AI应用落地，真正兑现大模型的价值，为业界走出AI大模型“焦虑症”找到了“最优解”！

中国大模型摆脱“焦虑症”，破局之路在行业

从全球“大模型之争”开启之初，“中美在AI领域差距有多大”就一直都是公众关注的热点议题，从1～2年到8～10年不等。

必须承认，我国在算力、算法和数据领域其实并不具备优势：高端算力卡被英伟达卡脖子无法供应，短时间内自有制程和设计又无法跟上；算法领域，虽然模型数量众多，但大多数是基于国外开源架构优化，缺乏自主性和领先性；数据领域，我们的开放数据和国外不在一个数量级上，中文语料严重不足。

这些差距是短期内难以抹平的，这时候，缩短差距的正确打开方式，自然不是以己之短博人之长。

从另一个角度看，我国有全球唯一的全工业门类、最多的金融消费人群以及最大规模的政务和城市体系，产生了丰富的场景和私有数据，这些都成为发展行业大模型的天然土壤。因此，比拼应用成为中国大模型破局的一条有效路径，通过大模型赋能一个个行业细分场景，最终形成战略突围。

以差异化优势入局，可以预见，今天率先拥抱大模型的行业企业和组织，面对的将是一个划时代的重大战略机遇。

政企行业大模型挑战重重，工程化能力是“胜负手”

当然，站在新时代的起点，政企行业打造大模型，依然是挑战重重，因为大模型的应用本身就是一个复杂的系统工程，除了单点技术的持续突破外，更需要基于场景和需求匹配合适的技术，通过全链路、多技术融合的系统性创新整体推进。

首先，大模型不是孤立的技术，必须重视软硬件基础设施的协同发展。除了大模型本身，我们还需要关注其背后的技术生态系统，包括开发工具、计算架构以及硬件设施如算力、存储和网络。在设计和验证过程中，必须考虑性能、可靠性、可维护性和兼容性，确保系统的高效和稳定运行。

第二，行业大模型需要AI-Native的基础设施。一般企业可以直接选择公有云享受云上的充沛算力，但对于政府、金融、电力等大型政企而言，为了满足安全合规要求，混合云才是更优选，即先借公有云的超大算力和数据训练基础大模型，再在私有云里结合私有数据二次训练得到企业专属大模型，最后在边缘云推理实现场景化应用。

第三，大模型需要建立AI开发工作流，促进模型确定性交付。大模型的开发是一个复杂的系统工程，需要跨团队协作和迭代开发。为了提高开发效率和质量，需要建立一站式的AI开发工作流，实现标准化和自动化，减少开发过程中的不确定性。

第四，大模型需要重视数据工程，打造优质数据集。高质量的数据是大模型成功的关键。目前中文数据集与英文存在差距，需要通过建立数据工程能力，优化数据的供应、流动和使用，为大模型高质量供数。

第五，行业大模型不适合孤军作战，需要着力培育产业生态。生态是发展大模型不可或缺的一环，这需要政府和行业头部企业从技术生态、数据生态、模型生态和应用生态四个层面，去构建AI时代开放、可闭环、有质量的生态体系。

最后，大模型不是一锤子买卖，需要持续运营与优化。大模型运营和建设同样重要，持续的运营和优化对于大模型平台的长期价值至关重要，这要求企业建立适合的流程、组织结构和人才队伍，不断优化现有场景并探索新的应用领域。

一言以蔽之，行业大模型考验的不是单项能力，而是全流程融会贯通的工程化能力。

先行者迈出坚实步伐，行业大模型未来可期

综上不难看出，尽管当前大模型在技术和价格上卷得如火如荼，但其兑现价值的“主航道”在行业，真正的赛点在于落地。在行业大模型的大赛道上，不盲目追求堆算力、堆参数量，而是聚焦技术与场景的深度融合，踏踏实实积累工程化能力，帮助行业大模型落地才是关键。从这个层面讲，AI for industries的华为云与政企行业先行者的联合创新实践，可谓走在了正确的道路上。

去年，华为云就率先发布业界首个大模型混合云华为云Stack。在近期的华为开发者大会上，华为云更进一步发布大模型混合云十大创新技术，包括多样性算力调度、算子加速、云边协同等等。既有根技术研发实力，又有业界最全的AI大模型全套工具链和软硬件产品，华为云Stack一套组合拳下来，行业大模型的焦虑也被治好了大半。

比如，从2022年开始，山东能源集团携手华为云基于混合云打造全球首个矿山大模型，已在煤矿领域9个专业40多个场景应用实践。今年1月，鄂尔多斯与华为联合打造内蒙古首个以行业AI大模型为核心的工业互联网平台，在煤矿领域提升、主运、安监、防冲、采煤、掘进、辅运、洗选、焦化等9个专业实现了26个场景智能化，达到可视、可管、可溯规范化作业，提升安全生产能力的同时有效提高了生产效率和效益。

更值得注意的是，先行政企的行业大模型不仅是自建自用，更是在牵头打造示范场景并沉淀经验，对外输出向行业赋能。比如，鄂尔多斯工业互联网平台目前已完成44个AI大模型应用开发，上架270多款商品，为28家AI企业、16家矿鸿企业共44家应用开发者以及当地300多家矿山生产企业提供了开放可靠的交易平台。

展望未来，相信在华为云及产业上下游各方的共同努力下，依托我国场景丰富的优势，大模型必将能够打开更广阔的行业智能化天地，加速迈向智能世界，释放更大的经济和社会效益！