“以大模型为代表,AI正在加速产业升级和经济增长,‘百模大战’说明,大家都看到了新的趋势。但我认为,在短短数月时间内,多个行业大模型密集出现,这只是阶段性现象,终局应该是只有少数几个大模型胜出。”这是百度集团副总裁吴甜19日接受记者采访时作出的判断。
最近几个月,包括三六零、昆仑万维等A股公司,也包括华为等科技公司,还有百度、腾讯等大厂在内,都争相挺进大模型,这使得这项新兴AI技术,快速分化为通用大模型、行业大模型、垂直大模型、专属大模型等多大类别。
之所以会出现终局胜出者不多的判断,重要原因之一来自于成本端——真正从底层做起来的大模型成本非常高。
吴甜介绍,大模型并不是想要做就能做起来的,需要有多年的积累、综合的能力和坚定的信心,一直投入下去,才能够做好。从这一点上可以看到,将来只能有少数的大模型。
同时,应用层面,未来想象空间依然很大,未来依托几个少量大模型,将会衍生出非常广泛的应用生态。
在部分地区发力成为AI创新策源地的过程中,应用端的创新就是重要发力点。北京市科学技术委员会日前发布《关于征集北京市人工智能行业大模型应用案例和应用场景需求的通知》,面向北京市人工智能创新主体和行业用户,征集人工智能行业大模型应用案例、行业应用场景需求,同时启动北京市大模型技术产业创新图谱梳理工作。
按照计划,北京市将充分结合社会经济高质量发展需求和区域特点,聚焦大模型技术创新与应用,加快推动相关技术及产品熟化落地,不断拓展行业大模型应用广度和深度,形成技术支撑、场景牵引、深度赋能的人工智能行业大模型产业生态。
科技部新一代人工智能发展研究中心此前发布的《中国人工智能大模型地图研究报告》显示,我国10亿参数规模以上的大模型已发布近80个,其中北京发布的数量最多,几乎占全国近一半,大模型学者指数、模型开源数量和影响力等指标均位居全国第一。
随着大模型数量的增多,玩家能力排序也必然走向分化。最新发布的《AI大模型技术能力评估报告》显示,百度文心大模型评分为3.5,12项指标7个满分,综合评分排名排到了第一。
大模型百舸争流过程中,依然面临不少挑战。吴甜认为,现阶段大模型的产业化面临着三大挑战。首先是模型大带来的训练难度高、成本高;第二,对于算力规模要求非常大,性能要求高;第三,数据规模大,收集、挖掘、建设、筛选、清洗这些数据本身也是一项巨大的工程。
在吴甜看来,大模型的产业模式可以类比芯片代工厂。“大模型平台是价格昂贵的大算力系统,可以把大数据、大算力、大算法都封装,并且可以建设自动化、数字化、标准化的的生产模式。应用方只需定义好问题,把对AI模型的能力要求交给大模型平台,由大模型平台进行生产,这样才有可能实现产业应用遍地开花。”她认为,大数据、大算力和强算法通过开发训练的过程,都可以封装给大模型平台,让千行百业都可以使用。只有这样,大模型才能真正高效地支撑起千行百业的应用。