让大模型真正成为新质生产力。
作者|刘杨楠
编辑|王博
2月29日下午,2024中关村论坛系列活动——第二届北京人工智能产业创新发展大会在国家会议中心举行。
这是春节后第一场人工智能产业的重磅大会,国家会议中心四层大会堂座无虚席。在由Sora引发的新一轮人工智能热潮中,不少新问题也出现在了人们面前,“寻找答案”也成为了很多参会观众的目的。
本届大会的主题是“更安全、更开放、更普惠——让大模型真正成为新质生产力”,聚焦人工智能大模型成果应用。大会由北京市门头沟区人民政府、中关村发展集团股份有限公司、华为技术有限公司发起。
在大会上,位于门头沟区的“京西智谷”还发布了多个重要的产业合作项目。
算力方面,北京市首个自主创新人工智能算力集群完成签约,可支持运行千亿级别参数大模型。这意味着“一廊四极”首都地区算力供给体系中的“京西一极”将通过更多更优质的算力,创造新质生产力。
数据方面,北京市国际大数据交易所数据资产服务中心揭牌,门头沟区人民政府将联合北京市国际大数据交易所探索“产业+数据”“数据+场景”“数据+应用”的创新发展模式。
应用方面,央视网依托总台超高清国重实验室下设全媒体融合传播研究机构的科研资源,与门头沟区“京西智谷”共同成立“AGI(通用人工智能)联合研究中心”,关注视频生成大模型,探索传媒行业人工智能应用落地。
此外,“京西智谷”联合智谱华章、百川智能、面壁智能、第四范式、中国科学院自动化研究所等24家在京企事业单位发起“大模型应用产业联合体”,旨在促进人工智能技术的广泛应用和产业的深度融合,共同致力于推进人工智能技术的研发和应用,特别是在大模型领域的突破和创新。
这背后有何深意?对北京人工智能产业又会有哪些促进?
“大模型应用产业联合体”发起仪式,图片来源:大会主办方
在本次以大模型为核心的技术浪潮中,北京在人工智能产业的布局无疑走在全国前列。
根据北京市科委、中关村管委会信息科技发展中心在大会上发布的数据,北京人工智能相关企业数量约2200家,约占全国的39%,其中独角兽企业33家,占全国的50%。北京人工智能领域学者超过1.5万人,占全国4.9万人的30.6%,位居第一。
以“清华系”为代表的人工智能创业公司迅速涌现,海淀区五道口则成为大模型领域的“宇宙中心”。
不过,真正的宇宙由无数星系组成,大模型生态也是如此。“宇宙中心”之外,还有一众星系有序运行在自己的轨道上,共同维持宇宙的平衡。
门头沟区,便是京西正在闪耀的“人工智能”星系。
2019年,门头沟“乌金遍地下,百宝满山川”的千年采煤史画上了句号,人工智能随后成为了门头沟区三大产业之首。2023年,门头沟区便联合中关村发展集团、华为公司共同建成并运营100P“京西智谷”智算中心,获科技部全国首发、华北地区唯一“国智牌照”及北京市首家“北京算力互联互通平台首通调度成功企业”称号,“京西智谷”成为了门头沟区的新名片。
门头沟区委副书记、区长吕晨飞在大会上表示,门头沟区是北京人工智能重点布局区之一,近年来,门头沟区立足地区实际,在全市人工智能产业发展大局中找准自身定位,与海淀等人工智能强区实现错位发展,瞄准“小切口”做好“大文章”。
如何理解瞄准“小切口”做好“大文章”?会上公布的门头沟区人工智能产业发展路径,就是答案。
一方面,探索建设安全自主的人工智能生态,即构建基于国产自主芯片的全栈自主算力,并融合国产自主软件,打造以国产自主大模型为基础的全要素国产自主创新产业生态。
另一方面,着力建设全国数字视听领域生成式人工智能高地,即借助央视和门头沟区的合作,重点聚焦数字视听领域,以AI+5G+4K/8K为方向,深入探索“大模型+垂类模型”应用,形成“大算力+大模型+大应用”模式,积极打造前沿技术先行先试的展示窗口。
目前,门头沟区已经以“京西智谷”智算中心为基座,将产业版图向上延伸至框架层及模型层。
数据、算法、算力是推动人工智能创新发展的“三驾马车”。以大模型为核心的新一代人工智能浪潮中,“三驾马车”依然缺一不可。
北京智源人工智能研究院理事长、北京大学多媒体信息处理全国重点实验室主任黄铁军则强调了AI生态的重要性。他认为,大模型将创造一个包容一切的新生态,历史经验可以借鉴但都不足以描述,积极参与创造这个生态就是正确的方向。
黄铁军在大会现场分享,图片来源:大会主办方
开放是普惠的基础。门头沟区正在试图建立一个更开放的商业生态,来最大程度填平中小企业追赶世界领先水平的鸿沟。
会上,北京人工智能代表企业发起了“大模型应用产业联合体”。“联合体”依托华为硬底座和软底座,立足北京,放眼全国,协同人工智能产业模型、应用、服务等各类伙伴,共同探索人工智能生态合作模式,建立人工智能产业标准,打造繁荣的人工智能产业生态,加速人工智能产业升级。
央视网依托总台超高清国重实验室下设全媒体融合传播研究机构的科研资源,与门头沟区“京西智谷”共同成立“AGI联合研究中心”,双方优势互补、强强联合,面向生成式人工智能在视音频领域的应用开展前瞻性技术科研攻关,持续输出研发成果。研究中心将充分发挥科技引领作用,加强产学研结合,持续提升科技创新能力,加快促进科技成果转化,进一步推动生成式人工智能这一新质生产力的快速发展。
此外,产业的长远发展离不开源源不断的优质人才。
2023年,门头沟区发布了《门头沟区人工智能大模型产业创新发展三年行动计划》,与智谱华章共建了大模型赋能创新中心;开放了七大类别人工智能应用场景,推动中科视语道路识别检测等标志性场景成功落地;建立了全国首个人工智能安全可信护航计划生态发展中心。
目前,算力、模型到应用场景,再到人才培养,门头沟区对人工智能产业的全要素布局已经初现雏形。这与黄铁军此前的预测不谋而合,他表示,未来大模型生态将只有少数几个顶尖的大模型,而其他企业需要在生态中找到自己的位置。
而在这个生态中,门头沟区的角色是什么?
“追赶”,是2023年中国人工智能产业的一大关键词,或许也会成为2024年的关键词。
当OpenAI用暴力美学炸开了认知智能的新世界,这家成立不到十年的创业公司就已成为全球AI企业的指向标。近期,OpenAI又用文生视频模型Sora刷新了广大从业者的认知,由Scaling Law(规模法则)产生的智能涌现,让OpenAI“暴力美学”的传奇还在继续。
大会上,清华大学基础大模型研究中心主任、教授唐杰就提出了一个问题——Scaling的尽头是 AGI吗?在他看来,真正的Scaling规模远超学术界想象。
唐杰在大会现场分享,图片来源:大会直播截图
在“如何追赶OpenAI”的大命题下,算力、数据、参数设置、人才、资金、落地场景、商业模式等子命题如何解决,成为除OpenAI之外所有AI企业的共有难题,也是区域发展中决策者必须要考虑的问题。
在大语言模型这块处女地上,解决每一个子命题都需要“摸着石头过河”,区别在于,一个人独自“过河”,还是一群人手拉手共同前进。
知不足而奋进,望远山而力行。
有决心还要有工具。华为公司副总裁、计算产品线总裁张熙伟分享,华为昇腾通过在基础软硬件生态、开发者生态上的持续建设,打造更开放、更易用、更协同的新生态。昇腾将全面深化人工智能产业合作,助力北京建设全球数字经济标杆城市。
找到了“黑土地”,就需要一片“试验田”。而门头沟区正在做的,便是为生态中各个生态位的企业提供一片丰沃的“试验田”,成为各生态位玩家之间的“粘合剂”,让企业们“拧成一股绳”,在门头沟的土地上相互合作、试错,进而不断成长、蜕变。
其中,算力是人工智能发展的重要支撑。无论是过去一年激烈的“百模大战”,还是持续的芯片“卡脖子”难题,都证明优质算力已经成为稀缺资源。
在人工智能产业发展热潮中,算力跟基础设施是一样的,大企业有自己的算力,而对于中小企业来说,算力非常宝贵,为中小企业提供普惠的算力服务,在北京市范围内,门头沟区是第一个破题的。
这种勇于破题的精神转化成了打造生态的决心。在本次大会上,“京西智谷”发布了近期的产业合作成果,其中北京市首个自主创新人工智能算力集群受到各方关注。
面向多样化场景和共性技术研发,“京西智谷”人工智能计算中心致力于打造开源开放、安全高效的人工智能算力集群,支持运行千亿级别参数大模型,并积极配合中国算力网络建设,力争成为北方智能算力枢纽中心。
吕晨飞在大会上介绍,门头沟区作为“首都发展重要门户”,将继续抢抓机遇、开拓创新,瞄准打造“京西智谷”,加快人工智能产业发展。
一是进一步建强国产自主算力,按照首都算力供给体系规划,聚力打造“京西一极”,构建基于华为、摩尔线程芯片的异构算力,全方位做好大规模算力基础设施的建设、管理、使用和技术支持。
二是聚焦数字视听领域深化人工智能产业发展,与央视合作建设AGI联合研究中心、内容安全大模型、数字人产业平台。
三是进一步优化产业生态,出台和完善行业细分领域、专精特新企业、人才引进扶持、基金金融支持等系列政策,并进一步深化创新应用场景开放。
此外,门头沟区与中关村发展集团共同打造百万平米高品质中关村(京西)人工智能科技园,一期31万平米将于今年年底达到竣工条件,明年上半年开园。
科技是国家强盛之基,创新是民族进步之魂。以大模型为首的人工智能技术是新一轮科技革命和产业变革的重要驱动力量,将深刻改变人类社会生活、改变世界、改变未来。
21世纪的第三个十年,基于大模型的一系列原创性应用将构筑数智生态、释放数字生产力,凝聚出新质生产力的新动能,成为高质量发展的发动机。同时,大模型技术也会逐步走向更安全、更开放、更普惠,推进千行百业的数字化转型和智能化升级,加速实现高水平科技自强。
(封面图来源:大会主办方)