最近,作为一个生活在“中国最互联网城市”的深圳市民,我突然萌发要写这样一篇文章的想法。然而,作为一个人工智能领域的小白,我并不知道该从哪些方面下笔。
于是,我准备了一些问题,想要请教业内人士为我解答。经过一天的资料搜集,我终于将问题拟好,但是发给他们后,等待回复需要两天时间。
迫于时效性,我又十分想立刻知道这些问题的答案——
于是,我把其中一些问题分别发给了“WeTab AI pro”“文心一言”“讯飞星火”三个平台,很快我就得到了相应的答案。
(图为WeTab AI pro的回答)
(图为文心一言的回答)
(图为讯飞星火的回答)
在这三个不同的平台中,我得到回复的时间分别是“即刻”“3秒”“10秒”;面对专业回复,我即将等待的时间是“两天”,不同的回应时间便很好地解释了——什么是算力。算力的发展,意味着效率的提升与跃迁。
假如想让现在与我对话的模型变得更加聪明,就需要对模型进行不断的训练。训练大模型,不仅需要被灌入海量的数据,还需要复杂的数学计算、更是动辄千亿级别的参数;没有足够的算力,就无法快速地处理这些数据、无法快速更新这些参数,更别说让模型表现得足够聪明伶俐。
以ChatGPT为例,训练它所耗费的算力大概是3640PetaFLOPs/天,相当于用每秒运算1000万亿次的算力对模型进行训练,需要3640天才能完成。
数据被视为最宝贵的资源,是一座富矿,而算力则被视为是挖这座矿的工具。通过算力对数据进行处理,就能挖掘巨大的数据价值,创造财富。正因此,算力才会被视为人工智能时代下的核心竞争力。
制约与突围
在全球经济复苏面临较大不确定性的同时,数字经济依然保持强劲增长,算力已经成为经济增长的重要驱动引擎。
尽管2023年8月的数据显示,我国在用数据中心机架总规模超过760万标准机架,算力总规模达到每秒1.97万亿亿次浮点运算(197EFLOPS),位居全球第二,算力总规模近5年的年均增速近30%。
但有相关数据呈现,从人均角度来看,中国仅处于中等算力国家水平。
世界各国人均算力对比(2020)(图源:《泛在算力:智能社会的基石》)备注:原数据来自罗兰贝格咨询公司
业内人士介绍,我国和国外的算力发展主要存在三方面的差距:算力层面、芯片技术及算力商业模式。
算力层面主要体现在国内外大模型的差距。目前国内已经发布的大模型产品有百度文心一言、讯飞星火、Kimi等,但是从试用结果看,和ChatGPT、GPT4仍有一定差距。
一方面是因为算力基础设施规模小于微软的规模水平,因此训练精度水平并不深;
另一方面是国内做AI大模型的时间相对较短,还需后续的优化。在OpenAI做出产品之前,这个领域一直没有商机和盈利,因此很多互联网企业都没有实际落地该应用,ChatGPT火了之后,互联网大厂才加速推动大模型产品。
当然,大模型的正常运行,离不开最为核心的载体——芯片。如ChatGPT所耗费的算力(3640PF/天),若换算成英伟达A100芯片,理想情况下总共需要大概6000张,在考虑互联损耗的情况下,则需要一万张A100作为算力基础。
“2022年10月,美国限制英伟达和AMD向国内出售高性能计算芯片,国内能够买到的GPU芯片数量比较有限。然而,高性能GPU芯片代表着这个时代‘顶级聪明的算力’,这个水平的芯片面临缺货,正在成为我国发展高水平AI技术的主要限制因素。”业内人士表示。
另一位业界人士指出,“去年12月,有分析机构曾给出了详细的数据:H100的性能达到1979Tflops,而A100的性能为624Tflops。而就最强的国产AI芯片而言,其性能仅为512Tflops,与A100相比仅有四分之一的算力。此外,国产AI芯片在单位算力功耗和发热等方面也存在一些问题,落后于英伟达的A100和H100。考虑到AI训练和推理等任务对大量芯片的需求,国产AI芯片的高功耗成为企业难以承受的负担。”
虽然我国在算力产业链后端(半导体产业)需要作出长期努力,但在算力产业链前端(提供算力服务或服务器)是具备较强竞争力的。全球市场只有美国和中国拥有规模化的云厂商,国内各行业也呈现云化转型的发展趋势。
但仍需注意的是,我国的云计算厂商整体上并不赚钱。据统计,中国七大云计算厂商加起来,全球份额低于20%,年营业亏损总和超百亿元。国外主要云计算厂商(微软、亚马逊)已经有了成熟的商业模式和稳定的利润回报。本土企业面临的最大压力,是长期在全球算力产业链的价值分配中处于劣势,使之难以进入商业可持续的良性循环。
当然,真正的算力竞争,并不是各个企业、科研院所单纯比拼谁每秒计算多少次,而是如何让算力流动起来,更大程度释放算力的利用率。
IDC(国际数据公司)数据显示,(全球主要经济体)企业分散的小算力利用率,目前仅为10%~15%,存在很大浪费。激活现有的算力资源,精准服务需求,要比单纯堆砌算力、死磕芯片更有价值。
构建更大范围的算力网络就是正在探索中的可行思路,我国推动的“东数西算”工程,就是算力网络理念的一次落地实践。东部地区明显对算力需求更高,西部地区因为制冷成本低(气温低),能源便宜(运输成本低),算力成本自然更低。借助成熟可靠的通信网络基础设施,将低时延要求的算力迁往西部地区,全国统一资源调配,可以实现更好的算力性价比。
去年12月底,国家发展改革委等部门联合印发了《深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》,相对“东数西算”工程启动之初的最大不同是,其提出了更清晰的解决方案,并给出了截至2025年底前的一系列明确建设目标。
谈及如何拉长板补短板,业内人士表示:“一方面,我国在基础设施建设方面具有速度快、成本低的优势,这有助于快速部署算力基础设施,如数据中心和通信网络;另一方面,我国拥有庞大的国内外市场和用户基数,这也为算力应用提供了广阔的市场空间和需求潜力。相信随着有关政策的出台和更多资金的投入,我们将不断发挥现有的优势,在算力领域实现快速发展,逐步缩小与国际先进水平的差距,并在某些领域实现领先。”
深圳:算力先锋城市的崛起与展望
国际数据公司(IDC)在《2022全球计算力指数评估报告》中指出,中国的算力产业规模和多样性目前正持续高速增长,2018年—2022年,北京、杭州、深圳的算力规模位居全国前三。
我所处的城市——深圳,作为中国改革开放的前沿城市,正在积极打造算力先锋城市,以推动数字经济和人工智能产业的高质量发展。
根据《深圳市算力基础设施高质量发展行动计划(2024-2025)》,深圳计划到2025年,通用算力达到14EFLOPS(FP32),智能算力达到25EFLOPS(FP16),超算算力达到2EFLOPS(FP64),存储总量达到90EB。先进存储容量占比达到30%以上,重点行业核心数据、重要数据灾备覆盖率达到100%。
在算力基础设施方面,深圳以政府、电信运营商、大型互联网企业、独立第三方为主力,位于深圳的国家超级计算深圳中心、鹏城云脑等算力基础设施,为人工智能产业的发展提供了坚实的算力保障。
据了解,去年11月举行的全球超级计算大会期间,鹏城云脑II存储系统凭借在全节点测试中超过21万分的表现,连续第七次夺得超算存储500强(IO500)榜单全球第一。此前,2022年6月,鹏城实验室牵头联合国内十多家计算领域的领军企业、科研机构启动的“中国算力网”研究计划取得突破,一期工程“智算网络”正式上线,跨域纳管了20余个异构算力中心。
以鹏程云脑为代表的深圳算力基础设施,是如何成为引领深圳发展的 “风向标”“梧桐树”的?它的建设,又有哪些可供参考的深圳智慧与经验?
对此熟知的业内朋友做了更加具体的分享:
一是使命担当定位高。鹏城实验室联合华为和国家新一代人工智能产业技术创新战略联盟AITISA等,规划建设——“鹏城云脑”。目前,鹏程云脑与鹏城实验室的“鹏城云网”“鹏城靶场”“鹏城生态” 等科学基础设施相互配合、相互促进,形成了独具特色的生动高效科研发展态势。
二是用人机制新、聚集人才快。鹏城实验室采用国内人才“双聘制”和国际人才“合同制” 的方式,实行“固定+流动”人才管理机制,多方合力,打破了“部门”和“行业”的界限。鹏城实验室灵活的人才流动聚合模式,也快速集聚了一批海内外高层次科技人才。
三是深化应用覆盖领域,赋能作用强。鹏程实验室为反哺深圳市投资,专门推出鹏程云脑100P的算力,免费供全市中小企业申请使用。运作机制上,由于中小企业算力需求频繁多样,鹏程云脑不直接面向中小企业,而是将算力划拨给市工信局下属的创新中心,由创新中心负责算力调配。支撑赋能上,除了算力供给,鹏程云脑还开发了许多基础软件、基础算法供中小企业使用。
“深圳充分发挥算力基础设施对数字经济‘聚合器’、‘孵化器’的作用,有效促进了人才、资金、技术、数据等要素的联动,从而优化数字经济发展生态,带动新能源、电子信息、高端装备等相关产业快速发展,这是我们应当从中汲取的‘深圳经验’。”他表示。
另一位业内人士则从“算力生态构建”的宏观角度出发,介绍了深圳有望成为算力先锋城市的内在基因:
从产业链协同发展上看,深圳集聚了华为、腾讯、平安等领军企业,以及晶泰科技、云天励飞等一批“领头羊”和“独角兽”企业,形成了覆盖基础层、技术层和应用层的完整人工智能产业链。这种产业链的完整性为算力建设提供了强有力的支撑。
从算力资源整合上看,深圳不仅构建全市“算力一网化、统筹一体化、调度一站式”城市级智能算力平台;还与周边城市合作,建设企业级智能算力平台;联合香港企业、科研机构、高校,打造深港人工智能算力中心等。这种规划与区域合作,有效整合了社会多元算力资源,提升了算力供给的效率和水平。
从市场供需导向上看,深圳出台《深圳市极速宽带先锋城市2024年行动计划》等系列政策,有助于明确市场预期,促进供需平衡;此外,在工业、先进制造业等优势重点行业,深圳围绕交通、能源、园区等企业场景,积极开展算力应用创新,提供算法公共服务,从而更好地满足市场需求。
“如今,深圳在算力发展上已经取得了一定的成就。然而,在芯片设计、高性能计算、人工智能算法等关键领域,深圳还需利用现有的人才、资金、技术优势,持续加大在算力核心技术上的研发投入,从而推动算力的进一步提升和拓展应用。”他说。
迎接算力浪潮,我们不必妄自菲薄
在我们审视产业发展时,一个重要的问题是:需要多少资源?
Sora的兴起让我们见证了OpenAI在从文本到视频领域的突破,然而,我们不能忽视的是背后所投入的巨大成本,包括数据训练和算力支持。ChatGPT依赖着约3万块GPU芯片提供算力支持,而Sora对算力的需求更是巨大。
据外媒报道,OpenAI的创始人正力图筹集高达7万亿美元的资金,用于支持公司的半导体计划。这一融资规模相当于2023年英国GDP的两倍多,对于多数国家而言,这样的资金投入都是不现实的。
如果我们希望创造比Sora更智能的AI模型,我们所需的数据和算力是无法预知的。然而问题在于,如果人们不断投入巨额资金用于争夺算力,最终研发出智能认知模型,又将为人类带来什么?也许AI能创作出更优秀的文章、漫画、视频,可人类却被迫在工作中与AI竞争。人工智能的发展旨在更好地为人类提供服务,而并非取代人类。
因此,除了不断发展通用大模型的算力和硬件,我们也在努力在特定领域进行开发,例如智能驾驶等专用大模型的应用,因为这需要的资金更少,而且可以直接应用于产业领域。总而言之,这就是我们国家在人工智能领域发展的逻辑。今年两会期间,与人工智能相关的新闻报道数量创下了历史新高,其中大部分与人工智能赋能产业有关。
与需要大量资金和算力的通用大模型相比,选择先确保AI为实体产业赋能,实现降本增效,这样才能更有效地利用资金。我们今天能够便捷地购物、能够尝试AR、VR等虚拟现实、能够体验更智能的家居与出行,都要感谢不断进步的“智能工厂”“互联网络”。
因此,没有必要过分夸大Sora的神话,也没有必要贬低自身。确实,长期以来,我们的科技发展一直在不断摸索前行,而现在在人工智能领域,我们也需要更多的开拓精神。
然而更重要的是,不是看别人在做什么,而是要清楚自己要做什么。
来源:圳经事