年轻人追捧上海为“魔都”,原因或许包括一点,上海善于在“年轻产业”施展“魔力”。
与以往任何一场颠覆性的科技革新相比,人工智能(AI)大模型的浪潮来得更为迅猛和狂热。以2022年11月ChatGPT问世为代表,人工智能发生了方向性改变,从辨别式AI走向生成式AI,后者底层技术即大模型,在全球迅速掀起一场大模型技术竞赛。
短时间内,微软、谷歌等几乎所有全球科技公司都在押注大模型。国内情况如出一辙,百度、阿里、商汤等科技企业及科研机构纷纷入局。2023年被称为“大模型元年”,一度出现“百模大战”的盛况,2024年逐渐进入应用落地层面“百花齐放”,大模型发展日新月异。
得益于在人工智能产业上率先布局和技术积累,上海在大模型这条新赛道上跑在前列。
2023年9月28日,全国首个、上海唯一的大模型创新生态社区模速空间在徐汇滨江成立。不到100天,50余家AI企业入驻这片“新空间”。2024年5月8日,模速空间迎来二期重点企业入驻,至今已有70家企业完全入驻,有“超过58家企业在排队”。
国家网信办2024年4月发布信息显示,全国现有117款生成式人工智能服务通过备案,其中上海独占24款。另据上海市网信办6月13日最新数据,上海备案大模型数量已达到34款。模速空间所在的上海徐汇囊括其中21款。
飞速发展的大模型技术正在重塑千行百业,人工智能与行业、场景的深度融合备受期待。在上海建设国际科创中心的版图上,以模速空间为代表,AI大模型已成为一颗冉冉升起的新星。
2024年以来,记者深入报道并持续关注上海模速空间,新故事不断在这里上演。本文聚焦模速空间新进展,并分析上海布局大模型产业的历程及面临的机遇和挑战。
向垂类应用拓展
模速空间揭牌半年多,规模持续扩大,入驻企业开始向ToC(消费者)端垂类应用拓展。
5月8日,模速空间迎来二期重点企业入驻,现在一二期近两万平方米载体已投入使用,入驻大模型相关企业共达70家,三期正同步规划设计中。模速空间的规划面积,最终将达10万平方米。
“三期现在已经有超过58家企业在排队,其中28家企业已经签约。”5月23日,模速空间运营方,上海大模型生态发展有限公司总经理陈海慈在接受记者采访时说,目前整个行业发展的热度跟速度超出预期。
陈海慈特别提到,与模速空间一期相比,二期入驻企业在垂类应用的拓展上显示了更多可能性。
不少业内人士曾指出,2024年将是AI大模型“应用之年”,“杀手级”应用或将出现。同时,大模型应用的用户也将在两三年内有十倍乃至百倍增长。模速空间聚集了较多面向ToC端的新兴大模型企业,有望持续产出大量标准化的产品和应用。
刚过去的5月,模速空间“在ToC端跑得很快的”MiniMax,推出了面向消费者的一款“海螺AI”。
MiniMax是模速空间的底座基础大模型企业之一。2024年1月,其发布了国内首个基于MoE架构的大模型abab 6;三个月后,4月17日进一步推出更强大的abab 6.5。
海螺AI,背后接入的就是MiniMax自研的多模态大模型,包括上述万亿参数MoE大语言模型abab 6.5,语音大模型和图像大模型。
打开这款应用,其交互方式与国内外主流大语言模型相似,如同一款“智能助手”,可即时提问,也可上传资料进行分析。它可支持输入200k tokens的上下文长度,1秒内处理近3万字的文本,可进行书籍、长篇报告、学术论文等内容的阅读、分析和文本写作。
同时,它具备实时语音对话功能,用户可与AI进行对话和问答,以多模态的交互方式满足需求。
在模速空间,一些企业像海螺AI一样在ToC端打造智能助手。另一趋势是,还有些企业利用AI大模型赋能千行百业。
孪数科技是入驻模速空间二期的企业之一。5月24日,施耐德电气全球执行副总裁Barbara Frei到访模速空间,与孪数科技就“睿动魔方”孪生智能系统的技术以及未来的战略深度合作展开讨论。
孪数科技称,其与施耐德电气联合开发的“睿动魔方”数字孪生系统,包括魔方机器人,HMI端和MR端数字孪生系统,致力于大语言模型赋能柔性产线设备控制。
在陈海慈看来,如果说模速空间一期企业更多专注于大语言模型,那么二期企业则彰显了人工智能走进千家万户的可能性。
“可用、够用、好用”
从诞生起,模速空间不同于一般科创园区,关注的重点并非招商,而是定位于一个人工智能全产业链的创新生态社区。
陈海慈称,一方面,模速空间不断把AI产业链上、中、下游聚集在一起,既有底座大模型,也有垂类和行业应用模型,既专注大模型技术型企业,也支持AI推广、营销类企业。
另一方面,模速空间运营平台所有的工作,算力调度、开放数据、评测服务、金融服务、综合服务等,归根结底只为保障AI企业创新创业,提高社区创新生态的浓度。
一个最新动作是,上海西岸国际人才港于2024年5月在模速空间启用。模速空间对高平台、高学历、高视野的创新创业人才的需求不断提升,此举为进一步吸纳和服务科创人才。
很多人已知道,大模型是建立在大算力、大数据和强算法之上的创新应用,依靠人工“喂养”的大量数据,通过不断训练,大模型可以极大地扩充知识边界,从而导致智能涌现。
算力被视为大模型的“水电煤”,如果没有以算力为核心的基础设施作为支撑,大模型根本就跑不起来。但是,算力是稀缺资源,也是AI企业发展最大的瓶颈。
“模速空间成立后,上海做的第一件事就是为企业协调和调度算力。”陈海慈说,模速空间以初创企业和中小企业为主,这些企业在算力议价上常常很被动,不仅算力价格贵,而且使用时间和周期也无法保障。
在上海市和徐汇区协调下,模速空间从一开始就对接算力厂商,确保社区内即使是初创中小企业,也能够公平地获得算力,从而训练各自的大模型。
商汤科技董秘办董事总经理盛世伟告诉记者,模速空间揭牌后,商汤科技与徐汇区达成合作,先期提供1000P的专属算力供模速空间的AI企业使用,满足了许多初创企业需求。作为上海本土企业,商汤大装置现有的总算力规模已突破性地增长至12000 petaFLOPS。
商汤只是模速空间的供应商之一。目前,模速空间的算力调度平台已对接商汤、华为、腾讯、阿里和三大电信运营商等9家供应商,共计超过50000张GPU卡。用陈海慈的话说,确保企业算力“可用、够用、好用”。
“去年9月入驻模速空间,我们得到一些政策性支持。”金融垂类大模型企业“金声玉亮”合伙人查小荟告诉记者:“除了场地支持,还包括算力补贴,因为大模型本身需要长期不停训练,才会越来越智能、越来越有效。”
查小荟说,商汤、移动、电信等算力厂商会到模速空间进行调研,与AI企业一对一接洽,匹配不同的算力需求。对初创企业而言,这种服务保障可谓“及时雨”。
算力决定模型的速度,语料决定模型的质量。陈海慈称,模速空间依托上海人工智能实验室开源数据平台OpenDataLab,协同大模型语料数据联盟,为入驻企业提供大规模、多模态、高质量的开放数据服务。这些语料、数据,有效支撑企业训练模型。
此外还有金融支持。目前,徐汇资本、奇绩创坛、临方投资、游族投资等入驻模速空间常态化办公,截至2024年5月,入驻投资机构在管基金规模约8000亿元,累计对接服务大模型企业43家。
上海AI生态的优势
模速空间横空出世,上海能够短时间集聚这么多AI大模型企业,形成大模型创新生态,背后是长期技术积累和产业布局。
据记者梳理,自2017年起,上海在全国率先布局发展人工智能产业,2018年举办首届世界人工智能大会,至今已连续举办6年。这几年,上海AI产业规模从2018年1340亿元跃向了2022年3821亿元,年均增长超29%。
徐汇区是上海人工智能产业最集中的地区之一,徐汇区科委主任张宁在接受记者采访时谈道,模速空间的快速诞生和壮大,相关部门作了大量调研分析、抽丝剥茧,“我们是把大模型产业看明白了再引进企业的。”在这一轮生成式AI的浪潮袭来之前,外界仍把AI视为技术,上海已把它当作产业赛道。
商汤在上海发展壮大就是一个例子。
过去半年,全国智能计算中心的招投标金额超过百亿元,算力供给快速提升,呈现出蓬勃发展的势头。而早在2020年,商汤科技就在上海临港启动了新一代人工智能计算与赋能平台建设。2022年初,作为商汤大装置重要载体的人工智能计算中心(AIDC)正式投运,成为亚洲最大的人工智能计算中心之一。
“我们之所以在上海建设这样一个大规模的基础设施,背后有几个原因。”5月23日,商汤科技联合创始人、商汤科技大装置事业群总裁杨帆在解放日报第79届文化讲坛说。
杨帆解释,之所以押注AI基础设施,一方面是商汤认为AI的基础设施建设是未来构建一个繁荣的人工智能产业生态所必备的底座;另一方面,因为上海在人工智能的产业生态上有着独特的优势。
上海人工智能产业发展有良好政策环境。2022年9月上海制定《上海市促进人工智能产业发展条例》,这是全国人工智能领域首部省级地方法规,从科技创新、产业发展、应用赋能、产业治理与安全等方面制定了明晰的法律规定。
2023年11月,为精准支持AI大模型创新发展,上海出台《推动人工智能大模型创新发展若干措施(2023—2025年)》。这一系列的政策措施,营造了通用人工智能的创新生态。
机遇和挑战并存
今时今日,AI大模型的概念吵得沸沸扬扬。有人开玩笑,谈生意如果不提AI,都不好意思说自己是做企业的。
但即便讨论的声量高,一个基本事实是,AI大模型仍是新生事物。它处在早期高速发展阶段,国内外企业都在摸索它的商业落地前景,应对投入产出带来的现实挑战。
首先,大模型技术还在演进。上海人工智能实验室领军科学家林达华在2024全球开发者先锋大会上谈道,大模型技术演进有两股主要驱动力量,一是源于所有研究者和从业者对于AGI(通用人工智能)技术理想的追求;另一方面,是产业界看到了大模型带来产业革命的可能性,以巨大资源投入此赛道。
这两股力量交织促成了人工智能行业的迅猛发展。林达华说,过去一年人工智能领域所取得的技术突破,远远超过了过去十年甚至几十年的突破和进展。
林达华认为未来会有更高效的模型结构出现。当前主流的大模型无不建立在Transformer架构堆叠的基础上,但产业界和学术界在不断探索更加高效的架构,随着验证逐渐成功,未来它们会慢慢进入产业界,带来模型架构新的黄金期。
其次,大模型如何商业化落地是最大挑战。多个业内人士提到,AI企业普遍受困于巨额研发投入与少得可怜的商业回报。若在投入上浅尝辄止,企业无法真正部署人工智能技术,但不计回报地投入,则意味着巨大风险。
“人工智能拥有如此广阔的前景,但我们对于它的发展满怀期待的同时,也不可回避它所面临的很多挑战。”杨帆说,人工智能在产业发展方面面临的一个最大挑战,就是如何让AI公司能够持续性盈利。
第三,人工智能基础设施化是必然趋势,应用层丰富的场景将是重要机会。包括百度创始人李彦宏在内,多个业内人士都曾谈及AI基础大模型层面的机会正在收敛,而应用层的想象空间正在打开。“卷模型不如卷应用”已逐渐成为共识,国内丰富的应用场景和数据将是AI创业企业的机会。
“今天可以看到,基础大模型的数量在收敛,大家的赛道开始出现细分,不是在挤同一个赛道。”陈海慈说。模速空间成立时就提出“十百千万”的目标,即十万平方米孵化空间、百家创新企业、千款行业应用、万亿产业规模。其中百家创新企业和千款行业应用,也意味着在千行百业当中寻找商业落地场景。
模速空间运营方和多个入驻企业在接受记者采访时谈道,基于底座大模型,研发更多的行业模型、垂类模型,在消费、游戏、娱乐、金融、自动驾驶等各领域为AI应用层的繁荣提供了条件。
“对模速空间来说,我们的定位就是大模型的孵化器和加速载体,今后模速空间的企业不会只有70家,我们希望会有700家甚至更多企业在模速空间的支持下成长起来。”陈海慈说。
模速空间当前的愿景,就是希望通过这块新空间开枝散叶,扶持更多中国AI大模型及应用诞生。
“希望有一天媒体采访一些中国大模型头部企业时,他们会提到起步就是在模速空间,如果这一天到来,我们的目标也就实现了。”陈海慈说。