大模型赛道上,上海如何跑在前面?
走出龙耀路地铁站,现代、繁忙、艺术的上海西岸藏着答案。这里距离黄浦江滨江岸线几百米,沿路能看见休闲的行人,更多是脚步匆忙的白领。方圆一公里内,坐落着腾讯、阿里、微软、上海人工智能实验室、商汤、无问芯穹、蜜度蜜巢等科技巨头和AI大模型初创公司。
2024年3月下旬,上海西岸,模速空间。本文图片除注明外,均为澎湃新闻记者 李佳蔚 图
就在这个地铁站旁边,是全国首个、上海唯一的大模型创新生态社区“模速空间”。2023年9月28日,经历38天快速筹建,模速空间正式揭牌。不到半年时间,这里吸引了60多家大模型企业入驻,其所在的徐汇区已聚集近300家产业链上下游企业,规模仍在扩大。
人工智能(AI)是上海重点发展的先导产业,产业规模从2018年1340亿元到2022年突破3800亿元,年均增长超29%;规模以上企业数,也从2018年的183家增至2022年的348家。
大模型正引领新一轮人工智能变革,业界普遍认为,大模型是迈向通用人工智能的核心引擎,将带来人工智能的再次跃升,已经成为全球科技竞争焦点。
2024年,全国前4批次通过上线备案的大模型中,上海占据24个。其中,徐汇区独占15个,集中在模速空间。
可以说,模速空间是观察上海AI大模型产业发展的最佳窗口。这片区域,正在产生越来越大的集聚度、显示度、影响力。
3月下旬,2024全球开发者先锋大会(GDC)开幕,地点设在上海西岸,以“模速空间——开发者的模力之源”为主题,许多人冒雨前来参加。2月份,上海市委书记陈吉宁调研上海模速空间创新生态社区,主持召开人工智能科创机构和企业座谈会,听取意见建议、进行现场办公。
如果说现在正值大模型的“风口”——固然未来有很长的征途,在这个时间节点,上海已抢占先机,跑在前列。模速空间,正力争成为代表上海乃至国家赢取全球科技战略竞争主动权的“主力因子”。
近日,澎湃新闻记者以模速空间为切入点,实地探访并访谈多个大模型企业、政府相关负责人,探寻上海布局AI大模型赛道的前后过程和基础逻辑。
“上下楼就是上下游”
从地图上看,模速空间所在的上海西岸,分布着上海人工智能实验室、期智研究院、商汤科技、阿里巴巴、腾讯等知名科研机构和科技企业,形成一个人工智能产研生态圈。模速空间,在其中扮演专业孵化和加速载体的角色。
模速空间宽敞的公共区域,许多人办公、交流、开会。
3月下旬,澎湃新闻记者走进模速空间,这里和许多创业园区相似,设施简洁、舒适,环境明亮,除了一个个独立办公空间,宽敞的公共区域经常有人围在一起交流,气氛轻松。目前模速空间一期、二期共2万平方米已投入运营,三期已在规划建设中。
与其他创业园区不同的是,模速空间聚焦AI大模型领域。许多企业在门口设有公司简介,有的专注金融、商业垂类大模型,有的致力于通过大模型改善购物体验,一些企业面向政企服务(ToB/ToG),一些则直接服务个体用户(ToC)。
在模速空间5楼,“金声玉亮”合伙人查小荟刚结束上一场会议,在公共区域快速腾出一处角落与记者交流。她说金声玉亮属于金融垂类大模型,可以视作投资顾问的助手,帮助解答客户有关个股、行业、大盘的相关问题。
“我们的客户有不少金融大V,以前他们需要每天或定期录制短视频投放,停更时间长了就会掉粉。现在用数字分身,可以解决大V分身乏术的困扰。热点、内容、文本、肖像动作,一键就可以生成出来。”查小荟说,金声玉亮的语料库24小时不间断更新,很多金融投资热点,大模型能实时作答。
模速空间的很多创业者和查小荟一样忙碌、干练,几乎随时都有研发人员用中英文召开线下或线上会议。许多中国AI技术人员每天加班加点,铆足了劲头希望超越OpenAI。
模速空间所在的上海西岸。上海徐汇 图
徐汇区科委主任张宁在接受澎湃新闻记者采访时表示,这一轮人工智能企业创业,创始团队都有很强的产业背景:模速空间90%的创始团队有连续创业或大厂背景,80%的创始人来自头部名校,50%的团队有海外经历。
这里流传一句话:“上下楼就是上下游。”张宁解释,“在一栋楼里,聚集着大模型底层技术、应用研发、场景设计、算力支持、产品营销等一条产业链上不同的企业。”
政府作为“店小二”,希望在很近的物理空间范围内,让科研人员能找到任何想见的人、对接任何想接触的资源、获取任何想得到的生活服务,这是模速空间要做到的“集聚”。
这种集群效应,让入驻其中的企业深有感受。“我们的很多服务对象就在这栋楼里,走到隔壁办公室问一问,或者在孵化器组织的活动中就能了解行业的最新动态。”“开放传神”创始人张家庆把公司的加速发展,归功于一栋楼汇聚整条产业链的空间格局。
3月29日下午,在模速空间,蜜度蜜巢负责人刘益东在为央企高管介绍企业情况。
模速空间运营方、上海大模型生态发展有限公司总裁陈海慈告诉澎湃新闻记者,模速空间希望能形成一个产业链的闭环和生态,产生上中下游的和谐共鸣。“传统来说,其实就是提供一个空间的服务,类似于大家今天讲的孵化器或是众创空间,该有的我都有,物业、法律、投融资等等都会覆盖到。但是,更重要的是结合产业自身的特点,能为大家提供差异化的内容。除了那些传统的东西,我们会差异化地跟各类企业发展相关的核心内容,有针对性地解决问题。”
蜜度蜜巢总裁、蜜度CTO刘益东告诉澎湃新闻,其公司以上海人工智能实验室开发的书生通用大模型为基座,在政务垂类应用上发力,自主研发的蜜巢政务大模型能为企业和政府提供知识管理、数据挖掘等服务,已发布2.0版。
“‘书生’作为一个基座大模型,它也需要垂类应用参与,我们希望能够在这个里面成为强有力的生态建设者。”刘益东说。辅助是相互的,此前蜜度蜜巢向书生·浦语供给了语料,加入由上海人工智能实验室牵头的“语料数据联盟”。高质量、大规模、安全可信的语料数据,对于大语言模型的训练和性能提升至关重要。
张宁表示,汇集60多家大模型企业的同时,模速空间形成了算力调度、开放数据、评测服务、金融服务、综合服务等全方位的创新创业保障。
举例来说,算力是大模型公司最大的瓶颈,如果没有以算力为核心的基础设施作为支撑,大模型根本就跑不起来。模速空间的算力调度平台,对接了商汤、华为、腾讯、阿里和三大电信运营商等9家供应商,超过50000张GPU卡,全力保障大模型企业算力可用、够用、好用。
“半步优势”
人工智能并不是新兴事物,如果从1950年代图灵问出“机器能否有人类智能”算起,人工智能已经历半个多世纪的发展。只不过直到这一两年,随着ChatGPT和Sora的出现,AI大模型才终于引爆整个行业,让很多人看到“商业价值”。
2023年被称为大模型元年,国内外科技、AI企业纷纷下场试水,中国涌现出200多个大模型,一时间掀起“百模大战”。通用大模型、行业大模型、垂类大模型……各式大模型出现,各行各业都想从中分一杯羹。
虽然行业很热闹,创业者很兴奋,但大模型具体怎么落地商用,很多人似乎摸不着头脑。一些业内人士发现,与2023年ChatGPT带来的投资热潮不同,2024年Sora出现后,“大厂”显得“冷静”很多。
也在2023年,当很多大厂、企业看待AI的眼光终于从“技术”转换为“产业”时,上海徐汇悄然打造了一个“AI生态社区”,把产业链上、中、下游聚集在一起,全方位赋能应用。
换句话说,当大家都在卷模型的时候,上海创造了一种新“玩法”。
经过2023年的一轮“烧钱”,很多企业达成了一个新的共识:通用大模型,只是少数人的游戏;下一阶段,机会在行业大模型、垂类大模型。不久前百度创始人李彦宏也说:“大家不要去卷模型了,卷应用吧,只有应用直接创造价值”。
模速空间入驻的60多家大模型企业,超过80%是来自垂类领域的应用企业。“垂类可能是商业落地过程中多数企业唯一的选择。”查小荟从行业角度分析,通用大模型成本太高,产品很容易“中庸”,“好像什么都能做,又好像什么都做不好”,中小企业玩不起。
在产业风口,模速空间能够快速集结一批高水平的大模型企业,实属难能可贵。在张宁看来,一方面,这基于上海市和徐汇区的人工智能产业积淀,“我们很早就抓住了人工智能的变革趋势和产业风口”。
自2017年起,上海在全国率先布局发展人工智能产业,2018年举办首届世界人工智能大会,至今连续举办6年,徐汇一直是核心承载地。这几年,上海AI产业规模从2018年1340亿元跃向了2022年3821亿元。
很多人以为模速空间“横空出世”,张宁清楚背后的积累和布局。几年前,当人们把AI视为不赚钱的“技术”时,上海已开始把它当作产业赛道。一个典型的例子,就是培养和发展人工智能独角兽企业商汤科技。
另一方面,张宁说,模速空间的快速诞生和壮大,相关部门作了大量调研分析、抽丝剥茧,“我们是把大模型产业看明白了再招商的。”张宁说,和AI科学家、企业家打交道多年,他发现对大模型创业者来说,好政策固然重要,但企业往往更喜欢也更需要一个能够理解大模型产业,也懂得如何帮助大模型企业的政府。
基于此,模速空间作为全国首个、上海唯一的大模型创新生态社区,诞生在徐汇。张宁把这个过程谦逊地形容为“半步优势”。
不过,即使有“半步优势”,在大模型日趋白热化的竞争当中,任何城市都无法松懈。
2023年11月,上海印发《上海市推动人工智能大模型创新发展若干措施(2023-2025年)》,推出一系列支持大模型创新发展的政策措施,推动大模型语料联盟的实体化运作,开源一系列高质量的语料数据,为全球人工智能开发者创新创造构建更良好的生态环境。
徐汇区更进一步,推出许多增量举措。模速空间不仅有基金投资、产业链合作、房屋租金等优惠,初创企业还有“算力券”支持,这一平台降低企业大模型训练门槛,牵引大模型在金融、教育、医疗、制造等典型领域的垂直应用。
招商优质企业的同时,上海积极吸引青年人才。2024年3月初,徐汇区委书记曹立强亲自带队,组织30余家高科技领域的企事业单位赴清华北大招聘,参与招聘企业超过1/3属于人工智能领域。
创新成果涌现
围绕模速空间,目前上海西岸已诞生4个底座基础大模型,即上海人工智能实验室的书生通用大模型、商汤的“日日新”senseNova大模型体系、MINIMAX-ABAB大模型、界跃星辰大模型。垂类应用更多,相关产品已达百余个。
3月23日,2024全球开发者先锋大会(GDC)在徐汇滨江开幕。上海徐汇 图
3月23日,2024全球开发者先锋大会上,上海市副市长陈杰谈道,上海大模型创新成果不断涌现,上海人工智能实验室开发的“书生浦语”大模型开源发布,多款人形机器人也即将发布。他还提到,大模型产业载体持续拓展,模速空间已吸引60多家大模型企业入驻。
作为科研一线代表,上海人工智能实验室主任助理、领军科学家乔宇表示:“大模型目前正在朝多模态方向演进,我们建立了一个具备知识、对齐、价值3个层面的新的多模态大模型评测体系,这将为未来大模型的发展以及评测提供新的参考和引领。”
在这次大会上,阶跃星辰发布了该公司Step系列通用大模型,包括Step-1千亿参数语言大模型,Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型预览版——这也是国内初创公司里首个万亿参数大模型。
上海阶跃星辰智能科技有限公司CEO姜大昕是微软前全球副总裁,他说,模型的参数从千亿到万亿,数量上提升了一个量级,在难度上也对算力、系统、数据、算法各方面提出了挑战。
澎湃新闻注意到,无论上海人工智能实验室、商汤、界跃星辰等基础大模型企业,还是蜜度蜜巢、金声玉亮等垂类模型初创企业,目前发展速度和更新迭代都非常快,并且开始收获商业上的成功。
商汤科技,基于SenseCore商汤大装置提供的算力,在四方体的不同立面上呈现出与平面图像一样的画面。
在接受澎湃新闻采访时,商汤科技董秘办董事总经理盛世伟透露,生成式AI业务已成为商汤从无到有并超过10亿元收入体量的核心业务。财报显示,2023年商汤实现总收入34亿元,其生成式AI业务创造了11.8亿元的收入,收入增长率达200%,占该集团总收入的35%。
2024年2月,商汤推出了“日日新”大模型4.0版,在代码编写、数据分析和医疗问答等多场景中达到了与GPT-4相匹配的能力。而仅仅2个月后,新版马上就要迭代更新了。
“在即将到来的4月下旬,我们会有一个技术交流日,届时将展示我们更新的‘日日新’5.0大模型的能力。”盛世伟透露,“日日新5.0”版本的性能全面对标GPT4-Turbo。
对初创大模型企业而言,吸引大公司投资、合作是发展壮大的重要机遇。而对很多大企业而言,“AI+”更是这一轮大模型浪潮的核心,大模型有望赋能千行百业,成为实体经济发展的新引擎。
3月29日下午,许多央企高管参观模速空间。
“(蜜度)蜜巢刚刚介绍的AI知识管理,对我们来说会有比较大的助力。”3月29日下午,央企航空工业机载总经理雷宏杰在参观模速空间时说。
“会考虑和上海大模型企业合作,把这样的新技术应用到企业管理中吗?”澎湃新闻记者问。
“我觉得这个是必需的,要提高企业的效率,像刚才讲的知识管理、数据挖掘等模式,现在大模型可能是最好的解决方案。”雷宏杰强调,“但首先得保证安全性,这对企业非常重要。”
“这次来上海看(大模型产业),对我们有很大收获。”雷宏杰补充道。
借助产业风口,垂类大模型企业迎来了前所未有的机会。查小荟也深刻体会到了这种变化。公司在谈第一家券商客户时,整整用了一年。但最近几个月,不断有新客户自己找上门来。“金融行业越来越感知到对人工智能的需求。”她说。
在模速空间5楼,百思玛特是一家专注于商品精准营销的大模型企业,类似电商导购,其联合创始人邱运伟是一名90后,此前在美国硅谷工作,2023年11月开始扎根上海模速空间。
这个创业团队目前只有十余人,主要成员此前均供职于IBM、Facebook等科技公司,他们是模速空间典型的一类创业者。邱运伟打开电脑,展示公司2024年1月在国内推出的首款产品“芝麻AI”,上线首日就登上微博热搜,有超过10万用户。
“未来可能充满了很多不确定性,公司目前聚焦在半年之内,3到6个月验证我们产品在相关垂类市场的情况,收集更多数据,提升产品性能。”这个青年创业者说话时朝气蓬勃。
虽然是规模不大的初创企业,像百思玛特这样的电商垂类大模型,如果发展得好,未来很可能彻底颠覆现有的电商模式。
实现这一切愿景还需要时间。在陈海慈看来,大模型产业的“打法”和之前的其他产业相比存在巨大的差别,重点在于创新生态,“在之前的竞争中,就看谁出的人多、谁付的钱多、谁给的政策好。毫无疑问,上海在这些方面是有优势的,但我认为,最后决定性要素是创新策源的链接。所以我们更关注的,是怎么提高创新生态的浓度,让大家做大模型的产业时,他就会想到模速空间。”