当前位置:首页|资讯|清华|OpenAI|Sora

中国AI创业圈为何被“清华系”“交大帮”包围?

作者:IT时报发布时间:2024-07-30

北京筑“基” 上海聚“用”

(配图由智谱AI根据新闻内容生成)

作者/ IT时报记者孙妍

编辑/王昕 孙妍

“北有清华系,南有交大帮”,这种说法在AI大模型创业圈里流传甚广。放眼望去,中国AI大模型初创企业圈颇有被“清华系”“交大帮”包围的势头,这波AI创业门槛直接被拉升至学霸级别。

据《IT时报》记者不完全统计,拥有清华背景的AI公司创始人已经多达40位,较为活跃的有十几位。可以说,清华系撑起了AI创业圈半壁江山。

北京AI创业圈以“清华系”为核心,而在上海这座“模都”,一支重要的AI生力军正在崛起,那就是“交大帮”。

“清华系”撑起AI创业圈半壁江山

“新AI四小龙”智谱AI、月之暗面、百川智能和MiniMax,除了中科院校友闫俊杰带领的MiniMax外,全是“清华系”AI公司。智谱AI的领军人物是清华大学计算机系教授唐杰,而月之暗面的创始人杨植麟正是唐杰的学生。百川智能的背后是鼎鼎有名的清华大学计算机系96级毕业生王小川,从搜狗到百川智能,这位“互联网梦之队”成员的物理空间几乎没有离开过五道口,于是王小川也被称为“清华东门守门员”。

30多年打造AI基因

“AI是一项硬核技术,而清华大学计算机大类的专业能力在全球处于领先位置,所以这一轮AI创业人才主要来自清华大学等头部高校。”清华大学新闻学院和人工智能学院双聘教授沈阳认为,清华大学能够开国内AI研究之先河,离不开一位奠基人——中国科学院院士、清华大学计算机系教授、人工智能研究院名誉院长张钹。

二十世纪七十年代,人工智能在生物控制和模式识别方向的研究已经兴起,当时一批国内研究人员在改革开放后赴美求学,张钹便是这批留学生中的一员,作为访问学者前往美国伊利诺伊大学进修学习。回国后,张钹领衔成立中国首个智能机器人实验室。1990年,他又与同事联合成立中国首个人工智能国家重点实验室——“智能技术与系统”国家重点实验室。

OpenAI的文生视频大模型Sora成为多模态大模型在2024年开年的“王炸”,而在Sora引发全球震动两个月后,被称为“国产Sora”的Vidu横空出世,Vidu的技术路线发布甚至早于Sora,而Vidu大模型背后是一家AI初创公司——生数科技,其领军人物是清华大学计算机系教授朱军,而朱军正是师从张钹,被这位中国AI奠基人评价为“最满意的博士生之一”。

生数科技由瑞莱智慧RealAI孵化而来,瑞莱智慧是朱军的第一次创业,一直专注于人工智能安全性,曾经用一副框架眼镜、一张纸就攻破了19部安卓手机的人脸识别,自此一战成名。

生数科技的联合创始人兼CEO唐家渝是清华大学教授孙茂松的学生,而被斯坦福大学AI团队抄袭的中国大模型公司面壁智能的创始人刘知远,也是孙茂松的学生。孙茂松、刘知远正是清华大学人工智能研究院知识中心三大实验室之一的自然语言处理实验室的领军人物,这个实验室还曾孵化AI初创企业——深言科技。

清华大学30多年的AI基础研究积淀正在转变为中国人工智能的生力军,在产学研转化的过程中,清华大学的创业基因为学生提供了生态土壤。“从专业和研究实力上来讲,很多高校难分伯仲。由于清华和交大的AI研究起步较早,其创业基因深深根植于血液里,创业生态相对完善。”在北京、成都、意大利米兰、上海等多地有创业经验的云境智筑智能科技创始人兼CEO孙知行表示。

从清华实验室到AI算力界的“安卓”

在2024世界人工智能大会上,无问芯穹联合创始人兼CEO夏立雪发布了全球首个千卡规模异构芯片混训平台,“打开水龙头前,我们不需要知道水是从哪条河里来的。同理,未来我们用各种AI应用时,也不用知道它调用了哪些基座模型,用到了哪种加速卡的算力——这就是最好的AI Native基础设施。”

6年前的夏天,阳光还是那么炙热,夏立雪提交了他在清华大学电子工程系的博士论文。

2013年,他加入NICS-EFC实验室,成为汪玉的第一位博士生。如今,汪玉已经成为清华大学最年轻的系主任,这个实验室也早在2016年成功孵化了AI芯片公司深鉴科技,在2018年被全球最大的FPGA(可编程芯片)厂商赛灵思用3亿美元收购。

人工智能的升级需要软件和硬件共同实现,深鉴科技走的是第一条路,从算法等软件层面提升效率;第二条路是英伟达们的硬件迭代方法;而NICS-EFC实验室想要走第三条路:软硬件联合优化。

2018年的AI界,有100个场景,就有100个小算法,就要做100次联合优化。而夏立雪们想做的是1次联合优化就满足80%的需求。

2023年初,一家叫作“无问芯穹”的公司成立,集齐了清华大学、北京大学、上海交通大学等一众人才。汪玉是无问芯穹的发起人,夏立雪担任CEO,原商汤科技数据与计算平台部执行研究总监、时任北京大学副研究员颜深根担任CTO,现任上海交通大学长聘教轨副教授、清源研究院人工智能设计自动化创新实验室负责人戴国浩担任首席科学家。

无问芯穹想将汪玉实验室过去十年积累的全栈技术向整个行业推广,当下正是最好的时候。受限于英伟达等高端芯片禁令,同时国产芯片仍处于成长期,产能不足等问题困扰着AI大模型产业界。

夏立雪坦言,无问芯穹想做“AI算力界的安卓系统”,将M种模型和N种芯片统一起来,以此解决国内AI领域的“生态竖井”难题。

目前,无问芯穹异构芯片混训平台已支持包括AMD、华为昇腾、天数智芯、沐曦、摩尔线程、NVIDIA等六种异构芯片。4个月前,无问芯穹Infini-AI大模型开发与服务云平台宣布首次公测,已有智谱AI、月之暗面、生数科技等大模型公司在Infini-AI上稳定使用异构算力。

“清华电子系奠定了一个技术基础,我们和这些模型公司、硬件公司有充分信任关系,所以更应该在这个时代站出来做这个事情。”夏立雪表示。

从无问芯穹身上,我们可以看到“清华系”从0到1的孵化历程,然而从一家自带学院派光环的AI创业公司到算力界的“安卓”,夏立雪们还要经历从1到100的艰难之路。

上海与北京形成两大AI高地

在2024世界人工智能大会(WAIC2024)上,“北清华,南交大”的AI创业格局越发凸显,一场大会,妥妥成了两大高校的校友会。围绕着清华、交大两大人才聚集区,北京和上海也形成了两大AI高地。

在上海,应用层百花齐放。在北京,竞争核心围绕模型层展开。澜码科技CEO周健便提到,北京聚集了很多互联网大厂与大模型厂商,着力点集中于模型层,竞争相当激烈;上海大模型公司发力中间层与应用层,企业之间交流共享的氛围更浓。

“我们在上海和北京两地同时设立了公司,总部落在上海。”“我们正打算从北京来上海,北京办公室仍打算保留。”在WAIC2024上,多家AI创业企业向《IT时报》记者反馈道。虽然原因不尽相同,有关政策、人才、业务等等,但是北京与上海两大AI高地开始出现人才流动现象,越来越多AI公司选择在北京和上海两地设立公司,模型层和应用层两手都要强。

“交大帮”闪耀上海AI创业圈

2019年,在第一批AI创业企业风头正盛时,AI创业圈就已显现“交大帮”的实力,商汤科技的联合创始人徐立、第四范式的创始人戴文渊、依图科技的联合创始人林晨曦、思岚科技的创始人陈士凯、云天励飞联合创始人陈宁等,都是来自上海交通大学的校友。

时间来到2024年,澜码科技等一众“交大帮”新AI企业开始崭露头角。

澜码科技CEO周健毕业于上海交通大学,从谷歌到阿里云,从依图再到澜码科技,周健自身的职业生涯路径也展现了一个AI行业人才的典型特征:国外—国内—上海。

孙知行的职业路径也颇为相似,从意大利到北京,从成都再到上海,一直从事城市发展和建设领域的设计工作。

湘江科学城国际竞标中标案例,孙知行团队与院士团队合作用AI辅助优化设计

孙知行与上海交通大学在设计和人工智能领域建立了深度合作,在与“清华系”“交大帮”多年接触后,他感受到作为学院派或学霸们创业的优势。“像清华和交大等更加注重产学研联动转化的高校,更容易使创业者从0走到1,有光环的企业对资本吸引力更大,就好比伴生于矿脉的金子,更容易被发掘到。然而热门赛道的初创企业存活率在现实中很低,除了埋头攻克技术壁垒外,还需在自身经营管理、市场和渠道开拓、商业化运作等方面不断加强。”

两大AI聚集地隔浦江相望

在WAIC2024上,浦东张江“模力社区”正式启用,坐落于张江科学城城市副中心,至此,上海两大AI中心的格局开始显现:西有徐汇“模速空间”、东有浦东“模力社区”

“魔都”正在向“模都”转变。上海目前已有34款大模型通过备案,包括上海人工智能实验室“书生”、商汤“日日新”、MiniMax“海螺问问”、阶跃星辰“跃问”等。

从人才来看,全国三分之一的AI人才在上海,多达25万人。上海14所高校成立了人工智能研究院,除了“交大帮”外,其他高校也源源不断地为AI行业输送人才。从产业规模来看,2023年聚集AI企业348家,产业规模超3800亿元,居全国前列。从投资规模来看,上海人工智能产业投资基金累计募资31亿元,开投三年来整体投资进度超过74%。母基金部分投资了红杉、奇绩创坛等12支子基金,实际募集规模572亿元。

徐汇“模速空间”

全国首个大模型创新生态社区“模速空间”落地徐汇,自去年9月揭牌至今已吸引上、中、下游近80家大模型企业入驻,目前徐汇全区共有大模型企业150多家,已有22个大模型通过备案。

澜码科技、MiniMax、无问芯穹等公司都入驻于此。在上海多年,周健对上海AI创业氛围感受最深的是政策出台速度快且支持力度大,在算力补贴、场景对接、招商力度和政府专项基金等方面都为AI企业提供了支持。

MiniMax副总裁刘华也提到,针对算力、场景、数据、人才等行业企业面临的实际困难,上海出台了一系列具体的工作举措。比如,推动大模型企业与场景企业对接,帮助大模型技术快速落地;对AI人才落户上海,提供了快速通道;对企业申办相关业务资质,主动组织业务辅导。

算力和数据的基础设施已经搭好。算力是人工智能的“燃料”,上海建成了市级算力调度平台,对于租用大模型的研发企业,经评估后给予最高10%的租用补贴。

依托大模型语料数据联盟,上海已开源4200亿Token语料数据。在此基础上,上海成立了语料专业运营公司,以市场化机制为大模型企业提供资源供给和标注加工等服务。

近期,孙知行打算将公司落户于上海浦东“模力社区”,开启他All in AI的创业之路,简而言之,就是用AI赋能城市发展和建设行业的各个环节。

浦东“模力社区”

孙知行表示,浦东“模力社区”聚焦垂类模型应用,徐汇“模速空间”注重AI大模型产业生态。

在浦东,600多家AI重点企业聚集,已经形成产业规模效应的是人形机器人和具身智能,2023年国内发布的12款人形机器人中,就有4款出自浦东。

在沈阳看来,现在中国大模型行业在全球处于“基座跟跑,应用并跑”的状态。在基座大模型方面,中国处于全球第二,但是中美差距并不大,比如在多模态大模型这个方向,中美企业一直在你追我赶。而在应用方面,中美并跑,而且中国应用生态比较繁荣。

应用是我国大模型发展的优势,上海想走的路便是放大这一优势。

“学界与业界不是割裂的,有了业界的数据和算力,学界才更容易探索新的发现,实现从0到0.1的跨越。”周健认为,这波AI创业潮快要来到“低谷期”,市场期待更有突破性的底层大模型出现,大模型应用层才会百花齐放。

上海主抓应用层,北京主抓模型层,两大AI高地的人才交流,对中国人工智能产业两手都要硬的整体发展来说,是一种向上的流动。

排版/ 季嘉颖

图片/ IT时报 采访对象 智谱AI

来源/《IT时报》公众号vittimes

E N D


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1