钛媒体App 12月5日消息,天眼查信息显示,清华系 AI 大模型软硬件协同优化平台公司上海无问芯穹智能科技有限公司(以下简称“无问芯穹”)近日发生工商变更,股东新增百度、广西腾讯创业投资有限公司(腾讯)、北京智谱华章科技有限公司(智谱AI)、红杉中国、真格基金、北极光创投、歌尔股份创立的青岛同歌创投基金、徐汇资本等机构。
与此同时,该公司此次新增多位主要人员(董事),包括Monolith砺思资本创始合伙人曹曦等。
结合公开信息,无问芯穹目前已完成三轮融资,均未对外公布,领投方为红杉中国。此前的其他投资方包括徐汇资本、砺思资本、启明创投等机构。
据悉,无问芯穹(Infinigence AI)成立于2023年5月,创始团队由清华大学电子工程系推动成立,目标是打造大模型软硬件一体化最佳解决方案。依托行业领先且经过验证的AI计算优化能力,打造从算法到芯片、从芯片集群到模型,再从模型到应用的三阶段“M×N"中间层产品,链接上下游,共建AGI(通用人工智能)时代大模型基础设施。
无问芯穹创始人是清华大学电子工程系系主任汪玉教授;公司CEO是汪玉的学生、清华电子系2009级校友夏立雪博士,他曾赴美国杜克大学进行为期半年的访问学者;公司法定代表人曾书霖博士也是汪玉的学生。
汪玉教授
汪玉所任职的清华大学电子工程系,源于1932年成立的清华大学电机系电讯组,1952年建系,始称“无线电工程系”,1958年更名为“无线电电子学系”,1989年更现名至今,是中国半导体与集成电路行业的“黄埔军校”,包括燧原科技创始人兼CEO赵立东,现任清华大学校长、党委副书记王希勤等人都毕业于该专业。
1982年出生的汪玉,本科、硕士、博士均在清华大学,2007年汪玉选择留校任教,是目前清华大学最年轻的系主任,也被称为 AI 芯片的“探路者”,同时也是IEEE Fellow、清华大学电子系教授、国家自然科学基金优秀青年基金获得者等。
2016年1月,以汪玉教授为负责人的深度学习处理器项目,通过清华大学电子信息学院论证并获得支持。随后,项目团队以知识产权转化入股、创立AI芯片公司深鉴科技,进行产业化运营。其学生姚颂、单羿是深鉴科技创始成员,投资方包括高榕资本、金沙江创投、三星风投等机构。
2018年,深鉴科技被全球最大的FPGA厂商赛灵思收购,随后赛灵思也被美国芯片巨头AMD所收购。因此,深鉴科技成为国内商业化发展最成功的AI芯片公司。
2023年初,以ChatGPT为代表的 AI 大模型风靡全球,AI 2.0时代正在到来,但算力训练成本高、难以统一高效部署算力设施等仍是大模型发展制约因素。
今年7月在2023世界人工智能大会一场分论坛上,汪玉表示,无问芯穹是面向大模型的MxN软硬件联合优化中间层的平台,利用其平台设施,推理成本、微调成本、人力成本均有望降低10倍以上,同时文本长度也会增加10倍以上。
今年11月,无问芯穹联合清华大学、上海交通大学团队在Arxiv上发表了一篇论文,提出了一种新方法 FlashDecoding++,通过异步方法实现注意力计算的真正并行,可以将GPU(图形处理器)推理提速2-4倍,在英伟达A100显卡上的推理平均加速37%,以及同时支持英伟达和 AMD 的GPU产品。
简单理解为,无问芯穹的技术平台可解决国产GPU产品和英伟达、AMD这类高性能产品结合之后的解耦问题,因为国产GPU产品在双精度、算子、软件生态、CUDA等方面存在差异和落后情况。“我们现在在做的就是。怎么样去面对顶层的各种各样模型和底层的各种各样的硬件。”汪玉表示。
本研究论文的三位共同一作分别是无问芯穹首席科学家、上海交通大学副教授戴国浩博士,无问芯穹研究实习生、清华大学硕士生洪可,无问芯穹研究实习生、上海交通大学博士生许珈铭。通讯作者为上海交通大学戴国浩教授和汪玉教授。
目前,FlashDecoding++已被集成于无问芯穹的大模型计算引擎“Infini-ACC”中。在「Infini-ACC」的支持下,无问芯穹正在开发一系列大模型软硬件一体化的解决方案,其中包含大模型“无穹天权(Infini-Megrez)”、软硬件一体机等。
“现在大家都在做各种各样的非常厉害的芯片,但是,怎样去把模型更好的部署在这些芯片上,让做应用开发等领域人员不会花费额外的代价,其实会极大推动大模型研发。无问芯穹就是想要推动大模型技术设施发展进入各行各业,这也是我们努力的方向。”汪玉今年7月表示。
截至发稿前,无问芯穹官方暂没有公布相关融资消息。
(本文首发钛媒体App,作者|林志佳)