创业公司扎堆ChatGPT被质疑：大模型自研究竟有多少？

作者：商业秀发布时间：2023-03-11

撰文｜毕俊

出品｜商业秀

自今年2月中旬监管出手降温以来，国内关于ChatGPT的各大社群讨论，似乎沉寂了不少。

彼时市场传言，有关部门将加强ChatGPT及相似产品的监测评估和违规行为处置工作，要求坚决关闭从境内访问境外ChatGPT的代理服务。内容包括但不限于关闭从境内访问境外ChatGPT的代理服务，要求各类网站、应用程序、公众号、小程序等，不得通过代理、插件、用户自行部署等方式向公众提供境外ChatGPT产品的访问服务。如存在访问渠道，迅速整改下线。

虽然该消息并未得到有关部门的证实，但之后部分国内访问境外ChatGPT代理服务，确实已被关闭。并且，部分通过小程序部署接口为用户提供ChatGPT服务的机构访问接口已被停用，以及淘宝上出售Chatgpt账号的商家们更是迅速消失。

很快，A股ChatGPT的概念板块遭遇一波快速回落，包括汉王科技、海天瑞声、云从科技、格灵深瞳等在内的多家公司收到了监管工作函。而被问及的主要问题集中在相关公司与ChatGPT有没有关系、有多少关系、是否借机炒作等。

更有意思的是，相比2月初全民争相体验ChatGPT的热火朝天，现在已经很难在淘宝等平台搜索到售卖Chatgpt相关账号的商品了。

不过，这些并未影响到一些类ChatGPT创业者们的热情。

毕竟，对于沉寂许久的人工智能领域而言，ChatGPT的横空出世，是NLP技术的一大进步；同时也意味着通用人工智能的大门就此开启。

AI的新纪元已经来到，没有人愿意错失。

01 创业公司被质疑：大模型自研有几分？

在社交媒体上，不少国内创业公司都在声称，要发力打造中国ChatGPT。就连原美团联合创始人王慧文，也在社交平台即刻上喊话要“打造中国的OpenAI”。

王慧文甚至放出豪言，要设立了北京光年之外科技有限公司，出资5千万美元，估值2亿美元，并称下轮融资已有顶级VC认购2.3亿美元。

不久，美团创始人王兴也在朋友圈透露，将以个人身份参与王慧文创业公司“光年之外”的A轮投资，并出任董事。

除了大公司，一些做类ChatGPT的创业公司也备受关注，甚至引发争议，比如一家叫做MiniMax的公司。

公开资料显示，MiniMax成立于2021年12月，以大模型为主要研发方向，拥有三个模态的基础大模型，涉及文本到视觉、文本到语音、文本到文本三大模态。基于自研的大模型，该公司此前曾推出过一个智能对话机器人生成平台 Glow，后又推出人工智能助手Inspo。

据媒体报道，Inspo是由 MiniMax公司自主开发，底层是一个大型语言模型。通过与Inspo的对话可以得知其模型训练数据截止于今年2月，是MiniMax的核心技术之一。该模型基于Transformer架构。

而更具体的信息比如模型参数量以及使用了哪些数据库，则未有具体回答，官方也并未释放出更多的详细介绍。

从一些网友的使用截图看来，Inspo的训练模型已经更新到了GPT-3.5-turbo。并且最新版本由OpenAI发布，在之前GPT-3的基础上优化了模型结构和算法。

来源：网络

不过，也有不少网友质疑，这个大模型既然是基于OpenAI发布的GPT的基础上推出的，那么它的大模型自研部分究竟有多少？是不是含水分？究竟能不能被称为真正的“中国版的ChatGPT”？

这类被质疑的创业公司不胜枚举，比如有业内人士在知乎上表示：国内某团队上线的服务似乎是直接大量使用了ChatGPT 的问答数据来训练自己的网络，输入问题和通过ChatGPT得到的回答高度相似。

来源：知乎

该人士同时指出，“国内有大量ChatGPT 和GPT3.5 代理，获得了大量 ChatGPT 的真实用户问答数据，是优质的训练素材。但，这是违反 ChatGPT 协议的行为，虽然 OpenAI 管不了，但这个有点丢人。”

甚至有网友评价道，如果说MiniMax这种程度的大模型也称得上自主研发的话，那科研的创造性，仿佛是个笑话一般。

对于所有的创业公司而言，不愿错过这波AI领域的机会是一回事，但是否有真的有技术实力承接，则是另一回事。

小冰公司CEO李笛曾在接受《中国企业家》采访时表示，“产出ChatGPT的Foundation Model（大模型）在今天这个时代，还不是创业公司可以玩转的。很多人去计算Foundation Model，主要计算它的GPU。但实际上，GPU这些东西这都是看得见的，看不见的是，如果你这个模型训练出来了，但模型不收敛，你就白训练了，就得推倒重来，这是工程问题，你需要推倒重来很多次。”

如果按李笛的说法，以如今国内这些创业公司的资金水平和技术积累，至少还很难搞得出原创版的大模型。

02 一场资金与技术的持久战

以人工智能训练为例，它不仅需要消耗大量的算力，还需要投入顶级研究人员薪资等人力成本。

毕竟，AI技术研发需要真正有实力的专家。

科技情报分析机构AMiner和智谱研究发布的《ChatGPT团队背景研究报告》显示，在OpenAI的ChatGPT研发团队中，有27人为本科学历，25人为硕士学历，28人为博士研学历(注：5人信息缺失)，其占比分别为33%、30%、37%。

相比之下，Minimax的团队似乎有些配置不足，虽然其创始团队也来自海内外AI公司和科技大厂，但核心技术骨干只有几名，既要做大模型和数据训练，又要做商业化布局，这样的团队还远远不够。

按照Minimax接受媒体采访时的说法，这家成立于2021年12月的创业公司，仅仅用了一年半的时间，便“自研”出了三个模态的基础大模型，涉及语音、图像、文本不同内容的生成。

而反观OpenAI，这家成立于2015年12月的公司，其推出ChatGPT也要等到2022年12月，从研发到产品推出，其间整整花了7年时间。

最初，OpenAI的定位为非营利公司，但创立之初就吸引到10亿美元的种子投资。随后几年，OpenAI以每年数百万美元的速度消耗着融资。

然而，研发的进展缓慢与资本的逐利相冲突。在董事会发生变动后，公司从非盈利组织转为可公开融资的追求资本回报的科技企业，迅速获得了微软10亿美元的投资计划。

据《纽约时报》报道，自2019年以来，微软对OpenAI至少投资了30亿美元。今年1月，OpenAI宣布获得微软“多年期数十亿美元的投资”。据Semafor报道称，投资高达100亿美元，包括其他风投公司。

至此，OpenAI的估值则将达到290亿美元。

可以看到，在强有力的资金支持下，OpenAI的GPT产品才得以迅速迭代，前两代的开源GPT模型和GPT-3积累了大量数据，在2022年更是进化出了ChatGPT。

从研发到产品面世，ChatGPT的商业化之路需要大量资金投入。据Business Insider估算，目前ChatGPT一个月的维护成本在300万美元（一天将近10万美元），考虑到人力成本，费用估计还要加倍。OpenAI的产品用的是微软的Azure企业云服务器，有投行分析员估算，一年的成本可能从2500万美元到10亿美元。

OpenAI的ChatGPT研发之路尚且如此艰难，何况一家小小的创业公司呢！

因此，关于Minimax的资金来源以及商业化过程，也难免会引发外界质疑。而且，目前Minimax也并未对外公开其资金情况以及投资团队。

如此看来，MiniMax需要对外公开回答的问题还不少。

03 技术的厚积薄发

自2022年至今，生成式AI是一个很热门的话题。与之而来的是，今年 ChatGPT瞬间爆火。

对新事物的出现，我们国家的监管上也并非“一棒子打死”，政策上给予了积极的支持。

2月13日，北京市经济和信息化局发布的《2022年北京人工智能产业发展白皮书》提出，2023年要全面夯实人工智能产业发展底座，支持头部企业打造对标 ChatGPT的大模型，着力构建开源框架和通用大模型的应用生型。

自2月起，百度、阿里、腾讯、京东、字节跳动等大企业纷纷发声，表示自己在大模型领域已经开展了深入研究，且获得了很多成果。

在这波大模型的追赶赛中，百度是最早开始研发预训练模型的企业。从2019 年开始，百度就深耕预训练模型研发，先后发布知识增强文心（ERNIE）系列模型。

文心大模型研发的带头人，百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士，是自然语言处理领域权威国际学术组织ACL（Association for Computational Linguistics）的首位华人主席、ACL亚太分会创始主席、ACL Fellow，还是IEEE Fellow、CAAI Fellow及国际欧亚科学院院士。

此外，王海峰还兼任中国电子学会、中国中文信息学会、中国工程师联合体副理事长等。目前，王海峰在国内外期刊会议上发表的学术论文有200余篇，获得已授权专利170余项。

在业内看来，推出ChatGPT，需要扎实的AI技术基础，尤其是AI深度学习领域的积累。而百度十多年来，已经累计投入超过1000亿来研究AI技术。

有分析师表示，ChatGPT相关技术，百度在中国乃至全球范围均具有综合优势。ChatGPT处在技术架构的模型层，而百度在芯片、框架、模型、应用四层技术栈均有布局，其文心系列大模型在行业已普遍应用，而能支撑该训练模型的框架，除百度飞桨外，在中国难出其右。

所有的技术型产品，尤其是人工智能领域，其底层技术的研发都需要经历漫长的时间周期。而一些创业公司跟风入局，利用时间差赚一些快钱，或许能有一时风光，但长远来看，终会被市场淘汰。

通用人工智能的研发需要持续的资金与顶级人才投入，就通用人工智能领域而言，受限于算力、数据规格、历史投入、顶尖人才、资金实力等方面的要求。显然，大公司比创业公司更具备优势，比如百度之所以能尽快推出类ChatGPT产品“文心一言”，也是因为百度十年多来累计投入超过1000亿来技术研发。

而创业公司显然更难一些，一方面，它们的前期技术研发沉淀甚少；另一方面，它们也还面临着在应用端根据行业需求调整和优化耗费的高昂成本，且难度颇高。

但创业公司因此就完全没有机会了吗？有，对创业公司而言，他们只要脚踏实地做好ChatGPT相关的一个细分板块，也依然有机会跑出来。

创业公司扎堆ChatGPT被质疑：大模型自研究竟有多少？

推荐体验

相关资讯

创业公司扎堆ChatGPT被质疑：大模型自研有多少？

美国推出ChatGPT，究竟有何目的？

有多少AI创业公司，被OpenAI发布会判了“死刑”？

ChatGPT全球爆火！究竟有何特别之处？

可持续专栏 | ChatGPT的环境成本究竟有多大？

近期资讯

大连齐化新材料取得一种环氧树脂清洗装置专利，减少原材料中的杂质

江苏蓝力重工科技取得重工机械用属具加工用清洁装置专利，清洁大尺寸属具时更便捷方便

安凯微：视觉SoC芯片已量产，算力达2T OPS

湖南瓦特曼机器人科技有限公司被认定为高新技术企业

通威太阳能取得载板自动清洁装置以及镀膜设备专利，提高载板脏污清洁效果以及清洁效率

信阳华容取得铝电解电容器导针清洗装置专利，有利于导针的清洗和杂质的去除

宁波博特轴承科技取得一种轴承加工中的屑料吹扫装置专利，降低噪音水平

东莞市利人净化科技有限公司取得模块化便携移动风淋室专利，有效缩小运输空间

广州小马慧行取得喷气安装结构等专利，解决了现有技术中的相关问题

本田动力取得盲孔吹净装置专利，能够解决现有盲孔的吹净和断刀的检测两项操作独立进行导致生产效率低下的问题

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响