当前位置:首页|资讯|ChatGPT

创业公司扎堆ChatGPT被质疑:大模型自研究竟有多少?

作者:商业秀发布时间:2023-03-11

撰文|毕俊

出品|商业秀

自今年2月中旬监管出手降温以来,国内关于ChatGPT的各大社群讨论,似乎沉寂了不少。 

彼时市场传言,有关部门将加强ChatGPT及相似产品的监测评估和违规行为处置工作,要求坚决关闭从境内访问境外ChatGPT的代理服务。内容包括但不限于关闭从境内访问境外ChatGPT的代理服务,要求各类网站、应用程序、公众号、小程序等,不得通过代理、插件、用户自行部署等方式向公众提供境外ChatGPT产品的访问服务。如存在访问渠道,迅速整改下线。

虽然该消息并未得到有关部门的证实,但之后部分国内访问境外ChatGPT代理服务,确实已被关闭。并且,部分通过小程序部署接口为用户提供ChatGPT服务的机构访问接口已被停用,以及淘宝上出售Chatgpt账号的商家们更是迅速消失。

很快,A股ChatGPT的概念板块遭遇一波快速回落,包括汉王科技、海天瑞声云从科技格灵深瞳等在内的多家公司收到了监管工作函。而被问及的主要问题集中在相关公司与ChatGPT有没有关系、有多少关系、是否借机炒作等。

更有意思的是,相比2月初全民争相体验ChatGPT的热火朝天,现在已经很难在淘宝等平台搜索到售卖Chatgpt相关账号的商品了。

不过,这些并未影响到一些类ChatGPT创业者们的热情。

毕竟,对于沉寂许久的人工智能领域而言,ChatGPT的横空出世,是NLP技术的一大进步;同时也意味着通用人工智能的大门就此开启。

AI的新纪元已经来到,没有人愿意错失。

01 创业公司被质疑:大模型自研有几分?

在社交媒体上,不少国内创业公司都在声称,要发力打造中国ChatGPT。就连原美团联合创始人王慧文,也在社交平台即刻上喊话要“打造中国的OpenAI”。

王慧文甚至放出豪言,要设立了北京光年之外科技有限公司,出资5千万美元,估值2亿美元,并称下轮融资已有顶级VC认购2.3亿美元。

不久,美团创始人王兴也在朋友圈透露,将以个人身份参与王慧文创业公司“光年之外”的A轮投资,并出任董事。

除了大公司,一些做类ChatGPT的创业公司也备受关注,甚至引发争议,比如一家叫做MiniMax的公司。

公开资料显示,MiniMax成立于2021年12月,以大模型为主要研发方向,拥有三个模态的基础大模型,涉及文本到视觉、文本到语音、文本到文本三大模态。基于自研的大模型,该公司此前曾推出过一个智能对话机器人生成平台 Glow,后又推出人工智能助手Inspo。

据媒体报道,Inspo是由 MiniMax公司自主开发,底层是一个大型语言模型。通过与Inspo的对话可以得知其模型训练数据截止于今年2月,是MiniMax的核心技术之一。该模型基于Transformer架构。

而更具体的信息比如模型参数量以及使用了哪些数据库,则未有具体回答,官方也并未释放出更多的详细介绍。

从一些网友的使用截图看来,Inspo的训练模型已经更新到了GPT-3.5-turbo。并且最新版本由OpenAI发布,在之前GPT-3的基础上优化了模型结构和算法。

来源:网络

不过,也有不少网友质疑,这个大模型既然是基于OpenAI发布的GPT的基础上推出的,那么它的大模型自研部分究竟有多少?是不是含水分?究竟能不能被称为真正的“中国版的ChatGPT”?

这类被质疑的创业公司不胜枚举,比如有业内人士在知乎上表示:国内某团队上线的服务似乎是直接大量使用了ChatGPT 的问答数据来训练自己的网络,输入问题和通过ChatGPT得到的回答高度相似。

来源:知乎

该人士同时指出,“国内有大量ChatGPT 和GPT3.5 代理,获得了大量 ChatGPT 的真实用户问答数据,是优质的训练素材。但,这是违反 ChatGPT 协议的行为,虽然 OpenAI 管不了,但这个有点丢人。”

甚至有网友评价道,如果说MiniMax这种程度的大模型也称得上自主研发的话,那科研的创造性,仿佛是个笑话一般。

对于所有的创业公司而言,不愿错过这波AI领域的机会是一回事,但是否有真的有技术实力承接,则是另一回事。

小冰公司CEO李笛曾在接受《中国企业家》采访时表示,“产出ChatGPT的Foundation Model(大模型)在今天这个时代,还不是创业公司可以玩转的。很多人去计算Foundation Model,主要计算它的GPU。但实际上,GPU这些东西这都是看得见的,看不见的是,如果你这个模型训练出来了,但模型不收敛,你就白训练了,就得推倒重来,这是工程问题,你需要推倒重来很多次。”

如果按李笛的说法,以如今国内这些创业公司的资金水平和技术积累,至少还很难搞得出原创版的大模型。

02 一场资金与技术的持久战

以人工智能训练为例,它不仅需要消耗大量的算力,还需要投入顶级研究人员薪资等人力成本。

毕竟,AI技术研发需要真正有实力的专家。

科技情报分析机构AMiner和智谱研究发布的《ChatGPT团队背景研究报告》显示, 在OpenAI的ChatGPT研发团队中,有27人为本科学历,25人为硕士学历,28人为博士研学历(注:5人信息缺失),其占比分别为33%、30%、37%。

相比之下,Minimax的团队似乎有些配置不足,虽然其创始团队也来自海内外AI公司和科技大厂,但核心技术骨干只有几名,既要做大模型和数据训练,又要做商业化布局,这样的团队还远远不够。

按照Minimax接受媒体采访时的说法,这家成立于2021年12月的创业公司,仅仅用了一年半的时间,便“自研”出了三个模态的基础大模型,涉及语音、图像、文本不同内容的生成。

而反观OpenAI,这家成立于2015年12月的公司,其推出ChatGPT也要等到2022年12月,从研发到产品推出,其间整整花了7年时间。

最初,OpenAI的定位为非营利公司,但创立之初就吸引到10亿美元的种子投资。随后几年,OpenAI以每年数百万美元的速度消耗着融资。

然而,研发的进展缓慢与资本的逐利相冲突。在董事会发生变动后,公司从非盈利组织转为可公开融资的追求资本回报的科技企业,迅速获得了微软10亿美元的投资计划。

据《纽约时报》报道,自2019年以来,微软对OpenAI至少投资了30亿美元。今年1月,OpenAI宣布获得微软“多年期数十亿美元的投资”。据Semafor报道称,投资高达100亿美元,包括其他风投公司。

至此,OpenAI的估值则将达到290亿美元。

可以看到,在强有力的资金支持下,OpenAI的GPT产品才得以迅速迭代,前两代的开源GPT模型和GPT-3积累了大量数据,在2022年更是进化出了ChatGPT。

从研发到产品面世,ChatGPT的商业化之路需要大量资金投入。据Business Insider估算,目前ChatGPT一个月的维护成本在300万美元(一天将近10万美元),考虑到人力成本,费用估计还要加倍。OpenAI的产品用的是微软的Azure企业云服务器,有投行分析员估算,一年的成本可能从2500万美元到10亿美元。

OpenAI的ChatGPT研发之路尚且如此艰难,何况一家小小的创业公司呢!

因此,关于Minimax的资金来源以及商业化过程,也难免会引发外界质疑。而且,目前Minimax也并未对外公开其资金情况以及投资团队。

如此看来,MiniMax需要对外公开回答的问题还不少。

03 技术的厚积薄发

自2022年至今,生成式AI是一个很热门的话题。与之而来的是,今年 ChatGPT瞬间爆火。

对新事物的出现,我们国家的监管上也并非“一棒子打死”,政策上给予了积极的支持。

2月13日,北京市经济和信息化局发布的《2022年北京人工智能产业发展白皮书》提出,2023年要全面夯实人工智能产业发展底座,支持头部企业打造对标 ChatGPT的大模型,着力构建开源框架和通用大模型的应用生型。

自2月起,百度、阿里、腾讯、京东、字节跳动等大企业纷纷发声,表示自己在大模型领域已经开展了深入研究,且获得了很多成果。

在这波大模型的追赶赛中,百度是最早开始研发预训练模型的企业。从2019 年开始,百度就深耕预训练模型研发,先后发布知识增强文心(ERNIE)系列模型。

文心大模型研发的带头人,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士,是自然语言处理领域权威国际学术组织ACL(Association for Computational Linguistics)的首位华人主席、ACL亚太分会创始主席、ACL Fellow,还是IEEE Fellow、CAAI Fellow及国际欧亚科学院院士。

此外,王海峰还兼任中国电子学会、中国中文信息学会、中国工程师联合体副理事长等。目前,王海峰在国内外期刊会议上发表的学术论文有200余篇,获得已授权专利170余项。

在业内看来,推出ChatGPT,需要扎实的AI技术基础,尤其是AI深度学习领域的积累。而百度十多年来,已经累计投入超过1000亿来研究AI技术。

有分析师表示,ChatGPT相关技术,百度在中国乃至全球范围均具有综合优势。ChatGPT处在技术架构的模型层,而百度在芯片、框架、模型、应用四层技术栈均有布局,其文心系列大模型在行业已普遍应用,而能支撑该训练模型的框架,除百度飞桨外,在中国难出其右。

所有的技术型产品,尤其是人工智能领域,其底层技术的研发都需要经历漫长的时间周期。而一些创业公司跟风入局,利用时间差赚一些快钱,或许能有一时风光,但长远来看,终会被市场淘汰。

通用人工智能的研发需要持续的资金与顶级人才投入,就通用人工智能领域而言,受限于算力、数据规格、历史投入、顶尖人才、资金实力等方面的要求。显然,大公司比创业公司更具备优势,比如百度之所以能尽快推出类ChatGPT产品“文心一言”,也是因为百度十年多来累计投入超过1000亿来技术研发。

而创业公司显然更难一些,一方面,它们的前期技术研发沉淀甚少;另一方面,它们也还面临着在应用端根据行业需求调整和优化耗费的高昂成本,且难度颇高。

但创业公司因此就完全没有机会了吗?有,对创业公司而言,他们只要脚踏实地做好ChatGPT相关的一个细分板块,也依然有机会跑出来。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1