当前位置:首页|资讯|OpenAI|ChatGPT|人工智能

OpenAI将破产?ChatGPT何去何从

作者:中国战略新兴产业发布时间:2023-08-28

原标题:OpenAI将破产?ChatGPT何去何从

OpenAI将破产?ChatGPT何去何从

中国战略新兴产业融媒体记者 艾丽格玛

“OpenAI可能会在2024年底破产。”

这则惊世骇俗的新闻在人工智能领域引起了大量的关注和讨论,它来自于一家印度媒体Analytics India Magazine的专栏作家Mohit Pandey的分析文章。一时间,“生成式人工智能如何持续变现”成为热门话题——毕竟,身为先行者的ChatGPT尚未成功,后发者和模仿者们也同样面临着同样的困境。

从风头无两,到身陷困境,生成式人工智能在今年历经烈火烹油、鲜花着锦之盛,又渐现颓势,各种“GPT”们又该怎样寻找出路?

“烧”钱无止境

70万美元,这是ChatGPT每天的平均运营成本。

根据公开数据,自从开始开发ChatGPT以来,截至今年五月,其亏损翻了一番,达到了5.4亿美元,而2022年它的收入却只有3000万美元。OpenAI首席执行官山姆·奥尔特曼,定下了今年营收2亿美元、明年营收10亿美元的目标,但随着后续GPT-5开发等相关工作的进行,亏损可能持续扩大。

ChatGPT的每月成本会受到多种因素的影响,因此并没有一个确切的数字。它的成本取决于模型规模、运算资源、数据处理、人力成本、维护以及其他因素。

OpenAI资料显示,ChatGPT训练一次13亿参数的GPT-3 XL模型每天需要的全部算力约为27.5PFlop/s,而训练一次1746亿参数的GPT-3模型每天需要的算力约为3640PFlop/s。运营和维护大型语言模型十分昂贵,每月成本可能高达几百万美元以上。它引以为傲的数十亿到数千亿个参数的深度学习模型,使它需要更多的计算资源和内存,从而增加了硬件和电力成本。

运行ChatGPT需要的高性能的GPU或TPU,其租赁费用以及电费成本都会在每月成本中占据重要比例。国盛证券估算,2023年1月平均每天约有1300万独立访客使用ChatGPT,对应芯片需求为3万多片英伟达A100 GPU,初始投入成本约为8亿美元,每日电费在5万美元左右。

除此之外,为了训练ChatGPT,需要大量的文本数据,在某些情况下,需要人工标记数据以进行训练,采集、清洗和处理这些数据可能会产生一定的费用。而为了持模型的稳定性、安全性和性能,需要有专业团队进行监视、维护和技术支持。

到目前为止,OpenAI“烧”的钱,仍然来自微软对它的投资,这使公司能够维持运营,但盈利却无从谈起。

而且,与微软这个自己“背后的东家”理念的分歧,也逐渐显露。

例如,最近,微软发布了Azure ChatGPT的GitHub存储库,直接在Azure平台上提供服务。一天后,该存储库被删除。

实际上,微软唯一通过OpenAI获得收入的方式是通过Azure OpenAI服务,因此希望将所有用户都转移到这个服务上,而不是免费提供ChatGPT给每个人。对于OpenAI来说,当然希望将所有用户留在自己的ChatGPT平台上。

但很显然,市场不需要“两个ChatGPT”

在去年三月,微软还将Bing搜索与ChatGPT合并,用户达到了1亿。但实际上,OpenAI反对微软将不完整版本的GPT-4集成到Bing Chat中。

对于微软来说,如果ChatGPT只能在其Azure云和Bing上可用,利益就能最大化。在这一点上,两家公司之间显然存在分歧。

为何增长陷入瓶颈?

从今年5月到7月,ChatGPT用户数量已经连续两月下滑。

SimilarWeb数据显示,与6月相比,2023年7月的用户群减少了12%,从17亿用户下降到15亿用户。

有人猜测,用户数下降的一个主要原因可能是“API内部竞争”。也就是说,有很多相关公司禁止员工在工作中直接使用ChatGPT生成文本,但允许他们调取它的API,并在工作中使用。

但API也需要购买,并非开放的服务,这显然无法解释它亏损持续的原因。

OpenAI采用了“平台业务模式”的战略。本质上,它充当了其他公司和服务构建的基础层。OpenAI与支持其的初创公司之间存在一种共生关系。换句话说,这些初创公司增长得越多,它们的计算需求就越大,对OpenAI平台的支出就更多。

>> OpenAI的商业模式

OpenAI借助GPT-3和DALLE这样的大型生成模型,向希望在其基础模型之上开发应用程序的企业提供API访问,这些企业可以将这些模型整合到其产品中,并使用专有数据和附加的AI功能来定制这些模型。另一方面,OpenAI还发布了ChatGPT,采用了免费增值模型。微软还通过其商业合作伙伴关系将OpenAI的产品进行商业化。来源:fourweeksmba.com

根据麦肯锡最近的一项研究,生成式人工智能对生产力带来的附加值,可能会为全球经济增加数万亿美元的价值。如果将生成式人工智能嵌入软件的影响也计算进去,这个价值将大致翻一番。而银行业、高科技和生命科学是可能从生成式人工智能中获得最大影响的行业之一。

例如,在银行业,如果完全实施这些项目,生成式人工智能技术每年可以提供额外的2000亿至3400亿美元价值。在零售和消费品包装领域,潜在影响也相当大,每年可达4000亿至6600亿美元。

但是,这些额外增加的价值,目前并没有反哺OpenAI这类提供人工智能模型的公司,他们的市场份额和他们的财务损失之间完全不成比例

利润都去了哪里?

主要利润可能流向了运行模型所需的芯片制造商和云计算巨头。

例如,大模型运行计算需要的GPU,是唯一能够处理大型语言模型等重型计算任务的芯片。目前,英伟达销售的GPU性能最佳,一片的价格高达数万美元,而英伟达的估值最近飙升到1万亿美元。

开源人工智能公司Hugging Face的首席执行官克莱姆·德朗格(Clem Delangue)认为,购买人工智能工具的那些公司其实变相得到了大量“补贴式的服务”,他们获得的服务价值远远超过了他们目前支付的金额。

OpenAI也在努力更新它的服务模式,以期获得更多的使用。

例如,8月24日,OpenAI宣布,将与位于旧金山的数据标注初创公司Scale AI合作,将Scale AI的微调工具与OpenAI的GPT-3.5文本生成模型结合在一起。OpenAI公告称:“自GPT-3.5 Turbo发布以来,开发者和企业一直在要求能够定制模型,以为其用户创建独特和不同的体验。”而微调允许开发人员针对特定任务定制AI模型。企业可以微调模型以匹配其品牌的语气和语调,或者让它以特定语言回答问题。

然而,市面上仍然不乏对其不欢迎的声音。

就在8月24日同一天,有媒体报道,《纽约时报》在其网站上屏蔽了GPTBot,这是一个爬取网页内容的爬虫。而其他主要新闻网站,包括CNN、路透社、芝加哥论坛报、ABC和澳大利亚社区媒体(ACM)旗下的品牌,如堪培拉时报和纽卡斯尔先驱报,似乎也已经不允许这个网络爬虫爬取信息。

大型语言模型,需要大量信息来训练它们的系统。但是这些用于训练的数据来源,其知识产权归属则争议较大

在8月初,包括法新社和盖蒂图片在内的媒体签署了一封公开信,呼吁对AI进行监管,包括有关“用于创建AI模型的所有培训集的构成”的透明度以及对使用受版权保护材料的同意。Google建议,除非明确选择退出,否则AI系统应该能够抓取出版物的作品。亚马逊和Shutterstock在内的主要网站也已经屏蔽了GPTBot。

这些“闭门羹”,让OpenAI的运营成本又一次增加。注重自身知识产权私密性的客户可能会对它避而远之,获取数据的成本也在增长。有业内人士认为,或许OpenAI可以通过收购专门收集图像或文本数据的平台来获取版权归属更加明晰的数据,但这也并不便宜。例如,拥有几十亿篇帖子的Quora网站,目前估值为18亿美元。

花钱如流水,却难以找到持续变现的商业路径,OpenAI开始陷入瓶颈。

群敌环伺间,前路何在

当下市场中的开源模型也抢走了很多OpenAI的潜在客户。

例如,Meta的Llama 2在性能上与ChatGPT的差距不大,并且同样与微软有合作,允许人们将该模型用于商业用途,这可以满足许多公司的业务需求。

相比OpenAI昂贵的付费模式,开源模型显然对预算有限的组织而言更有吸引力。不少初创公司都从专有模型迁移到了Llama 2。

与GPT相比,它在某些方面也更好。

第一代Llama发布几个月后,Meta在编码方面还赶不上OpenAI。现在,该公司发布的代码生成模型Code Llama,可以根据代码和自然语言提示生成代码。Code Llama是基于Llama 2构建的,经过专门的代码相关数据集微调。该公司宣布了四个版本的Code Llama,每个版本都有不同的容量。

Code Llama模型可以有效处理高达10万个上下文标记,从而实现更相关的代码生成,这对于理解大型代码库和调试复杂的代码非常有用。开发人员可以输入大部分代码库以获取帮助,解决问题并理解复杂的编码挑战,甚至有的还可以在单个GPU上运行,以获得较低的延迟和实时代码完成。

广泛的基准测试验证了Code Llama的强大性能。与其他特定于代码的AI模型相比,Code Llama的34B模型在HumanEval上获得了令人印象深刻的53.7%分数,并在大部分基本Python编程(MBPP)上获得了56.2%的分数,可与ChatGPT的性能相媲美。

更让人为ChatGPT捏一把汗的是,与Llama 2一样,Code Llama是开源的,并且也可供商业用途。

此外,OpenAI曾经的共同创始人埃隆·马斯克的X.ai,或许也会成为OpenAI的有力竞争对手。马斯克多次表现出对OpenAI运行模式的担忧,后来更是提出建立一个“TruthGPT”的想法,这个模型不像ChatGPT那样“带有偏见”,这个想法引发了许多人的兴趣。马斯克为此甚至购买了1万个英伟达 GPU。

或许,目前科技巨头们暂时还愿意为了赢得市场份额而承受亏损。但如果它们永远无法盈利呢?

唯一一点可以肯定的是,尽管生成式人工智能工具很昂贵,但它“仍然远比人力劳动便宜”。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1