今天分享的是人工智能系列深度研究报告:《 2023人工智能研究公司OpenAI盈亏分析报告 》。
1、算力与精度的关系
算力与精度的关系:根据Yufan Liu等人的论文研究,模型精度每下降10%,算力可能减半。模型的大小由其参数量及 其精度决定,精度通常为FP64、 FP32、 FP16、BF16、 TF32 、INT8、IN4等,精度下降使得算力承载扩大的同时, 也会导致性能在一定程度上下降。根据Yufan Liu等人的研究,其模型测试精确度降低到原来的90%左右时,模型被修 剪后剩余FLOPs的数量约占原始网络中FLOPs总数的50%。因此,可以通过使用更低的精度来减少GPU需求,具体关系大 约为精度每下降10%,所需算力减少到原来的二分之一。
2、单张A100芯片每日吞吐量测算
单张A100卡的每日吞吐量测算:根据英伟达官网数据,NVIDIA DGX A100 640GB的服务器,包含8个NVIDIA A100 80GB Tensor Core GPU, DGX A100具有高达640GB的总GPU显存,可将大规模训练作业的性能提升高达3倍,并将MIG实例的大 小增加一倍,从而从容应对颇为复杂的大任务,以及简单轻松的小任务。据微软官方介绍,每个ND A100 v4 series虚拟 机有8块A100芯片,对于Davinci 3模型(GPT-3.5)使用英伟达80G显存的NDA100芯片,若需要大约3个虚拟机,共需要约 24块芯片。考虑到高并发和低并发的情况,Davinci 3模型在低并发情况下平均每秒可以处理0.28个请求;而在高并发状 态下,平均每秒钟可以处理0.34个请求,此时,一张卡每天的吞吐量大约为1224次(0.34*60 Secs*60 Mins*24 Hrs/24 GPU Cards)。但在实际使用时,若芯片全部打满容易出现崩掉的情况,因此需要考虑芯片的使用效率。
3、精度和算力的换算
不同模型得分及精度转换:根据Tim Dettmers等人的论文,团队使用大模型GPT-4当裁判,对不同模型的回答进行打分,以 GPT-3.5的成绩作为100%,最终GPT-4自己的得分是114.5%。Michal Kosinski的研究表明,GPT-3可以解决70%的心智理论任 务,而GPT-3.5解决了93%的任务,以GPT-3.5的成绩作为100,GPT-3的分数约为75(70/93*100)。如果使用分数对精度进行 衡量,则GPT-4精度相当于GPT-3.5的1.145倍,GPT-3精度相当于GPT-3.5的0.75倍。
此外,如果New Bing目前使用的模型为压缩约6倍后的模型,所需算力约减少到原来的六分之一。同样,模型的质量会受到 一定的影响,压缩后大约从GPT-3.5下降到GPT-3的水平,具体其打分换算过来约76.2分。完整版《2023人工智能研究公司OpenAI盈亏分析报告》来源于公众号:百家全行业报告 研究报告内容节选如下
4、GPT模型不同精度模型下的算力需求
在2500万DAU的假设条件下,若每个用户10次的使用次数,GPT-3.5所需GPU数量大约为27.2万A100。如果2024年Bing Chat 的DAU达2500万,每个用户提10次问题,若按照芯片75%的使用效率进行测算,GPT-3.5所需GPU数量大约为27.2万 (2500*10turns/1224 turns/0.75 GPU utilization rate)。若根据精度下降10%,算力除以2的逻辑,可以推算出GPT-4 在2500万日活及10次平均使用次数下条件下所需算力大约为66.4万(27.2 GPU/(2^log0.9(114.5/100))。
在同样的假设条件下,若New Bing之后使用压缩6倍的模型(得分76.2分),所需算力约为4.5万GPU。如果微软对模型进 行压缩,压缩后的模型使用4块芯片,其算力需求约为4.5万。同样地,在相同假设前提下,GPT-3所需的算力约为4.1万 (27.2 GPU/(2^log0.9(75/100) 。根据机器之心,GPT-4的推理成本是Davinci模型(GPT-3.5为Davinci3)的3倍,与我们测算结果相似。
总逻辑:OpenAI提高GPT-4付费比例,降低GPT-3.5成本
1、据data.ai数据显示,截至2023年6月19日,ChatGPT iOS端上线首月的日活付费率约为4.36%。截至2023年6月19日, ChatGPT iOS端5月21日-6月19日美国地区平均日活用户量约94.64万人,累计付费用户数约为4.13万人,因此日活付费率 (月付费用户数/日活跃用户)约为4.36%。
2、GPT-3.5的成本分析:如果GPT-3.5的精度下降为原来的95.7%,成本大约下降25%。目前,由于大量GPT-3.5用户没有 付费,Open AI可能选择降低其成本。2023年6月13日, Open AI宣布降低GPT-3.5等模型成本,具体为gpt-3.5-turbo每1K 输入tokens降低25%至0.0015美元、每1K输出tokens降低至0.002美元。
3、GPT-4的付费分析:ChatGPT使用用户画像:在ChatGPT用户中,程序员所占比例最多;学生和教师用户次之;设计师、 创作者用户所占比例排名第三;此外,还有社会科学家、游戏玩家、投资者等多类用户。为什么为GPT-4付费:GPT-4具有 独特的第三方插件及“代码解释器”功能。2023年5月,Open AI向Plus用户全面开放了GPT-4第三方插件功能(plugins); 2023年7月11日,ChatGPT“代码解释器”(Code Interpreter)测试版正式向所有Plus用户开放,具体来说包括帮助分析 数据、创建图表、编辑文件、执行数学运算等功能
1、Open AI为什么用户放缓:扭亏是个关键
根据Similarweb的数据,截至2023年7月12日,ChatGPT网页端日访问量基本持平。2022年11月30日发布以来,ChatGPT 用户数量持续上涨。据官方数据显示,ChatGPT上线2个月活跃用户突破一亿人次。而根据Similarweb网页访问数据,截 至2023年7月12日,ChatGPT网页日访问量已基本持平,维持在五千多万。
据data.ai数据显示,ChatGPT iOS端加速扩张,每日活跃用户量呈增长趋势。2023年5月18日,Open AI正式发布 ChatGPT iOS版本。根据App Annie的数据,截至2023年6月19日,Open AI ChatGPT iOS端美国地区前30日平均日活跃用 户94.6万人。
2、提高收入:提高付费率
据data.ai数据显示,截至2023年6月19日,ChatGPT iOS端上线首月的日活付费率约为4.36%。根据data.ai的数据,截至 2023年6月19日,ChatGPT iOS端美国地区累计下载约264.8万次,累计收入约100万美元。当前,GPT-4 PLUS的付费价格为 20美元/月。根据data.ai,截至2023年6月19日,ChatGPT iOS端5月21日-6月19日美国地区平均日活用户量约94.64万人, 累计付费用户数约为4.13万人。因此日活付费率(月付费用户数/日活跃用户)约为4.36%(4.13÷94.64)。据 Questmobile数据,百度APP日活月活用户比例为37%左右,因此如果ChatGPT日活月活比例为37%时,月活跃人数约为255.6 万(94.64÷37%),此时月活付费率(月付费用户数/月活跃用户)约为1.6%(4.13÷255.8)。
2.1 Open AI总体营收分析:12%的付费率或为盈亏线
在GPT-3.5精度没有下降的情况下,假设在8次平均使用次数条件下,如果日活月活比例达到30%,月活付费率突破14%,对 于未压缩情况下的GPT-3.5或能实现盈亏平衡。在每用户平均使用8次的条件下,Open AI全年整体算力成本约为65.5亿美 元,此时处于亏损状态。而若日活月活比例为30%,付费率突破14%时,年收入可能达到67.2亿美元/年,或将实现盈亏平 衡。
在GPT-3.5精度下降的情况下,如果日活月活比例达到35%,月活付费率突破12%,对于压缩后的GPT-3.5或能实现盈亏平衡。如果GPT-3.5的精度下降约5%,成本大约下降25%,在6000万DAU,每用户平均8次请求次数的条件下,Open AI整体算力 成本约为47.4亿美元。如果日活月活比例达到35%,月活付费率突破12%,对于压缩后的GPT-3.5或能实现盈亏平衡。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
本报告总计:24页。
受篇幅限制,仅列举部分内容!
报告来源公众号:【百家全行业报告】