当前位置:首页|资讯|人工智能|OpenAI

2023年人工智能研究公司OpenAI盈亏分析报告(附下载)

作者:AIGC学派发布时间:2023-08-29

原标题:2023年人工智能研究公司OpenAI盈亏分析报告(附下载)

今天分享的是人工智能系列深度研究报告:《2023年人工智能研究公司OpenAI盈亏分析报告》。(报告出品方:深度行业分析)

精选报告来源公众:人工智能学派

报告共计:24页

【报告内容摘要如下】

算力与精度的关系

算力与精度的关系:根据YufanLiu等人的论文研究,模型精度每下降10%,算力可能减半。模型的大小由其参数量及其精度决定,精度通常为FP64、FP32、FP16、BF16、TF32、INT8、IN4等,精度下降使得算力承载扩大的同时,也会导致性能在一定程度上下降。根据YufanLiu等人的研究,其模型测试精确度降低到原来的90%左右时,模型被修剪后剩余FLOPs的数量约占原始网络中FLOPs总数的50%。因此,可以通过使用更低的精度来减少GPU需求,具体关系大约为精度每下降10%,所需算力减少到原来的二分之一。

单张A100芯片每日吞吐量测算

单张A100卡的每日吞吐量测算:根据英伟达官网数据,NVIDIADGXA100640GB的服务器,包含8个NVIDIAA10080GBTensorCoreGPU,DGXA100具有高达640GB的总GPU显存,可将大规模训练作业的性能提升高达3倍,并将MIG实例的大小增加一倍,从而从容应对颇为复杂的大任务,以及简单轻松的小任务。据微软官方介绍,每个NDA100v4series虚拟机有8块A100芯片,对于Davinci3模型(GPT-3.5)使用英伟达80G显存的NDA100芯片,若需要大约3个虚拟机,共需要约24块芯片。考虑到高并发和低并发的情况,Davinci3模型在低并发情况下平均每秒可以处理0.28个请求;而在高并发状态下,平均每秒钟可以处理0.34个请求,此时,一张卡每天的吞吐量大约为1224次(0.34*60Secs*60Mins*24Hrs/24GPUCards)。但在实际使用时,若芯片全部打满容易出现崩掉的情况,因此需要考虑芯片的使用效率。

精度和算力的换算

不同模型得分及精度转换:根据TimDettmers等人的论文,团队使用大模型GPT-4当裁判,对不同模型的回答进行打分,以GPT-3.5的成绩作为100%,最终GPT-4自己的得分是114.5%。MichalKosinski的研究表明,GPT-3可以解决70%的心智理论任务,而GPT-3.5解决了93%的任务,以GPT-3.5的成绩作为100,GPT-3的分数约为75(70/93*100)。如果使用分数对精度进行衡量,则GPT-4精度相当于GPT-3.5的1.145倍,GPT-3精度相当于GPT-3.5的0.75倍。

【内容看点】

  1. 算力的逻辑:“10%的精度 vs 50%的算力”
  2. Open AI的总体盈亏分析
  3. Open AI“单用户”盈亏分析
  4. 如何提高GPT-4付费率

(本“人工智能学派”已获上百家出品方授权。本文仅供参考,不代表我们的任何立场。如需使用相关信息,请参阅报告原文,内容版权归原撰写/出品方所有。)

报告共计:24页

受篇幅限制,仅列举部分内容。

海量精选报告来源公众号“人工智能学派”


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1