当前位置:首页|资讯|人工智能|OpenAI|ChatGPT

2023年计算机行业:紧抓算力、大模型把握AI带来信息产业革命(附下载)

作者:星情独叶发布时间:2023-07-18

今天分享的是人工智能AI系列深度研究报告:《2023年计算机行业:紧抓算力、大模型把握AI带来信息产业革命》。(报告出品方:国信)

研究报告内容摘要如下

OpenAI 推动 T GPT 模型快速迭代 ,T ChatGPT 成为标志。随着 ChatGPT 引爆全球科技行业,关于 AI 大模型的突破成为关键焦点。第一阶段 GPT-1 到 GPT-3 主要以参数扩张为主:基于 Transformer 模型,通过学习大量未标记的文本数据,逐步结合无监督预训练的技术,开始具备少样本及零样本学习的能力;模型参数也从 1.2亿,提升至 15.8 亿,最终达到 GPT-3 的 1750 亿。第二阶段为模型增强阶段:instructGPT 引入了人类反馈强化学习方案(RLHF),鼓励模型输出与人类偏好一致的结果,随后 ChatGPT 面向公众,产生更多的有效标注数据;GPT-4 则实现了多模态模型,可以接受文本和图像形式的输入,其真实性和有效性方面取得了有史以来最佳成果。

GPT-4 再进化 能力进一步提升。OpenAI 经过 6 个月的对抗测试,以及结合 ChatGPT的经验对 GPT-4 持续调整,在真实性和可控性取得了历来最好结果。GPT-4 处理文本量达到 25000 字左右,约等于 ChatGPT 的八倍,也能接受图像输入。根据实验结果,GPT-4 在各种专业测试和学术基准上表现与人类水平相当。与 GPT-3.5相比,当任务复杂性达到一定阈值后,GPT-4 比 3.5 具有更好的表现,其能够处理更细微的指令。GPT-4 目前的整体表现优于现有的大型语言模型。

媒体爆料 4 GPT-4 模型细节 , 参数体量再扩大。OpenAI 并没有披露 GPT-4 模型的细节,近期媒体 semianalysis 发布文章《GPT-4 Architecture, Infrastructure,Training Dataset, Costs, Vision, MoE》介绍了 GPT-4 的模型细节。文章表示,GPT-4 在 120 层中总共包含了 1.8 万亿参数,是 GPT-3 的 10 倍以上;GPT-4 采用混合专家(MoE)模型,共有 16 个专家,每个专家的 MLP 参数约为 1110 亿;GPT-4的训练使用了大约 25,000 个 A100 芯片,一次的训练的成本为 6300 万美元。从GPT-4 模型比 GPT3.5 更好的效果表现来看,无论是参数体量、模型优化都有进一步的提升。性能的持续提升,为 AI 应用的一步打下基础,同时也大规模拉动了算力的需求。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

本报告共计:32页。受篇幅限制,仅展示部分内容。

精选报告来源公众号:【人工智能学派】,回复关键字“6688”,获取完整PDF电子版



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1