当前位置:首页|资讯|AIGC|ChatGPT

河北源达:AIGC商用在即,AI算力景气提升

作者:数字财经智库发布时间:2023-05-08

原标题:河北源达:AIGC商用在即,AI算力景气提升

分析师:吴起涤

报告日期:2023年3月10日

执业登记编号:A0190523020001

出自:源达信息证券研究所

一、Al纪元,ChatGPT

1.ChatGPT: AI的旷世巨作

ChatGPT是一种聊天机器人软件:全名为Chat Generative Pre-Trained Transformer,是OpenAl于2022年11月推出的聊天机器人,该软件使用方便快捷,只需向ChatGPT提出需求,即可实现文章创作、代码创作、回答问题等功能。

ChatGPT 功能强大: ChatGPT目前仍以文字方式互动,而除了通过人类语言交互外,还可以用于相对复杂的语言工作,包括自动文本生成、自动问答、自动摘要等在内的多种任务。

2.ChatGPT的背后:强大的AI公司OpenAl

OpenAl是美国一个人工智能研究实验室,是促进和发展友好的人工智能,使人类整体受益。OpenAl成立于2015年底,组织目标是通过与其他机构和研究者的“自由合作”,向公众开放专利和研究成果。此外根据新浪消息,埃隆·马斯克为公司的创始人,但于2018年提出离职,原因是特斯拉与Al的关联越来越深,外界担忧特斯拉将运用OpenAl的技术实现升级。

根据Insider消息,ChatGPT于2022年11月发布后,OpenAl估值已涨至290亿美元;此外根据新浪科技消息,OpenAl最近告诉投资者,预计2023年营收将会达到2亿美元,2024年将达到10亿美元。

3.ChatGPT工作原理:基于人类反馈对语言模型进行强化学习

OpenAl基于GPT模型,使用监督学习和强化学习的组合来调优ChatGPT,其中人类反馈强化学习(RLHF)使ChatGPT趋近人类价值观及意图。

(1)︰收集数据微调GPT3.5模型:预训练的GPT3.5在少量已标注的数据上进行调优,以学习从给定的提示词(prompt)列表生成输出的有监督的策略;2)模拟人类偏好,训练奖励模型:对大量的模型输出进行排序,创建了一个由比较数据组成的新数据集。在此数据集上训练新模型,被称为训练奖励模型(Reward Model,RM) ; 3)使用奖励模型,基于PPO进行最优化:强化学习被应用于通过优化 RM模型来调优模型,所使用的特定算法称为近端策略优化(PPO)。

源达信息证券研究所隶属于河北源达信息技术股份有限公司(经营证券期货业务许可证:911301001043661976)源达信息证券研究所由吴起涤所长领衔,汇聚了一批业内顶尖的分析师和研究员,专注于宏观经济研究、行业研究和公司研究,致力于为投资者、政府、企业提供最有价值的研究咨询服务。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1