当前位置:首页|资讯|ChatGPT|OpenAI

一文读懂什么是ChatGPT:前世今生、发展趋势、商业模式及赛道玩家(附下载)

作者:数字化与智慧城市发布时间:2023-06-11

原标题:一文读懂什么是ChatGPT:前世今生、发展趋势、商业模式及赛道玩家(附下载)

前言

ChatGPT是一种聊天机器人软件,OpenAI于2022年11月推出的聊天机器人,具备人类语言交互外复杂 的语言工作,包括自动文本生成、自动问答、自动摘要等多重功能,应用场景广阔,相较于上个版本更像人类一样聊天交流。

ChatGPT应用场景广泛,拥有潜在空前蓝海,其功能覆盖各个板块,我们将其分成生成应用和布局搜索和数据分析程序生成和分析文本生成、内容创作、一般推理和其他七部分

ChatGPT的前世今生

ChatGPT共经历了人工智能发展的三大趋势。

机器学习: 2012年左右,随着基础算力的提升,全球已经开启人工智能热潮即大数据时代。政策、资本先行,应用场景逐渐丰富。机器 学习是AI的一种技术方向,无论是自然语言处理还是机器视觉都是机器学习的应用。

神经网络: 2015年左右开始繁荣爆发,神经网络是实现AI深度学习的一种重要算法,是通过对人脑的基本单元神经元的建模和链接,探 索模拟人脑系统功能的模型,并研发出的一种具有学习、联想、记忆和模式识别等具有智慧信息处理功能的人工系统。

Transformer算法: 2017年左右,是图型神经网络的一种,Transformer开始广泛应用于机器翻译之中,逐步取代循环神经网络(RNN), 不再使用递归,而是采用了注意力机制进行优化,通过自我监督学习或无监督方法进行训练,优点在于建模能力强,通用性强,可扩展 性强,能够更好的进行运算。而ChatGPT则是在该算法上不断迭代、演进、升级最后生成的一种算法。

从算法模式的版本上,ChatGPT已经经历了四个版本,未来有望生成新版本即GPT-4。

GPT-3是GPT系列第三代语言预测模型,是OpenAI创建的GPT-2的继任者: GPT-3的应用包括帮助Viable公司快速理解客户反馈、帮助 Fable Studio完成VR角色的虚拟人物生成,实现与自然人对话、帮助Algolia实现快速予以论文搜索等(算法准确率高达91%,准确率是BERT算法四倍)。

而InstuctGPT可以理解成是GPT-3的微调版本: InstructGPT由GPT-3语言模型提供支持,是一种对齐语言模型以遵循指令,InstuctGPT模型比GPT-3 更擅长遵循指令,且回答更真实,且有害情绪输出大幅下降例如暴力情节。

ChatGPT可以理解成是GPT-3.5的微调版本: ChatGPT是从GPT-3.5系列中的一个模型进行微调,相较于InstructGPT,ChatGPT效果更加真实(拥有非常强的泛化能力和生成能力),模型的无害性实现些许提升(生成带有有害、歧视、偏见等情况的有问题样 本的概率本身就会很低),编码能力更强(在GPT3.0积累的大量Coding代码基础上,部分OpenAI内部员工参与了数据采集工作)。

GPT-4有望打开海量应用: OpenAI 首席执行官称,GPT-4有望成为多模态的人工智能,根据openAI 创始人Altman消息,参数预计更大, 计算模型优化有望实现更优化,且GPT-4将是纯文本模型(不是多模态),我们认为GPT-4的推出潜在商业价值巨大,模型更具备“拟人化” 的功能,文本生成和内容创作有望更加丰富,并有望进入文字工作的相关领域,例如新闻、金融等相关行业。

ChatGPT与InstructGPT的相同点:使用来自人类反馈的强化学习(RLHF) 来训练该模型。

ChatGPT与InstructGPT的不同点:数据收集设置略有不同、并加入了强 化学习近端策略优化,可以理解成在“人脑思维”的基础上加入了“人 类反馈系统”,是一种奖励模型。因此效果更佳真实、模型的无害性实 现些许提升,编码能力更强。

ChatGPT仍有提升空间,仍有一些限制需要突破:可能写出看似合理但不正确或荒谬的答案,原因是:

1、训练时没有真实来源;

2、训练模型谨慎性的提高导致它拒绝可以正 确回答的问题;

3、监督训练会误导模型。

对输入措辞的调整或多次尝试相同的提示很敏感。例如,给定一个问题的措辞,模型可以声称不知道答案,但只要稍作改写,就可以正确回答。

该模型通常过于冗长并过度使用某些短语。

该模型已努力使模型拒绝不当请求,但它有时会响应有害指令 或表现出有偏见的行为。

ChatGPT&OpenAI

ChatGPT强大的背后是全球AI的“领军企业”OpenAI。

OpenAI是美国一个人工智能研究实验室,是促进和发展友好的人工智能,使人类整体受益。OpenAI成立于2015年底,组织目标是通过与其他机构 和研究者的“自由合作”,向公众开放专利和研究成果。此 外根据新浪消息,埃隆·马斯克为公司的创始人,但于2018 年提出离职,原因是特斯拉与AI的关联越来越深,外界担忧特斯拉将运用OpenAI的技术实现升级。

根据Insider消息,ChatGPT于2022年11月发布后,OpenAI 估值已涨至290亿美元;此外根据新浪科技消息,OpenAI最 近告诉投资者,预计2023年营收将会达到2亿美元,2024年 将达到10亿美元。

OpenAI不仅仅是ChatGPT: Open AI的业务不仅仅局限于ChatGPT领域,还包括Dall·E2、Whisper等项目。DALL·E2 可根据自然语言的描述创作逼真的绘画作品,Whisper是一种 语言识别系统,其鲁棒性和准确性极高,支持多种语言的转录并翻译成英文。

ChatGPT商业模式

OpenAI的商业模式即API接口收费: 客户可以通过OpenAI的强大AI模型构建应用程序,例如访问执行各种自然语言任务的GPT-3、将自然语言翻译成代码的Codex以及创建和编辑原始图像的 DALL·E。公司按照不同项目的AI模式和不同需求进行收费,对于AI图像系统按不同的图片分辨率定价;对于AI语言文字系统按字符单价收费,对于调整模型和嵌入模型按照文字单价收费,并根据不同的调用模型区别定价。目前DALL·E 方面,已有超过 300 万人在使用,每天生成超过 400 万张图像。其API具备快速、灵活、可拓展等性质。

OpenAI的商业模式属于底层模型开放性标准化SAAS服务模式: 公司通过提供相关AIGC代码,提供自动图形模型或语言模型生成等产品,用户通过其API接口接入,并支付平台费用获取相关图像、语言、代码调整服务,OpenAI可获得付费订阅式的SAAS费用,我们 认为该商业模式用户粘性极强。

目前我国AIGC商业仍处于初期阶段,部分文本、图像等生成的公司仍处于初期阶段,以辅助生成内容服务为主,部分公司已经进入AIGC开发阶段,但仍处于免费试用、获取流量阶段,我们认为未来相关公司SAAS模式有望形成。

ChatGPT促使AIGC快速商业化发展。AIGC(AI Generated Content)即人工智能自动生成内容可以在创意、表现力、迭代、传播、个性化等 方面,充分发挥技术优势,打造新的数字内容生成与交互形态。我们认为,GPT系列是AIGC的一种商业化方向。

AIGC已经实现的商业化方向。

AI写作: 例如AI生成文字、写邮件、广告营销等,比如GPT 的使用,我们认为其应用场景有望提高文字工作者的效率, 例如新闻、政府、金融等工作场景。

AI作图: AI自动生成图片,只需要简单输入几个关键词即可在几秒钟之内诞生一幅画作,我们认为可将其应用于传 媒、游戏、宣传等工作场景。

AI底层建模: AIGC生成底层技术开发,OpenAI和StableAI是该方向的龙头,我们认为其工作场景有望提高算法工程师的效率,并进入互联网、ICT等广泛应用场景。

AIGC未来商业化发展方向: AI生成视频和动画,目前该领域仍存在连贯性和逻辑性的问题亟待解决。

AIGC也被认为是继UGC、PGC/UGC之后的新型内容生产方式: UGC是用户生成内容,起源于Web2.0时代,例如博客、视频分享、Youtube等 应用方案;PGC/UGC分别指专业生产内容与职业生成内容,例如视频创收平台优酷、土豆平台节目《暴走漫画》、《万万没想到》、或 是抖音、快手等用户生产内容。

AIGC在创作成本上具有颠覆性,而且具备降本增效的多重优势,并且有望解决目前PGC/UGC创作质量参差不齐或是降低其有害性内容传播等问题,同时创意激发,提升内容多样性,此外价格上OpenAI最贵的AIGC语言模型达芬奇为每0.02美元750个单词,AIGC图型模型价格仅为0.020美元一张。

AIGC有望赋能“千行百业”,我国已有应用案例: 2022年,随着“两会时间”开启,依托百度AIGC技术的数字人主播度晓晓正式“上 岗”,成为全国两会报道中一道独特的风景线。此外,冬奥会期间,百家号TTV技术验证了AIGC的发展潜力。来自人民网、中国青年网等多家媒体通过百家号TTV技术进行内容生产,持续发布实时赛况等题材的短视频作品,单条播放量超70万。

赛道相关玩家

科大讯飞

科大讯飞于2022年初正式发布了“讯飞超脑 2030 计划”,其目的是向“全球人工智能产业领导者”的长期愿景迈进。该计划是公司的核心战略,目的是构建基于认知的人机协作、自我进化的复杂系统,即让机器人感官超越人类,具备自主进化的能力,打造可持续自主 进化的复杂智能系统,助力机器人走进千家万户。其计划分为三个阶段性里程碑:

第一阶段(2022-2023):推出可养成的宠物玩具、仿生动物等软硬件一体机器人,同期推出专业数字虚拟人家族,担当老师、医生等角色; 

第二阶段(2023-2025):推出自适应行走的外骨骼机器人和陪伴数字虚拟人家族,老人通过外骨骼机器人能够实现正常行走和运动,同期 推出面向青少年的抑郁症筛查平台;

第三阶段(2025-2030): 最终推出懂知识、会学习的陪伴机器人和自主学习虚拟人家族,全面进入家庭。

汉王科技

汉王科技是人工智能领域领先者: 成立于1998年,是人脸识别、大数据、智能交互技术、产品及服务的提供商。公司以核心技术为基础,面向市场需求,已形成了以识别技术为核心的、针对不同细分市场的软硬件产品系列,既有通用产品,如e典笔、汉王电纸书、汉王笔、 文本王、名片通、绘图板等。公司主营业务分为四类:

笔智能交互业务:公司在笔智能交互方面的技术主要分为电磁触控及电容触控两大类,公司是全球仅有的两家拥有无线无源电磁触控自 主知识产权的企业之一,此项业务包括数字绘画、电容笔、无纸化签章; 

文本大数据业务:公司依托 AI 文本图像识别技术、NLP 技术、RPA技术平台,在各行业赛道中寻找数字化、智能化的落地场景,此项业 务包括智慧司法、智慧档案、智慧人文、智慧教育、智慧金融等;

人脸及生物试别与相关AI终端。

云从科技

云从科技是一家专注于提高人机操作系统和行业解决方案的人工智 能企业,致力于推进人工智能产业化进程和各行业的转型升级。一 方面公司通过业务、硬件设备、软件应用,为客户提供数字化、智 能化的人工智能服务。另一方面,公司基于人机协同操作系统,赋 能金融、出行、商业等场景。公司自主研发了融合人工智能技术的 人机协同操作系统和部分AIoT设备。 

人机操作系统: 1) 系统结构,公司自主研发人工智能应用的设计、 开发、训练的操作系统,包含AIoT设备、人工智能算法和引擎、AI 模型和训练等核心模块,实现AI能力的自动部署、监控和边端感知; 2) 产品功能,通过底层AI业务流程引擎和决策支持系统,优化人 机交互体验,提升业务流程执行效率,让人机具有决策功能;3) 产品分类,包含人机协同和整体操作系统、“轻舟平台”的服务平 台及配套AI应用的SaaS服务。 

人工智能解决方案: 云从科技基于自主研发的人机操作系统及其应 用产品和AIoT硬件设备提供面向智慧金融、智慧治理、智慧出行、 智慧商业的四个领域综合解决方案,同时提供该领域的定制化软件 开发服务。

海天瑞声

海天瑞声是我国领先的训练数据专业提供商,发行人始终致力于为 AI 产业链上的各类机构提供算法模型开发训练所需的专业数据集。 发行人所提供的训练数据覆盖智能语音、计算机视觉、自然语言等 多个核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种 创新应用场景。

公司产品倍受认可: 公司的产品和服务已获得阿里巴巴、腾讯、百 度、科大讯飞、海康威视、微软、亚马逊、三星等国内外客户的认 可,应用于其研发的个人助手、智能音箱、语音导航、搜索服务、 智能驾驶、机器翻译等多种人工智能产品相关算法模型的训练过程 中。 

公司具备多重技术领先性: 公司核心技术先进性包括算法与数据处 理技术并用、工具和平台共建、在语音语言学基础研究方面有深厚 积累等,公司可提供数据的一站式解决方案,广泛支持复杂的算法 数据标注需求。

【篇幅限制,详细见附件】

【免责声明】来源:华西证券研究所。感谢作者辛苦原创!由数字化与智慧城市整理推荐,版权归作者所有。文章内容代表作者独立观点,不代表数字化与智慧城市立场,转载目的在于传递更多信息。如涉及版权问题,请联系我们删除或做相关处理。

报告领取:关注公众号【数字化与智慧城市】并后台回复【ChatGPT: 开启AI新纪元30页】下载本文报告。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1