当前位置:首页|资讯|AIGC|ChatGPT

AI会让你失业吗?8000字精华揭秘AIGC底层逻辑、产业应用与前景(收藏)

作者:中信读书会发布时间:2023-05-19

原标题:AI会让你失业吗?8000字精华揭秘AIGC底层逻辑、产业应用与前景(收藏)

ChatGPT 进入到大众的视野之后,更多人认识了 AIGC ,企业在想着怎么通过 AIGC 实现数智化的转型,个人在想着该怎么去适应 AIGC 给我们的生活以及工作带来的重大的变化。

那这一切的前提都需要我们来认识一下 AIGC的底层逻辑是什么?它的核心价值是什么?还有就是我们要如何运用它,如何去看待它?

上个月,我们邀请丁磊博士以“AIGC下一步:底层逻辑、产业应用与前景”为主题进行了直播分享。

本篇内容为直播精华稿,全文约8000字,阅读约11分钟左右

丁磊博士是美国俄亥俄州立大学人工智能专业博士,美国哥伦比亚大学博士后,他是人工智能商业化落地的先行者,曾经为 PayPal 创立人工智能平台,历任百度金融首席数据科学家、 PayPal 全球消费者数据科学部创始负责人等职务。他曾经在 IEEE 会刊等发表高质量论文 20 余篇,获得了 30 多项授权专利。

丁磊博士同时还帮助企业运用人工智能提升效益,与中国农业银行、中国电信、万科集团、联合利华等行业巨头深度合作,推动人工智能落地,领导研发的营销和风控决策系统精准服务智能机器人平台,在多个行业都获得了成功的应用,2018年被第一财经评为中国数据科学50人。

1. 数据 - 模型 - 大模型 - 决策式 AI - 生成式 AI

近些年大家对 AI 都比较熟悉,从人脸识别到自动驾驶,已经隐约看到 AI 对社会生产力和个人生活带来的提升与变化,AIGC更是来势迅猛,尤其是去年底发布的ChatGPT,对于 AI 专业人士来说冲击也非常大,在当时当下,通过人工智能可以产出如此丰富的内容,甚至在某些方面超越人的水平,即使对于一个从业20多年的人工智能老兵来说,也有相当大的冲击力。

AIGC 是怎么一步步给社会带来巨大冲击的?

AIGC核心是模型,模型的背后是数据。大数据概念从 10 多年前开始就比较火,在2010年左右,大数据概念比较新奇,当时我在国外从事“数据科学家”的工作,这个工作当时被国外媒体誉为最性感的工作。数据是模型的支撑和基础,如果没有数据就谈不上模型。所谓的生成式人工智能,比如形形色色的AIGC应用,包括ChatGPT和最新的GPT 4,以及国内各种版本都基于大模型。为什么说模型越来越大?因为这些模型它们所涵盖的信息越来越大了。

模型相当于人脑,人类的大脑不停地从外界经验中总结规律,而模型从大量数据中学习,学习针对外界事物和各种问题的解决方法,更确切地说,模型其实是知识和逻辑的数字化载体。大模型承载了大量信息,现在很火的ChatGPT模型,它几乎承载了一个成年人所具有的通识和逻辑信息。

说到大模型,过去的模型跟近年来发展起来的生成式 AI模型有什么区别?

AI 模型主要分几种,一种是分类,就是把事物分类,比如把人脸分类,这是张三的脸,这是李四的脸;另外一种叫聚类,就是给你一大堆图片,或者一大堆视频,让 AI 自动分门别类,这叫做聚类,延伸一下还包括回归,就是给每一个事物打上一个实数的标签,预测出一个实数的量,比如说预测人的价值,预测人的风险,这类问题叫做回归。总结一下,经典的人工智能或者机器学习问题主要分成:分类、聚类或者回归。

这既是过去人工智能取得巨大成功的基础出发点,但也是制约过去所谓“决策式 AI” 产生更大价值的重要原因,因为这三类问题对于我们客观世界的表述形式是有限的,我们只能把事物分类,或者说只能给事物打上一个数字标签,对大量复杂的问题,比如我需要一个营销方案,决策式 AI 就没法生成。

而现在生成式 AI 已经超越了经典的决策式 AI

经典的人工智能用到的是决策式 AI,更像是做选择题,判断和分类是它的强项。比如,判断一个图片是汽车图片还是马车图片,这就是一个典型的决策式 AI解决的问题,当然不限于此,自动驾驶汽车在马路上,要不要自动停车,要不要自动加速,这些都是决策式 AI 给我们带来的功能。

但如果我们要生成一幅图片,生成一个营销方案,生成一个针对未来的规划,决策式AI就无法做到。如果说决策式AI是做选择题,那么生成式AI就可以做简答题,甚至可以帮我们写文章。

2. AIGC是更加面向前端的内容,是更偏向前台的存在,而生成式 AI 是它背后的技术

刚才简单给大家介绍了从数据到模型,从决策式 AI 到生成式 AI 的一个历程。下面我想给大家再进一步具象化地表达AIGC,AIGC 是更加面向前端的内容,是更偏向前台的存在,而生成式 AI 是它背后的技术,在它背后起支撑作用。

AIGC 模型的发展历程

2014 年推出了序列到序列(seq2seq)模型。什么叫序列到序列模型?就是说我可以输入一个序列,然后通过这个模型的计算思考输出另外一个序列。

貌似简单的结构,其实蕴含无穷。我们日常处理的几乎所有问题都可以变成一个序列到序列的问题,比如,你接到领导的一个需求,这是输入的一个序列,那么你输出了对应的工作产出,这是输出的序列。

只要我们恰当地把日常生活中或工作中的信息编码成相应的序列,那么生活工作中很多信息都可以通过序列到序列的形式生成,所以生成式人工智能应用范围非常广,它的核心出发点就来源于10年前一个序列到序列的框架,它极大地延伸了传统决策式AI所不能解决的问题,这是一个非常令人激动的,给人类带来想象空间的一个基础模型。

随着时间的发展, 2017年行业中又推出 Transformer模型。Transformer是一个英语单词,意思是变换器,就是把一个东西对应的数据,变换成另外一个东西对应的数字化形式。Transformer变换器模型基于序列到序列模型基础,同时又有自身的创新点,第一个创新点叫注意力机制,第二创新点叫位置编码。具体的信息大家从这本新书《生成式人工智能》中详细了解和学习到。

现在许多生成式AI大模型都是基于 Transformer变换器而构建,包括大家耳熟能详的 GPT 模型。GPT是什么意思呢?G,Generative,就是生成式的意思;P,Pretraining,预训练,就是模型先给你预训,有点像我们现在的预制菜,预制菜只需要回家热一热就行,GPT 模型的预训练是指别人已经训练好了,你拿来再加工一下就可以用了。T,就是我刚才说的 transformer。

GPT模型给行业带来了非常大的变革和突破,2018年是GPT模型第一版,2019年是第二版,2020年是它的第三版,GPT第一版模型大概有1亿个参数,GPT第二版模型有15亿个参数,第三版模型将近有1750亿个参数了,足以见到这个大模型的演进趋势非常快。

1750亿个参数,这个数量可能已经超过人脑中神经元数量,可以说ChatGPT这种类型的模型对于人脑的模拟在一定程度上做得比较好。

按照大模型的演进速度,上一版是 1750 亿个模型,那么 GPT-4的参数可能超过它5倍。如果真是这样,参数的数量已经超出人脑中神经元的数量。今年图像处理领域也有另外一个大模型叫做 SAM 模型, SAM就是 segment anything model,指可以分割一切图片的模型,这个模型也是计算机视觉底层的一个突破。大模型越来越具象化,而且主要的模态,比如文本、图片、音频等,基本上都已经被攻克,甚至包括部分跨模态模型。

什么叫跨模态模型?

以GPT-4为例,它既能识别图像,又能识别文字,甚至可以在两个模态中切换,这叫跨模态模型。跨模态一直是通用人工智能的理想状态,现在最先进的模型中,跨模态已经部分实现。最终通用人工智能想达到的目标,就是人类所能理解的所有模态,包括我们的一切感官、信息都可以互联互通。现在已经有模型可以从音乐中生成舞蹈姿势,就是你给 AI 听一段音乐,对应的虚拟人会按照音乐产生一段对应旋律的舞蹈。

生成式AI 已经可以生成现在主流的信息形式或者模态,延伸一下:AI,可以生成“万物”。这里万物对应的是实物在数字空间中的映射,包括文本、图片、音频、视频、剧本、方案、代码甚至设计图,这一切跟我们生产生活息息相关的数字形态的事物,所以,通过生成式AI,“万物”皆可生成。

在工业时代,电机把电能转变成机械能,我们的日常生产生活离不开电机。那么我们的 GPT 模型是什么呢?GPT 模型把我们的电能转化成智能,从 GPT-1 到 GPT-4,我们 GPT 模型以及与它类似的生成式模型,把我们的电能转化成智能,而且是逐渐可以匹敌人类的智能。

GPT-1模型,主要突破就是使用了预训练的方法。

GPT -2模型采用了迁移学习的技术,它可以把一个领域中学习到的知识迁移到别的领域。

GPT -3 侧重了泛化能力,这是从一个事物延伸到别的事物上的一种学习归纳能力, GPT-3.5 在听从人类指令和模型微调方面取得了一些突破。

到了 GPT-4,已经实现了一定意义上的跨模态理解。ChatGPT 也实现了应用插件, GPT 它不只是一个模型,它已经成了一个计算平台。有点像iPhone或安卓,是整个移动生态的底层,GPT 类似的模型可能就是下一代智能革命的底层平台,ChatGPT 也做了一个生态化的尝试,它跟很多应用通过插件进行合作,可以把数据跟其他应用进行互联互通。

以上给大家介绍了GPT 的几个版本,下面我们再看几个例子。

3. 相当于斯坦福大学高材生水平的GPT-4

2022年 OpenAI 公司向全世界宣布了 一个突破。ChatGPT 其实是基于 GPT 3.5 模型衍生出来的,而 GPT 3.5 模型又是在 GPT 第三代模型上的微调。

为什么我们说ChatGPT 是一个里程碑式存在,因为仅从数字上大家可以看到,ChatGPT 是历史上第一个两个月内积累1亿活跃用户的应用,远超其他任何一个你所知道的互联网应用,为什么如此出色?基于个人对于ChatGPT底层的理解,分享两点:

第一点,ChatGPT封装了世界上相当多的知识,把成年人的通识以一种数字化的形式刻录在ChatGPT 模型里,并且它的知识面足够宽。它并不是无所不知,也不一定永远正确,但在特定领域可能比很多人做得都好。

第二点,ChatGPT具备强大的逻辑和推理能力。有评估认为 GPT 3 的能力在高中生和大学生之间,而 GPT-4相当于斯坦福大学高材生的水平。

这个图片是 GPT-4官网上的一个图片,标题叫“一张有趣的图片”,有人把这个图片发给GPT-4模型,让它识别一下,为什么这是一张有趣图片。

GPT-4讲得非常精准:因为它把一个老式电脑的 vga 插口,插在了一个新型的手机上,这种组合一般不常见。

这个实验说明 GPT-4 模型不但具有一定程度上的图片和文字理解能力,还具有了我们常识和推理能力。这对AI是非常稀缺、非常罕见的能力。

下面给大家看第二个例子。我问了ChatGPT 一个问题:“真正难以被 AI 取代的工作其实很少,但是绝大部分的职业都会受到 AI 的影响”,这句话逻辑正不正确?

同样的问题我曾问过周围几个朋友,他们没有给出我满意的回答,后来我问了ChatGPT,它的回复如下图:

其实,这句话逻辑上有问题,应该将“难以”改成“可以”。

我身边很多朋友没有看出来,因为这句话确实很绕。虽然ChatGPT的回答不亚于人类的回答,但它也没看出来,我们不能总说ChatGPT的好,所以给大家举了一个负面的例子,因为我想大家知道,人类的逻辑非常复杂,真正想要具有完善的逻辑体系和思维能力是非常有挑战的一件事情。

因此,我们也会犯错误,我们也不能阻止 AI 犯错误。

刚才我们从通识角度看了那张有趣的图片,从逻辑角度我们做了一个测试,有些问题如果人类也搞不定,那么 AI 也搞不定。还有,虽然ChatGPT模型很厉害,但它只能解决它所知道的问题,我们如果需要让 ChatGPT模型解决我们的问题,解决我们工作和生活上的问题,我们要怎么做?在《生成式人工智能》这本书上有详细描述:我们可以去微调模型,微调出适合我们工作和生活的模型,去适配我们特定应用的场景。

GPT 模型经过微调以后,会成为独当一面的“人才”,可以成为一个艺术家,一个设计师,一个程序员,一个工程师,甚至可以成为一个广告优化师,供应链管理专家,或者成为一个客服人员,它可以成为各行各业专业的人员。只要我们拿相应领域的专业数据,在 GPT 模型基础上进行微调,就可以完整地发挥生成式AI的作用。

说到 GPT 的价值,比如艺术创造性的工作,我们去绘制图片漫画,创作影视歌曲,我们用生成式 AI 可以起到辅助性的作用;比如设计性的工作,包括设计服装、设计家装、设计建筑、设计城市, AI 工具可以给人类提供辅助和支持;比如逻辑性的工作,包括程序员、药物研发的科学家, AI 工具也可以起到支持和帮助作用,甚至在很多场景下可以取代人类所从事的一些枯燥的、低端的、乏味的工作,让人类可以更好地聚焦在一些高端的、创造性领域。

4. 生成式 AI 对比 决策式 AI:前者会创作,后者只会做选择

在生成式 AI 和决策式AI 对比之前,大家可以先看一下智能式客服的逻辑框图:

大家经常会接到AI客服电话, AI 机器人只能在每一个节点,就是在每个方框的地方,针对客户的语音输入做一个判断,再决定进行哪条路径。这就是传统决策式AI,它只能做判断题和选择题。

如果生成式 AI 来重做这个场景,则会直接帮我们生成一个逻辑跳转的框图,生成式AI通过数据训练以后,可以灵活自由地根据场景创造出逻辑跳转框图,并在业务的每个关键节点给我们做出判断和选择。

所以,生成式AI学习的空间和学习的数据形式,在序列到序列模型和Transformer变换器模型的支持下非常广泛,生成的内容也非常广义,AIGC 生成内容不仅仅局限在图片、文字或者音视频上,从业务逻辑、策划方案到逻辑框图等专业内容形式,都可以通过生成式 AI 来生成。

问答一:AIGC 可能会给哪些产业带来了一个巨大的变革。

OpenAI 首席科学家伊利亚·苏茨克沃,他说过一句话:ChatGPT模型学习的是“世界模型”。

为什么他把ChatGPT学到的东西称为世界模型?因为首先他把互联网文本称作世界的映射,将整个互联网文本作为训练语料的 ChatGPT 模型,学习到的就是整个世界,那么它就是无所不包的,并且已经接近我们一个成年人所有的思维水平,包括通识、逻辑和推理能力。

用这样一个世界模型和其他大模型,我们怎样去改造世界?

先给大家看书中的一幅图

在这幅图 X 轴上有很多模型,包括 ChatGPT 模型, GPT-4模型, Stable Diffusion 生成图片的模型,以及我们之前常用的GAN模型等。在 X 轴上有许多模型,它能理解世界的方方面面。

在 Y 轴是生成的内容,生成内容包括文本、图片、音频、视频、剧本、代码、方案设计、交互策略等等各种各样内容形态,可以说,我们日常工作生活中所产出的各种数字化内容,其实都在 Y 轴上,也是我们客观世界在数字世界的映射。

Z 轴上我列举了一些职能。什么叫职能?我们可能做金融业、制造业、医疗业等各种行业,但每个行业都会有一些通用的职能,包括研发、生产、供应链、营销、客服、风控以及安全这些职能,职能跟行业之间是另外一个映射关系。

X、Y、Z三个轴形成一个坐标系,行业怎么通过 AIGC 来改变?在整个三维空间中的每一个点都是我们可以做的事情,好比你可以用 GPT-4模型生成一段代码用在生产上,生成一副图片用在营销上。如果你是设计师,你可能要生成一个设计;如果你从事营销策划,你可能要生成一个策略或一个方案。不同的职业,生成的内容不一样,再把这个内容用在 Z 轴上。不论你是做营销的,做供应链的,做安全的还是做生产的等等,在整个三维空间所覆盖的领域,我们可以找到想做的各种各样的事情,这三个轴构成的空间近乎可以囊括我们在工作中碰到的各种问题,它都可以通过生成式 AI 进行底层支持和赋能。如果你今天掌握了这个工具,也许明天你的工作就会变得更好。

问答二:阿里CEO张勇说:所有的产品都值得用 AI 重做一遍。这句话怎么看?

这个问题可以衔接到上一个问题,基本上我们刚才所说的空间中的每一个点都可以通过 AI 进行改进。

我们从各自的角度出发,从各自专场领域出发,从各自的应用场景和行业出发,我们可以获得非常多的用 AIGC 进行改造的方向,在《生成式人工智能》一书中,我列举了各个领域、各个层面的案例来支撑。

正如上一个问题给大家分享的,只要你打通了X轴、Y轴、Z轴三个环节,AIGC就是你的工具,它是你的赋能,而不是取代你。

问题三:企业如何拥抱这一次 AI 浪潮,进行数字化升级?

企业数字化升级一定是一把手工程,一定是企业的领导牵头,他需要打通数据,打通业务流程。

很多时候不是企业没有数据,而是因为企业数据存在于很多零散的数据库中,没有办法实现打通,也没有办法实现跟业务互联互通。只要能把企业信息打通,在很多环节下 AI 是可以进行赋能的,尤其是 AIGC 给我们带来了新的工具,企业数字化转型升级的空间会更大。

很多企业会有一些问题,比如很多企业将 AI 部门等同于 IT 支持部门,或局限成算法工程师的工作,这样做限制性非常大。

此外,在实际中我们发现企业的需求跟 AI 模型之间存在很大鸿沟。因为企业的业务负责人可能对业务非常熟悉,但是对业务的数字化表达,关键指标如何通过数据优化等问题,没有太多概念。

所以我们要进行数字化转型,必须让企业决策者和业务负责人对指标数字化。比如,营销部门要优化线上营销效果,需要明确是要优化点击,还是优化收藏,还是优化购买等,必须要有一个数字化的指标,把相关上下游数据进行打通。如果这几点可以做到,我们就可以通过 AI 帮助场景优化和提升。

在 AI 赋能企业的过程中,我们发现生成式AI 能够解决一些决策式AI 解决不了的问题,决策式 AI 更像做选择题,而生成式 AI 更像做简答题,创作内容是它的长处。生成式 AI 应用场景更多,它不是局限于从几个事物中选择一个事物,它能创造出全新的内容。

另外,原来的 AI 缺少通识和逻辑,导致决策式AI在很多场景很难落地,现在最新的生成式人工智能,它具有了人类一定程度上的通识、逻辑和推理能力,弥补了决策式 AI 之前在业务落地过程中的痛点。如果我们把决策式 AI 跟生成式 AI 结合起来,那么可想而知,企业抓住这一次历史性机会,一定能加快创新步伐,在竞争中取得优势地位。

问答四:对于普通人来说, AIGC 到底会给我们带来哪些影响?我们的工作真的会被 AI 取代吗?

首先 AI 其实是一个特殊工具,好比说挖掘机起重机代替了人的体力, AI 显然是代替人的智力,它有人类的通识和逻辑能力,下一步会在某些场景下进行替代。

剑桥大学最近针对“人工智能对人类可替代性”的一项研究,引入了三个维度,第一个是社交智慧,就是跟人相处的一个能力;第二是创造性,顾名思义就是创造新事物的能力;第三个是感知和操作能力,包括我们感知外部环境以及精细操作的能力。当处理创新性和变通性比较低的工作,和需要大量重复性工作时,人工智能效率会比较高,稳定性也更好。

在面对一些需要情感交互,应对复杂场景,以及需要创造性的工作时,人工智能表现就没那么好了。所以在看到人工智能长处时,我们要直面它的短处,我们要在恰当的场景下运用人工智能,给我们的生活和工作带来便利,这才是我们运用人工智能的目标。

普华永道 2018 年曾发布一个报告,叫《人工智能和相关技术对中国就业的净影响》。这篇文章预计在未来20 年中国将会有 26% 的工作岗位被人工智能相关技术取代,但同时它又指出,人工智能和相关技术通过提高生产率和实际收入水平能够产生 38% 的新工作岗位。

最终两个数字相互抵消,还将净增 12% 的工作岗位。

所以,人工智能它带来的更是一个职业结构的影响,可能以后更多是重复性、低效的工作会被人工智能取代,同时产生更多高端的需要运用人类创造性和沟通能力的工作。

人工智能不是我们的竞争对手,更多是我们的工作伙伴,它必然会成为未来生产的一个要素,使我们生产力得到很大提升,我们需要做的是与人工智能一起工作。现在很多行业领先的公司,包括一些新兴行业,很多人已经开始和人工智能一起工作了。

那么如何才能做到和人工智能一起工作?

首先我们需要 AI 思维,AI 思维就是一种数据驱动的思维,我们从数据中形成模型,一旦用了模型以后,面对未知的情况,我们的 AI 就能做出最佳预测判断,甚至生成全新内容。对于生成式 AI 来说,就是在未知场景下生成全新的创造性内容。不管是决策式 AI 还是生成式AI,底层逻辑都是一样,就是当我们没法只靠人类局限的经验和思维进行推导的时候,AI 通过数据来训练就成为一个必然选择,这就是我们说的 AI思维方式。我们需要理解AI思维的底层逻辑,其基础在于数据,核心在于模型, 实现在于算力,具体应用在于业务场景。AI 思维可以避免很多人类思维的主观因素和片面因素,它是具有积极意义的。

其次,我们要具有 AI 的工具思维,工具思维就是利用工具, AI 的工具思维本质上是一种数据化思维,通过数据化思维,我们可以使用 AI 、训练AI。

AIGC 的技术发展浪潮是不可逆转的,我们与其消极对待,不如思考如何为我所用。我们理解了 AI 的底层逻辑以后,我们就能在工作和生活中使用 AI,挖掘 AI 技术的价值,让 AI 为我们服务,让 AI 成为我们的一个工具。

问答五:AI 能分析股票吗?现在实现了吗?

AI 一直以来可以分析股票走势。通过我们现在这种新的生成式人工智能,对于股票走势这种时间序列的分析,会有一些更好的洞察。在书中我们就有对于具有时间顺序的数据序列的预测案例。通过生成式AI模型,我们可以更好地生成对于时间序列的预测,包括股票的预测。

问答六:普通人该如何训练自己的 AI 思维?

第一,提升自己的数据化思维能力。什么叫数据化思维?就是拿数据说话,能够去解读数据。它的底层逻辑就是统计学和一些基础的数学知识。

第二,可以关注一下我写的上一本书《AI思维》,这里面详细描述了如何建立AI思维框架。

问答七:AI 未来的应用场景主要是哪些?

AI 的应用场景可以分为两大类,一类叫做消费类应用,包括我们的智能手机,自动驾驶汽车等,这些跟我们息息相关的设备或装置;

第二类叫做行业应用,包括金融业、零售业、医疗业、制造业,各种各样的行业里都有许多应用 AI 的空间。

问答八:目前行业应用这项技术的水平如何?

整个行业都非常新,不管是国内还是国外,现在大家都在摸着石头走路。国内外的大公司也是你追我赶,发布各种新的大模型。

在应用层面,我们书上有很多案例,给大家展示目前行业最前沿的模型和应用领域。我们也调研了很多学术论文,把尽可能多的行业前沿案例罗列在这本书上。你看完这本书以后,就可以大致了解目前行业应用生成式AI所处的阶段。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1