冯宏声腾讯研究院高级顾问
王枢腾讯研究院博士后
技术跃迁:
从人工智能到生成式人工智能
图灵在1950年提出“机器能够思考么”这一问题。1956年的达特茅斯会议将“人工智能”(Artificial Intelligence,AI)定义为“使一部机器的反应方式像一个人在行动时所依据的智能”,奠定了AI研究的终极目标和评价标准。
生成式人工智能(AI Generated Content,AIGC)的狭义概念是“通过人工智能自动生成内容的生产方式”,广义概念是“像人类一样具备生成创造能力的AI技术”。AIGC基于训练数据和生成算法模型,可以自主生成、创造新的文本、图像、视频、3D交互(如虚拟化身、虚拟物品、虚拟环境)等各种形式的内容和数据,能够开启科学新发现,创造新的价值和意义。
最早的AIGC应用可以追溯到1966年由麻省理工学院计算机科学家约瑟夫·维森鲍姆开发出的人机对话程序“伊莉莎”(Eliza),该程序主要使用“模式匹配”和替换方法,基于特定规则给予预设的响应。
2010年以后,深度学习(Deep Leaning)技术的突破开启了AI的新篇章,显著提升了计算机在识别图像、处理音频、玩游戏等方面的能力。2017年,转换模型(Transformer)的问世引领预训练模型兴起,推动自然语言处理革新,Seq2Seq、GPT和BERT等模型问世,改变了文本生成和理解的方式。2020年,GPT-3模型的出现带来了突破性的生成和理解能力。2022年,以ChatGPT、GPT-4为代表的大语言模型(Large Language Model,LLM)让大模型首次出现颠覆性的涌现能力(Emergent Abilities)。
美国社会哲学家刘易斯·芒福德提出:“技术变化是文明史的核心”。AIGC被认为是AI技术发展的一次跃迁,可以实现从感知、理解世界到生成、创造世界的跨越,将成为新的生产力工具和创造力引擎,深刻影响经济和社会,造就新的文明时代。
范式变革:
AIGC技术正在深度融入出版业
AIGC等信息技术正在重塑信息内容容器、重构内容生产流程,推动出版业由“专业化生产内容”(Professional Generated Content,PGC)升级至“人工智能生成内容”,即AIGC,带来出版范式变革。
1. 容器重塑:出版业进入“活容器”时代
在数字出版语境里,“容器”并非物理形态的介质,而是“以数字形态封装内容的符号”。AI技术正在助力出版业实现内容容器的智能化升级,并开始介入容器内部所装载内容的创作和生产中,新技术让容器“活”起来。
1)文字容器:可以由工具自主填充内容
AIGC工具已广泛用于资料搜索、情节分析、搭建设定、启发创作、协助创作等场景,用以提升写作效率。小说作者可以通过作品喂养、调试ChatGPT模型,来提供新故事概要或进行角色设定等,AIGC工具可以补充细节描述。人类正在成为向文字容器填充内容的事前训练师、事后优化师,创作与生成的过程则交给AIGC工具来完成。
2)图像容器:可以由人指挥工具填充内容
图像的创作门槛逐渐降低,借助文生图、图生图工具,以自然语言输入对想象图像的描述、加入提示词(Prompt)就能生成图像,图像的生产效率得到提高,AIGC工具能拆解人们的“创作(表达)”动作,重组“点线面色彩光(表现)”元素,实现快速输出。与此同时,对工具无法取代的艺术家“创意(思考)”思维,评估其创新度的标准也将进一步提升。
3)音频容器:可以丰富种类、风格与应用
基于智能语音合成技术,可以生成逼真模拟语音,创造丰富的虚构音源;基于规模化音频数据和多轮交互,“智能曲谱”等AIGC音频应用程序可以支持音乐家低成本完成创意风暴、灵感试验,探索多元风格;基于实时交互,可以支持虚拟助手、语音翻译、虚拟教师等应用场景。
4)视频容器:可以实现一站式、一体化生成
AIGC技术助力视频容器可以集素材搜集、视频剪辑、后期包装、渲染导出和发布于一体,降低视频制作门槛;AIGC视频工具叠加数字交互引擎技术可实现虚拟制作,如腾讯公司打造的互娱虚拟影棚,升级了传统绿幕拍摄模式,以“所拍即所得”助力视频生产提质增效。
5)游戏容器:可以促进交互丰富、应用多元
游戏也可以抽象为封装内容的符号,成为独立的交互式内容容器。AIGC能帮助开发者低成本生成对话、脚本、地图、布景、人物设定等数字资产,修复代码,提升产品研发效能;AIGC还能降低交互内容的制作门槛,如将AI与用户原创内容(User Generated Content,UGC)相结合。已有游戏公司开始布局AI-UGC游戏平台,让玩家可轻松制作各种类型的小游戏,交互式内容的AI-UGC时代即将到来。
6)容器的全面进化:功能融合、解放创作
一是功能融合,容器的功能隔阂被打破,游戏成为全面兼容图片、文字、声音、影像功能的顶级容器;二是理解用户,基于数据分析和强交互,更能满足用户的个性化需求;三是可持续创作,容器即时沉淀用户反馈,反哺创作者,形成可持续再生产;四是解放创作,创作型用户从标准化、可重复的脑力劳作中解放出来,提出更多创意。
2. 流程重构:出版业全生命周期的流程再造
在AIGC技术加持下,传统出版业产业链面临重构,正在实现由线性到非线性的进化,呈现出更加智能化的发展趋势。
1)信息采集:可以实现快速高效的数据遍历
AIGC技术能够根据提示词快速抓取海量数据,并完成自动分析处理。在出版业,利用AIGC工具增强信息采集能力,帮助编辑快速获取特定主题数据,高效归纳总结,支持选题策划,正在成为行业的应用趋势。
2)内容创作:可以支持创作方式智能化升级,从纯粹人工创作进化到“人+机器”创作
AIGC技术支持“可重复、可预期创作”的投入减少,借此实现内容的批量化快速生产,提升内容创作效率。但囿于缺乏共情、思考、常识判断等能力,AIGC还不足以完全颠覆和替代以个性化创意、强情感互动为代表的人类创作。
3)内容生产:可以促进互动生产与协同生产
基于AIGC技术的生产线,可以促进作者、编辑和终端用户(读者)在生产环节实现实时互动,内容供应实时更新;可以实现“质量标准化、流程规范化”的新工业化,支持协同生产的升级。
4)内容传播:可以实现以传播促进生产升级和消费升级
AIGC技术的多轮交互能帮助供方快速提升“内容匹配精准度”;用户也可以不断升级消费需求。例如,用户与智能对话机器人可以就某一新闻事件不断进行提问和回答,同时为用户推送实时资讯和背景知识,全方位呈现符合用户需求的、精准且完整的新闻图景。
5)内容消费:创新沉浸式、高匹配、个性化消费模式,支持优质内容嵌入更多应用
基于AIGC与数字人、VR/AR等技术的叠加,借助与智能终端的“软硬一体”,升级智能客服、智能推荐、智能教育培训的功能,实现沉浸式交互效果;基于供需两端精准标引和智能化关联,实现智能匹配;基于大语言模型的跨场景应用,促进知识不断嵌入专业场景、社交场景和娱乐场景,实现优质内容供应升级。
6)流程的全面重构:场景融合、升级服务
一是环节融合,传统编、印、发的线性流程可融合为以任一环节为起点的实时供应;二是场景融合,各类场景入口贯通,用户可获得跨场景的不同体验;三是产销融合,将供给与消费进行闭环连接,实现C to B、UGC、AIGC和跨域销售的直接连接;四是服务升级,提供更贴近用户需求的知识服务。
认知重启:
以价值回归寻找出版业初心
新技术的应用会改变原有的社会生态,AIGC对出版业的影响不仅体现在具体模式、流程和机制的改变上,更体现在总体性文化变迁的根本逻辑上。在此背景下更需要回到出版业的本源去审视这个古老的行业,在变化中寻找不变,发现其根本价值和存在意义。
1. 关注技术应用的负面影响
AIGC技术的应用给内容生产带来了一系列便利的同时,也给内容生态带来一系列负面影响,其背后恰恰是出版业本应实现但由于主客观局限而未能实现的社会价值。
1)文化污染:机器幻觉产生污染文化的虚假知识
当提问的知识范围超出问答式AIGC程序的数据库,或提问的语义范围超出其问题精准识别能力时,程序仅依据表层字词的对应关系抓取知识并进行重组,如果输出前的判断与校验能力不足,答案就会变成“一本正经的胡说八道”,这些虚假知识的生成被称为“机器幻觉”,很容易由此造成虚假信息泛滥,产生文化污染。
2)文化窄同:认知范围狭窄,体验内容同化
AIGC使用自然语言建立交互式连接,用户极易对其产生依赖性。但ChatGPT等工具背后有时会隐藏“主观性”的价值观导向,容易造成认知倾斜、认知狭隘,甚至对个体的世界观和价值观产生重大影响,并可能蔓延至不特定人群。
3)文化枯萎:出发点是“积极懒惰”,实际造成“消极懒惰”
从某种角度来说,AIGC技术是厌倦重复性脑力劳动的“积极懒惰”所激发的“重复性思考替代工具”,以内容交互模拟头脑风暴,为创作者提供更多元的思路;但这也容易造成使人们停止思考的“消极懒惰”,导致文化创新力下降。
4)社会问题:从业人员受冲击,新就业岗位亟待规范
AIGC对特定职位的替代趋势势不可挡,文字创作和编辑、美术创作制作、视频创作制作、游戏制作的相关岗位,以及翻译、编程等岗位都会面临挑战。虽然AIGC也将创造新的职业岗位,但目前新职业岗位规范与培训标准尚未明确和稳定,需要在发展中逐步探索。
5)法律问题:虚假欺诈及版权制度面临重构
AIGC接近自然语言的对话方式具有一定欺骗性,甚至可能存在被用于欺诈等犯罪活动的风险,需要做好安全合规防范。对出版业而言,难以识别的“中译中”式洗稿将带来创作伦理问题;如何对所使用语料的所有权人、模型开发者、模型使用者和消费者在法律上给予平衡性保护,空白磁带税、数字税等模糊性救济手段是否能继续适用,版权相关制度是小修小补、继续沿用还是必须重构,以上问题都对版权制度重构提出了挑战。
2. 回溯出版业的价值本源与本质
出版业应透过技术应用表象,认清技术发展的本质和趋势,以价值回归寻找行业本质,重启认知,理顺出版业与信息技术双向驱动的融合发展关系,实现内容的可持续价值创新。
1)重识出版的概念及价值
人类社会形成和发展的基础是交流能力,而交流得以实现的基础是思想的表达、表现和传播。出版业为实现人类的交流承担了重要任务:实现信息从不可知到可知,实现信息在不同个体间的准确传递。
出版是利用信息技术完成信息内容的生产与供应,传播思想、传承文化,实现社会广泛连接与深度交流,服务并赋能于各生产、生活领域的社会活动。其价值在于实现文化积累和文明传承,激发文化创造与再创造活力,促进经济社会发展,引领和支持科技创新。
2)理解出版的本质及功能
出版以提供知识“外挂”的方式支持人的成长,使人对知识的学习、理解和运用更加稳定,让人更像一台精密的机器。
出版的本质是满足各种信息需求的信息内容供应活动。对信息的需求可以分解为:生产(交流+学习)+生存(社交+学习)+生活(社交+消费)。信息可以分为知识、资讯和故事。其中,知识是信息的顶级形态,也是驱动出版业价值实现的燃料。
出版的功能是,在技术的加持下,从表层传播功能拓展出延伸的连接功能和潜在的评价功能。
其一,表层的传播功能。出版可以记录、储存、传递思想和催生新思想,将抽象信息(思想)转化(表达、表现)为可感知的具象信息(内容)并固定(稳定)下来,最小损耗地传播、满足消费。可以表达为:
出版的基础功能=思想/信息×(表达+表现+传播+再创造)
其二,延伸的连接功能。出版可以基于技术的连接,开展内容的传播,形成更泛在的连接。信息技术只是实现连接可能的基础,信息内容才是实现交流的连接点。可以表达为:
出版的泛在连接=技术研发应用×(人人+人物+物物)交互×(个人社交与消费+商业服务与流通+公共服务与交流)
其三,潜在的评价功能。出版可以建立评价指标,对内容和用户进行双向评估,助力供需双方提高信息匹配度,支持供需两端最终达成信息内容匹配、推送的价值共识,支持个体或机构成长。可以表达为:
出版的双向评估=供给侧供应能力评估(用户端信息适配性测评体系)+消费侧摄取能力评估(供给端用户知识测评体系)
3. 认知信息生命周期和相关信息技术的本质
1)基于信息内容的视角
AIGC技术及其他相关信息技术仍然符合信息生命周期的底层逻辑。AIGC技术是信息赋能生产生活环节的突破点,是促进智能提升和智慧演进的“仿人工的机器智能”技术。
信息的生命周期包括四个阶段:(1)抽象信息阶段:针对客观世界的事物,大脑产生感知信息、认知信息;(2)具象信息阶段:通过语言表达、数据符号封装、符号汇聚、有形包装,形成内容、数据、文献,再对文献逆向处理,去包装、去封装,回归信息最高形态即知识;(3)信息应用阶段:传播和使用信息,支持各领域知识的逻辑性应用,促进虚拟信息和现实世界广泛交互;(4)信息增值阶段:赋能生产生活,从低效劳动模式中获得解放,此为“智能”,支持人类打破现有知识逻辑,回到信息生命周期前端,创造新的认知信息即新的知识,产生“智慧”。
2)基于信息技术的视角
当前信息技术的升级目标仍然是要全面促成信息的内容表达(创作)、表现(生产)、传播(交易)和消费(反馈)升级,促进人类的交流能力和协同能力的升级。
与此分类相对应的则是:基于AI的ChatGPT,实现表达突破(对话式);基于AI的数字交互引擎,实现表现突破(沉浸式);基于区块链及Web3.0的资产管理与流通交易系统,实现传播突破(共识性);基于AR/VR的“软硬一体”化和沉浸式交互装备,实现消费突破(体验性)。上述技术的集成,将实现对真实世界的全面感知、连接和交互,开启更多数实融合的创新模式,形成完整的全真互联集合(全真体验+无限连接+自由协同+数实融合)。
3)内容与技术的双向驱动
出版业以广泛消费市场为科技成果落地转化“铺路架桥”,不断驱动前沿科技研发创新;而前沿科技又为出版业数字化提供技术底盘,推动出版业不断创新与进化。
产业重生:以出版与AI的融合共创未来
《出版业“十四五”时期发展规划》明确提出“健全完善数字出版科技创新体系”,“突出科技创新在推动出版业数字化转型升级、实现深度融合发展中的重要作用”。出版业应与AI加速融合,探索更多公共服务和商业服务模式,推动出版业重生。
1. 融合的目标:共同支持实体经济发展
在互联网已成为社会基础设施的时代,出版业过去赖以生存的外部条件已经发生改变,传统印刷产品、书店、图书馆在文化内容传播生态中的定位都已经有所变化。出版业需要积极拥抱技术,打破介质的包装、符号的封装,突破、拓展服务模式的边界,重塑行业。
出版与AI融合发展的基础,是二者有着共同的价值取向,即都是在为解决人类与环境的冲突而努力。出版业的具体产品,比如一本图书,特别是专业领域的图书,就相当于AI领域中的一个智能体(Agent)。
出版业在国民经济蓝图中的坐标处于横向位置,与所有经济领域紧密连接。而出版业与AI的融合应在垂直细分领域展开,在服务外部产业发展、服务个体成长的应用场景中全面汇合,以各种形式的知识服务为实体经济发展作出贡献。
2. 融合的路径:传统与新兴的双向驱动
融合最终要催生出新业态。出版业与AI的融合,可以从纵向和横向两个维度进行:纵向上,要以文化和科技融合为基础,依托资源标引数字化,促进生产数字化,驱动运营数据化,实现服务智能化;横向上,要以传统出版的内容质量管控经验,融合新兴出版的内容高效运营经验,共同探索行业价值可持续提升路径。
1)资源管理:夯实标引基础
加强信息内容资源标引,以元数据标引促进内容数据可复用。一方面,传统内容数据多为非结构化、无标引的,阻碍了智能化复用和价值挖掘,被标引的元数据将成为出版业的源头数据和核心资产。另一方面,要解决AIGC的机器幻觉、文化污染等问题,也可以通过标引实现内容的可溯源性和高精准度,正如传统时代的文献索引是各领域知识传承和知识创新的基础。未来,要以确立内容元数据标准为基础,以标引规范化实现核心资源资产管理水平的升级。
2)生产管理:打造灵活工具
打造灵活易用的内容生产管理工具箱。要推动产学研合作、上下游协同、内容企业和科技企业联合创新,避免低水平重复建设,高效利用已有计算资源;支持和引导高质量中文优质资源向符合条件的技术机构和企业开放,以市场化合作方式推进生产升级。
3)运营管理:构建关联体系
构建基于标引、覆盖供需两端的关联管理体系。要加强知识关联管理和需求关联管理,提高后端内容资源管理体系化与结构化,碎片化及关联化重组前端交互界面,提高供需匹配与调度的关联管理能力。推动大语言模型成为横向的通用能力,建设领域内大知识模型(Large Knowledge Model,LKM),加强二者关联管理,助力AI进入垂直行业领域的纵向应用,实现模型即服务(Model As A Service,MAAS)。
4)服务升级:丰富泛在智能
加快赋能外部行业升级,带动消费升级的应用创新。对话是最早且仍然最有效的知识传播和文化传承方式。依托LLM和领域内LKM,融合数字交互引擎、数字人等技术,可打造更多拟人化泛在智能体,创建更多ToB和ToC的对话式知识服务场景。
5)安全升级:加强合规建设
出版业要继续肩负“精神家园守望者”的责任与义务。我国的AI治理规则体系和监管体系全球领先,对AIGC带来的新问题,应继续秉持包容审慎原则,优化立法、健全监管。同时,企业也要保持敬畏态度,坚持长期主义,坚持科技向善,对新技术负责任地开发和应用,加强合规体系建设。
结语:相信未来
面对新一轮信息技术的创新与应用,出版业既要保持敏感,又要保持定力,回归历史规律,探寻行业本质和定位;既要深入学习理解技术,更要及时采取积极行动,创新产品形态和服务模式,实现内容的广泛连接,推动行业自我迭代与价值外溢。
相信未来的出版业必将为经济社会发展、文化传承、文明进步作出更多贡献。
本文摘自《数字出版研究》2023年第4期 冯宏声,王枢《变革与重塑:出版业与人工智能共创未来》,注释及参考文献从略。
王焕超、胡晓萌:《拐点时刻?AIGC时代的新闻业》
朱开鑫:《AI生成与版权保护》
👇 点个“在看”分享洞见