当设计师创造人物形象时,只需输入关键词与要求,软件就能自行设计?高效且快捷?是的没错,这就是AIGC,新一代生成式人工智能,是人工智能从1.0时代进入2.0时代的重要里程碑。
经过多年试验和摸索,AIGC最终达到了可以通过训练模型和数据学习,生成与人类创作相似甚至超越人类水平的内容,但并不仅局限于图片。例如,通过输入关键词、描述或样本,AIGC可以生成与之相匹配的文章、音频、视频等,可谓功能强大。
计算机智能化很早就已萌芽
使用计算机生成内容的想法自上世纪五十年代就已经出现,早期的尝试侧重于让计算机生成照片和音乐来模仿人类的创造力,只是限于当时的技术和水平,效果并不理想。
在1957年,莱杰伦·希勒和伦纳德·艾萨克森通过将计算机程序中的控制变量改为音符,完成了历史上第一部由计算机创作的音乐作品——弦乐四重奏《依利亚克组曲》。而到了80年代中期,IBM基于隐马尔可夫链模型创造了语音控制打字机“坦戈拉”,已经能够处理两万个单词。
随着时间的推移,于1990-2010期间,AIGC也慢慢从实验性向实用性逐渐转变,深度学习算法、图形处理单元(GPU)、张量处理器(TPU)和训练数据规模等都取得了重大突破,而由于受到算法瓶颈的限制,效果依然有待提升。到了2007年,纽约大学研究员罗斯·古德温装配的人工智能系统已经能对公路旅行中的所见所闻进行记录感知,撰写出了世界上第一部小说《1 The Road》。而2012年,微软公开展示了一个全自动同声传译系统,通过深度神经网络(DNN)可以自动将英文演讲者的内容通过语音识别、语言翻译、语音合成等技术生成中文语音。
时间从2010到如今,由于深度学习模型不断更新迭代,AIGC也随之取得了突破性进展。尤其在2022年,算法获得井喷式发展,成就了AIGC为相关企业办公工具的繁荣局面。
AIGC能涉足多种工作领域
因AIGC的强大功能,其工作覆盖面也较广,涉及多个领域,在文本生成、图像生成、语音生成、视频生成等均达到一定水准和高度,被很多企业以及自媒体所运用。
其中文本生成是使用人工智能算法和模型来生成模仿人类书写内容的文本,是在现有文本的数据上训练机器学习模型,以生成在风格、语气和内容与输入数据相似的新文本,可以说这为广大文字编辑工作者带来福音。而人工智能生成的图像可以是现实的或抽象的,也可以传达特定的主题或信息,能够给设计师们提供广阔的素材与思路。
AIGC在音频的生成上一样相对成熟,语音质量已达到自然标准,未来将向更具情感的语音发展,期待未来我们能听到更高质量的音频作品。而视频生成AIGC已经被用于视频剪辑处理以生成预告片和宣传视频。工作流程类似于图像生成,视频的每一帧都在帧级别进行处理,然后利用 AI 算法检测视频片段。AIGC凭借其先进的功能和日益普及,可能会继续革新视频内容的创建和营销方式,呈现给我们的也将会更加惊艳。
新时代人类面对人工智能的挑战
AIGC在生成高质量内容的同时,也大大缩短了内容制作的时间,不仅提高了内容生产效率和多样性,而且降低了人工成本,这导致部分相关从业者处于失业状态,引发传统工作者的担忧和恐慌。然而,AIGC也存在着显著的缺点和弊端,例如,由于AIGC技术是基于大量数据的学习和发散,因此需要大量的数据支持。同时,AIGC技术也存在一定的误差率,需要不断地优化和调整。正如比尔盖茨对人工智能的评价:“人工智能虽然能读写创作,但是无法理解其内容。”也就是说,AIGC的创作行为依旧是机械性质,不具备人类审美观点特征。
无论是文本的生成还是人物形象塑造和视频创作,AIGC需要大量原有数据支撑,也就意味着AIGC是一种信息的重组和碰撞,所呈现的内容与原有资料质量持平。这个过程中会有残次品形成,也会组合成新的高于原有资料的内容,这种概率本身比较小,毕竟,所输入的算法以原有资料水平为标杆。也就意味着本质上AIGC的成果不是一种创新,是与原有资料同一水准的复制。
而当下社会环境,尤其创作类工作,无论文字还是图像等门类,都需要不断从本质上创新,而这个创新一定会是从无到有,闻所未闻的新内容,新形式。而这对需要输入大量原有资料的AIGC来说无异于空中楼阁。所以,AIGC的问世,对相关从业人员提出更高的要求,需要从业者要不安于现状,富有不断进取创新精神,才不会被社会所淘汰。
生成式人工智能的出现,再一次证明科技的力量,再一次代替人类做重复性的枯燥工作。最初是代替人类体力工作,而这次是代替脑力工作,而无论是体力还是脑力,人公智能始终代替的是人类重复性的机械劳作,如果一个人一直不断奋进和摸索,始终富有创建性与创新,那么,他终将不会被任何人工智能所代替。归根结底,AIGC是新时代诞生的一款办公工具,无需过于担忧。