生成式人工智能(AIGC)的不断发展,给文旅行业带来了新的机遇、问题和挑战。文旅产业应该如何把握以提高生产效率、激发具体应用探索等在内的机遇,如何应对技术冲击、版权归属、内容监管等多方面的问题与挑战,成为了目前需要紧迫探讨的问题。本文结合保利影业、保利文娱科技相关实践情况,从国家、行业和企业层面提出了相关对策建议,包括推进技术研发、制定标准规范、加强培训监管、提升行业技术水平等,以推动文旅行业高质量发展。
作者 | 李挺伟,杨億,叶丹宁,李铮,包文文(保利影业、保利文娱科技研究中心)
编审 | 时光
编辑 | 半岛
来源 | 三川汇文化产业(ID:schwhcy)
2023年,以大模型为代表的生成式人工智能(AIGC),席卷人工智能技术热潮,为各行各业的创新发展和转型升级提供了新的工具和能力。AIGC是现阶段推动数字经济发展的重要力量,是当前炙手可热的研究和投资方向之一。
一、生成式人工智能发展情况
(一)基本情况
作为一项前沿技术,生成式AI率先在教育、传媒、电商、娱乐、影视等多个领域施展出惊人的创造力,它与实体经济的深度融合创新为提振居民消费、释放内需潜力注入了全新动能。
目前来看,生成式AI主要有以下六种输出模式:一是输出文本,主要是生成通俗易懂、高质量户文本段落,并在复杂程度和细节把控方面满足用户需求。二是输出图片,即模型会根据文字或视觉提示生成具有可变性、创造性和不同逼真度的图片。三是输出音频,目前AI可以输出语音、音乐、歌曲内容等,虽然未达到“惊艳”的程度,但在视频内容中已经可以完成简单的配乐。四是输出视频,与图像输出类似,模型可以根据用户提示生成并输出视频,而视频中的人、物、景完全由模型虚构和创建。五是输出代码,即使用各种编程语言编写计算机代码,还可为开发人员自动总结、记录和注释代码。六是输出3D模型,即模型可根据文本或2D图像输出具有3D物体属性的模型数据或函数集。
(二)以Sora为代表的生成式人工智能
2023年3月,美国“开放人工智能研究中心”(OpenAI)的ChatGPT-4上线,模型性能和功能性得到进一步提升,在写作、作图以及代码生成等多模态专业领域已经能够极大地提升工作效率。今年,当地时间2月15日,谷歌推出了多模态大语言模型双子座(Gemini)1.5 PRO,可以为不同模态执行高度复杂的理解和推理任务,分析和理解1小时长视频、电影剧本的事件和细节。同日,OpenAI发布了文生视频模型Sora,模型在时长和分辨率上大幅超越其他同类模型,可以说是里程碑式的产品。Sora在视频生成中模拟了多种物理世界,世界中的动物、人物、建筑细节细致,人物的皮肤肌理、动物的毛发描绘清晰并对光影的反射、镜头移动等细节处理合理,使生成的视频内容具备了真实感。
Sora的特点可概括为以下四点:一是视频主体和背景的连贯性,能够保持画面稳定性,时长长达1分钟(同类产品一般在20秒以内);二是OpenAI的原生语言能力较为丰富,推测Sora对自然语言理解程度较高;三是生成不同长宽比的相同视频内容,能够做到视频主体内容始终在画面合适位置;四是Sora目前已有案例显示出一些符合世界物理规律的现象模拟。Sora之所以是AI里程碑,是因为它再一次突破了AIGC用AI驱动内容创作的上限,它所展现出来的能力对现有其他AI视频生成工具的效果对比,几乎可用“碾压”来形容。
另一方面,Sora目前还是一个不成熟的产品,Sora生成视频中可能包含不合逻辑的图像,存在无法准确模拟复杂场景的物理原理和因果关系实例等现象,比如吹蜡烛火不熄灭,跑步机上方向错误等问题。尽管问题很多,但Sora展现了视频模型未来的潜力,未来只要有足够的数据和算力支持,就可能更深入的理解物理世界的规则。
从年初苹果发布Vision Pro头戴式显示设备、到各家PC大厂接连发布AIPC,到这次的OpenAI发布Sora,全世界对于人工智能的创新在加速,迭代地越来越快。今后用AI自动创作生成的内容会影响很多的行业领域,对于热点话题的“时效性覆盖”将是AI的主要任务,比拼的是AIGC的效率和驾驭AI的能力。
二、生成式人工智能为文旅行业带来的机遇
生成式人工智能的发展,可以说是一场新的工业革命,文旅行业是生成式人工智能应用的重要领域之一。Sora作为一种先进的人工智能助手,其核心技术在于大数据分析、自然语言处理和人工智能算法。这些技术在文旅产业中的应用将有助于提高文旅产品的创新能力和服务水平。
(一)可作为元宇宙的内容生成器和效率加速器
元宇宙是一个庞大而复杂的虚拟世界,想要使用者在元宇宙获得极佳的体验,需要在场景和建模以及物理引擎上面投入大量资源,生成式人工智能技术目前也在尝试进行3D内容生成,提高内容生成效率和模型精度,Sora的出现与3D内容生成相结合,将大大提升使用者的真实性体验。
(二)可降低建立数字博物馆的技术门槛
通过积累文物模型数据,结合生成式人工智能,将为文物的虚拟修复、展示和研究甚至文物鉴定提供有效的工具支持。通过AR技术也可以在不触碰真实文物的前提下多角度观察文物细节。同时,通过生成式人工智能,也可以为馆藏产品进行文物IP创新,创造出符合公众喜闻乐见的IP形象。
(三)可加速文旅产业与相关产业的融合
随着5G、物联网等新技术的不断发展,文旅产业正加速与相关产业融合,Sora等人工智能技术将为这种融合提供有力支持。如与影视、动漫、游戏等行业合作,打造具有吸引力的文旅IP;在文旅小镇、主题公园等项目中,像Sora这样的各类AI模型可以提供智能化、数字化的解决方案,提升项目的运营效率和盈利能力。此外,生成式AI与各类AI大模型还可以推动文旅产业与科技的深度融合,如无人驾驶、智能交通等技术创新在文旅领域的应用,为游客带来更为便捷的出行体验。对于文化遗产的保护和利用,AIGC可以帮助创建历史场景的复原视频,让游客更直观地了解历史和文化,提高教育的趣味性和参与度。
为了加速文旅与互联网智慧融合,保利影业旗下的保利文娱科技推出一款AI速拍产品-VLOG速拍宝,赋能景区数字化升级,助力文旅产业高质量发展。VLOG速拍宝为一键生VLOG产品,覆盖100座以上的城市、25个省级行政区、100个以上的景区,总设备数量达到2000台以上。通过自动抓拍游客游览过程,生成专属VLOG。同时为景区和特定景点定制视频模板,挖掘景区历史文化底蕴,一键生成游客与景区相融合的微电影。另外,保利文娱科技旗下的全息投影显示终端-空间云柜的全息数字人技术,可在未来为博物馆、景区、展厅、会议、文旅导览等,提供1:1 真人还原的各类AI智能服务。
三、问题与挑战
技术进步是一把双刃剑,生成式人工智能在提升用户体验、提高生产效率的同时,也带来了很多问题、挑战:
(一)生成内容的迭代调整存在难度
目前来看,生成式人工智能难以真正输出感性的、拟人化的深刻表达,音频的流畅度和真实感还有待加强,视觉感知能力的欠缺导致视频或3D模型在精准度、仿真度和还原度上难以兼顾。
(二)数据安全问题
生成式人工智能时代,高频度的人机交互使得个人信息全方位地暴露,泛滥的虚假信息进入生成式人工智能庞大语料库之中,随即大规模传播将会带来社会危害。
(三)伦理与道德问题
生成式人工智能模型无法理解道德和文化问题,有可能无法很好的适应当地的社会文化和习俗,在创作上可能会存在偏见和误解,对内容制作方可能造成一定的风险以及不良的社会影响。
(四)知识产权问题
如果人工智能研发机构在训练模型时没有获得训练数据提供者的明确授权,很可能产生知识产权纠纷。另外,生成式人工智能产生的内容是否受著作权和专利权保护,目前仍存在很大争议。
保利影业旗下的科技公司保利视讯在数字水印、内容安全、版权保护、音视频监测和溯源领域拥有先进的技术,可在知识产权保护方面发挥巨大作用,为文旅产业高质量发展保驾护航。
四、生成式人工智能赋能文旅高质量发展的对策建议
作为文旅行业从业者,一方面要积极拥抱新技术,另一方面应加强企业对生成式人工智能的风险防范意识。
(一)国家层面
鼓励生成式人工智能的技术研发,激励企业参与全球生成式人工智能的竞争与合作。推进生成式人工智能科技安全立法和行业标准制定进程,为有关算法的可专利性和生成内容的商业秘密或作品认定提供政策依据。兼顾制定多层次的行业标准及国家标准以配套法律政策文本的实施。生成式人工智能的监管标准既要同国际接轨,又要考虑到我国生成式人工智能行业发展的特殊性,保证规则体系建构的制度适配性。切实考虑企业参与生成式人工智能技术重大研发和海外竞争的核心利益,对生成式人工智能内容实行包容审慎和分类分级监管。
除此之外,我国AI发展所需要的语料数据仍相对匮乏。有数据显示,全球通用的50亿大模型数据训练集里,中文语料的占比仅为1.3%。业内人士指出,虽然我国的数据资源丰富,但是由于数据挖掘与流通不足,中文语料库与英文等其它语言的数据语料库相比仍有差距,可能成为阻碍大模型研发的重要因素。因此,进一步规范、完善中文语料库是训练和优化AI大模型的重要基础。语料库的丰富充实或将使资料查找更加便捷,进一步降低了普通人的AI使用门槛,帮助普通人以更简单的方式获取更全面的信息。
(二)行业层面
应以场景理论为导向,分情景开展生成式人工智能的风险识别及其防控。推动采用数字水印技术对知识产权进行保护,避免侵权行为。积极推进通用大模型技术与垂直领域相融合,使模型更专注于专业领域能力,可以更高效的帮助行业企业实现价值。
(三)企业层面
加强技术普及和员工培训。生成式人工智能作为创意效率工具,让企业内部做好迎接变革的准备至关重要。加强内容审核和技术监管,鼓励企业建立多部门协同的人工智能风险治理团队,从数据、技术、产品、合规、法务、内审等多视角,对生成式人工智能应用从训练数据到输出内容进行审核和监管,确保符合法律法规和道德标准。
另外,在应用场景方面,AIGC可助力虚拟现实体验提质升级。目前来说,文旅体验受制于时间和空间两个维度,时间上无法沉浸式体验历史和未来,空间上受制于场景搭建和资源开发。未来,AIGC可根据用户的个性化需求生成定制化的沉浸式体验内容,在已有基础上打通虚拟空间,融合增强现实(AR)、虚拟现实(VR)和混合现实(MR)体验,为游客提供突破时间和空间限制的虚拟旅游体验。
面对AIGC带来的挑战,文旅产业需提升行业整体技术水平,培养专业人才,加强行业自律,确保内容质量,深化产业合作,实现产业链上下游企业协同发展,共享技术红利,注重用户隐私保护和数据安全,构建可信赖的数字文旅生态。只有保持开放的心态,紧跟技术发展趋势,直面机遇和挑战,关注技术发展带来的各类问题并积极应对,持续推进行业高质量发展,才能在智能化时代立足于不败之地。
参考文献
[1] 张成甦.生成式人工智能嵌入消费领域的机遇、风险与应对[EB/OL].工业技术经济,2024-02-23[2024-02-25].
[2] GPT-4: Scaling Up Language Models[EB/OL]. OpenAI, 2023-03-17.
https://openai.com/research/gpt-4
[3] Sundar Pichai, Demis Hassabis. Our next-generation model: Gemini 1.5[EB/OL]. The Keyword, 2024-02-15.
https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/?utm_source=gdm&utm_medium=referral&utm_campaign=gemini24#sundar-note
[4] Video generation models as world simulators[EB/OL]. OpenAI, 2024-02-15. https://openai.com/research/video-generation-models-as-world-simulators
[5] 晏轶超,程宇豪,陈琢,彭乙骢,吴思婧,张维天,李俊杰,李逸轩,高景南,张维夏,翟广涛,杨小康.基于神经网络的生成式三维数字人研究综述:表示、渲染与学习[J].中国科学:信息科学,2023,53(10):1858-1891.
[6] 任泽平:Sora横空出世,会颠覆哪些业[EB/OL]. 新浪财经,2024-2-20.
[7] 全新人工智能模型 Sora对文旅产业的三大影响[EB/OL]. 七彩文旅,2024-2-22.
[8] 孙那、鲍一鸣.生成式人工智能的科技安全风险与防范[J/OL].陕西师范大学学报(哲学社会科学版),2024-02-19.
[9] 陈永伟.超越ChatGPT:生成式AI的机遇、风险与挑战[J].山东大学学报:哲学社会科学版,2023,(3):127-143.
[10] 生成式人工智能的风险和机遇管理[EB/OL]. 普华永道, [2024-02-25].
[11] 李兵兵.人民数据打造全球最大中文语义语料库助力Sora新场景[EB/OL]. 人民数据,2024-2-20 [2024-02-25].