通信世界网消息(CWW)“数字人”作为多模态人机交互的重要载体,在生成式人工智能技术浪潮的带动下,逐渐从单一虚拟形象向“有头有脸有脑”创新进化,应用场景不断拓展和深化,已经成为全球布局的重要赛道。美国等西方国家积极开展“数字人”布局,基本掌控核心技术生态。我国在“数字人”应用场景方面具有显著优势,但也存在关键技术需突破、规模化应用受制约、产品应用存在知识产权和伦理问题等风险隐患,需要统筹布局、精准实施,抢抓人工智能发展机遇,更好助力“数字人”产业创新发展。
“数字人”的重要意义
“数字人”以计算机图形学、人工智能等为底层技术,具备“类人”智能,具有人类外观、行为、思想等多重特征。近几年,新一代信息技术创新推动“数字人”飞跃式发展,使其制作时间大幅缩短,虚实交互能力显著提升,正加速成为“数字劳动者”,助力形成新质生产力。
“数字人”是物理和数字世界交互的关键入口,将深刻变革人们的生产生活方式。在生产领域,以人工智能大模型驱动的“数字人”成为“数字员工”,能够高效执行数据处理、信息分析等基础任务,完成决策辅助、创意设计、用户服务等复杂工作,可超越物理空间限制,实现24小时连续工作,极大提升工作效率和服务质量。在生活领域,“数字人”能够在社交网络和虚拟现实空间中代表用户参与交流和活动,为用户创造更多社交机会,同时还能够扮演个人助理的角色,管理家庭设备、安排日常事务,使得生活管理更加智能化和高效。
“数字人”开创经济发展新增长点,在催生数字原生经济的同时将为实体经济注入创新动力和增长潜力。“数字人”成为人工智能和实体经济深度融合的新载体,整合数字技术和经济社会需求,催化出一系列新业态和新模式。在供给端,“数字人”实现工业化生产情绪价值。“数字人”依托表情识别、情绪判断、情感合成等技术,批量提供个性化的服务模式,拓展销售、教育、医疗等行业的服务范围。在需求端,“数字人”打造新型消费场景。“数字人”激发元宇宙消费新需求,虚拟世界的家电、服装等消费品需求大幅上升,提升数字资产的底层价值。
“数字人”是人工智能等新兴技术落地的突破口,成为各国科技竞争的焦点。“数字人”是元宇宙和人工智能全栈能力集大成产品,对于推动二者的发展具有重大意义。从人工智能领域来看,“数字人”交互涉及文本、语音、图像、视频等多种模态,这些多模态的集成使得“数字人”成为推动人工智能进入“通感”时代,解锁真实世界理解力的关键力量。
国内外“数字人”发展状况
从技术方面看,美国企业持续创新“数字人”底层研发,加速完善核心技术生态。Epic Games、英伟达、Meta等美国科技企业先后推出MetaHuman Creator、Omniverse Avatars、Instant Codec Avatars等3D“数字人”创作工具、平台或技术,支持快速构建3D“数字人”,推动“数字人”生成门槛不断降低。国内的“数字人”创作工具和平台则主要集中于2D“数字人”领域,3D“数字人”的开发多采用项目制推进,尚未形成成熟的平台化产品。
从产业方面看,国内外“数字人”呈现蓬勃发展态势,涵盖从科技巨头到初创企业的广泛参与者,且在资本市场备受关注。在企业层面,国外以科技巨头、3D引擎公司和初创企业为主,注重技术创新与市场扩展;国内则全行业布局,包括技术和传统行业企业,侧重技术应用,企业数量快速增长。统计数据显示,截至2023年底,国内“数字人”相关企业达99.3万余家,其中2023年新增相关企业41.7万余家,与2022年同比上涨42.3%。在资本层面,“数字人”备受市场青睐,全球投融资数量和金额双双实现高速增长。
从应用方面看,美国在影视领域深耕多年,我国在直播、金融、教育等多个行业实现应用落地。美国的“数字人”最早诞生于好莱坞,如Pixologic、Autodesk等公司为美国特效、CG公司的电影制作提供了技术支撑,国际知名的《指环王》《阿丽塔:战斗天使》等电影均有“数字人”技术的应用,但在其他领域则浅尝辄止,未有亮点应用出现。我国“数字人”应用百花齐放,不仅有洛天依、翎Ling、AYAYI等现象级“数字人”偶像,还出现了大批量以真人为原型的直播带货“数字人”。在金融领域,已有浦发、百信等多家银行上线“数字人”员工,结合柜台的远程视频柜员机(VTM),可协助用户办理日常金融业务。此外,在教育领域,国内企业也在探索武汉“益小青”等青少年心理教育“数字人”。
从发展环境方面看,国外更加重视对“数字人”领域的监管,国内则坚持发展与安全并重,给予产业更多成长空间。美国针对“数字人”相关技术应用建章立制,参众两院先后出台了侧重点各异的三部法案,即《2018恶意深度伪造禁止法案》《深度伪造责任法案》《2019年深度伪造法案》,关注深度伪造技术对选举及色情传播的影响。我国兼顾“数字人”安全与发展。一方面针对生成技术出台相关法律法规,对包含“数字人”在内的深度合成信息服务进行规范。另一方面,持续出台“数字人”相关支持政策,如上海、昆山等城市都将“数字人”写入当地的元宇宙行动计划中,鼓励探索式发展;北京市政府出台国内首个“数字人”产业专项政策,拟将北京打造成全国“数字人”产业创新高地。
当前“数字人”存在的问题
“数字人”关键技术存在瓶颈问题。在“数字人”制作技术方面,支撑生产3D“数字人”的建模软件、渲染引擎基本被Autodesk、埃匹克等国外厂商所把控,国内尚无相近水平产品。在“数字人”智能交互技术方面,作为“数字人”大脑的“大模型”技术展现出巨大优势,然而我国在这方面总体处于后发跟随状态,底层大模型技术薄弱,与美国存在较大差距。
“数字人”规模化应用有待进一步突破。一是“数字人”在自然流畅度、逼真度、情感表达及应对突发情境上未达预期,主要应用于客服助手、虚拟播报等基础场景,未涉及高级认知任务。二是“数字人”人物制作、驱动表达、内容生产、运营服务等产业链各节点相对割裂,制约产品迭代升级。三是创造和维护“数字人”角色,需要高水平的技术支持、深刻的内容创意和持续的内容更新,以达到“数字人”持续运营的目的。
“数字人”存在知识产权和伦理风险。一是“数字人”形象的知识产权尚未明确,涉及用户、平台方及形象原型等多方主体。二是“数字人”逼真效果挑战人类“眼见为实”的认知底线,且应用门槛逐渐降低,将极大增加互联网内容监管难度。三是“数字人”沉浸式体验,可能影响用户精神状态,存在伦理风险。如近期有网友利用“数字人”技术“复活”已故艺人,引发家属极度痛苦和强烈反对。
我国“数字人”下一步发展建议
打造标杆案例,引领技术创新。推动“数字人”与生产制造、生活消费、公共服务等领域融合创新,打造一批特色行业标杆场景;开展“数字人”案例征集工作,组织遴选一批具有前瞻性和创新性的“数字人”应用试点示范项目,带动底层核心关键技术突破;加强典型案例和先进经验的宣传推广,带动提升全社会对“数字人”技术应用成果的认知和接受度。
加强协同配合,探索产业路径。推动跨地区、跨部门、跨行业协同联动,促进政策、科研、产业一体化协同发展;鼓励高校、研究机构与地方加强对接,探索“数字人”科研转化和产业落地新模式;梳理“数字人”典型场景和重点行业应用,通过开展“数字人”技术应用大赛等方式,发掘优秀团队和企业。支持“数字人”制造企业开展场景创新和应用实践,深入垂直“赛道”打磨“数字人”产品。
加快标准制定,优化发展环境。加强“数字人”标准化工作的总体规划,加快推进“数字人”基础共性、关键技术、应用实施、安全治理等领域的标准研制;加强“数字人”标准宣贯和推广,鼓励评测机构依据权威标准开展评估测试工作,通过“以评促建”的方式,促进“数字人”技术产品进步;鼓励国内“数字人”企业积极参与国际标准建设,进一步巩固提升我国在“数字人”领域的标准话语权。
完善监管治理,筑牢发展根基。鼓励高校、企业、科研院所积极参与“数字人”身份体系搭建和规则制定等工作,加快构建可信赖、可查验、可追溯的“数字人”身份及标识管理体系;普及隐式数字水印在“数字人”治理领域的应用,鼓励国内企业开展隐式数字水印“鲁棒性”的提升工作,提高对违法和不良信息的追溯能力;加紧研究各类“数字人”应用对人的心理影响,以及给人类社会带来的变化,引导社会正确看待与使用“数字人”相关产品。
*本文刊载于《通信世界》
总第946期 2024年7月25日 第14 期