神秘的虚拟数字人，即将改变什么？

作者：知识就是力量杂志发布时间：2024-10-21

数字人深度学习

图中扎着马尾辫、背着双肩包，漫步校园的是清华大学计算机系“学生”、清华大学首位虚拟数字人——华智冰。那么，什么是虚拟数字人？又是怎样的技术让虚拟数字人如此逼真？

华智冰（图源：《知识就是力量》杂志）

陪伴在虚拟

空间的“朋友”

虚拟数字人存在于电脑和网络世界中，你可以和它们交流，它会慢慢“了解”你的习惯，变得越来越“懂”你。为了让这些虚拟朋友更真实，科学家开发了一系列技术。

听懂你在说什么

听懂的背后是自然语言处理技术在起作用，它包括语音识别、语言理解、语言生成等技术，这让虚拟数字人可以理解并生成自然语言。

此外，为了让虚拟数字人的表情和动作更生动，科学家利用面部表情和身体动作捕捉技术，对人类运动数据进行采集和分析，从而控制虚拟数字人的运动和行为。这样，它们就能以更自然和有趣的方式与人交流了。

情绪“补给站”

当涉及情感交流时，情感识别技术就派上了用场。这项技术不仅可以通过收集用户的说话内容、语音语调、面部表情等信息分析其情感状态，还会给予适当的情感反馈。

理解你的意图

为了让虚拟数字人能够记住用户喜好并提供更好的服务，深度学习技术对大量数据进行学习和分析，使虚拟数字人可以自主改进行为。

在自然人与虚拟数字人交流的过程中，自然语言理解技术可以使虚拟数字人理解用户输入的自然语言，并作出回应。近年来，大语言模型的横空出世也为人机交互的智能性带来新的突破。

活灵活现的“人”

熟悉的声音

在自然语言理解并生成回复文本基础上，语音合成技术可以将文字内容生成为音频，让虚拟数字人说出的话更自然。

早期的语音合成技术使用的是单元拼接合成，即先构建语音片段数据库，然后选择合适的语音片段拼接成想要的语音。

从输入信息到虚拟数字人输出内容所需的处理技术（图源：《知识就是力量》杂志）

随着深度学习技术的不断成熟，深度神经网络被用来学习文本与语音之间的“复杂关系”，利用大量的训练数据学习如何从文本生成更自然的语音。并且，随着深度学习模型的更新迭代，现在最新的模型已经可以做到使用某个同学的几条语音片段，就能“克隆”出这个同学的声音，实现从文本到声音的转换。

人工智能技术幻化成“人”

3D建模技术是创建虚拟数字人的外观和形态的基础。建模软件可以创造出栩栩如生的虚拟形象；运动学引擎可以模拟虚拟人的运动和动作，让行为更加真实和流畅；关节驱动技术和程序驱动技术，则为虚拟数字人提供了直观的交互体验和高度自定义的行为控制。

虚拟数字人

能做什么？

作为客服代表，虚拟数字人展现出了巨大潜力，它们不仅能提供全天不间断服务，还可以根据用户的情感状态提供个性化服务，在提高服务效率的同时，增强用户体验。

虚拟数字人（图源：《知识就是力量》杂志）

在教育领域，虚拟数字人则可“化身”教师或助教，根据学生的学习情况，智能推荐学习内容，甚至在虚拟环境中模拟实验操作，为学生带来更生动直观的学习体验。

例如，北京邮电大学的智慧教室借助“5G+全息投影”技术，将授课老师的三维全息投影人像清晰呈现在教室讲台上，实现了跨校区远程互动教学。同时，教室里配备了人工智能助学机器人，可辅助同学们更好地完成学习任务。

在医疗健康领域，虚拟数字人可以辅助医生进行病情诊断，提供治疗建议，甚至在远程医疗中扮演重要角色，例如，通过模拟手术和解剖，帮助医学生进行实践学习。

虚拟数字人，就像是来自未来的使者，与它的每一次交互都是一次奇妙的“冒险”。在未来，它们将变得更加智能化、个性化，或许会成为我们生活中不可缺少的一部分。

撰文 | 李雅、高迎明

运营编辑 | 段阳阳

质量审核 | 业蕾

❖ 文章来源：《知识就是力量》杂志

《数字世界的居民--虚拟数字人》 ❖

相关资讯

安在软件 2024-12-27

60% 回馈用户？头米生活的 “疯狂” 底气在哪？

文章编辑：xinshijie050大家好，我是鑫视界,一家软/件开发的负责人，在电商分销这个行业的第11个年头一、头米生活背景与初心现在的传统电商平台价格竞争激烈，佣金高昂，商家利润空间压缩，用户难以享受实惠。头米生活通过数字化战略，助力商家精准营销，实现多方共赢，推动国民共同富裕。二、头米生活核心理念：发展哲学：“以平台为核心，商家与用户为双翼，乡村振兴供应链与品牌事业部产融孵化为两大动力源”的“一体两翼，双擎驱动”战略。愿景：构建多方共赢生态，激发核心竞争力，推动价值飞跃式增长。使命：通过优化

鑫视界0 2024-12-27

警用侦察利器|便携式穿透成像仪AID-P-30J

穿透成像仪，为新研发的光学成像技术装备，可解决国内现有成像装备在光学介质干扰多种场景下的高清成像难题。光学介质主要指玻璃类（玻璃幕墙、车窗、贴膜玻璃、特种、多色玻璃、电控玻璃、雾化玻璃）、烟雾、火焰、强光、无光等介质穿透成像，进而满足侦察需求。卡亚（北京）国际光电技术有限公司（简称：卡亚国际），成立以来，一直致力于新型光学技术研发及推广的，旨在用创新的技术解决行业痛点。现有便携式穿透成像仪系列、固定式穿透成像仪系列等多款产品，可适用于警用、安防、海防、边防、应急救援等多个领域。本文介绍：警用便携侦察新

卡亚国际公司 2024-12-27

公网全双工对讲机与普通公网对讲机的区别

对讲机作为传统的通讯工具，经常被大家用到工作、生产中，对讲机也大致分为模拟对讲、数字对讲、公网对讲三类。模拟和数字对讲都是基于无线电频点进行自组网通话，差异是数字信号的对讲安全性更高，语音经过编码解码，不易串频，而公网对讲依托运营商物联网卡，利用公网（如4G/5G网络）进行语音和数据传输的设备，不需要建立专门的基站或中继台，就能实现全球范围内的无线通讯。普通的公网对讲机解决了自组网对讲机的距离限制，只要有运营商信号的地方都能互通，但没有改变半双工通话是本质：同一时间只能一路说话权限，且说话时需要占用手长

TIKOOL太酷全双工内通 2024-12-27

红肉西梅苗，专业培育，品质之选

果实之喜：红肉西梅的专业培育与超越樱桃的种植技术 [图片] 在这片翠绿的世界中，红肉西梅以其独特的鲜甜口感和高营养价值成为了人们的焦点。而今日，我们将向您隆重介绍【红肉西梅苗，专业培育，品质之选】，为您带来超越天花板的种植技术，实现果实丰收的喜悦。 [图片] 一、超越味蕾的诱惑：红肉西梅的口感魅力 [图片] 红肉西梅是一种独具特色的果品，它的果实肉质丰满、汁液丰富，口感细腻，独特的甜味中带着一丝清香。随着种植技术的不断提升，红肉西梅的口感也越来越受到人们的喜爱。由于其鲜美的口感和高营养价值，红肉西梅在市场

万林农业 2024-12-27

OCIN 2024东方脑血管病大会——Mentice中国团队参会掠影

2024年10月24-27日，一年一度的“东方脑血管病大会（OCIN）”在上海国际会议中心隆重召开。本次会议由上海医学会、上海市医学会脑卒中专科分会主办，秉承“交流、合作、规范、创新”的核心理念。 [图片] OICN大会主席——长海医院刘建民教授于开幕式致辞 Mentice中国团队全程参加本次会议，并重点关注了来自美国的Demetrius Lopes教授发表的关于“血流导向装置治疗复杂分叉部动脉瘤”的演讲及来自德国的Jens Fiehler教授发表的关于“脑血管病血管内治疗的未来创新 ”的演讲。 [图片]

曼提斯模拟教学 2024-12-27

神秘的虚拟数字人，即将改变什么？

推荐体验

相关资讯