当前位置:首页|资讯|数字人

数字人分身让他们有了第25小时 提效300%

作者:极昼发布时间:2024-07-25

资料图。讲述者提供

摘要:连轴转8小时,面诊近百人,这还不包括急诊等等突发情况。医生的一天有多少精力可以深耕专业领域?有资深外科医生手术连台,顾不上吃饭,更得小心翼翼处理医患沟通。这个处境下,医生的价值感和身心健康面临考验,对等的医疗信息传播也成为稀缺。AI数字人技术提供了一种解法,让医生拥有“分身”,多出的第25小时正在改变这个行业。类似的,在当下3D互联网时代,这项技术逐渐深入报业传媒、政企等多个领域。

文| 李希澄

编辑| 吴意

“我”的分身

张琳琳两手抱在胸前,过一会儿又摊开,或者左手叠右手靠到腹部上。她穿着白大褂,找平时在医院工作的感觉,尤其是跟患者说话的肢体动作。摄影机旁边,工作人员不停调动她,给出“分身”需要的素材。

屋外是2022年冬天的京郊。从医20多年,张琳琳第一次尝试留下一个自己的分身。她是北京安贞医院心血管内科副主任医师,3年前,被成都万木健康科技有限公司(以下简称“万木健康”)邀请,做相关专业的科普视频,在网上传播。

那段时间,张琳琳也发现,网上主打健康科普的自媒体爆炸式增长,但其中很少有自己的同行,这些内容都没有专业认证。她常在朋友圈刷到一些错误信息,比如让高血压患者别急着吃降压药,但实际上,“拖得太久会损伤器官”。万木健康的提议让张琳琳想到,可以借机扭转这些误解,还能提高日常面诊效率。

2022年,张琳琳的分身在制作中。讲述者提供

只能迁就医生档期,万木健康联合创始人杨笛清楚这里面的不容易。他创业前就是一名皮肤科医生。他在2021年开始做万木健康,找了全国各大医院专家医生,合作线上健康科普。那是疫情期间,他和同事一直想抓住卫生健康的热点话题,赶制视频,但让医生从繁重的本职工作中抽身出来写文案,再录像,几乎是不可能的。

转机出现在2022年下半年。ChatGPT发布,让杨笛关注到人工智能。他考虑把AI引入到视频创作领域,迈过瓶颈。很快,他找到华为云在成都高新区的办公点。这不是杨笛第一次见到数字人,但华为云的展示超出了他的期待。尤其是,制作几乎没有技术门槛——3-5分钟的视频素材采集真人形象,加上30句语音的收集。

这是基于华为云盘古基础大模型能力、渲染引擎和实时音视频能力而达成的技术。除了用PB级的音视频数据进行训练、构建数字人之外,只输入文本,描述希望生成的数字人模样,在10秒内就能生成模型。如果是上传图片生成数字人,只需要30秒。

也是基于数字人技术,河北日报报业集团纵览传媒有了转型智能化的关键一步。今年年初,纵览传媒决定抓住数字人这一新的技术风口,和华为云合作,定制纵览传媒的数字人,开发数字人应用场景。近十年来,推动媒体融合,一直是传统媒体面临的重要课题。技术应用是关键,但过分追求技术,又容易忽略内容创作。

今年上半年,纵览传媒的数字人分身站在了纵览智媒大厦的三楼大厅,原型是纵览传媒的一位女员工。数字人初步的应用落地,扮演了智媒中心讲解员的角色。只要轻点LED屏幕,就能触发和讲解员的互动,请她讲解报社历史、河北政策。

数字人的存在,有效降低了人员录制成本,起到降本增效的作用。“人工智能技术肯定是未来的核心,(启用数字人)是传统媒体深化改革措施之一。”集团技术保障服务部主任肯定了数字人在融媒体改革中的潜能。

宜昌市政务大厅的智慧柜台。讲述者供图

在数字内容产业,内容力决定了企业的竞争力,而在政务服务方面,数字化发展也成为潮流。楚天龙股份有限公司(以下简称“楚天龙”)在这方面做出创新。以第二届828 B2B企业节为契机,楚天龙和华为云在2023年达成合作,研发政务服务数字人,希望能代替传统人工服务,将“数智政务”推向新阶段。

在今年,楚天龙研发的数字人在宜昌市政务大厅上线,数字人技术走进日常,帮人“跑腿”,提供一对一的办理服务。该公司负责人张劲松介绍,数字人作为综窗业务员的分身,通过政务知识梳理和训练模拟后,具备业务人员同等的知识储备,借助各类自助服务终端平台,面向用户提供一对一办件、咨询服务。

政务数字人既提高办理效率,也为市民提供更人性化的服务。张劲松举例,当用户想要了解个人相关的权益、或者福利待遇,数字人可结合多轮对话内容,了解当前用户信息后,精准匹配个人情况,给出答案。

第25个小时

在刚接触数字人的2022年,万木创始人杨笛记得制作数字人所需素材的要求还比较高,比如视频要有4K画质,对画面构图、光圈都有具体要求,音频也要高保真,所以医生们都要专程到摄影棚录。在一些偏远地区,就要由专业团队到当地统一录制。但现在,制作的门槛不断降低,对普通人更友好,医生完全可以自己拿起手机录素材,上传到华为云后台,生成分身。

在近半年里,张琳琳听到越来越多患者说,是看了她的视频过来面诊的。直到这个月,她的自媒体已经更新84条视频,都是她的分身出马。话题涵盖冠心病患者的心理护理、科普冠心病支架的安装,搭建起了有关冠心病的知识树。有科普视频打基础,她发觉和患者的沟通也更顺畅了。

这样,张琳琳把更多精力放在更擅长的专业领域。以前录科普视频,她要花半天到一天确定文案。日常工作忙,她就在手术前、午休时挤时间。现在她不需要再琢磨文稿里的语气词或过渡句,“时间分配也变得更自由。”

近两年来,杨笛团队已经给上千位医生做了分身,包括一些县城的基层大夫。它虽然不能面诊、开刀,但能替医生完成重复性劳动,杨笛形容,这就像个小助理。“我们想用数字人创造医生的第25个小时。”2022年11月,万木健康和华为云合作,成为了国内首个医生AI数字人运营服务商。

在向医生推广数字人时,杨笛发现多数人在意的是信息、数据安全问题,尤其一些医疗界专家会担心自己的数字人形象被滥用。杨笛告诉他们,华为云的制作有一系列规范要求——制作前要上传本人身份证和授权书,做好的数字人形象存放在华为云后台,要密码才能登陆。

资料图。讲述者提供

去年7月,在东莞举办的华为开发者大会上,公布了华为云MetaStudio的全新升级,推出了数字人模型生成服务和模型驱动服务,希望通过数字人服务和技术赋能,使中小企业甚至普通个体实现数字人自由,改变传统交互方式,重塑内容生产。

据楚天龙负责人张劲松介绍,公司产品研发初期依托自有机房实体服务器的方式,虽可完成基础层面支撑,但在系统稳定性、数据安全性及扩展能力方面均存在不足。合作后,云服务器的运维由华为云提供,技术团队专业实力强,7*24小时响应,并提供SLA服务保障,这让楚天龙能将更多精力放在业务开发和运营上。华为云的云服务器还具有高度的灵活性和扩展性,企业可以根据实际需求,随时调整服务器资源的规模和配置。

如果一位市民前来办理车辆年审,传统的机器人只能笼统讲述办理流程,但数字人则会主动提问和市民对话,不仅能识别和理解用户语义,还能通过对话内容推理出用户办件意图,提供精准的办件指引。在人工柜台耗时30分钟的办理流程,这样只要10分钟左右,从而创造出业务人员的“第25个小时”。

楚天龙研发的数字人上线。讲述者提供

走入日常

接触数字人两年来,杨笛明显感受到数字人技术的迭代升级。首先是训练的速度变快了。最初,建模大概需要一周左右,现在只需要24小时。其次,数字人声音和口型的匹配度也在提升,高达95%。生成视频的速度也在变快,用时基本和视频时长一致。

这些技术发展,也解放了杨笛的团队。他说,现在能更专心地投入到产品研发和创新上——正在计划打造一个结构化的知识库,类似百科全书矩阵,针对某一疾病全面罗列知识点,或把医学专家出版的书籍内容编排成脚本,生成由数字人出镜的科普短视频。

除了在医疗短视频创作领域,数字人技术还陆续落地各行各业。在电商领域,华为云和贵州电子商务云合作,制作农户的数字人形象,代替农户直播带货,打开了农产品的销路。

数字人还能很好地“翻译政策”——将政府的各项政策进行分析整理后,用普通办理者能听懂的方式来进行解读,举例说明方便大家理解。对于企业,也可以通过咨询数字人了解特定行业领域、经营范围,政府出台的监管条款、扶持政策等。

在华为云的协助下,楚天龙将继续探索数字人的应用场景,如政务服务、民生改善和基层智治。负责人张劲松说,武汉本土的数字建设现阶段仍存在一些短板,比如新老城区数智发展不平衡等。“希望能够把数字人服务拓展到交通、教育、文旅等其他领域,进一步发挥数字人的优势。”

宜昌市政务大厅的智慧柜台。讲述者供图

在媒体行业,数字人技术也在继续深入传统媒体的改革。纵览传媒正计划将数字人接入到“纵览新闻”的App内,让数字人作为智能客服和用户沟通,替用户推送、朗读当日新闻,提高App的智能数字化水平,推进融媒体改革。

这项研发的任务落在了纵览传媒的前端工程师刘先生身上。他从业十多年,但刚开始着手数字人项目,对于手上的上百页开发文档,提出了疑问:该从哪里看起?模型和模型之间的区别是什么?五六个解决方案专家立即和刘先生开了一场电话会议,用半小时的时间捋顺了开发思路和流程。他很快找到了方向,花了两三周完成开发。在不久的以后,纵览新闻客户端的读者可以直接通过和数字人的沟通,精准获取端内的新闻资讯。

在AIGC时代,人工智能正在越来越多行业场景中发挥作用,触发产业变革。作为在AI大模型基础土壤上生长起来的技术,数字人逐渐在成为3D互联网时代各类应用的核心入口,深入各行各业。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1