2023年是新科技“大年”,年头ChatGPT掀起AIGC浪潮,年中苹果vision pro引爆空间计算革命,8月16日,虚拟人代表企业魔珐科技在上海召开超写实3D虚拟人AIGC消费级产品发布会,发布了“魔珐有言”“魔珐有光”“魔珐有灵”三款超写实3D虚拟人AIGC消费级产品的同时,首次对外诠释了“3D虚拟人”这一概念,罗超频道受邀到现场参加发布会。在体验最新的3D虚拟人产品后,笔者认为一直被诟病落地缓慢的虚拟人已迎来“iPhone时刻”,接下来将驶入发展快车道。
虚拟人概念早已炙手可热。天眼查数据显示我国现有“虚拟人”“数字人”的相关企业66.2万余家。2021年涉及投融资案例149起,总金额约326.03亿元;截至2022年10月,虚拟人领域投融资案例49起,总金额约124.96亿元。在正式走红前,虚拟人已有近40年进化历程。
1984年世界上首位虚拟偶像“林明美”诞生算是虚拟人的鼻祖,包括随后出现的“初音未来”、“洛天依”、“翎__Ling”在内,虚拟偶像均可拍图片、录视频,但只能单向输出内容“表演”,无法实时互动。随着技术发展,后来出现了可与用户“一对多”实时互动的虚拟人2.0,比如魔珐科技打造的国风虚拟偶像“令颜欢”就是其中代表。2023年AIGC技术爆发,ChatGPT、Midjourney等文生文、文生图的对话机器人走红,它们的前身可以追溯到Siri类语音助理。
40年来人类一直在孜孜不倦地让机器具备或者说复制“人”的部分特别,包括形象、动作、表情、声音、知识,这正是虚拟人产业的本质。宽泛地说,虚拟偶像、拟真人、数字人、数智人、对话机器人、二次元纸皮人、虚拟IP等等均可属于虚拟人,它们又可分为两类:一类是有真人形象的虚拟人,制作成本高,制作周期长,交互能力弱,智能程度低,往往是由影视动画MCN公司打造;另一类是AIGC公司开发的对话机器人、文生文/图助理智能程度高,但均缺乏真人形象和即时互动能力,一些AI公司探索的虚拟主播也只具备AIGC唇形生成能力,本质还是2D虚拟人,缺乏应用场景,很难适应视频化的移动互联网时代和对空间交互要求极高的XR时代。总而言之,前些年纷繁各异的虚拟人都存在着这样那样的短板,进而导致其应用场景少、普及度偏低、商业化较难,更未能形成跟互联网、移动互联网、AI一样的产业规模。
2023年,事情正在发生变化。随着AIGC技术的成熟,超写实3D虚拟人迎来全新的发展契机。在8月16日的新品发布会上,魔珐科技创始人兼CEO柴金祥教授提出了对“3D虚拟人”的全新诠释:“真正的3D虚拟人必须具有高质量超写实形象、能流畅表达可互动、在特定领域足够专业,且是AIGC生成的。”
很多人对“3D虚拟人”概念可能会有一些疑惑:市面上包括直播间不是早就存在三维虚拟人了吗?诚然,魔珐科技上半年推出的“令颜欢”“镜JING”等IP也都属于三维虚拟人。但本次魔珐科技定义的“3D虚拟人”的重点并不在于“超写实形象”,更在于“能表达可互动、垂直领域够专业”两大特质以及“全栈式AIGC生产过程”:
1、“有形象”意味着虚拟人“好看”。在碎片化的移动时代用户越来越习惯消费视频、直播等多模态内容,在空间计算主导的XR元宇宙时代平面化的图文只会愈发小众,因此“真人形象”将成为企业/组织(媒体、学校、医院等)传递信息的最佳方式;
2、“能表达、够专业”才能让虚拟人真正“有用”。在魔珐科技的定义中,3D虚拟人本质将是真人的“最佳实践”。“最佳实践”是管理学术语,意指人类在从事某项职业时沉淀的最佳的做事方式,包括知识、经验、方法论等,比如做直播带货的都要研究李佳琦等头部主播的“最佳实践”;比如企业销售新员工要跟着“金牌销售”“销售冠军”学习其“最佳实践”……3D虚拟人可将不同垂直领域的最佳实践快速批量复制,再提供24*7高效率、低成本的服务。3D虚拟人不一定会比人更聪明,但在特定领域它们将拥有最优秀群体的最佳实践,进而展现出巨大的应用价值,比如3D虚拟人可以让每个企业拥有不同的“金牌员工”,对内对外提供更好的服务,降本增效、升级体验、提高转化,用3D虚拟人主播取代店播进行7*24不休的直播带货就是一个很典型的应用场景。
3、魔珐科技“3D虚拟人”跟市面上的虚拟人最大的不同在于“制作过程”。基于三维形象、动画、声音、文本在内的虚拟人“造人”“育人”“用人”在内的全栈式AIGC能力,虚拟人将可走向大众化场景实现“普及”。
一些头部企业早已在探索虚拟人的应用,比如万科、浦发银行等均推出了虚拟人员工IP,不过这些虚拟人均是“高定虚拟人”,采取传统影视制作模式打造一个超写实虚拟人往往要上百万成本,只有少数资源充沛且有探索意愿的巨头级企业才可能拥有。2023年,可低成本、大规模、高质量生成内容的AIGC技术日趋成熟,超写实3D虚拟人的制作与运营成本出现指数级下滑,用柴金祥教授的原话说就是:
因制作成本锐减,3D虚拟人可被大量复制并应用到更多场景。3D虚拟人在XR设备上可呈现出更强的沉浸式、强互动和强体验优势,但它也可“向下兼容”,可被应用在广泛的场景、终端和触点,包括手机、电脑、汽车大屏、ATM机、售货机、终端机等终端,网页、App、小程序、PC软件等场景,以及线上线下、XR元宇宙全场景,真正做到“无处不在、7*24全年无休、1V1”服务。
除了重新定义了“3D虚拟人”概念,魔珐科技也带来了三款消费级3D虚拟人AIGC产品。
一个是魔珐“有言”3D虚拟人视频AIGC平台,可满足企业/组织/个体低成本制作虚拟人短视频的需求。
内容视频化趋势不可逆,企业在对外品宣沟通、产品营销、产品展示时越来越需要短视频,但制作成本高、门槛高、周期长。基于“有言”3D虚拟人视频AIGC平台,企业/组织只需要选取平台上的“形象”和“场景”再输入文本等素材就可以三步快速制作视频,省去了聘用主播、搭建场地、视频拍摄剪辑等费用,且可以不限时、无限量“即时生成即时发布”。此外,不具备制作技术或者不愿意出境的网红、KOL等创作者也可低成本打造虚拟人网红IP。
二个是魔珐“有光”3D虚拟人直播AIGC平台,可助力企业更好地利用“直播带货”这一新型零售基础设施。
今天直播带货已成为每一家企业不可或缺的零售工具,一分为二地看,一类是李佳琦等头部网红直播间,核心价值是“促销”,品牌大都赔本赚吆喝;另一类更常态化的是“店播”,也就是品牌官方旗舰店以及经销商等渠道的员工直播带货,本质是将线下1V1导购角色搬到线上,实现1VN全市场导购,这类直播场景对企业更重要,它创造增量且是赚钱工具。
除少数网红品牌持续投入网红直播间外,大多数头部品牌都在加码全渠道电商以及私域电商的“店播”,基于魔珐“有光”3D虚拟人直播AIGC平台,企业可快速搭建虚拟人直播间,可以减少主播雇佣成本,避免主播走红后“人走店凉”,还可实现24小时“日不落”开播全时间经营。截至目前已有多家头部品牌在直播间基于魔珐“有光”3D虚拟人直播AIGC平台,实现虚拟人全天候开播。
三个是“魔珐有灵”虚拟人服务AIGC平台可满足千行百业的企业虚拟人服务所需。在短视频与直播主播外,企业将会大量应用虚拟客服、虚拟医生、虚拟律师、虚拟导游、虚拟导购、虚拟老师等等3D虚拟人服务人员提升用户体验、提高流量转化的同时降本增效。针对多元化的虚拟人服务需求,“魔珐有灵”基于“3D虚拟人即服务”的理念,让企业可高效率生成基于垂直业务场景的专属AI虚拟人服务,规模化复刻“金牌员工”的最佳实践,让3D虚拟人在不同场景、不同终端、不同触点提供提供7*24小时1V1服务。
从三款消费级虚拟人AIGC产品的发布来看,魔珐科技自身已具备3D虚拟人的全栈AIGC能力,是国内乃至全球范围内为数不多的具备打造“真3D虚拟人”的企业。自此,魔珐科技也已从前些年以项目为导向的虚拟人技术服务型公司,蜕变为平台级3D虚拟人基础设施服务商,各行各业的企业、组织、个体以及开发者均可基于其领先的3D虚拟人AIGC能力,低门槛、低成本、大规模地应用3D虚拟人去创作内容、去开发应用、去升级业务。
“3D虚拟人”彻底改变了虚拟人的内涵与外延。
魔珐科技全新定义“3D虚拟人”,意味着虚拟人产业爆发的iPhone时刻已然来临。
英伟达创始人兼CEO黄仁勋说ChatGPT是AI的iPhone时刻,“iPhone时刻”由此也成为2023年的一大热词,被应用在许多产品/技术的评论中。当我们讨论iPhone时刻时到底在讨论什么?其实在2007年iPhone前,搭载塞班系统的诺基亚手机就已具备一定的智能化程度且支持安装手机软件。为什么直到iPhone出现,智能手机产业才真正爆发,移动互联网浪潮才正式来临?
首先,“iPhone时刻”意味着一款家喻户晓的现象级、革命性、消费级经典产品出现了,这样的产品往往不是最早的,但却是最完整、最强大的。苹果凭借着强大的整合能力让iPhone“重新定义了电话”,整合MP3、电话、MP4、掌机、PSP、阅读器和相机等硬件的功能。虽然初代iPhone性能很差、功能孱弱、应用匮乏,但却以全新的产品形态吸引了世人对智能手机概念的关注,迎来了安卓阵营的诸多玩家,逐步掀起了延续至今的智能手机狂潮。
3D虚拟人具备跟iPhone一样的革命性价值,通过强化超写实形象、能表达可交互、懂专业等属性以及变革制作模式,3D虚拟人彻底拓宽了虚拟人应用边界。必须要说明的是,iPhone初代只有极少数极客购买,2010年面世的iPhone4才算是第一款大众化产品。同样,3D虚拟人概念从明确到真正大众化也需假以时日,魔珐科技发布的“有光”“有言”“有灵”等“初代”3D虚拟人产品是一个全新的开始,我想这正是其将本次发布会核心主题定为“这,仅是开始”的深意所在。
其次,“iPhone时刻”意味着一个庞大的产业生态崭露头角。众人抬柴火焰高,初代iPhone给移动互联网产业大爆发埋下了一颗种子。iPhone不只是硬件,还有革命性的iOS以及后续内置于iOS的AppStore应用市场,这些正是移动互联网生态繁荣的土壤。
魔珐科技在发布会上发布了首个3D虚拟人操作系统“星云”平台,基于其流水化、工业化的3D形象/动画/声音/垂类专业能力产线,整合AIGC三维形象、AIGC动画,AIGC声音,AIGC文生文等能力,提供AIGC视频、AIGC直播、AIGC垂类服务开放能力,可助力开发者快速构建纷繁各异的3D虚拟人应用,抑或将3D虚拟人嵌入到原有的软硬件应用、数智化流程和业务中。一个类似于移动互联网生态的3D虚拟人生态正在生根发芽。
最后,“iPhone时刻”意味着产业链上下游基础设施日趋成熟,技术发展迎来“奇点”。iPhone在2007年出现2010年爆发并非偶然,也不是苹果一家的功劳。2007年运营商已在搭建3G网络,2010年3G发牌,给移动互联网爆发提供了网络基础设施;发展10余年的PC互联网打下了坚实的技术、数据、应用和用户等网络生态基础,没有互联网就没有移动互联网;包括传感器、相机镜头模组、移动端芯片、触摸屏等硬件以及对应的制造工艺也进化到了一定程度。因此可以说,横空出世的iPhone成就了时代,也被时代所成就。
同理,3D虚拟人正处在这样的历史节点,魔珐科技在2023年提出全新“3D虚拟人”概念也并非偶然,这与AIGC技术在2023年的突飞猛进息息相关。虚拟人技术与AI技术有着很深的渊源。2002年在卡耐基梅隆大学攻读博士学位期间,柴金祥就发表了全球第一篇关于利用AI生成3D虚拟人动画技术的论文。20多年来,柴金祥一直在3D虚拟人技术领域深耕并于2018年成立魔珐科技,将学术成果与商业实践融合起来,相较于大学而言,企业拥有强大的美术人才资源,更有着丰富的虚拟人应用场景。在接受罗超频道专访时柴金祥教授透露,在大模型概念出现前,魔珐科技已在尝试将超写实虚拟人制作路径从PGC逐步切换到AIGC,一直在探索用深度学习技术来制作与训练超写实虚拟人。
2023年AIGC技术快速迈向成熟且GPU等AI算力与日俱增,这让魔珐科技的3D虚拟人技术迭代获得了加速度,柴金祥教授也经常收获“惊喜”,“今天虚拟人能做到这程度,三五年前想都不敢想”。有了AIGC的东风,魔珐科技多年来积累的三维图像高质量内容数据、美术能力、动画能力、虚拟人领域的“最佳实践”等均得以厚积薄发,“3D虚拟人”概念的落地也才有了基础。
著名咨询机构高德纳发布的Gartner技术曲线被广为所知,其认为技术发展都会遵循一定的规律,在经历不同阶段后走向规模化爆发,这一规律在移动互联网等技术的发展中均得到验证。从最新发展态势来看,走过近40年风雨的虚拟人技术在经历漫长的孕育后终于迎来了爆发阶段。
有着与生俱来的“3D虚拟人+AIGC”双重基因,以及多年沉淀的虚拟人产业的“最佳实践”,魔珐科技也将在产业扮演独特的角色。自成立以来,魔珐科技就不甘只做一家“做项目”的技术服务公司,在一边做应用的同时,一边坚持沉淀基础能力,搭建底层基础设施,用柴金祥教授的话说是“我们是一竿子捅到底,工业化产线、操作系统OS、终端产品和行业应用四层都要做,全世界也只有魔珐科技四层都做。”这让魔珐科技的野心跃然纸上:要做3D虚拟人产业的“谷歌”。
iPhone的出现催生了移动互联网产业,形成了延续10多年的移动大繁荣,人们的生活、工作、学习,企业的经营与社会的治理均因此而改变。更易复制、无处不在、无所不知的3D虚拟人也将让虚拟人更大规模地商业化,逐步实现产业化乃至工业化,一个跟移动互联网一样繁荣的新型虚拟人产业正呼之欲出。
未来,3D虚拟人在消费、出行、教育、医疗、旅游、金融、法律、房产、心理咨询等行业均有大量应用空间,可被广泛应用在企业服务、营销、经营中,也将改变人们的日常生活、学习和工作。在接受专访时柴金祥教授抛出了一个引人深思的问题:不同时代有不同的内容载体。PC时代人们用软件,互联网时代用网页,移动时代有App,超级App上有小程序,AIGC和XR时代的内容载体或者说人机触点会是什么?
这个问题今年行业一直在讨论。上半年人们以为答案是ChatGPT这样的智能助理,甚至有人认为ChatGPT会颠覆Google/百度,现在看来类ChatGPT产品只是适合小众场景的过渡产品,别说无处不在了,就连颠覆搜索都很难。在罗超频道看来,AIGC以及XR时代的核心内容载体,更可能是适应视频时代、善于空间互动的3D虚拟人。3D虚拟人之于AIGC时代,如同App之于移动时代,其将会扮演人与元宇宙/数字世界/实体空间/AI世界的交互入口角色,由此将出现许多我们今天想得到、想不到的应用,在应用上又将诞生不同的商业模式。
这一切都是水到渠成的结果。因此从本质上来说,3D虚拟人就是“具身智能”的实体化产品。2023年继AIGC后“具身智能(Embodied Intelligence)”概念正在发酵,其将感知、思考和行动紧密结合起来,为机器人和智能系统带来了前所未有的能力和潜力。3D虚拟人在不同的专业领域将扮演真人的best practic(最佳实践)角色,将人类最强、最全、最新的智能化能力(知识、认知、技能、智慧等)规模化复制、实时化学习、普惠化应用,无处不在地服务于每一个人。
20世纪原创媒介理论家马歇尔·麦克卢汉在《理解媒介》一书中指出:一切的技术都是人的延伸。从猿人会制作并使用石器起,人类就一直在想方设法延伸自己。电话延伸了耳朵,电灯延伸了眼睛,交通工具延伸了腿脚,刀斧锄耙延伸了双手,武器延伸了牙齿……3D虚拟人则延伸了大脑,它让人类的专业认知可被无限复制,进而迎来更大的施展空间,给社会创造更大的价值。
看得更远一些,看似距离我们更加遥远的一些科技,比如脑机接口、意识永生、人形机器人的发展,其实都离不开“大脑延伸”,比如波士顿机器人在运动层面正在不断进化,但要真正被大规模应用一定离不开强大的大脑且要做到“知行合一”,这不正是3D虚拟人努力的方向吗?当3D虚拟人与人形机器人技术结合,带来的就是“有大脑、可行动”的智能机器人。
经典电影《阿凡达》呈现了人类拥有“虚拟化身”后的世界面貌,阿凡达英文原名为“Avatar”,词根本源自梵文,意指降临人间的神之化身,通俗意义可理解为“化身”,这正是3D虚拟人的核心要义。3D虚拟人的出现与普及,是人类走向未来科技世界的关键一步,《阿凡达》中的童话世界变为现实,似乎也不再那么遥不可及。