当前位置:首页|资讯|生成式AI|数字人|元宇宙

中科深智CEO成维忠:撞上生成式AI风口 千亿市场数字人如何加持电商、元宇宙

作者:扬帆出海发布时间:2023-05-18

原标题:中科深智CEO成维忠:撞上生成式AI风口 千亿市场数字人如何加持电商、元宇宙

点开橙色软件选购,你大概率会遇到虚拟导购在直播间讲解商品;打开交友软件,你顶着自己装扮的Avatar形象寻觅有趣的灵魂;去线下医院问诊,戴着白色护士帽的虚拟人指导你找到诊室、完成挂号。如今,数字人已经“飞入寻常百姓家”,扮演生活中随处可见的服务角色。

随着应用场景扩展和用户需求增加,市场对数字人的需求正在快速增长。据预测,到2030年,全球数字人市场规模预计将达到5275.8亿美元,年均复合增长率为46.4%。

然而,目前虚拟数字人发展仍处于起步阶段,如何让数字人拥有自己的“智慧”,真正在电商、元宇宙等诸多应用领域变成更懂交互的虚拟角色?这就要从上周三中科深智发布的大模型说起了。

作为技术企业,他们如何看待数字人在电商、元宇宙出海等行业中所扮演的角色?一家专攻3D数字人的企业又为什么会做出国内首个可私有化部署的商用大模型?扬帆出海特别邀请中科深智创始人兼CEO成维忠,一起聊了聊数字人将如何改变出海行业的未来发展。

直播带货“水土不服” 虚拟主播“一人成团”?

在国内直播间,主播带货已经是每个品牌的标配,抖音直播带货的火热让更多企业期待出海做出一番成绩。但真正去往海外市场,直播带货的效果被打上了一个问号。

和3000家电商企业合作的中科深智也是电商出海赛道的观察者,近年来,他们真切地感受到了海外和国内的差异。

“对于海外直播市场一直“不温不火”的问题,大家也很难达成共识。”成维忠说,很多出海的公司实际上对海外市场了解不足,往往只是把国内的电商经验照搬到海外去。试错成本很大。”

在中科深智和更多出海企业合作并进行深度分析后,成维忠和他的公司也逐渐得出了一些新的观点:

首先,不同于国内市场,海外企业的官网渠道在整体销售金额占比很高。所以,海外品牌对官网上的电商直播和视频要求远远高于第三方平台。

其次,受地理、文化等因素的影响,在海外不同市场中,直播带货的经验不会在另一个地区适用。在北美,人们必须要和主播进行频繁互动,他们会不断向主播提出各种问题;于欧洲市场,观众偏好卡通化的虚拟直播角色,用公司吉祥物作为直播形象最佳;而东南亚地区则更认可具有当地风格的直播,用英语一定不如用当地语言的直播效果好。

此外,国外不存在像“李佳琦”般的头部主播,也不会出现粉丝为追随某个主播驻守直播间的情况,观看直播的用户不会非要在直播时间段完成购买,所以国外直播的转化率并不高,海外多数直播网站的流量也较为平均。

关于海外直播带货转化率低的问题,成维忠提到,据他们观察,在海外做直播转播非常重要。“在国外流量比较分散的情况下,每个号可能一天只能成交1-2单,但品牌可以做1000个号。”

面对7×24小时的转播需求,更多企业会考虑采用虚拟主播上阵。中科深智采用的是他们研发的自动播,它能够将买家的问题交给人工智能分析,虚拟人甚至能根据观众的问题决定回复方式:一般问题采用弹幕回复,比较有共性的问题由虚拟人进行口播,需要着重提醒的问题则用弹框强调回答。

图源:中科深智

除了自动播之外,在成维忠看来,当电商服务进一步深化后,虚拟人能够围绕直播场景解决更多衍生问题:直播间需要做宣传海报;用大模型“几秒钟”就能生成一张;真人助播完全可以被“虚拟助播”代替,及时回答观众问题;每个直播团队都会配备的数据分析人员,他们的工作也可以交给大模型处理。

“现在的直播间都是一个团队在作战,但在将来一年时间里,可能团队中的大多数人都会被替代。”成维忠说。

中科深智的直播带货AI数字人展示

VR设施即将成熟 如何提升元宇宙体验

除了电商行业,元宇宙同样是虚拟人出现频率较高的应用场景之一。从2021年至今,出海领域陆陆续续涌现一批元宇宙产品,但它们中的绝大部分均未得到市场的青睐。

对此,成维忠认为,这是因为多数企业把重心放在数值、玩法和美术方面,却忽视了游戏NPC是否“聪明”、游戏动作能否优化的问题。此外,元宇宙行业还未出现成熟商业模式,商业变现机会较少。

但元宇宙行业的发展没有我们想象的那么悲观,成维忠自认是个乐观的人,对即将到来的苹果VR眼镜发布,他同样保持期待。他认为,VR设备取得的重大突破或将推进元宇宙行业发生“质变”。

“我的判断是,今年除了ChatGPT浪潮以外,最值得我们关注的就是苹果VR眼镜。”成维忠说。

2007年,iPhone问世,但手机电池很快就会没电、屏幕也有问题,但在3年后,这些问题全部都被解决了。iPhone 4的火热销售让整个行业形成了正向循环,让更多硬件公司加入其中,跟着苹果、安卓一起寻找解决更多问题的方法。

在成维忠眼中,元宇宙行业同样如此。“之前,全世界做头盔最好的是Oculus,但它没有解决VR/AR的便携问题。但苹果眼镜的宣传包括‘一键切换’,在外是AR,回家变成VR,这很重要。”成维忠说,“作为C端工具,它一定在任何地方都可以使用。而且,苹果这次还要公布操作系统,这说明它可能预备打造开发者生态。”

据传,苹果眼镜的出货量是150万台。大家可能觉得很少,但初代iPhone的出货量其实就是100万台。所以只要这150万台卖成了,苹果就成功了,它会带领开发者们走上良性循环的路。

而在现有成功产品身上,或许也能窥见成功的缩影。“以Roblox为例,它本身是一款轻社交游戏,采用轻数值玩法,但它的DAU很高、用户也很活跃。从今年1季度数据来看,Roblox收入已超6.5亿美金。”成维忠表示,美国产品把体验的打磨和创新看得很重,但类似这样的尝试在全球范围内非常少见。

谈及提升元宇宙虚拟人体验方面的优势,成维忠笑言,“这是‘有和无’的关系。比如企业需要智慧大脑和大模型,可能只有中科深智可以提供这项服务;其他企业用的是循环播放的动作库,但我们可以自动生成对应的动作和表情。”

以动作生成为例,成维忠提到,在动画公司里,动作和表情处理的投入的时间精力和成本会占到整个动画片的70%。而基于中科深智此前积累的跨多模态深度学习算法——CLAP算法,通过持续的不同模态数据的关联和交叉训练,可以让虚拟人拥有基于语音语义实时生成动作和表情的能力。

图源:中科深智

20亿 VS 1000亿 大模型赋予数字人“智慧大脑”

如果说动作自动生成赋予虚拟人活跃的能力,那么大模型就是让角色智能化的关键。

上周三,中科深智正式发布其自研“大模型”数智姜尚,并现场展示了自研200亿和20亿两种参数的大模型。作为一家“专注端到端生成式AI虚拟人”技术的公司,为什么会选择加入这场众多大厂参与的大模型研发战?

“国内很多做大模型的企业需求来自于资本市场的考虑,但中科深智做大模型确实是需求驱动。”成维忠解释道,他把大模型市场按照两个方向划分,一类是极少量的公司,比如谷歌、Meta、Open AI等,它们的使命是解决AGI(通用人工智能)的问题。第二类就是中科深智这样的公司,目标是将大模型赋能和行业场景做结合,这就要求大模型必须具备“差异化优势”,比如帮助合作方完成定制、私有化部署的需求。

开发大模型之前,中科深智使用NLP(自然语言处理)做语言识别工作,但这种技术在语言解析和应答方面的局限性很大。成维忠表示,很多企业提出希望进一步提升数字人的真实性,同时不再采用中之人(操纵虚拟人物直播的真人),但这些需求在当时均无法完成。

大模型问世后,问题迎刃而解。

成维忠表示,从大语言模型到照片的自动建模,再到动作和表情的生成,全链路、端到端解决方案,中科深智是国内唯一一家能提供这种能力的企业。如今,虚拟人的交互能力、解析和处理问题能力已不可同日而语,而这些能力将会在电商、医疗、元宇宙等行业中派上更大用场。

成维忠举了个例子,“过去,直播间需要用第三方工具抓取所有弹幕,再通过人工分析得出结论。而现在虚拟人在直播间工作的时候,完全可以监控整个直播间的氛围,并在直播结束后对正面和负面信息情况做出分析。”

但在众多动辄千亿参数的大模型中,中科深智发布的两个参数分别为200亿和20亿的模型似乎有些缺乏说服力。为了解答这个困惑,中科深智也在发布会当天现场对比了20亿模型和ChatGPT及其他知名大厂的大模型,验证参数量缩小后的效果。根据现场测试来看,实际操作足以满足企业需求,且它的速度会更快。

关于采用20亿参数的选择,成维忠告诉扬帆出海,参数过高的大模型对企业算力要求较高,难以实现私有化部署。而数智姜尚大模型完成了国内商用大模型的首次私有化部署,企业甚至只需要一块NVIDIA GeForce RTX 3090显卡即可运行。

从大模型的本身架构和训练方法上来说,中科深智的大模型和其他大模型并没有区别,只是在部分方向有所侧重。“在训练模型的数据来源上,数智姜尚大模型采用了更多中文数据集,也加入了更多医疗、电商相关行业的数据,这些数据均来源于中科深智的客户。”成维忠解释道。

“大语言模型解决了很多过去很难做到的事,在未来,我们会继续升级基于语音、语义方面的全部服务。”成维忠说。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1