当前位置:首页|资讯|ChatGPT|人工智能|数字人

投入数千万开发“能说会动的妙鸭相机”,跳悦智能已为数万个直播间提供数智人直播服务

作者:猎云网发布时间:2023-11-27

原标题:投入数千万开发“能说会动的妙鸭相机”,跳悦智能已为数万个直播间提供数智人直播服务

文/猎云网(微信ID:lieyunjingxuan 猎云精选)

不得不说,借助ChatGPT大模型的风口,人工智能热潮再度被掀起,AI赋能全行业成为了又一个增长引擎和财富密码。

AI数字人也成为了直播短视频行业的新宠,甚至都喊出了“不要工资、无需五险一金、永不离职,只要7999,数字人员工带回家”的口号。

在短视频和直播领域,AI数字人以其降本增效的优势和稳定输出的能力,正对传统直播模式进行重塑和改造。数字人直播,在直播间塑造了另一个增长范式,也正成为商家带货的必争之路。

艾媒咨询数据显示,中国直播行业总规模预计到2025年规模将达到21373亿元。《数字人产业发展趋势报告(2023)》显示,数字人将进入大规模应用期,转化现实生产力创造价值。到2026年中国AI数字人市场规模将达102.4亿元,数字人市场将呈现高速增长态势。其中,2022 年一年虚拟主播(数字人)企业注册增加数就高达 948 家,增速达 68 %。财经作家吴晓波在跨年演讲中更是直言:2023 年每家公司都可能需要一个数字人,可以用来做本地生活、直播、短视频等。

同时, AI 大模型爆发,对数字人在生成直播脚本、智能应答提问等方面有了更加迅猛的发展,让数字人有了更强大的发展基础。

在数字人赛道上,目前大厂、创业团队、AI公司和一些此前做智能客服营销的数字化服务商都在这一赛道频繁动作,腾讯、百度、阿里、京东、火山引擎等平台此前基于直播带货等多个场景,都推出过数字人产品平台或服务。同时一些科技公司也秀出了各自代表性产品,还吸引了谦寻控股这样的跨界玩家。此外,猎云网还关注到一些创业公司的数字人产品也取得了不错的市场效果。可以说,数字人市场正在逐步爆发。

但目前数字人直播行业,依然存在着制作成本高昂、带货质量堪忧、平台政策和监管政策不明朗、加盟商代理商割韭菜、缺乏情感价值、与真人差异较大等问题,也亟需行业的创业者破局。

成立于2021年的跳悦智能,专注真实和智能的拟人AI(数智人)技术研发,是数智人产品化较早实践者,在仿真数智人直播市场有不错积累;截止目前已建立数智人AI化创建、数智人视频合成、数智人互动直播组成的完整产品线,实现了市场技术双领先。

跳悦智能创始人兼CEO包英泽博士告诉猎云网,跳悦智能于2021年推出仿真数智人直播产品。在此之前,国内大部分AI直播都采用3D建模卡通人形式。跳悦智能开创了仿真数智人直播的产品形态,率先打开市场。跳悦智能技术部门是国内较早研发数智人技术的团队,通过5年的持续研发,积累了全AI人物创建、低成本AI推理、低延迟问答互动等独特的技术优势,在AI训练数据积累和人物AI模型推理效果方面领先同行。

目前,跳悦智能可以创作千人千面的数智人,而传统技术只能提供千篇一律的公版数字人形象。据包博士介绍,目前数字人市场上,对公版数字人的需求越来越少,大部分客户都需要根据自身场景打造的个性化数字人。跳悦智能依托大模型原理,实现了仅用一张照片就可以创建身体可以运动的数智人。

依托这样的技术,跳悦智能推出了跳悦AI直播、跳悦数智人视频合成平台、跳悦数智分身、跳悦直播API等多种AIGC产品可助力企业数智化升级。如跳悦AI直播是用AI算法合成的模拟真人形象的音视频流,可以应用在电商购物、团购券销售、留资获客、智能客服等领域实时与观众进行互动。其优势直播画面“所见即所得”,人物形象由用户录制和合成,AI主播可以手持商品进行展示,并且运用大模型理解和回答问题,更贴切准却,让AI主播的话术可以灵活演绎、千变万化。据悉,北京“滚爷吃面”餐厅运用跳悦AI直播产品不足一周即荣登带货日榜前10名、带货周榜长时间名列前排。

“可以理解我们的产品是能说会动的妙鸭相机”,包英泽这样告诉猎云网。

市面上较流行的3D数字人技术,从创意、建模、到应用要花费数十万元,这让很多中小型创业公司望而却步。相较于传统的3D数字人和2D视频数字人技术,跳悦智能的第三代数字人技术(跳悦数智人),具有更加千人千面和成本大幅降低的优势。

包英泽博士表示,将数智人技术平民化是跳悦创业的目标。跳悦通过深度自研嵌入式技术,在国内首先实现了可以运行在普通电脑的高仿真互动数字人产品。和传统依赖GPU推流的方法比,跳悦大大降低了产品售价。例如,在美团平台直播,跳悦的产品仅需699元每月,而其他竞品售价普遍在2000-3000元每月。

形象逼真、成本低廉、适应需求等条件对于数字人行业发展尤为重要,谁能够掌握核心技术和市场,就等于拿到了制胜法宝。AI的发展,也对数字人的算力资源提出了更高的要求,跳悦智能具备成本优势明显的算力资源,包括自建GPU数据中心,自研高可靠大规模GPU集群推理软件架构技术,可以实现1000+GPU同时运行。另外,得益于跳悦智能的海量数据积累:真实场景100Tb高质量视频数据;电商政务客服场景1000万句文本;1000+人物动作和服饰。基于大模型的第三代数智人核心算法基于 RLHF进行训练,通过专属数据训练LLM,更符合直播和短视频场景。

目前,跳悦智能已应用于直播电商、短视频创作、达人/主理人数智化、本地生活、智能客服、党建政务、银行保险、新能源汽车以及文商旅产运营等行业和领域,营收主要通过AI直播、数字分身等标准化产品和私有化部署付费,超过2万个直播间选择跳悦AI直播产品

包英泽博士向猎云网透露,跳悦智能此前凭借过硬的技术实力,以及产品个性化、智能化和平民化的特点,在行业积累了不错的商业化效果。未来跳悦智能将上线更多AI数智化与AIGC产品,以AI赋能生活,帮助中小企业实现降本提效,线上线下无限融合,支持多种基础实用型应用场景量化输出。

融资方面,跳悦智能已获得来自真格基金、汉能创投的数千万元投资。汉能创投管理合伙人王威曾表示,看好跳悦智能团队在多模态智能领域的核心技术实力、快速迭代的产品开发潜力、多场景探索的商业化落地能力。

团队方面,CEO包英泽博士本科毕业于清华大学,博士毕业于密歇根大学和斯坦福大学。作为早期员工加入AR公司 Magic Leap,后在硅谷创立xPerception并被百度收购,再之后曾任VIPKID首席科学家,在AI领域具有十五年研发经验和百万级用户产品经验。跳悦核心团队由原百度和VIPKID技术骨干组成,兼具人工智能、互联网、电商等多行业经历。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1