文|沈筱
编辑|王与桐
上线2个月1亿月活,ChatGPT以其强大的对话能力迅速刷新全球用户对人工智能的认知。在OpenAI和微软公布开启模型、应用更新加速度后,兴奋和焦虑的双重情绪开始在国内创投圈中蔓延。
在颠覆和被颠覆的讨论中,有一个在近期颇受关注的交叉带——“+Gen AI(生成式AI)”,即寻求将生成式AI技术与判别式AI技术和现有产品、场景结合。
然而,在思考生成式AI技术能否与业务耦合,以及技术如何落地的同时,创业公司还面临着诸多现实的问题:“+Gen AI”带来的增益真的能cover新增的投入吗?这样的加法,能帮助诞生于上一波AI技术浪潮,仍在谋求发展的创业公司带来新的价值创造机会吗?
尽管存在上述不确定性,从现实情况来看,其并没有阻挡各方拥抱新技术的态度。已经有很多企业正在努力搭上生成式AI技术革命的“车”。但是,这辆车是快是慢,能否通往企业理想的目的地,还需要很多思考和探索。
为了获得来自行业一线实践者关于生成式AI技术可能带来何种影响,以及有关新技术商业化落地机会和挑战的看法,36氪与BodyPark型动公园创始人兼CEO林宜立进行了交流。
林宜立曾任「出门问问」高管,在2021年创办了专注大健康运动赛道的AI智能数字化平台BodyPark。36氪曾报道过BodyPark的Pre-A轮融资。
2023年3月,BodyPark正式启动了AI 2.0战略,在原有“AI+真人私教”产品,和自研DeepBody Engine人体姿态识别AI引擎的基础上,推出了三款新产品:AI虚拟教练「ChatBPK」,AI游戏化健身新品「JustFive5分钟」,以及面向行业教练/康复师的AI远程授课SaaS系统「Coach Copilot」。
其中,ChatBPK是BodyPark整合当前主流大型语言模型(LLM),并以现有课程内容和用户数据为Grounding(校准),开发的AI多模态虚拟教练。用户可以在课前、课中、课后任意阶段,用自然语言的方式与ChatBPK交互,获得关于课后评估、健身计划等个性化、专业问题的解答。同时,ChatBPK的回答不限于文字形式,还支持拉取课中体态识别图片、教练指导语音等。
以下为36氪与BodyPark的对话,经编辑整理
36氪:BodyPark也是从做健身垂直领域小模型开始的。有说法认为上一波AI创业公司很难做,在您看来,到底难在哪?
林宜立:我们公司的核心成员不少是上一波AI公司出来的老兵,都经历过从2014/15年开始的AI创业热潮。我的最大感受是AI公司难是难在商业化变现,得找场景。
上一波往往是AI团队先有很牛的技术,但需要持续寻找落地场景,“拿着锤子找钉子”,往往会走一些弯路(尽管有时难以避免)。所以我们做BodyPark再创业的那一刻,就已深知场景和技术应该是紧密耦合的。不管是B端还是C端的场景,只有紧密结合用户场景去做技术创新,才可能将技术本身的价值和商业化前景发挥到最大。
36氪:说到“拿着锤子找钉子”,这一波想要直接利用生成式AI技术来做的企业会不会也有这样的情况?
林宜立:这个肯定也会有。比如现在OpenAI,ChatGPT火,很多创业团队就会直接拿着大模型的API直接封装做应用,很快的做出一些智能的聊天机器人,然后再去找应用场景。这多少也是“拿着锤子找钉子”的逻辑。
这个思维本身也没有大错,但我认为,以终为始来看,技术最终还是服务于场景,终局一定是找到解决特定问题的场景。在这个场景里,技术、产品能发挥非常核心的作用,帮助企业形成稳健的、具备长期壁垒的商业模式。
36氪:在您看来,所谓的AI 1.0和这一波AI 2.0/生成式AI技术相比,在场景或者应用上会有什么区别?
林宜立:我觉得有两大类需求。一类是技术范式变化带来的新场景需求,这个目前还需要时间去观察。另一类是老场景新解法,用户需求其实一直在,但采用新的技术,可以做一些原来做不到的事情,创造新体验、解锁新人群、构建新玩法。
比如我们现在做的在线运动健身私教课。新一波大语言模型/生成式AI技术会可能会十倍,甚至百倍地提升这些场景中的体验和效率。
我觉得对所有正在路上的创业团队、或者已经有成熟商业模式的公司来说,都要拥抱AI 2.0的机会。因为,站在企业的角度,相当于工具箱里多了一个非常有力的工具。
同时,AI2.0也会有原生的机会,会涌现出一些新的商业模式。比如技术2B创业,做大模型等更偏底层的基础设施的机会。像我们这样做垂直场景应用的企业可能就会为之买单。
还会有做中间件比如专门提供模型训练能力的,做算力加速的等等。另外,也会产生很多新的应用,可能不是老场景,但需求却早就存在,比如做情感陪伴类聊天机器人的。
36氪:您刚刚提到,BodyPark瞄准的其实是一个确定的老场景,那当初在考虑采用生成式AI技术时,主要考虑了哪些因素?
林宜立:当所有人都在聊大模型和AIGC时,BodyPark是带着自己的视角和场景来看这件事的。一方面我们一直密切关注并深度参与AI技术的发展。另一方面,本质上我们是一家AI产品服务公司,也很强调用户思维。用户不会只因为你有很好的技术而买单,但会因为你为他们提供了完整的体验价值而持续付费。
因此,我们首先考虑的是,新的AI技术能不能非常接地气地在现有场景中得到应用,解决具体问题。其次,另一个核心在于叠加新技术之后,能不能达成1+1远远大于2的效果。
过去我们通过“AI+真人”的组合搭配,把在线私教课的体验从0做到了1,把一个之前大家觉得做不到的体验做得还不错,跑通了商业化。现在有了Coach Copilot和ChatBPK这两个新产品模块后,我们有机会把服务效率和用户体验再从1提升到10甚至100,能更快地实现最初创业时想做AI虚拟智能教练的愿景。
36氪:您刚刚提到创业之初的愿景就是做AI虚拟智能教练产品,为什么创业之初没做,而是等到今天?是受限于技术,还是有其他的具体路径考虑?
林宜立:其实AI智能教练这件事是从创业之初就开始的,一直在做积累。但我们最初并没有关于什么时候能够真正构建一个完整AI虚拟教练的清晰时间表。
一方面,虽然团队有自研的人体姿态识别与动作理解算法引擎,但团队对专业教练的知识或者行业know-how还需要积累。另一方面,纯AI虚拟教练如何与用户更自然地交互也是一个比较大的难点。
这次大型语言模型出来之后,我们发现,这一波生成式AI技术可以把原来做的所有事情串起来,Connecting the dots。
我们基于深度学习人体姿态识别模型Deepbody Engine,叠加上生成式AI技术后,一些表面看似不相关的产品和业务其实可以构成更完整的、端到端的全栈服务生态。这背后的底层核心能力就是AI Virtual Coach智能教练。
现在,BodyPark每个业务线都可以更好地反哺这个核心能力,同时核心能力的每一次升级也能衍生新的业务、强化已有的业务。
例如,除了运动健身,我们也可以将相应能力迁移到康复和慢病管理领域。目前我们正在和一些知名的三甲医院康复科进行合作试点,用运动处方进行远程的慢病管理。这也是基于已有技术能力涌现的新商业机会。
36氪:您认为BodyPark能在现阶段快速实现 “+Gen AI” 的关键是什么?
林宜立:“+Gen AI”对我们来说是一个厚积薄发,顺势而为的事情,关键可能是垂直的小模型和大模型的协同。
在垂直场景中,如果没有专业领域知识,没有对相关用户数据的准确量化和记录,可能就无法从大语言模型(LLM)精调出可以和用户进行专业化、个性化交互的对话模型。只是简单调用大模型接口来和用户进行泛娱乐化互动,解决不了LLM “胡说八道和不够专精”的问题,不会对业务有实际帮助,也不会有用户为之长久付费。
拿BodyPark的例子来讲,我们需要达到的效果是ChatBot在前端,以自然语言、以图文并茂的多模态方式,与用户交互。这个ChatBot要能够在课前、课中、课后给用户提供个性化的内容,进行实时和异步的专业化指导,同时能够让它的指导与平台的课程内容体系联通。
我们过去两年打造的“AI+真人私教”这套体系,核心是基于AI算法,在自研深度学习模型DeepBody Engine的基础上,自建和叠加课程体系(BIPT进阶课程体系、课程动作库),以实现算法、数据、内容与产品的闭环飞轮。
所以,我们现阶段可以快速推出垂直场景的ChatBPK智能教练,主要也是得益于之前投入自研的这个AI小模型,实现了用户健身场景的数字化。在这个过程中,我们积累了大量图文、视频数据,包括用户在训练中做了哪些动作,练的怎么样,经常犯什么错误,真人教练给了什么指导。
只有把这些数据喂给大模型,让它理解这些数据,才能让大模型实现Grounding,接地气,也就是不会像ChatGPT那样胡说八道,或者仅给出一些泛泛的回答。
当然,在这个过程中,我们还需要去克服一系列技术和工程优化方面的挑战,这些都是沉淀和壁垒。
36氪:谈到数据规模和质量,垂直场景的专有AI小模型也需要好的数据来迭代优化,BodyPark是怎么做的?尤其是,在一开始还没有自有用户数据或者量很小的情况下。
林宜立:近年来,在学术界和工业界其实是有一些关于人体关键点识别(Human Pose Estimation)的公开模型和方法论的,但都仅适用通用场景,无法直接商用。在运动健身场景之下做人体姿态识别模型,要让AI既能看得清又能看得懂,确实有特定的难点。一是公开数据库里数据少且质量较差,二是垂直模型构建需要行业的know- how。
AI仅仅做到HPE人体姿态识别是不够的,还需要能理解人体的动作(Human Motion Understanding)。比如算法看懂人体骨骼关键点后,仅仅是记录了相关的空间坐标,并不知道学员是在做“深蹲”还是“俯卧撑”,以及动作到底标不标准。后者属于典型业务场景的需求逻辑,没有开源算法可用,需要积累数据和专家输入,自研摸索。
这也是为什么我们第一天就采用了“AI+真人”的模式。只有打通了从0到1的用户场景,做出有用户愿意持续付费的产品,才能有数据闭环,进而帮助我们在后续,利用真人教练反馈和训练数据来反哺和持续迭代算法。
现在来看,我们前期做的这些工作,正好也为接入大模型能力提供了更垂直、更丰富的数据。
BodyPark的“+Gen AI” 企业供图
36氪:具体到BodyPark AI 2.0战略中,生成式AI技术到底发挥了什么作用?
林宜立:生成式AI技术在这个时期非常重要,它大大强化了现有AI的体验度。用户体验更好了,感知更智能了,留存和粘性就会更高,最终会体现在复购上。复购变好了,LTV生命周期价值会更好,我们就有更多的空间去投资品牌、研发算法。
BodyPark的产品服务一直是算法和数据驱动的,核心价值也在于通过“量化自我”来解决消费者在运动场景中的启动难、坚持难问题。生成式AI技术能够降低互动门槛,使用户和教练都能更直观地感知训练/教学数据,进而认可数据的价值。包括课中实时指导(AI Coach CoPilot)和课后的互动和智能报告(ChatBPK),课后高光时刻AI滤镜这样的AIGC功能,都会提升数据的交付价值,提升用户体验。使得双边用户都会更加离不开这个工具。
另外,我们还有「JustFive」5分钟的纯AI游戏化互动的健身产品,可以以更低的门槛触达更广泛的新客群体,让更多用户感知到AI对专业度和趣味性的赋能。
36氪:之前您提到生成式AI技术其实对一些老场景的生产力提升是有帮助的,对BodyPark来说,这方面有体现吗?
林宜立:效率提升方面,其实没有生成式AI,我们的效率也还蛮高的,因为有自研的识别引擎,以及基于引擎新开发的AI Coach Copilot。AI可以辅助真人教练以更高的人效进行课中实时在线教学。
但同时,我们也在Coach Copilot里接入了LLM的能力,比如教练端用户训练日志的生成,以及多样性指导话术的生成,也能在一定程度上提升教练的生产力。
推出Coach Copilot后,教练相当于多了一个智能助教,可以实时监控和捕捉多个学员的动作数量与质量。Copilot除了可以在课中给学员即时的游戏化反馈,还能在教练端屏幕适时地给真人教练提示,帮助教练更从容地对不同学员进行针对性、精细化指导。据我们测算,Copilot提升了近3倍以上的教练单位时间人效产出。这样的沉浸式体验也提升了学员的付费意愿。
另外,对完整的健身服务来说,不能只是上课,课前、课后的辅导和问题解答等也很重要。而这一部分内容,生成式AI技术能帮我们更高效地做到。现在我们一样可以给助教做一个Copilot,同时用ChatBot替代一些职能。消费者问的很多问题,ChatBot都能智能解答。
36氪:在没有推出引入大模型的ChatBot之前,你们应该也是能出智能课后报告的,区别在哪?
林宜立:能做,但是用上一代AI对话技术来做会比较生硬,效率也比较低。生成式AI的特点是自然语言交互界面天然更友好,消费者不需要做复杂操作,随便一问,AI就能“听得懂”并给出非常直观、易理解的回复。
我们目前发布的ChatBPK,通过接入大语言模型并进行Fine-Tune,就像一个真实的、有温度的教练,用户可以有针对性地询问自己的训练情况,规划训练课程。就像前面提到的,人机互动门槛更低,数据价值感知更直观。这样用户的粘性也会更强。
36氪:目前BodyPark的商业化进展如何?从您的描述来看,有了更可用的生成式AI技术,BodyPark对未来有了更清晰的规划,能展开讲讲吗?
林宜立:数据上,用户规模已经有了十几倍增长,整体付费用户活跃留存续费数据指标,与行业传统的模式比,都有显著提升。同时,我们已经有了一批忠实的核心用户持续复购,积累了不错的口碑,也已经跑通商业模型UE(Unit Economics,单位经济模型)。
BodyPark的长期愿景是打造全球最领先的下一代「AI智能教练」和原生「AI数字化智能运动平台」,让更多消费者养成更积极、健康的生活方式。
中国的运动健身行业付费渗透率目前不到3%,而欧美达到了20%以上。随着疫情的结束和经济的复苏,我们相信新一代消费者对健康运动的需求会更加强烈,未来3到5年国内的市场规模将有成倍增长。
我们认为,长期增长的需求、变化的人群结构,叠加新的技术范式突破,一定会让新一代的创业团队有机会“抢存量”,并解锁“新增量”市场。
所以今年开始,我们会基于核心的「AI+数据+课程内容」积累,持续推出更多产品,进一步降低用户参与运动健身的门槛,打造更有趣上瘾、专业安全的智能产品、服务矩阵。同时我们也会探索更多大健康/运动/医疗康复场景的C端和B端商业模式,做到“AI仰望星空,业务脚踏实地”。
36氪:BodyPark对未来虚拟教练的畅想是怎样的?会不会是三维的?
林宜立:三维体验一定会到来,我觉得苹果XR发布之后可能会有一波新的机会。未来XR设备逐步成熟,我们可以把2D的体验复刻成眼前就是有个3D虚拟教练站在身边,获得更加沉浸、有临场感的体验。
这就回到为什么我们说“精细量化人体动作”这件事具备长期价值。未来3D体验普及时,我们今天做的这套体系价值也会更高。因为无论2D或3D,体感交互的用户体验创新,一定需要精准判断人体的动作和姿态,依然需要知道科学训练的课程和动作是怎样的,依然要具备结构化分析用户数据、做智能推荐的能力,以及,能用自然语言交互的方式去和用户互动。
对BodyPark而言,无论是智能手机,智能TV,可穿戴设备还是XR,都只是交互方式和载体的变化,都是我们内核算法和数据的外化方式。
36氪:未来纯AI智能虚拟教练会对现有的商业模式造成影响吗?真人教练和AI教练是什么样的关系?
林宜立:我觉得真人教练和 AI教练并不是替代关系,反而很长一段时间内都会是相辅相成、互相促进的。对商业模式来讲,是产品矩阵的逻辑,不同的组合创造不一样的价值,消费者的选择会更加分层和多元。
我们的不少用户,除了上BodyPark的线上真人私教课,也会去线下做户外锻炼,也会在碎片时间用JustFive App打卡。
当然,在一些场景中,AI虚拟教练对真人教练确实有替代作用。比如JustFive轻量的游戏化产品,可以让用户获得比传统录播课更加有趣的体验。但是,在另一些场景里,AI扮演教练Copilot的角色,可以辅助真人教练提升教学质量和效率,让用户获得更深度的付费指导体验。
我们在乎的是消费者的使用频率是不是整体提升了,TimeShare和WalletShare是不是增加了,而不是说未来市场上只能有唯一的一种产品方案。
尽管AI技术飞速发展,我们相信优秀的真人教练是具有不可替代的专业度、信任感和情绪价值的。但是AI赋能会拉高行业的平均值,AI可以在数据化、专业化上增强教练的能力,教练们的行业经验、专业知识也能积累到AI技术的应用中,让AI技术在健身行业的应用变得更加游刃有余。
DeepBody Engine解读 企业供图