硅基智能创始人司马华鹏最近“写”了一本新书——《大模型时代:ChatGPT拉开硅基文明序幕》。
确切地说,这本围绕人工智能、大模型、ChatGPT、数字人等领域展开讨论,前后洋洋洒洒数十万字的著作,是他与团队一起勾勒出框架和脉络,然后交给ChatGPT完成撰写的。甚至,AI还揽下了部分的销售工作。
与DNA编码为核心的碳基生命相对应,以文本编码为核心的AI智能体为社会注入了新的硅基劳动力资源。
从连续在科技领域投入和创业的角度来看,司马华鹏的履历较为“硬核”:2002年做跨国公司LANSEAL、为企业打造信息安全产品;2007 年在欧洲创立虚拟杀毒软件公司,服务过数十万客户;2017年,他又成立了主攻AIGC领域的硅基智能。
彼时,硅基智能是中国最早一批专注于智能语音机器人以及商业场景推广的企业之一。
公司创立初期,司马华鹏希望迅速推进数字人开发,围绕多个场景打造硅基劳动力。然而,ChatGPT尚未出世,AIGC的应用在当时并未达到可感可视,市场上有相应认知的客户屈指可数,数字人业务的开端并不顺利。创立初期,其地推业务团队主要通过抖音等平台联系各类达人、KOL推荐数字人产品。
“前几年打市场,我们被拒绝了几万次都有,甚至有时候提出免费给客户做,也有很多人表示质疑。”司马华鹏坦言。
不过,他依然相信AIGC与数字人人应用的前景:“硅基生命是开源开放的,他们集体进步,可以快速复制。拥有这些特性的硅基劳动力,可以把人从繁重的重复性脑力劳动中解放出来,让人回归人的价值。”
如今来看,这一场关于人工智能应用的牌局,司马华鹏“赌”对了。中国以及全球的经济思维与生产形势的变化,都在逐步成为支持这一论断的重要依据。
首先是以ChatGPT走红为引子,AIGC概念走向普及,一批头部企业的大模型逐渐加深了人们和市场对AIGC应用优化、取代部分人工工作的理解和接受度。
据中关村论坛人工智能大模型发展分论坛数据,截至今年5月末,中国已发布了79个大模型。从全球视角来看,美国谷歌、OpenAI等机构不断引领大模型技术前沿,英国、俄罗斯、以色列、韩国等地也有越来越多研发团队投入大模型研发。就全球已发布的大模型分布显示,中国和美国处于大幅领先地位,数量超过全球总数的80%。
一个鲜明的例子是,进入2023年后,司马华鹏再也不用跟客户们一遍遍解释公司名字“硅基智能”的由来。
其次是人口红利正在变化,AIGC作为“新劳动力”的价值优势将进一步发挥。统计数据显示,2022年末,中国人口比上年减少85万。中国社会科学院国家高端智库首席专家蔡昉在新书中谈到,“人口红利消失的挑战也是改革红利应运而生的机遇。”
事实上,AIGC已经在多个领域开始扮演重要的“劳动力”角色。比如,华为的盘古大模型近期落地山东省内开采储量最大、矿井服务年限最长的现代化大型跨井“李楼煤矿”,其功能之一是辅助防冲部门进行防冲卸压工程规范性验证,可以降低82%人工审核的工作量,实现防冲工程100%验收率。
而司马华鹏则踩准了电商直播与超写实数字人契合的原点。在近期与谦寻控股合资的谦语智能发布会上,硅基智能表示当前已经为超过40万的人克隆了硅基AIGC数字人分身。
“AIGC的发展,不是说完全淘汰和取代人工,而是训练和催生出善于理解和使用AI的人,解放人力、服务人民,告别部分机械、重复性的脑力劳动。”早在硅基智能成立之初,司马华鹏便已定下目标:2025年为全球提供一亿硅基劳动力。
今年5月,硅基智能推出了炎帝大模型,不同于传统的ChatGPT类通用大模型,炎帝大模型是一个多模态的行业脑,它将私有域知识用LLM大模型技术训练而成,叠加AIGC数字人技术,为对应行业提供“劳动力”。基于炎帝大模型的能力,硅基智能AIGC数字人在直播、短视频、电影生成等商业化场景中实现了可复制式的下沉,进一步扩大了AIGC与大众日常消费的应用接触面。
公开资料显示,以上一轮C轮融资为节点,硅基智能已获得腾讯投资、招银国际、国新央企、红杉资本等9轮融资,拥有80余项授权发明专利,公司估值近10亿美元,称得上是中国AIGC独角兽。
而机遇中也隐藏着不小的竞争。随着越来越多的科技公司试水大模型,AIGC整个赛道狼烟四起,其应用模式也更进一步地谋求走出行业壁垒、靠近社会大众消费。此间,利润和效率的考量成了AIGC后续发展中无可规避的硬性门槛。
前几年元宇宙、虚拟人变现存疑的问题暴露后,AIGC如何找到可持续的商业模型、在不同的使用场景实现靠岸?关于行业大模型与通用大模型的具体应用,谁又能更加迎合当下市场的选择?
近日,《天下网商》对话硅基智能创始人司马华鹏,以下为对话实录,经编辑整理。
《天下网商》:是什么促使您从电话机器人转到了AIGC数字人的行列?
司马华鹏:首先硅基智能有明确的进步方向。我们做的产业叫硅基劳动力,劳动力本质上考验的是背后的NLP(自然语言处理)核心交互能力。我们画了一棵圣诞树模型,圣诞树上挂了好多职业,树枝开叉的高低体现了它对NLP要求的水平,我们开发的炎帝大模型的自然语言处理水平在不断上涨,那么它就会像水一样去覆盖这些职业的工作领域。
最初我们做电话机器人,属于 NLP中交互深度不高的领域,如果硅基智能停留于此,就相当于我们把大模型的能力边界做了一个界定。所以2017年发明电话机器人后,到了2019年我们的重心转到了AIGC数字人,也放弃非常大一部分收入和利润。
一方面,大模型如果走老路、再往下发展就容易遇瓶颈;另一方面,从赚钱角度来说它是一门生意,但在用户体验上,现在哪怕是银行,接到的都可能是骚扰电话,所以在科技向善的角度,它不一定是一门好生意。
转做数字人还有一个重要的契机。2018年1月,公司一位合伙人的母亲去世,参加出殡的时候,我答应他把他的母亲用AI“克隆”出来。当时去世老人只留下了微信语音消息、日常照片等资料,我们先做了声音克隆,后来又做了形象克隆,再后来又加了对话互动。
这门技术现在也应用在数字人商业化的各个领域。这一路走过来,我们并不是纯商业的,也是对一个朋友的承诺。
《天下网商》:这样听起来,初衷是一对一的人机互动,但之前您提到过商业化的大模型还是中交互?
司马华鹏:中交互是相对于强交互而言的。如果AIGC应用的横轴是情感要素,纵轴是商业要素,那么目前对于我们而言,两者交汇点就是在中交互。
举个简单的例子,今天我可以跟1000个客户见面,但事实上如果要一一碰面,可能只能一天见3个。同理,AIGC去做一对一的输出,算力只能针对于一个领域、一个客户,就不能让它的算力和算法集中。
如果是中交互,我生成一套话术、一个方法论,可以面向成千上万人。只要转化率能比一对一的效率高,那是它就是划算的,是能赚回来的。所以,中交互就构成了AI的一个很好的商业模式。
《天下网商》:是交互模式影响了AIGC业务的主攻方向吗?
司马华鹏:从商业上算,我们认为中交互与商业的结合点就在直播上面。比如我们这场对话,只是闲聊、不对外发布,内容产生的价值会更低。但如果聊完之后,内容分布在各个账号里面,传播价值就会很大。直播也是一样,数字人适合在其中找到一个商业和情感的黄金交叉点。目前,我们认为短视频和直播等都是非常合适的。
《天下网商》:但直播行业很“卷”,大家都会关注到效率和成本,硅基是如何考虑这点?
司马华鹏:从前些年元宇宙的爆发,到ChatGPT引发的高潮,基于数字人的技术,其实有不同研究方向的流派。之前大家认识到的许多虚拟人,其实是3D技术做的,它有一个非常大的问题,就是非常贵,有的几十万甚至上百万才做一个。
我们在做的版块,属于AI生成数字人。依靠硅基智能的炎帝大模型,可以实现做一个数字人从头到尾不需要人类的参与,因为它已经学习了人类巨量的视频数据,包括怎么讲话、怎么做动作、怎么展现微表情等。
随着训练数据越来越多,过去大模型克隆一个人大约需要30分钟,后来降到10分钟、5分钟、1分钟,甚至现在我们有一张照片就可以把你克隆出来,成本呈现巨大的下降趋势。
所以,现在我们可以做到将克隆一个人的AI形象,降到几千块钱。你把你的声音和形象的数据发给我们,基本立等可取。几千块钱,对于几乎所有用户都是能接受的。
《天下网商》:直播重视交互,这样才能有情感感染、让观众有消费欲望,怎么让AI主播更像真人主播呢?
司马华鹏:这就是第二个攻关。人工智能的基石叫图灵测试,我们的AIGC数字人,都可以做到“以假乱真”。
硅基智能提出来图灵测试的三个阶段,第一阶段是大家广泛认知的,傻傻分不清,形态上相似。
第二阶段叫双向情感交互,也就是说它不仅能在整个视觉上通过图灵测试,同时它还能通过语言、语气、动作等习惯从价值交换上进一步达到图灵测试。就是说即使今天你分辨不出是不是真人主播、真人企业家在直播,但你还是能够在互动中跟他建立信任、不断地买东西,实现双向情感交互。
第三阶段我们叫死生相契,我们也在用这个技术构建数字人与人类之间的一对一实时交互。这是基于用户和AI之间关系的一种升级,比如今天我们养一个AI,我放到直播行业让它播一个月,它可能真的就挣几十万回来了,它为你赚那么多钱,你持续支付AI成长的算力费用,双方自然可以建立信任、成为好朋友,这就是第三个阶段。
我们做更真实的数字人,就是围绕这条路线在做。
《天下网商》:您曾说,不是买了数字人就能做好直播。那么我们为什么还要推动数字人进入直播?
司马华鹏:我们可以针对性地将电商领域知识加入大模型,训练出一个直播行业脑。因为行业内95%以上的公司,实际做的是平播和店播,而且由于直播投入增大、专业性越来越细化,还有许多商家其实是做不了真人直播,或者承担不了高额的成本。如果AI能做得比大部分主播更好,或者更便宜,那就对商家产生了价值。
《天下网商》:商家肯定希望产生更多价值,那如何让数字人做好直播工作呢?
司马华鹏:买一台电脑,和能写出一个好的程序,中间距离太远了。数字人进入直播也是一样,我们认为,有6个要素左右着商家的直播是否成功。
这6个要素分别是科技、运营、供应链、IP、金融、账号。我们在其中更多是扮演了科技和工具的角色。
举个例子,有一家公司买了数字人产品,用在一个新的平台账号上跑,跑了三天被封了或者流量没跑起来,就认为数字人不行,但如果说公司拿旗下最优质的账号测试,他很可能一下就跑出来。因为一方面抖音等平台已经逐渐规范了数字人直播的规则,另一方面数据和转化率本来跟账号相关性很大。让数字人从0到1去跑,结果铩羽而归,假如只归咎于技术,其实是很伤害这个产业的。
《天下网商》:所以硅基智能的数字人会得到哪些支点?
司马华鹏:直播成功背后,运营要素占的主导是非常大的,所以从一开始我们就在这个领域寻找盟友。我们认为只卖给客户单一的工具,他很难成功,甚至说在这个过程中遇到非常多的困难,会超过我们这家科技公司的想象。
因此我们携手了谦寻控股和部分业内头部的公司。事实上,我们很早就希望找一些优质的运营公司,把客户跑通直播的距离缩短。比如,经过专业MCN机构的培训或课程,然后再加上数字人直播的工具,商家可能一个月或者一个礼拜就能熟练的跑直播了,运营能力在其中占了重要因素。
《天下网商》:您对数字人还有哪些期待?
司马华鹏:从拟人态到双向情感交互,再到此生相契,其实这个路线图已经画得很清楚了。未来每个人都会有自己的一个数字伴侣,它可能就是你的Soul Mate、他能替你做的事情非常多,就像钢铁侠和贾维斯这种关系。
AI克隆这个事情现在只需要几千元的成本,你在《流浪地球2》里看刘德华对话AI女儿,大家还觉得很科幻,但是今天我们已经做出来了。
虽然整个过程还很长,但就是这么一个路径,直播只是当下它能替你干的工种之一。