《流浪地球》里,刘德华扮演的图恒宇在女儿图丫丫去世后,将女儿的记忆永存于“数字生命世界”,并用算力去驱动类似数字人的行为,可能很快就会广泛应用在真实世界当中。
这是基于AIGC之上的数字永生技术,也是这家来自南京的人工智能公司:硅基智能的创立起源。
在硅基智能创业初期,其中一位联合创始人经历了母亲的离世。在悼念逝者时,这位联合创始人告诉创始人司马华鹏,老人不会打字,微信上只留下老人生前遗留的语音消息。他问司马华鹏:“能不能让我再看见我的母亲?”司马华鹏一口答应:“好,我来想办法。”
于是,硅基智能的第一代数字人也就此诞生。至今,在数字永生的基础上已延展出了更多的应用场景。
硅基智能是一家全球首创AIGC数字人模式的科技公司。2017年发布了全球首个AI电话机器人并获得专利。
2017年至今,公司成立5年多以来,已获得腾讯投资,招银国际,国新央企,海松资本,红杉资本,奇虎中财等9轮融资。
截至目前, 硅基智能已拥有80余项授权专利。
如今国内正在经历“百模大战”,基于大模型的创业已经成为确定的风口。
而司马华鹏给出的答案是,由硅基智能将私有域知识用LLM大模型技术训练而成的多模态行业脑—— 炎帝大模型 ,叠加硅基AIGC数字人技术,将成为行业中的超级专家,也就是硅基劳动力,这让实现数字永生的曙光浮现。
搭载了炎帝大模型的数字人,已经实现了多种场景的商业化,如 短视频生成、直播生成、电影及电视剧生成 等,甚至在 数字永生创新领域 也会开展更多应用。
或许基于大模型下的数字人,才是人工智能行业创业更可观的切口。
互联网的诞生,几乎颠覆了所有行业。如今的AIGC,也正在朝着这个方向迈进,不断渗透到更多行业。
目前市面上基于大模型的落地应用其实还比较早期,To B层面上,Open AI算是最早进行商业化合作的案例。在国内,更多也集中在内容生成与直播领域。
而硅基智能的不同之处在于, 将实际应用落地的场景作为最终目的,围绕影视、直播产业的场景需求,去倒推技术研发, 是国内较早实现大模型产品商业化的企业,也是硅基智能能够快速吸引如腾讯、奇虎360等互联网公司,以及一众央企和知名投资机构青睐的原因。
相信很多C端用户在短视频平台上,已经对数字人直播不再陌生,这也是硅基智能AIGC数字人主要商业化场景之一。
据硅基智能方面向小饭桌介绍,基于硅基智能发布的炎帝行业大模型,已经在 自动生成短视频、数字人直播、数字永生、数字文娱 方面进行了大量应用。
短视频生成案例中,口播博主、百万粉丝大V沈楠、国内知名商业咨询顾问刘润都是硅基智能的合作伙伴。
如果说短视频对硅基数字人的要求较为简单,那么在直播领域的要求则要更要高一些。为了追求无限接近真人的感觉,在直播时,数字人需要对人类的语气、表情、情感等都有深入的理解和生成能力。
但目前市面上有不少直播数字人,还与真人直播有较明显的差距,过于僵硬,甚至惊悚,一眼就会被“识破”。这也是数字人直播方面需要被不断完善和解决的主要问题。而硅基智能的数字人已经可以达到“以假乱真”的级别,这些是靠高强度的算力、财力、电力叠加完成的。
据司马华鹏透露,硅基智能已经与国内知名MCN机构成立合资公司,深化布局接下来人工智能在直播电商领域应用。
司马华鹏表示,希望让AI学习头部主播如何选品、沟通、卖货、回答观众问题等技能,这些能力将在大模型学习下变成行业的通用大脑。
行业通用大脑一旦形成,势必会提高国内电商的开播率。 现在国内电商真正开播的商家并不多,因为没有长期稳定的优质主播,所以头部主播所在的公司容易形成行业垄断。因此, 硅基智能希望通过通用大脑,让所有数字人来完成同一水平的服务,实现服务平权。
在数字人直播方面,硅基智能和阿里、华为都有深度合作,同时也在行业里重点布局了自己的大模型。目前硅基智能AIGC数字人已经可以为全行业直播赋能,如跨境电商直播、本地生活直播、中小企业直播、乡村振兴等领域,通过提供一站式的人、货、场直播解决方案。
此外,数字永生也是硅基智能大力发展的一项数字人应用场景,主打情感陪伴、名人复刻,让亲人逝者数字化,还原出形象与声音,实时交互,云端陪伴。
据了解,硅基智能每年研发投入占比高达70%,并不断加大投入。同时立下两个目标: 成为第一家收入达到100亿的AI创业公司,以及利润达到100亿的AI头部企业。
司马华鹏也给出了实现这两个目标的时间表:“整体上,我们希望在2024年实现收入百亿,2025年实现利润百亿。”
创业者选择赛道,一定是基于对未来的判断。如同当初的马云对电子商务的笃定,司马华鹏也在早期对未来趋势有了自己的判断。
“我们对AI的定义就是硅基劳动力。” 司马华鹏表示。
2009年,司马华鹏在海外创业的初期,就曾经提出过未来的四大崛起,其中就包括硅基生命崛起。
基于此,司马华鹏坚定地走上了打造硅基生命这条创业路。
2017年硅基智能成立,并且成为全球第一家做出基于智能语音交互系统之上的电话机器人的企业,早于谷歌一年。 2019年还申请了全球首个AI数字人专利。
这一切都建立在创始人对交互模式和硅基劳动力的发展预判基础之上。
硅基智能数字人的定位是 基于知识传递和生命传递两个操作系统来重构现实世界的商业模式。
司马华鹏表示,从互联网诞生至今,全球操作系统会经过六大阶段:传递数据、传递信息、传递价值、传递体验,传递知识,传递生命。他认为传递数据、信息、价值和体验的操作系统已经有大量企业在做,但在知识和生命的传递方面,还没有一个统一的操作系统让我们像获取自来水一样轻松获取信息和知识。
未来,社会的知识储备会超过以往,知识和信息其实是一个东西,只不过知识维度更高。当下人类社会已经处于信息大爆炸的时代,在大量冗余的信息中,知识就显得弥足珍贵,所以需要更高层次的知识来帮助有效地理解和运用这些信息。
硅基智能将知识产业分为 存储、推理、创作、表达 四个部分。在知识的表达部分,硅基智能的投入和研发是最多的,这也是其整体定位的一大主要战略,并具有巨大发展空间。
全球“大模型”的诞生至爆发,让整个行业从惊叹中逐渐冷静下来,甚至连 ChatGPT的关注度也在减弱。
根据网站数据分析工具SimilarWeb数据,ChatGPT的访问量环比增长率从今年1月份的131.6%跌落至5月份的2.8%,6月更是首次出现下降,环比降幅达到9.7%。
什么样的大模型才是创业者和投资人值得关注的?
司马华鹏认为, 大模型会呈现多模态发展趋势。 大模型的多模态并不是图像、文本、声音等信息的简单融合,而是类似于人类快思考+慢思考进行决策的“智能决策链”。
依据目前的LLM水平,适合作为控制器用来理解用户需求,“审时度势”的思考,结合多个子模型系统,将用户任务分解为任务规划、模型选取、任务执行和响应生成等步骤,进而触发一系列动作的执行。这些不是只做一个通用语言大模型就足够的,是由大量的AI Agents组成的,是一次软件2.0的升级,也是中小企业的机遇。
在司马华鹏看来, 大模型时代将是基于通用脑和行业脑的协作而发展的。通用脑作为底座,行业脑与通用脑协作实现组织的超级数字化转型。
2023年5月28日,硅基智能发布了 “炎帝大模型” 。据了解,炎帝大模型加持下的数字人,支持根据文本内容调整自己的表演情绪,可以根据视频学习别人的动作。目前硅基AIGC数字人直播已达到每日5万场的常态,为客户每天创造数亿销售收入。
事实上,在大模型的落地场景中,数字人并不陌生,甚至还出现了口碑两极分化的情况。
有直播行业从业者质疑“数字人主播”称霸全网的时代还远远没有到来,当下的火热无非是代理商在割直播行业的“韭菜”,而另一种声音则认为“数字人主播”是行业的未来,也终将取代真人主播。
司马华鹏这样描述硅基智能炎帝大模型的独特性:“不同于传统的ChatGPT类通用大模型,炎帝大模型是一个多模态的行业脑。 它不像ChatGPT那样生成文本,而是生成短视频、直播、电影,甚至生成一个人陪伴你。 这一切不是为了挑战ChatGPT,我们也会利用GPT4以双引擎状态完成AIGC视频、直播生成。我们和它们是合作而非竞争的关系。”
根据文本内容调整后生成的表情、动作、声音、情绪,都会无限接近人类,很快就可以达到以假乱真的程度。
硅基智能还推出了基于炎帝大模型下,可以拍电影、电视剧的数字人产品,这是继2019年首创AIGC数字人模式,发明数字人直播之后,又一次产品技术的跃迁。
在硅基智能成立之初,司马华鹏就设立了2025年为全球提供1亿硅基劳动力的目标。目前,硅基智能正在朝着这个方向稳步迈进。
企查查信息显示,硅基智能成立不到一年,已经获得两轮融资,分别来自和君资本的天使轮和360集团与澎湃资本的Pre-A轮融资;2018年完成三次融资,分别来自招银国际、中财投资,以及红杉中国的两次参与;2019年实现了B轮和B+轮融资,分别由腾讯和招银国际完成;2020年数亿元的C轮融资,来自海松资本、国新央企运营投资、腾讯资本、浦信资本;2021年招商国际领投,中财投资跟投,硅基智能完成第九轮超千万元人民币的战略融资。如今估值已近10亿美元。
此外,硅基智能方面告诉小饭桌,硅基智能接下来将会利用数字永生,在全国做一个较大的公益项目,去复活许多重要历史人物,会广泛应用在博物馆、图书馆等场景中,达到数字永生的教育与公益目的。
未来,数字人还可以弥补教育资源不足、人口红利消失造成的劳动力短缺,实现医疗平权、服务平权。