当前位置:首页|资讯|汽车|ChatGPT

专访思必驰:DFM-2百亿级大模型主攻汽车、物联网等行业,将持续推进IPO

作者:36氪发布时间:2023-07-27

原标题:专访思必驰:DFM-2百亿级大模型主攻汽车、物联网等行业,将持续推进IPO

作为一家16岁AI公司的董事长,思必驰创始人高始兴在今年初第一次使用ChatGPT时依旧难掩惊艳,“至少,发言稿可以不用专人写作了。”

然而,伴随惊艳而来的,还有当时外界对几乎所有AI公司的质疑。

大模型走红后,不论是计算机视觉、语音识别,亦或基于垂直任务的自然语言理解,都被统称为“上一代AI”。在36氪今年的交流中,就有好几家“上一代”AI公司坦言面对新技术倍感压力。

对比之下,虽然思必驰也属人工智能语音语言公司,高始兴的内心却没有过多波澜,“我们比较早就布局了这一技术。之前十亿级的模型已经用在产品上,只是没有对外强调”。

据介绍,思必驰十亿级参数量的模型,名为DFM-1,于2022年研发推出,在ChatGPT还未火热的2022年已进行了小规模产品应用。而在7月的发布会上,思必驰又新推出了DFM-2大模型,参数量达到百亿级别。

除却已有布局,高始兴对思必驰的信心,还源于大模型的技术路线和场景积累。

对比其他模型,DFM-2在技术上强调对话交互能力,在场景中强调专业化和行业化。

思必驰联合创始人、首席科学家俞凯专门厘清了几个概念,“通用人工智能,必须要大模型加上语言计算才行,否则只是专用大模型。而在此基础上,通用大模型还分全域和垂域。”而语言计算,恰好是这家对话式人工智能公司的擅长所在。

俞凯解释,大模型概念由来已久,包括 AIphaFold 蛋白质折叠、Stable Diffusion 图像生成大模型到 Whisper 语音大模型等,但都没有引起产业广泛重视。直到对话式语言大模型 ChatGPT 的出现,展现出语言计算与大模型结合所达成的通用人工智能效果。俞凯笃信,“对话式语言计算大模型”,是认知领域通用人工智能发展的里程碑。

基于大模型和语言计算技术,思必驰的百亿参数模型选择落地垂直行业,而非全域。俞凯认为,目前To C领域,生成式AI已经跨越生产力门槛,但在To B领域,对大模型的数据和经验的要求都非常高。

思必驰的百亿大模型将主要聚焦汽车、物联网等行业——也就是这家公司早前已深入的领域。以汽车为例,据介绍,自2019年正式进入汽车前装,思必驰的产品目前已“上车”600多万辆。

“汽车和物联网领域是思必驰的主要业务领域——服务于汽车、家电等智能化,同时,也赋能垂直行业的信息智能化,如金融、政务。”高始兴表示。

但即便对所选行业已有积累,高始兴依然不否认大模型落地到具体垂直行业场景的困难。在他眼中,现在思必驰的百亿大模型“还不错,但依然有提升空间”。尤其,在汽车和家电等物联网领域,产品类别非常多,各种复杂场景下各系统的融合,都需要差异化方案——这种情况下要用好大模型,势必是一场长期战。

而在回答大模型是否会促进IPO的提问时,高始兴坦言,思必驰会在今年或明年继续启动上市,而大模型是否会对此有促进作用,还是要看产业落地。

“我们的主战场针对几个重点垂直行业,如车联网、IOT以及金融政务等。这个方向,思必驰在技术、资源和客户各方面都有积累。”他总结,“思必驰是一家比较踏实的公司。”

以下是对话部分(经节选):

36氪: 思必驰是什么时候开始考虑做大模型的?而且是大模型加上语言计算的概念?

高始兴:语言模型和人机对话,确实是我们首先提出的理念。我们是中国最早做对话式人工智能的公司之一,甚至可以说是首个引入这一理念的公司。

思必驰的联合创始人俞凯曾经参与创办过一家人机对话公司,后来被苹果公司收购,所以我们在人机对话方面的经验非常丰富。而在语言模型方面,我们已经做了三四年了。思必驰实际上很早就发布了十亿级别的模型。

36氪:这次发布的DFM-2百亿模型是什么时候开始做的?现在的进展是?

高始兴:我们的百亿级模型在四月份开始内部测试,现在已经开始与一些客户进行落地应用。

另外,思必驰的模型更加深扎行业。B端和G端与C端有很大不同,我个人认为,或许应该由国家来做这些能够覆盖各种生态的大模型,因为这应该是国家的基础设施。对思必驰来说,行业更应该是我们模型所深耕的对象。技术型公司应该深入到行业场景中去做技术创新,做产业应用。所以,我们的百亿模型的定位是具有一定的通用能力,然后深入到行业中,服务于行业的垂域模型。

36氪:思必驰怎么看生成式人工智能和大模型?

俞凯:今天我们讲了大模型和通用人工智能。生成式人工智能其实是诸多人工智能中的一类,它可以不是大模型,也可以不是通用的,而且在人工智能领域早已存在。现在的关键变化是,生成式人工智能在图像、语音和文字生成的多样性和质量上已经到了一个突破性阶段。

从产业上看,现在生成式人工智能在To C领域跨越了门槛。但如果是在To B领域,情况可能会有所不同。C端和B端的需求不一样,在To B领域,判别式人工智能的问题,生成式人工智能同样会面临。判别式人工智能关注正确与否,生成式人工智能更关注好与坏。然而在To B领域,即使是生成式人工智能,正确与否也非常重要。

对于我们来说,巨大的机会在于,生成式人工智能已经过了门槛,它可以作为辅助工具,与现有的商业模式结合来扩大应用。但是,出现一种全新的、纯技术的生成式人工智能被大规模复制的可能性是相当小的。

因此,在我看来,既没有那么乐观,也没有那么悲观。我不认为现在的生成式人工智能能够改变世界,但我相信,它会扩大我们的工具使用范围,并促使我们将人工智能系统更全面地应用到工作中。

36氪:大模型是否会对To B行业过去的部署应用产生影响?

俞凯:会有一部分影响,但我认为影响比较小。这个事情特别容易判断,举个例子:

假设你是一名不了解To B业务的媒体工作者,我把你派到一个制造工厂,你能否在一天之内完成那里的工作?如果能,那么这项工作肯定可以被ChatGPT或其他通用人工智能复制。如果不能,那么所有的积累都是有价值的。这件事的重点并不在于你生成了一些文案,而是你对整个知识流程的精确理解非常重要。

然而,你要如何获得这种精确的理解呢?要么需要有数据,要么需要有人教你。但如果你没有和厂商合作,没有处在这个垂域内,怎么可能有这些呢?所以行业的数据和经验是非常重要的。因为它无法代替人的经验和繁琐的to B流程,因为在to B领域评价指标是多维且复杂的,这些无法被通用人工智能简单替代。

36氪:目前思必驰大模型所重点关注的行业是?

高始兴: 我们主要关注汽车和物联网领域,这与我们的主要业务——汽车、家电智能化,行业信息智能化息息相关。对于垂直行业,如金融,我们也在做智能外呼等项目,像公安的智能审讯和反诈骗等也有。

我觉得我们目前也承载不了太多行业,而且要把几个垂直行业的赋能做好,也是一件非常了不起的事情。

比如在汽车、物联网领域,产品类别本身非常多,成千上万。而且,其中有的场景需要本地服务,有的需要云端服务,有的需要本地与云端结合才能做出好的端到端的人机交互体验。

在这之外,还有各种系统融合、声学环境等需要考虑。实际上,我认为如果不深入到行业中,是很难做好的。我们必须理解场景,而这些场景实际上非常复杂。

汽车领域思必驰从后装到前装,做了八到九年的时间,才做到现在的程度。我们已经做得相当好了,比上一代的语音控制技术已经进步很大,但还有进步的空间,东风大模型将会带来新的体验升级。

36氪:比如说还存在怎样的进步空间,有具体的例子吗?

高始兴:未来,我觉得汽车一定会有无人驾驶,它(大模型)就是你的驾驶助手、汽车空间的生活娱乐助手。你问它任何问题,除了常见的汽车控制等问题外,其他任何问题都可以回答你,像汽车工程师。车里也是一个生活娱乐空间,车内学习、办公等等都可以实现。

36氪:比较像现在流行的"副驾驶模式"。

高始兴:对,一定是这样的。我们实现了很多创新发布,如多音区人机对话,我们在这里不仅结合了人机对话技术,还结合了一些声学技术。无论你在车内的主驾驶座位、副驾驶座位还是后排座位,都可以进行人车交互。

有了百亿大模型之后,之前的产品就像大脑更聪明了一样。在车内,现在的人机对话还无法让它成为你车内的说明书。大模型之后,你可以问它关于车的任何问题,无论是维修问题,还是其他的问题,都能回答你。这就是一个例子。更高级的场景,你在车内,它就是你的助理,你可以通过人机对话进行订票、订酒店,一站式的服务。我们期待大模型可以像一个智能助理一样,更好地理解和与人交流。

36氪: 现在我们内测的效果怎么样?

高始兴: 还是很不错的,也还有提升空间。因为这涉及到很多方面,不仅是技术性能的提升,真正的落地还需要结合我们在垂直行业中的经验,结合这些场景进行优化,这不是一朝一夕可以完成的。比如刚才提到的让大模型消化、吸收产品说明书,就需要我们和汽车制造商一起合作。

36氪:思必驰今年还会启动上市吗?大模型会对这件事产生怎样的影响?

高始兴:我们肯定会启动上市,但不一定在今年,有可能是明年。至于大模型是否有促进作用,我觉得核心还是要把业务做好。大语言模型只是我们一个工具,我们一直在做人机对话语言模型,最终还是要产业落地。

36氪:作为一家准备IPO的公司,财务状况也非常重要,但训练大模型是一件比较贵的事。

高始兴:是的,训练大语言模型是很贵的,但好在我们过去有积累,包括人机对话的语料积累,语言模型技术的积累,以及早期购买的计算资源。

对思必驰来说,首先,这是必须要做的事情。其次,公司能承受。我们已经有了对话语言模型的技术和数据,所以这就是一个投入的问题。我们早期也有了GPU算力和超算中心,苏州政府也给了我们很多支持。

36氪:对于大模型的投入产出比,思必驰有什么预期吗?

高始兴:我觉得效果是陆续显现的,其实并不一定仅从C端直接收费。比如,如果我们的B端产品升级,用户体验好了,自然B端客户就会有源源不断的升级需求。当然我们大模型也有直接的C端用户。

整体来说,思必驰的大模型主要服务于"沟通万物、打理万事"的理念,主战场是针对特定行业,如车联网、IOT以及金融政务等,构建具有通用能力的行业专业模型。对于这件事,我们在技术、资源和客户各方面都有积累。思必驰还是一家比较踏实的公司。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1