在国内大模型竞争愈发竞争激烈、难落地的当下,智谱AI的模式有什么特殊之处?以及被资本追捧的它能给中国大模型带来哪些不一样的思考?
作者|斗斗
出品|产业家
对于智谱AI而言,很长一段时间里,“众星捧月”这个词再合适不过。
前段时间,智谱AI的最新一笔融资再次引发了广泛关注,成为万众瞩目的焦点。公开信息显示,新一轮融资金额超过 25 亿元人民币,加上前几轮融资,智谱AI市值已经突破百亿。
更值得注意的是投资方的豪华阵容,包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss 直聘、好未来、红杉、高瓴等多家机构,以及包括君联资本在内的部分老股东跟投。
在这场“百模大战”中,智谱AI无疑是被寄予众望的一个。
然而,值得注意的是,就目前来看智谱AI能商用的ChatGLM3只有6B版本,对标GPT 3.5商用高参数版本仍有距离。尤其是在阿里正式开源72B参数模型之后,智谱亦会面临不小的压力。
一些值得思考的问题是,智谱AI的优势究竟是什么?未来发展的想象力在哪?以及其目前面临的一些问题下,如何解题?挖掘其频繁融资的另一面。
一、百亿估值,凭什么?
从3月份开源第一代到现在7个月之后迭代到第三代,智谱AI发展十分迅猛。
在最新发布第三代基础大语言模型ChatGLM3系列。官方表示该模型的性能较前一代大幅提升,是10B以下最强基础大模型。
具体来看,按照MMLU排序,在所有规模的模型对比下,ChatGLM3-6B得分排序第9,但是前面8个模型最小的也是140亿参数规模的Qwen-14B,如果按照GSM8K排序,ChatGLM3-6B-Base甚至排到第三,超过了GPT-3.5的57.1分。
可见,智谱AI赶超OpenAI不是空穴来风。
想要深入挖掘智谱AI的优势,就不得不从国产大模型发展、落地的诸多难题讲起。
一项新技术的价值几何,商业化变现是最直接的检验方式。在国内一众大模型厂商中,可以说大部分都还处于讲技术、讲发展的阶段。对于商业化落地,基本处于一个探索阶段。
而智谱AI早在创业前就已经服务B端,目前客户已经超过1000家。可见其产业落地、商业化变现更有前景。
大模型落地又一个极为重要的前提,便是数据安全。智谱AI 作为国内唯一全内资、国产自研的大模型企业,它推出的 GLM 国产芯片适配计划,面对不同类型的用户不同类型的芯片提供不同等级的认证和测试,可真正实现安全可控。
这个优势,从某种意义上可以完全俘获央国企以及有特殊要求的大型企业。“国企央企,想做模型能力或者接入,智谱都是无论如何都是绕不开的选项。”某业内人士对产业家说。
此外,还有人的因素。在一级市场,早期投资就是投人,这一点在所有初创公司都适用。智谱AI的“前身”是清华KEG(知识工程实验室),CEO张鹏本科毕业于清华大学计算机系博士;董事长刘德兵师从高文院士,曾任清华数据科学研究院科技大数据研究中心副主任;总裁王绍兰为清华创新领军博士。
总体来看,智谱AI具备了落地经验、人才完备、资金充足、技术到位等天时地利人和的条件。这种条件也使其在一种大模型厂商的赛跑中,率先脱颖而出。然而这只是表象。
路径选择上,不同于比较主流的 GPT,智谱 AI 采用的是 GLM,智谱AI提出了全新的GLM(通用语言模型)路径。训练效率比GPT更高,也能理解更复杂的场景。
在大模型落地层面,其没有选择推出行业大模型,而是说服行业客户在通用大模型基座上做微调。在CEO张鹏看来,只有一定规模的通用大模型,才能实现类人的认知能力涌现。
此外,为了提高大语言模型作为AI Agent的表现和能力,清华大学和智谱AI推出了一种新的方案——AgentTuning,可以将有效增强开源大语言模型作为AI Agent的能力。
智谱AI获得资本和互联网巨头青睐的原因,不仅仅是因为其技术,更在于其在路径、模式、策略上的选择,以及对自身大模型底层定位的明确。
用CEO张鹏的话来说,智谱AI的全线产品与 OpenAI 的产品已经做到了对标。
那么,就当下而言,除了被验证的路径和模型,智谱AI有没有其它待完成的拼图?
二、商业化、AI开源和避不开的资金
通过智谱AI商用授权的模型版本来看。目前仅限于6B,即60亿参数。而从OpenAI开源模型来看,GPT-3 为具有 1750 亿参数的自回归语言模型,OpenAI 已将其部分开源;GPT-3.5具有 1375 亿参数,同样有一部分已经被开源。
更值得注意的是,阿里最近也开源了72B参数的模型。要知道目前的大模型应用,多处于大力出奇迹阶段,更大的参数,意味着更好的落地效果。
可以发现,虽然智谱AI作为国内第一开源大模型,有着较强的技术架构,但对标OpenAI以及国内大厂商业授权的模型规模上来看仍有一些距离。且随着阿里更大参数的开源模型发布,智谱AI在6B模型上的优势或将变弱。
而想要补齐这个短板,则需要大量的资金支持。
“如果智谱AI背后也能有一个像微软这样的金主,会十分亮眼。”某业内人士对产业家直言。
事实上,随着智谱AI大模型能力持续提升,训练参数自然也需要提升,对算力、存储等需求也会增加。这在资金上以及资源调度上将会是一个巨大的难题。
粗略来看,私有化部署一个130b规模的大模型,一年费用接近4000万,但这4000万花出去能带来多少价值,却是一个未知数。在AI大模型部署方面,目前小企业付费能力弱,大企业要么自研,要么还处于了解、认知阶段,商业化落地较难。
资金从哪来,是一个亟待解决的问题。
“智谱开源6b模型有一部分原因是为了告诉市场,我这有更好的,看你愿不愿意花钱。”某业内人士对产业家说。对于智谱AI而言,开源6B展示实力,以及拉投资是较为明显的解法。
而另一个解法,则是扩大“朋友圈”。
众所周知,互联网巨头在计算、存储能力以及数据资源方面有着较大地优势。而对于智谱AI而言,这些都需要其投入大量的资金去搭建。与巨头的合作,可以很大程度上降低研发成本、提高研发效率。此外,智谱 AI 还可以借助云厂商的市场地位和渠道,推广自身的人工智能技术和服务。
另一边,由于大模型需要部署在云上,按照数据运行付费,越多的用户使用模型和资源,对云算力的需求量就越大,云厂家的收入也就随之增加。且云厂商则可以借助智谱 AI 的技术实力,提升自身在人工智能领域的竞争力。
总体而言,对于云厂商而言,可以拉动自身云收入;对于大模型厂商,可以减少基础设施的投入,可谓一石二鸟。
目前,智谱AI已经与阿里、腾讯、美团等企业展开一系列合作。
从这点来看,智谱AI之所以“众星捧月”,更在于其开放、融合的商业模式,在国内大模型竞争愈发竞争激烈、难落地的当下,智谱AI的模式更能推动大模型的落地以及加速大模型生态的发展。
智谱AI的这种模式,也为其自身以及国内大模型未来的发展业态带来了一些新的想象力和思考。
三、国产大模型未来在哪里?
“模型能开除一半人,企业才会考虑用。”在与某行业人士的沟通中,其表达了对当下大模型商业化路途之远的观点。
客观来看,目前国内大模型的业态,属于百花齐放,已经开始出现同质化的特征。这不仅会造成算力等基础设施的非合理化使用,更或造成非良性的竞争。
目前,大模型落地进程较慢,加上仍旧如春笋般往外冒的大模型创业热潮,必将产生大量泡沫。对于国内大模型厂商而言,以生态之力,各司其职推动大模型商业化落地,无疑是一个最佳选项。
事实上,目前国内外主流大模型在算法层面尚不存在代际差,但是在算力和数据方面存有差距。
通过大力支持通用领域国内头部科技企业研发自主可控的国产大模型,同时鼓励各垂直领域在大模型基础上,利用开源工具构建规范可控的自主工具链,既探索“大而强”的通用模型,又研发“小而美”的垂直行业模型,就可以逐渐构建基础大模型和专业小模型交互共生、迭代进化的良好生态。
在大模型生态愈发完善下,也将带来一些新的变化。
首先是模型质量的提升。随着技术的进步和资源的投入,未来的大模型将具有更高的精度、更强的理解能力和更广泛的适用性。这不仅意味着它们能够更好地理解自然语言,还能够进行更多的复杂任务,如翻译、推理、创作等。
其次是更丰富的应用领域。除了传统的文本处理之外,大模型也将在语音识别、图像生成、视频理解和推荐系统等领域发挥更大的作用。这意味着我们可以在更多的场景中享受到AI带来的便利。
此外,未来大模型将更加定制化,能够更好地满足用户的个性化需求。用户可以根据自己的实际需求选择合适的模型,并进行定制化配置。这将使用户能够更加灵活地利用大模型来解决自己的问题。
在大模型生态中,数据将变得更加共享和开放。机构和企业之间可能会加强合作,共享优质数据资源,从而促进大模型技术的发展。这种合作将为大模型的开发和应用提供更加广阔的空间。
新的科技浪潮袭来,就必然需要一些企业承担一些使命。着眼当下,技术架构是大模型走出来的重要标准;遥看未来,想要站在AI大模型浪潮之上,生态构建力愈发重要。