机器之心原创
作者:吴昕
对于 AI1.0 时代的企业来说,他们关注大模型的成功,其实是关注背后基础算法的作用,将基础算法和先进理念应用到自己服务的行业和产品当中。对于创新奇智来说,平台固然重要,但长远来看,面向行业的纵深更为重要。
ChatGPT 热潮持续不断,一场接一场的密集发布事实上都在回答同一个问题:
ChatGPT 来了,跟还是不跟?如果跟,怎么跟?不跟,又意味什么?
4月13日,中国最大的「AI+制造」解决方案供应商创新奇智在其位于中关村的公司会议室举办了一场媒体沟通会。公司 CEO 徐辉详细介绍了2022年财报业绩高速增长的驱动力以及公司 AI2.0 时代的战略布局。会上,面向制造领域的 AIGC 产品「奇智孔明」 AInnoGC 也首次亮相。
在现场实时操作中,我们与「奇智孔明」围绕智造实训、工业软件两大主题展开对话,后者还小露了一手样本生成能力。
目前「奇智孔明」仍处于内测阶段。公司明确表示,「奇智孔明」主要面向以制造业为主的垂类场景,实现更多 2B 的商业化需求。
一、初见「孔明」
AInnoGC,中文名叫「奇智孔明」,是一个以工业预训练大模型为核心的生成式 AI 工程算法引擎,能够生成高质量的垂直于行业(或企业)的内容,也是创新奇智第一款 AI2.0 产品。
我们希望通过这个算法引擎将生成式能力带到产品解决方案中,让不同细分行业(或企业)都拥有自身数据的 AI 生成能力,创新奇智 CTO 张发恩说。
创新奇智的人工智能技术栈。目前 AInnoGC 是规划在 cloud 上的技术组件或者是技术引擎。MMOC 是一个软件平台,算法可以插进去,因此,AInnoGC 目前定位是 on cloud。
围绕制造业打造的产品解决方案通常可以分为两类。一类涉及产线运营效率提升,比如工业质检。
另一类叫做企业信息智能,信息和知识密度比较大,也和结构化数据有关,非常适合大模型的应用。我们现场测试了「孔明」的两个主要能力——智能实训和工业软件——都属于这类情况。
先来看看智能实训。我们先站在培训老师的角度,要求「孔明」准备一份为期三天的汽车厂家的培训大纲,完成速度很快,内容安排老练周到。
接着,我们又改变主意,希望将培训方案时间改为七天:
制造业虽然积累了很多数据,但传统工程师通常不会写程序利用这些数据。如果工程师想知道如何使用人工智能方法实现机车尾部和吊钩识别,问问「孔明」就知道了:
如果想不起实现目标检测的代码,「孔明」也能帮上忙:
新入职的新手工人也可以通过自然对话更快了解工作相关的内容:
除了智能实训,在工业软件方面,「孔明」能够做些什么呢?
目前国内工厂的数字化已经达到一个比较高的水平,每一项生成步骤都有相应的数据产生并且记录再工业软件上,比如业务数据、物流数据、管理数据、财务数据等等。但数据越多并不意味着洞察业务更方便,现在,仅凭对话就能立刻获得不同管理者想要的表格,节省了大量配置报表的工作。
你看,要求「孔明」生成某工厂 2022 年员工出勤率与离职率的统计表格,它也做得不错:
目前,智能实训和工业软件的应用正处在客户 POC 阶段。除此之外,我们还尝试用自然语言让「孔明」生成一张硅片瑕疵图片样本,结果,也成功了。
我们测试过,据张发恩介绍,新生成式算法生成的图片比利用对抗生成网络生成的图片,在泛化性和多样性方面都会好很多。通过扩散模型生成样本的效率也更高一些。
仔细观察,不难发现这两个应用场景的选择都非常巧妙。
比如,智能实训的经济效益和社会效益都很好。大学生毕业进入企业需要接受培训,资深产业工人另谋就业或者转型也需要接受新的职业培训。传统工程师也要与日益普及的软件打交道,了解编程知识。对于模型来说,这种不受时间、地点限制,可 7×24 小时交互意味着源源不断的反馈和数据供给。
这些数据不如产线上的数据要求严苛,对于培训来说已经够用。实训场景对生成结果也有一定包容性。随着闭环的形成,数据反哺并不断提升模型能力,平台越来越精准,累积的数据也会逐渐变成信息资产。
工业软件也是。将 ERP、MES 等不同业务系统的数据拿出来,根据不同的人的关切程度按需生成各种分析报表,辅助决策,同时也是在做数据和信息资产的积累。
精选两个场景,切开入口之后,公司还会一步步往外推开。创新奇智认为 AI 生成内容能力在很多工业场景中有大的发展空间。比如,样本甚至标签生成、站在工厂规划角度,智能产线设计、自动排程等也有很大的潜力。
公司的产品货架上过去有「软硬兼施」,有运营效率,未来还有信息智能甚至更多,这样一个全方位的管家服务,将帮助公司更加深度地黏住企业客户。
二、技术与商业:「孔明」背后的大模型逻辑
据介绍,技术路径上,计算机视觉和自然语言处理技术其实同宗,创新奇智的工业预训练大模型也使用了 Transformer 架构。
可以确定的是,面向行业和面向客户的预训练大模型会成为一个必然需求。张发恩也反复强调,参数数量不等于模型能力,模型的规模大小并那么重要,重要的是模型的能力。
如果说 ChatGPT 是一个受过大学教育、具备通识知识的人,那么,他要在智造领域有所作为,还要接受专业培训。创新奇智的工业预训练模型更加面向 B 端制造业,领域知识体量没有通识那么大,目前也不需要比肩通用大模型的参数规模。
我们会更加关注服务和经济效益上的能力,我们会更加务实。张发恩说。
在大家颇为关心的算力问题上,虽然公司没有几万张 GPU 卡,「但我们还是有算力规模能力的,五年下来还是积累了一定数量的 AI 算力。」徐辉在沟通会上透露。
目前,创新奇智也在利用一些先进技术(例如 LoRA)对算法进行优化,让大模型在小算力的情况下依旧可以运行。
对此,张发恩进一步解释道,GPT3.5 有 1750 亿个参数,用了几千张 GPU 卡训练了几个月。但同样规模参数的大模型,训练精度和所需算力水平其实在快速下降。
这就像第一次做一个产品,交付周期也长,人工打造的也多,往后批量的时候,周期和成本都会往下降。技术界也是一样,同样规模模型能力,可能只需要原来算力的几十分之一就能做到。「对于这一块儿,我们相对表示乐观,所以不去军备竞赛。」他说。
与其一味追求模型的规模,创新奇智更愿意强调工业预训模型的领域性和私有化部署,模型的成功离不开大量专业数据和 know-how 的积累。
通用的预训练大模型,例如 ChatGPT 不能有效解决行业中大客户对大模型的专属需求,训练时使用的数据也是公开的互联网数据,大模型内部并不含有行业的或某大客户内部业务数据知识。尤其是,对于各个细分领域的巨头来说,数据——无论是经营数据还是生产数据(比如工艺、成分、流程)——都是公司的商业壁垒。
你很难想像华星光电或者中石油会把数据拿给别人训练,它只会建立自己的大模型技术。因此面向行业和面向客户的预训练大模型,私有化部署会成为一个必然需求。
与此同时,制造业又是一个行业 Know-how 极强的领域,每个细分领域都有自己的知识,在智能化过程中,每个相似的环节都需要根据对行业know-how 重新设计。这些知识是通用大模型没法凭空生的,只有深耕行业服务的公司才能设计出针对工业的大模型。
如果说工业预训练大模型构成「奇智孔明」的核心,那么,在它之上还有四个关键技术组件:Fine Tune Service、Prompt Service、Instruction Service,以及 Model Service。
比如,Fine Tune Service 代表着我们会在模型上做微调,让模型具备能理解客户私域信息的知识。张发恩解释道,这些客户的数据当然是私有的,领域的数据,训练到一个给客户专门部署的模型中,不会留在我们这一侧。
为了加速模型迭代,Prompt Service 有助于提升企业客户与模型合作效率,生产更符合需求的结果。
不过,不管如何强调垂类行业的大模型无法比肩通用型的规模,投入成本之大仍然不容置疑——模型大、适配困难,训练一次的时间和电价成本都不低。这部分成本需要服务商选择合适的对象去摊薄,这就要求产品一方面上量,另外也要有一定的购买力。
我们在创新奇智 2022 年财报中也找到了答案。目前,公司制造业务板块聚焦于「钢铁冶金、面板半导体、3C 高科技、工程建筑、汽车装备、能源电力、食品饮料&新材料、智造实训 」8 个细分领域。
客户数量也从 2021 年的 159 家增加至 2022 年的 292 家。其中,制造业的客户数量从 2021 年的 93 家增加至 2022 年的 221 家。
创新奇智将年收入贡献 450 万以上的客户称为优质白金客户。精耕细作优质白金客户,是公司持续获得客户粘性和收入成长的重要方法。2022 年,公司优质白金客户收入从2021 年的 7.99 亿元增长69%,达至 13.5 亿元,其中,制造业优质白金客户贡献的收入由 2021 年的 4.13 亿元增长至 2022 年的 7.92 亿元,增长比例为 92%。
事实上,公司研发「奇智孔明」的驱动力也有一部分来自客户。ChatGPT 很好地教育了 AI 圈外的人,公司客户会主动找到公司要求他们提供一些服务。
我们逐步研发工业预训练模型,徐辉表示,在制造业和金融领域选择客户和场景,做联合应用落地探索,利用 AIGC 去做一些更落地、切实际的应用和企业服务。希望借助工业预训练大模型,积极开拓增量市场,更深刻地服务制造业客户,也进一步提升为客户降本增效的能力。
三、「横」与「竖」,如何拥抱 AI2.0?
如果将 2018-2022 定义为 AI1.0,这五年来人工智能遍地开花,却未形成真正的智慧。除了客户接受程度有限,也因为技术部署的时间和经济成本都比较高。
即便如此,创新奇智仍取得了亮眼业绩。财报显示,公司在 2022 年营业期内收入15.58亿元,同比增长 80.9%;毛利额达 5.07 亿,同比增长 89.7%;毛利率 32.6%,同比增长 1.6 个百分点。
「AI+制造」为公司第一大业务板块,收入人民币 9.48 亿元,同比增长 111.2%,营收占比从 2021 年的 52.2% 提升至 60.9%。
徐辉在沟通会上表示,对公司未来业绩增长表示乐观,也坚信 AI 行业一定会走向正循环。
不过,值得注意的是,目前中国制造业的 AI1.0(以卷积神经网络 CNN 为代表)普及率可能仅有 10% 左右,因此在未来相当长一段时间里,1.0 版本技术普及仍然是创新奇智营收增长的坚实支柱。
财报也提到 2023 年将积极布局 AIGC。对自己在 AI2.0 时代所处的位置,创新奇智一直有着清楚认知——术业有专攻,我们特别适合做大模型技术的行业应用。
面对这样一个一半火焰一半海水的时代机遇,「我们给自己的定位是坚定去做运用大模型技术的行业应用的公司。」徐辉说,扬己之长,做好大模型技术应用的创新旗帜。
而对于做平台的那一「横」,徐辉认为最后逻辑上会有非常先进的大模型平台公司,中国也会有。
长远来看,横非常重要,未来有更多的纵深一「竖」更重要,正所谓宝剑锋从磨砺出。
有人发明了电和冷冻技术,非常伟大,人类深受其利。但谁赚到了更多的钱呢?是那些将电和冷冻技术运用到不同场景的人,比如将电和冷冻机结合起来造出冰箱、冰柜的人。
还有谁比造冰箱、冰柜的人赚得更多呢?是可口可乐,因为它改变了人类的生活方式。