AIGC,人工智能的iPhone时刻。
作者|赵健
ChatGPT给各行各业所带来的深远影响,远非其本身的产品形态——一款足够智能的聊天机器人那么简单。
此时此刻,嗅觉敏锐的科技公司已经开始将AIGC(AI Generated Content,AI生产内容)能力集成到产品中去了。
在海外,Salesforce近期推出了Einstein GPT,这是全球第一个CRM生成式AI,同时设立2.5亿美元——迄今为止规模最大的AIGC风投基金;谷歌近期宣布将AIGC能力整合进办公套件Workspace,微软宣布将GPT-4植入Office办公软件,该功能名为“Microsoft 365 Copilot”。
在国内,动作快的科技公司也开始布局了,比如数睿数据将AIGC引入其企业级无代码软件开发平台。
无代码开发是过去两年to B市场的风口之一,它对过去的传统软件开发带来了颠覆性。在AIGC的加持下,从无代码搭建到用AI生成一个新应用的效率将提高100-1000倍,这将是一次新的颠覆。
对此,「甲子光年」采访了数睿数据创始人、CEO穆鸿,来探讨AIGC在无代码开发领域的机遇与挑战。
去年12月初,在看到铺天盖地的报道后,数睿数据创始人穆鸿在第一时间尝鲜了ChatGPT,同时让智能工程团队整理了一份详细的体验文档。因为负责公司的整体战略,穆鸿对技术的变化有很强的敏感性。
穆鸿发现,虽然表现得并不完美,但ChatGPT所展现出的“类人”的逻辑推理能力,还是让人大受震撼。
体验之后,穆鸿的心态很复杂。
就像很多人本能地担心自己失业一样,穆鸿的第一反应也是担心数睿数据自身的业务,是否也可能被ChatGPT颠覆掉。
数睿数据自己本身就是一个“颠覆者”。2016年,刚刚成立的数睿数据定位是一家大数据公司,通过数据工具帮助企业挖掘数据价值、实现数据驱动业务。在经过三年的探索之后,穆鸿发现仅靠数据工具还无法解决更源头的问题——数据从哪儿来?数据的价值到哪儿去?这些问题不回答,数据就无法真正发挥最大的价值。
2019年,数睿数据主动进行商业转型,从大数据公司向 “数据驱动的无代码开发平台”转型。
无代码开发——通过写少量代码或完全不写代码的方式进行软件开发,就像搭乐高一样“搭建”应用,本身就是对软件开发的一次颠覆。而ChatGPT所展现的AI生成内容、甚至生成代码的能力,会不会也是无代码开发的一次颠覆?穆鸿想搞清楚这一点。
与此同时,穆鸿也同样感到兴奋。AIGC是一次由底层技术变革而驱动的生产力范式转移,将AIGC与无代码开发结合,将会擦出巨大的火花。
AIGC并非一个新概念,但真正让AIGC产生逼近人类的创作能力——从文本、图片到视频,不过是最近十年间的事情。 数睿数据创始人穆鸿认为,AIGC之所以能在过去短短几年开始爆发,得益于“大模型”的发展。
2017年,谷歌发布了一篇具有里程碑意义的论文 《Attention is All You Need 》,描述了一种用于自然语言理解的新神经网络架构Transformer,它可以生成高质量的语言模型——具有更高的并行性计算,训练时间明显减少,可以相对容易地针对特定领域进行定制。
2015 年至 2020 年间,用于训练AI模型的计算量增加了 6 个数量级,AI进入大模型时代,并衍生出BERT、GPT、T5等不同的大模型路线。
大模型从过去只能处理单一任务进化到多任务处理,并且逐渐在手写、语音和图像识别、阅读理解、语言理解等方面接近甚至超过人类。
成立于2015年的OpenAI就是在此期间成长起来的,其最新发布的GPT-4,已经在GRE、模拟律师考试等人类模拟考试中取得前10%的成绩。
穆鸿表示,如果说7年前的阿尔法狗只是围棋爱好者对AI的能力产生了具体的感知,而今天的ChatGPT则是第一次让普罗大众都感受到了AI的革命性影响。
就像iPhone手机的诞生催生了一场移动互联网的革命,大模型的成熟也正在催生一场AIGC的革命。
如果问哪些公司能尽早参与到这场AIGC革命中,数睿数据至少不会是迟到者。
数睿数据的核心团队来自华为、360、阿里等世界五百强公司和互联网头部企业,在大数据与AI领域有很多项目的经验与技术积累。公司成立之初,穆鸿就把大数据与AI作为业务发展的技术驱动力。
2021年,数睿数据发布企业级无代码开发平台smardaten,并在年初成立人工智能工程部(现为智能工程部),为整个平台做AI赋能。智能工程部部长车文彬,从事人工智能与大数据分析挖掘相关领域研究数十年,先后在华为担任数据科学家,以及在360担任高级算法专家等职务。
“即使不能算软件开发行业最早涉猎AIGC的企业,我们也算是无代码开发领域最早布局AIGC的公司之一了。”穆鸿对「甲子光年」表示。
过去3年,数睿数据的智能工程部门在AI领域构建了一套覆盖增强分析、自然语言处理、机器视觉三大领域的产品体系。
第一步称为“SE(软件工程) for AI”,通过无代码的软件开发降低AI的使用门槛。
2021年,数睿数据基于无代码平台smardaten开发面向不同场景的应用,一些自动化、机器学习的能力被嵌入应用之中,即使是毫无人工智能算法经验的小白用户,也可以基于业务逻辑来享受到AI的便捷性。
比如,某证券公司需要对个股信息进行每日报道。由于报告信息大同小异,需要工作人员从数据表中查看相应的信息再填充到相应的模板中,整个过程耗时耗力。
数睿数据通过对用户提供的原始表格数据进行数据解读、功能解析,结合槽位填充生成股票简报。
第二步则是反过来——AI for SE。这一步的核心,是让无代码的开发过程本身也具备更加智能化的能力。
穆鸿一直有一个“公民化开发”的梦想,通过无代码的工具与平台,降低过去需要经验丰富的工程师才能做到的软件开发门槛,让业务人员也能更快地用起来,实现人人都是开发者。
比如通过NL2SQL(Natural Language To SQL) 技术,将业务人员的查询意图快速准确地转换为可执行的SQL查询语句,省去人工构造SQL语句的过程来提升数据查询效率;或者在构建大屏应用时,运用自然语言处理(NLP)技术来理解用户输入的问题,直接向业务开发者展现智能推荐的最合适的可视化形式。
在低代码、无代码领域的厂商通常可以构建四大类应用。
第一大类是管理型应用,也就是最常见的表单或者流程,代表厂商是OutSystems、Mendix、数睿数据。平台可以自动生成(或辅助生成)表单和业务流程。穆鸿认为,大约百分之二三十的厂商可以提供类似功能。
第二类是数据型应用,包括数据治理、数据中台以及数据交换共享等,一些厂商比如Tamr(美国数据管控解决方案商),在产品中会用到机器学习的算法来自动化数据处理。这个领域中,大概只有10%的头部厂商会提供类似功能。
第三类就是已经存在多年的BI,属于可视化应用,目前该领域比较火的概念是增强性分析,使用AI来增强数据可视化分析。
最后一类是运营型应用,有相对复杂的业务逻辑,需要写部分代码来实现,也会用到AI的能力,比如自动代码生成、补齐或者BUG发现。
穆鸿表示:“在这四大类应用中,基本都有在单点领域做到头部的公司,但还没有哪一家四个方面都做的比较好。我觉得数睿数据算是一家。”
一家公司的基因往往决定了一家公司的使命。核心团队过往的AI经历,以及智能工程部门三年以来的AI布局,让数睿数据更加从容地迎接这场AIGC浪潮。
ChatGPT的出现,让穆鸿开始思考AIGC与无代码在未来结合产生新的可能性。
数睿数据智能工程部前三年的AI探索,并非“颠覆式创新”,而是主要基于过去成熟的小模型技术(局部尝试预训练的大模型)展现出来的锦上添花的能力。虽然smardaten无码化组件日趋成熟,但仍摆脱不掉频繁的需求沟通、应用设计等环节。
未来AIGC的引入将打破这一常规,不再局限于过去的锦上添花,而是能够逐步改变软件应用的构建范式,以及将来应用本身的范式。
穆鸿告诉「甲子光年」:“现在的无代码构建应用是通过’拖拉拽‘的方式进行模块化搭建。但如果引入AIGC能力,用户只需描述想法,可以是语音、文本甚至图片,是不是就可以迅速地、自动化地把理想的应用构建出来?这是应用构建的范式变化。”
数睿数据已经在做类似的研究工作了。今年,数睿数据在AI层面的规划为“智能体验”,将AIGC融入数据、分析、应用三个核心能力体系,致力于打造适配smardaten的AIGC能力框架,来提高用户体验。
在数据领域,smardaten融合AIGC数据合成技术很好地解决了行业数据量少、数据安全系数低等问题,不仅可以有效保证数据安全,且可充分学习样本数据规律,缩短数据准备周期,使生成的数据“保质保量”。
在分析领域,结合smardaten可视化能力和智能分析引擎,AIGC辅助smardaten囊括常规数据分析、时空分析、根因分析、数据解读等多种高级分析能力,致力于实现对话式决策分析。
在应用领域,smardaten大屏不再停留于过去拖拉拽的形式,而是集成卡片化设计理念,通过实时交互、结合用户反馈,自动生成用户想要的大屏效果,实现“所说即所得”。
smardaten可提供大量解决方案作为AIGC的知识库,涉及智慧城市、工业制造、数字政府等数字化场景。 用户通过AIGC加持的smardaten平台,仅需提出需求,即可生成相应解决方案。
smardaten的易用性及智能化体验不仅局限于可视化大屏,还可以基于丰富的行业积累,利用AIGC快速构建符合用户需求的特色应用,满足个性化需求。只需要通过简单对话即可完成应用构建、流程创建及审批等,聊天机器人会自动解析语义,明确需求,与系统自动交互,打通数据完成所有操作。
除了应用构建的范式变化,AIGC还有可能改变应用本身的范式。“过去的应用界面都是表单、流程,未来还会是这样吗?通过类似ChatGPT的大模型能力,就可以实现你需要的功能。比如你要请假,直接对系统说一句’我要请假‘就完事了,你也不需要关注后面是否是一个请假系统,甚至不需要关注流程后面是否真的有一个软件。”
穆鸿表示,应用构建的范式改变短期就会实现,而应用本身的范式改变,可能还需要很长的时间。
此外,AIGC在2D/3D图像生成领域的能力也不容小觑。在穆鸿的规划中,smardaten还将融入AR/VR、数字人、数字孪生等技术,并结合AIGC能力,构建数字化模型,实现2D大屏转化为3D场景,通过手势与3D场景实时互动等能力,打造全新的可视化交互体验。
而如果把时间线拉到更长,数睿数据的长期规划则是做类似ChatGPT训练方式的“应用GPT”。
在无代码构建场景中,借助ChatGPT中的强化学习技术,通过不断学习各种开发行为,打造智能应用装配助手,在用户构建过程中针对逻辑编排、数据建模、样式设计等行为进行智能引导和配置建议,从而进一步降低开发难度。
smardaten基于各行各业解决方案与对应OA、ERP等系统的积累,作为数据训练出无码化组件的GPT模型,帮助用户通过对话轻松完成从需求澄清、业务设计到功能开发的一站式体验。
应用构建的GPT模型第一阶段将企业级系统拆解为对应的功能,结合系统解决方案、需求文档等材料,得到预训练策略模型。第二阶段通过设计人员、架构人员等协同评分训练回报模型使其学习到最佳应用生成方案。第三阶段利用强化学习生成优质的应用界面或流程。
这将大大提高用户做软件开发的用户体验,而基于AIGC的“用户体验”也是数睿数据智能工程部今年的核心命题。
将AIGC技术引入核心产品smardaten平台,并非数睿数据的最终目的,而是手段。
穆鸿一直在用商业视角看待AIGC所带来的技术变革的价值。
“数睿数据定位为数字化转型的最佳合作伙伴,本质是一家商业公司,我常要求团队包括要求自己,要思考技术的引进到底给客户带来什么价值。比如一个复杂场景的大屏应用,以前需要做2个小时,用了AIGC的技术之后,是否可以做到30分钟?到底要引进哪些技术,为客户提供哪些服务?如果客户不买单,技术的投入就没有意义,也不会长久。”
大模型给产业变革带来了蒸汽车一样的生产力,但也非常昂贵,并非所有的AI公司都需要从零开始研发大模型。
OpenAI CEO Sam Altman在和领英创始人Reid Hoffman的一次访谈中表示:“将来会出现几个大的基础模型,开发人员都基于这些基础模型研发AI应用。我认为,将来在基础模型和具体AI应用研发之间会有一个中间层,出现一批专门负责调整大型模型以适应具体AI应用需求的初创企业。能做好这一点的初创公司将会非常成功,但这取决于它们能在“数据飞轮”上走多远。我对初创企业训练模型的能力持怀疑态度,将来承担模型训练角色的不会是初创公司,但它们可以在上述的中间层角色中发挥巨大价值。”
数睿数据将自己定位成“中间层+应用层”的角色。穆鸿表示:“无论是平台、提示词还是工程优化,这些都算是中间层的任务,也正好是我们擅长的。同时,我们是做工具与AI出身,与应用场景连接紧密,公司本身也在开发一些应用模板或组件,我们的最终目的是要把技术更快地应用到客户场景中去。”
而在底层的大模型,数睿数据则倾向于直接与大模型公司合作,或基于开源项目(比如GPT-2)做研发。穆鸿明确表示数睿数据既不会亲自做大模型,“那可能是大厂或某些创业公司的事情”,也并不太在乎到底是用小模型还是大模型,关键在于是否产生了客户价值。
穆鸿认为,3~5年内,AIGC还不能对无代码的商业价值带来颠覆性的改变。“原来软件卖50万,叠加了AIGC就能卖100万?我还看不到。”
或许要换一种思路。AIGC带给无代码平台的价值,并不是要把软件卖的更贵,而是通过AIGC生成的新的应用、组件或物料(图片、视频等),带来第二增长曲线。
OpenAI的商业模式就非常有参考价值。首先,OpenAI的技术在不断地迭代更新,用户无法对其形成买断;其次,API也好,模型也好,它的技术可以变成一种服务来租用,形成订阅的收费模式;第三,它适用的场景众多,可以实现资源复用。
穆鸿告诉甲子光年:“对比来看,现在市场上所谓的SaaS租用模式,很多也是可以买断的,包括我们自己。但如果大家都认为软件提供的能力是服务型的、是需要不断更新的,对于中国的产业来说会是一个巨大的变化。”
AIGC是否能给无代码行业带来这种变革?穆鸿表示,除了关注AIGC在效率层面的提升,他更关注的是knowledge(知识)的积累与技术的融合,如何在无代码平台中体现出价值。这也是数睿数据团队一直在努力的工作。
“想象一下有一个石化领域的行业专家,对一些应用部件或者结果判断有自己的理解。软件平台通过阅读他的文本(就像ChatGPT一样)就可以抽象出一个应用组件,将来数睿数据服务石化领域客户,就可以直接把组件拖拽到应用中去。我认为,AIGC如果能实现这种效果,才是真正的从传统的信息化、数字化往智能化的方向去转型的过程。”
AIGC在无代码平台之外提供了增值服务的能力。数睿数据现在也会提供增值服务,包括图片物料、应用模板等,但是增值服务的内容素材无法做到无限供应,而且通用模板时常不能满足个性化的要求。
如果将来不再是仅仅为客户提供模板,而是提供一个“生成模板的AI能力”,就可以解决素材无限供给、个性化服务、提高客户的粘性等问题,从现在的授人以鱼,升级为授人以渔。
长期来看,这才是AIGC带给无代码行业的真正的颠覆性革命。
这也不仅仅是无代码行业的机会,也几乎是所有软件行业的机会。在AIGC的能力下,未来所有的企业软件、SaaS、云服务,都可能需要重新再做一遍。
就像智能手机的诞生催生了移动互联网繁荣的生态。此时此刻,正是AI时代的iPhone时刻。