当前位置:首页|资讯|第四范式|AI大模型|生成式AI|编程

第四范式参战AI大模型!首提AIGS战略,现场问答画画写代码

作者:智东西发布时间:2023-04-26

原标题:第四范式参战AI大模型!首提AIGS战略,现场问答画画写代码

智东西

作者 | 程茜

编辑 | 心缘

智东西4月26日报道,今天下午,AI独角兽第四范式首次公开了其面向企业的大模型产品SageGPT(式说大模型),并且首次提出AIGS(AI-Generated Software)战略,也就是以生成式AI重构企业软件。

第四范式创始人、首席执行官戴文渊现场拔网线测试了式说大模型在图片理解、多轮对话、图片代码、生成代码、逻辑推理上的能力。

除了这些通用大模型外,戴文渊认为,在C端,用户对于软件的使用体验已经优化的十分到位,但对于B端软件来说,很多企业在报销、申请办公室等方面的软件体验很差,因此B端软件的体验有巨大的提升空间。

第四范式提出了AIGS战略,并将式说定位为基于多模态大模型的新型开发平台。他补充道,要做到AIGS,大模型需要具备Copilot(副驾舱)和思维链CoT(chain of thoughts,多步推理)的能力。

第四范式今天公开的已经是式说的第三个版本,从今年2月开始,该公司就发布了具备生成语言能力的式说1.0,后续又推出加入文本、语音、图像、表格、视频等多模态输入及输出能力以及企业级Copilot能力的式说2.0。

一、写代码、文图互生、“装箱”难题均不在话下

首先是图片理解能力,测试人员上传了一张电视剧《狂飙》的剧照,式说不仅可以描述这张图片的大致情况,还可以回答图片中有几个人、他们在做什么。

其次是图片生成能力,测试人员让式说“画一张配色鲜艳的篮球鞋”,它还可以通过背景来突出“篮球”这一元素:

在代码生成能力上,测试人员让式说“请用VBA编写一个求两个数乘积的代码”:

在CoT思维链能力中,测试人员告诉式说“我想研发一个万亿参数的生成式大语言模型,请告诉我解决这个问题的每一步”,它会将涉及到的基本步骤都罗列出来:

更为基本的聊天能力方面,测试人员让它做个自我介绍,不过在第一句话上其生成的内容出现了重复性词语:

测试人员让式说做一个旅游规划,如“五一假期去硅谷旅游,有什么推荐的地方?”,式说罗列了几大值得逛的景点:

写作能力方面,式说可以“根据电影《流浪地球2》的情节,写一个《流浪地球3》的剧本”,它还将前两部的剧情梗概展现了出来:

在推理更为复杂的“装箱”操作上,式说也快速、准确的完成了任务,并且测试人员还能查看它的思考过程:

二、三个阶段,要用生成式AI重构企业软件

除了具备这些通用能力外,第四范式还提出了AIGC时代的AIGS(AI-Generated Software战略,也就是以生成式AI重构企业软件。

戴文渊认为,生成式AI可能先改造B端的软件。他举了一个关于二维码的例子,二维码支付在国内已经无处不在,但海外的二维码支付并不普及,原因在于美国信用卡非常成熟,二维码相较于信用卡的提升并不大,因此其替代性并不强。但国内,二维码支付带来的体验升级是从现金支付开始的,因此更为直观。

同样,生成式AI改造C端的软件体验不见得非常明显,但对于B端菜单式的软件,生成式AI可以将其转化成更自然的交互方式。

例如,当前的员工想要通过企业软件预定会议室,他们需要找到这个时间段内想用的办公室,然后再去挑选没有被占用的会议室。而经过生成式AI改造后的范式AI助手,员工只需要和它说“查询会议室:下午14点7楼空闲的会议室”,就能清晰看到当前可用的会议室。

因此,AIGS还可以让复杂的工作变得更加简单,第四范式将AIGS的路径总结为三个阶段:

第一个是Copilot阶段,用户使用自然语言就可以让Copilot调动不同的信息、数据、应用,来完成指令。例如用户想要把照片的亮度提升20%,不需要用户拖到修图软件中,只需要通过自然语言来输入进去。

第二个阶段是Copilot+基于企业规则的“知识库”绝大多数用户使用软件都并不是使用单一功能,而是多个功能的集合,而AI可以参照这一相应的规则来执行指令。例如任务是“把这张照片p的好看一点”,式说就可以查询“人像美化”知识库后,依次调节图片的亮度、对比度等。

第三个阶段是Copilot+思维链,软件系统的使用行为不断被大模型学习,最终形成AI针对这个领域的思维链,AI就可以自动按照步骤完成“把照片处理得更好看”等任务。

除此以外,生成式AI对软件的改造,不仅仅体现在体验上,还体现在开发效率上。戴文渊说道,当前的软件开发,绝大多数都是以月计算时间,更复杂的软件开发可能要以年计算。但生成式AI改造后的软件开发,可以将这一时间维度缩短到以天计算。

他补充道,AIGC最重要的是将它的能力变成生产力工具,提升企业的生产效率。因此,第四范式将式说定义为一个软件开发平台,是基于大模型的新型开发平台。

式说大模型的优势包括数据安全、成本可控的多模态大模型能力,内容可信的知识库能力,执行可控、知错能改的Copilot能力,以及能够实现多步推理、复杂任务拆分、形成数据飞轮的思维链能力。

第四范式正在快速迭代产品,基于AIGC的能力,帮助企业内部软件实现效果提升。据了解,目前,其产品已经落地数十家头部行业公司,覆盖金融、医疗、能源、航空行业等。

三、四大能力积累,未来让机器自己实验找答案

第四范式在AIGC领域的布局分为四层,分别是底层的式说大模型,能力层的Copilot、知识库、思维链CoT,平台层的开发平台,以及最后在金融、零售、医疗、制造行业的应用。

第四范式主任科学家涂威威谈道,他们想让语言模型不只拥有能聊天、会画画的能力,而是要成为一个生产力工具。

在1.0阶段,大规模预训练模型存在知识过时、上下文长度受限的缺陷,第四范式基于Memory Augmentation的核心技术,能辅助大模型进行相应推理,解决用户的实际问题。

此外,这一技术不仅是将数据接进来,还能构建一整套的反馈机制,来让用户越用越好。

2.0阶段大模型的核心能力是知识库结合Copilot,也就是让机器具有一定的视觉、听觉和执行能力。

通过Plugin模式,大模型可以做一些科学计算, 让其应用到实际领域中去的时候,能针对每个领域具有专业的能力。

并且,2.0阶段大模型主要是企业已有的操作规范,来让机器模仿人并代替人执行相关流程。

3.0阶段就要机器做更多的事情,大模型拥有学习更多思维链的能力,可以复制、模仿、学习人的行为,甚至于模仿人的一系列动作来执行更加复杂的任务。

涂威威谈道,他们下一个阶段的目标就是让机器对着任务的最终目标去学习,而不是简单复制人的步骤,而这往往需要机器去做实验。

因此,为了降低机器的实验成本,第四范式未来的方向就是利用大型语言模型,让机器在虚拟环境中进行迭代,再应用到实际环境中去,拥有可以解决更高层目标的能力。

结语:B端企业软件或成大模型应用爆发点

OpenAI造就的ChatGPT的爆火,验证了生成式AI产品的可行性,也提升了市场对于大模型的信心,但对于其商业化路径的探索,更多还要依靠企业选择的方向。

生成式AI的爆火很大程度来源于它对于人们生产效率的颠覆性提升,但对于企业来说,私域数据的安全性与如何快速应用前沿技术同样重要,就需要更专业的技术公司来为提供支持,找到前沿技术与数据安全保护的平衡点。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1