图片来源@视觉中国
文 | BT财经
一家SaaS软件公司,正处在大模型范式革命的前沿,而它抬头一看,自己追赶了数十年的对手微软,正猛然成为大模型时代的最大“赢家”。接下来该怎么办?这就是金山办公要面临的现实。金山的转身迅捷而果断。2023年初,金山办公决定彻底调转公司船头全力转型AI。5月16日,WPS AI到来的同样迅速且猛烈,一经推出就引发市场强烈关注,金山办公All in AI的姿态以及丰富的技术和工程积累是其在AI浪潮下快速反应实现应用落地的关键,这为金山办公未来提供了足够的想象空间。近日,金山公司举行了一次媒体交流会,金山办公高级副总裁毕晓存、金山办公副总裁姚冬等高层回答了媒体关心的问题,以下是现场实录。
WPS AI再次进化
媒体:我看到了咱们的功能和微软的Copilot是比较贴近的,上一次发布之后到现在进化了这么长时间,我们有哪些相关方面的进展可以披露一下?这一次和上一次技术的讨论,我们有什么新的一些变化,顺便给我们普及一下?
金山办公副总裁姚冬:
大家如果参加过我们上一次的发布会的话,会发现我们上一次主打的是内容生成,演示的是我们的轻文档,代号叫AI配置的产品,主打是文档创作、大纲生成、改写、续写,主要利用的大语言模型文字的生成能力,具有很丰富的产品功能,但是仔细来看有几个主要的功能,第一个是理解能力,就是对用户意图的理解,我们输入了一段话,这段话我不是说基于他做的主题,而是说我知道这句话用户想要什么,他到底想干什么,他想达到什么目标。
第二个我们是对内容的理解能力,像刚才演示上我们可以把一个文档PDF甚至是拍照扫描的,包括拍了一个瓶子,把里面的内容拿出来阅读理解,怎么证明我们的算法模型和我们的应用可以理解用户内容?因为我们可以对他的问题做提炼,让他回答用户相关的提问,证明大模型可以理解他的提问,这个是和上一次是有一点不一样的,包括我们有更复杂的对内容表格的理解,那个是非常复杂的逻辑判断条件,内容大模型阅读理解能力和我们现有的功能相结合,这个是跟上一次有一点不一样,并且未来我们可能还会在这个方向继续做一些相应的产品和功能。
金山为何率先把应用落地?
媒体:刚才看到大模型阐述文章的能力我还是觉得挺震惊的,我有两个问题,第一个问题我想问一下,现在很多公司在关注大模型的风控问题,金山是率先把应用落地的,我想问一下金山接入轻表格到今天这么多的功能展示也就一个月的时间,为什么能进展这么快?你认为AIGC落地的难点在什么地方?
第二个问题是,国内科技企业纷纷布局大模型,从应用方的视角来看,金山办公觉得未来哪家大模型企业最终会脱颖而出?
金山办公高级副总裁毕晓存:
首先我们认为AI的这一次技术变革,对我们来讲是前所未有重要的一次。就像章总在前面开场也分享过,金山办公历经35年的发展历程,其实我们经历过几次大的技术迭代,第一次就是PC时代,那一会儿我还没有加入金山办公,所以听前辈讲,当时也是非常凶险,后面移动办公时代,云计算时代,我们都保持了非常高的敏锐度。
我们认为技术不变革就是我们被变革,所以这是一个生与死的问题。我们对技术本身很重视,第二个我们看到了AI能够在软件行业,长期来一些方向性的变化,前面章总和姚老师也分享了一些。
软件发展到今天,尤其像金山办公这么复杂的产品,我们觉得目前已经到了用户不太会用的阶段,包括我自己,我自己在金山办公十几年其实很多功能我用得也并不多。AI这一次是有可能颠覆掉整个人机交互的过程,让用户以一个更简单轻松的方式实现用户在办公场景效率提升,甚至企业效率提升,所以我们认为这个对我们来讲是一个革命性的变化,是一个机遇。
刚才您也讲落地困难,这个确实是事实。姚老师在2017年开始带队,我们就有了AI技术的一定储备,所以这个也是我们之所以反应这么灵敏的原因。
对于每一家公司难度其实差不多,我觉得可能难点在于过去储备够不够,有没有AI算法和工程能力。
第二可能就是整个团队组织的灵活性,能不能够快速地跟进一个技术。
第三是至关重要的一点,我认为每一次技术变革或者一个公司战略的落地能不能快速达成,达成效果怎么样,一定是一个从上至下的一把手工程。
我们开始做AI这件事情以来,章总已经作为一号位一直在带着我们,无论从OKR的落地然后整个团队方向规划,我们其实每周都有非常多的会议在落地。
所以从这几个方面来讲,可能每一家公司面临差不多的困难。
金山办公助理总裁晁云曈:
刚才提到国内有很多厂商做大模型,我们公司目前的定位是模型的应用方,从这个角度来说,大模型肯定是多多益善,市场足够大充分竞争可以促进市场的发展。
从我们的观点来说,这个局面您说大模型大家都在做,都在往前发展,这个局面后面可能会变成什么样子,在我们看来,这些大模型不一定都会去从单纯的AIGC或者单纯的阅读理解去获得突破,而是像我们今天演示的很多能力,它里面有类似思维、推理、逻辑理解、代码生成之类的能力,所以我们看来国内的大模型其实未来也可能出现百花齐放的局面,就是在不同的领域进行分化、特化,然后单纯强化自己某一个方面比较独到的能力,从而在场景里面能够更好地契合、落地。
大模型和PDF结合有什么突出优势?
媒体:刚才PDF展示很出彩,我想知道为什么这次会突出展示大语言模型和PDF这方面的结合呢?
金山办公副总裁姚冬:
一个是展示一下我们阅读理解方面的能力,包括对用户问题的理解,也是对内容的理解,同样也秀一下我们过去五六年积累的PDF格式理解和扫描识别的能力。
为什么能够这么快推出这个能力,因为除了大模型本身以外,一些基础技术能力其实是我们多年积累的结果,比如说像刚才拍照扫描,对扫描建文档的理解、拍照理解,其实OCR技术我们从2017年就开始做了,还有我们做刚才显示的PPT排版,其实PPT智能排版是我们2016年就开始做的东西,稻壳有很丰富的素材库、模块库是十几年前就开始积累的东西,这就是我们展示一下过去很多年来在一些基础技术方面积累的成果。
媒体:WPS海外版的进度什么样?和国内会有什么差别?
金山办公高级副总裁毕晓存:
今天我们也展示了表格的能力,是用中文界面展示给大家看,因为我自己英文都不太好,为了方便让我们更好地理解所以我们用了中文界面,我们表格包括PDF的能力,包括文字生成,在海外同样都有,展示中文版其实跟我们内部整个战略的计划是有一定的关联性,我们是期待全线产品、全端然后全部AI化,这是统一的过程,现在大家能看到我们海外和国内分别在不同的产品上做了一些演示,是因为我们在投入上,希望能够调动所有团队研发的力量,我们要做一些交叉的事情,不要做重复的事情,只有这样才能速度更快一些,最终我们会全线一起上线,颠覆掉我们现在的整个产品。
具体的差别可能还是背后的模型,我们前端的功能层面,包括API层面,说到这个话题和我们过去这么多年大的工程管理也有一定的关系,包括我们的API也是统一的,让我们能够在多端和国内海外能够齐头并进一起推进。
AI会不会颠覆办公软件?
媒体:我有两个问题,一个是大模型还有一个非常重要的能力生成代码,包括WPS里面有宏脚本方面的功能。金山WPS AI会不会也做生成代码这方面的尝试?
第二个问题,刚才演示把AI的能力整合到软件产品里面,还增加一个功能在侧边栏,未来,AI会不会对办公软件的形态带来更颠覆性的转变,会不会进化成一种完全不一样的东西?
金山办公副总裁姚冬:
说到代码能力,这个其实是金山非常独特的优势,因为办公软件这种产品,从整个行业技术架构来说,一定会做成基于大量的API然后在上面生成一个脚本,并且脚本的能力一定会覆盖所有用户的操作。
也就是说你用鼠标键盘能做出来的操作,用脚本一定能做到,这个行业从微软到我们都是基于这个架构做的,这种软件必然是这种架构,但是到了今天的大模型时代发现这个东西是非常独特的优势,只要大语言模型能够把代码写出来,就能够通过脚本完成所有用户做出来的事情,也就是说一个人类能够做出来的事情,大模型只要能写出相应的脚本就能做到。
所以我们未来会在这个基础上持续优化迭代,我们和一些合作伙伴一起把大模型的代码生成能力进一步提升。
金山办公助理总裁晁云曈:
刚才提到的演示的AI像是一个功能,不知道有没有注意到演示表格操作时,AI修改的每一个内容会标红放在那里,我们模仿的是什么呢?我们认为AI不单纯是功能,相当于引入了新角色和您一起协作。
像是我们和同事一起协作一样,我的同事如果告诉我把绩效表里边某某内容改了,麻烦你看一下,那它一定会标黄给我看,不然我就会问你是来和我一起协作的还是捣乱的?所以我们看起来就是AI未来的演化会有三个层级。第一个层级是从协作的角度来说有点像是一个实习生,我们对实习生的要求相对来说会更倾向于人来提供思路,人来提供观点。
甚至我会把数据、资料都找好,告诉实习生帮我进行一个什么样的整理,什么样的分析。我们刚才提到AI可以不知疲惫、反复做这件事情,进行尝试,看什么样能命中你的需求。这个层面上AI做的事情叫做人力所不能及;第二个层面随着AI能力的发展和办公软件加持的加深,AI会变一下它的身份更像是业务助理。就是我告诉他我的思路是什么我的论点是什么,甚至有些论据告诉他,他从企业数据、历史已经积累的这么多文档里,自己能够找到一些数据、信息、资料。并且帮我形成一些结论、总结、分析呈现给我,这是第二个层面的交互或者说和AI共存的方式。
第三个层面这个可能更趋近于理想状态,我们在工作时扮演更加像甲方的角色,对于AI的定位更像是外包的智库、智囊。我告诉它我想要的需求,它甚至能帮我提供思路、论点、论据、数据进行整合分析最后呈现给我。这样的发展过程中不管是AI也好还是办公软件也好面临的变化,不同场景下,不同的层面下不可能一蹴而就,每一个场景能力都是拉齐的。所以我们认为说您刚才提的这个问题就是在不同的场景下,有些走得快一点,有些走得慢一点,走的快点的也许已经走到第二层,走的慢一点的也许还在第一层。所以我们看法是在最终极最终极的状态下,人和办公软件更多的是一种对话。中间可能有非常多的层级,非常多的阶段出现。
媒体:金山开发了很多功能,主要体现在两个方面问题,一是商业化方面的,以后商业化的逻辑和顺序大概是什么样子?二是研发,现在做的这些场景的事情背后逻辑是什么样子?
金山办公高级副总裁毕晓存:
我先回答商业化问题,技术问题由姚老师帮忙回答一下。商业化这块大家知道AI本身是有一定的算力成本的。虽然我们相信未来算力成本一定会下降,但是至少当前还是有的,所以它天生是商业化产品。现在整个商业模式是纯订阅模式,在短期内没有把商业化当成最重要的事情,优先还是先把产品落地,让整个WPS能够AI化,让AI帮我们重塑,这是我们短期最重要的事情。所以我们会在今年合适的时候,先推出一部分用户给他们测试。
目前整个大模型的AI和以前的AI不太一样,更多需要用户的反馈,无论正反馈负反馈,只有这样才能迭代产品,所以依然是产品优先,先把场景推给用户,其次再考虑商业模式具体怎么样。从长期来看,这些年在商业化方面花的精力比较多。我是觉得这次AI最终落地,有可能对商业化有一个全新的测量方法,它的模型可能也不太一样了。因为过去我们谈到商业化时一定会谈用户基础是多少,但是长期来讲大家可以想象一下每个人身边有两个助力,一个助力就是上次演示的通用型的LPgAI,它能帮助我们解决一些每个人工作当中都会遇到的通用性问题。
第二个是基于WPS,基于office非常熟练的高手,它会懂我们所有的功能调用,手速也很快能够帮我们解决任何日常办公文档处理的。这么两个AI助理在自己身边,我相信付费转化率已经不是现在数字能体现的。长期来看一定是商业化产品,但是短期不会把它当成最重要的事情,长期还是对它保持很乐观的期待。
金山办公副总裁姚冬:
我补充一下,我们肯定是基于现已有的功能和大模型结合,快速推出一些产品给用户试用收集反馈。因为办公软件是功能非常复杂的产品,本身功能就是数以千计的,它的功能点有好几千个,现有功能上应该能挖掘出不少亮点,其次我们会再做一些长周期的新功能。这个肯定是内部在做的,只不过全新的功能周期都比较长,大概在半年、一年的跨度上,但是我们下一代新功能开发都是以AI为第一优先级,一定要考虑到AI存在和它配合。
金山办公高级副总裁毕晓存:
我再补充一下,基于现在产品的计划。我是觉得我们现在几亿的用户,对用户理解还是比较深入的。像刚才演示提到的,为了满足用户从零到一生成一篇文章以及分析文章,其实我们做了挺多的工作,比如像稻壳就是很典型的案例。首先我觉得我们会把这些过去传统模式实现的这种为了让用户更简单轻松的能力先AI化,先解决这一步,让用户沿着以前的用户习惯但是改变了交互模式现在使用起来。其次把以前基于用户的理解一些高频场景,比如像移动端刚才移动产品经理分享,我们在移动端更多的是轻编辑以及阅读。
我们能帮用户快速地不通过手输入解决一些这样的场景,其次可能是长期展望的话,能不能让手机用户真的用起来办公软件,当前我们做得并不好,没有真正让用户用起来,可能这些是我们中长期思考的,应该也不会太久,现在有些开发计划正在进行中。
AI技术让移动办公时代真正到来
媒体:我有两个问题,第一个问题是,对于金山来说WPS AI这个项目算不算金山办公 All In 的项目?第二个问题是,刚才看到移动端演示我个人觉得蛮惊喜的,就目前这个状态是不是预示着移动办公这个命题开始成立?
金山办公高级副总裁毕晓存:
我们自己认为AI这个大的技术背景下,我们不革自己的命,就等着被革命。这件事情可能对任何一家软件公司都是一样的,可能不仅仅是金山办公。因为我自己把软件分为两种,一种是notpad这种简单的记事本,一种就是像footshop这种非常复杂,我觉得过去十几年我们自己逐步在找自己发展的路径上面,希望把工作变得简单轻松,但是已经发展到了一个比较复杂的阶段,今年其实在没有AI技术前提下,原本的战略也是能够降门槛,让用户更简单、轻松,但是AI技术到来,让我们发现有一个杀手锏的技术,我们为什么不用?
AI技术的出现我们觉得首先必须积极去拥抱它,就像章总演讲也是说时不我待,一定要积极拥抱他,一定是all in AI。
过去我们的五大战略是内容、云、协作、多屏、AI,以前我们几个战略齐头并进,但是在今天我认为其他四项可能已经成为AI的基座了,其他几项为我们储备了比如说我们有非常多的云文档,我们能够在未来怎么样应用好大模型阅读理解,去把数字变成知识,帮助企业、个人更好地附用以前自己的信息,可能类似于像这样的案例,我是觉得其他四项战略在今天可能已经成为一个基座型的东西了,未来AI是我们最重要的战略没有之一。
金山办公副总裁姚冬:
从我们的内部统计数据会发现,移动端的用户和PC端的用户其实差不多,数据有差距但是差别不大,但是在移动端的使用时长却比PC端要短得很多,因为移动端做不了复杂操作,自然用户就不会长时间地使用,PC端肯定要做一些排版、处理、计算还有很多复杂操作,所以PC端一个用户一天可以用好几个小时,但是手机端就不会这样子。
因为移动端为了便利、便携性,其实牺牲了做一些复杂和高端功能的能力,屏幕太小、输入不方便,但是大模型给了我们一个新的机会,就是用户的输入会变简单,因为只需要自然语言输入。
还有它可以理解用户的需求自动执行一些操作,运行一些脚本,这样的话也省去了很多复杂操作。
比如说举一个例子,一个表格,想把第三列和第五列交换一下,对人类来说就是一句话的事,在移动端不是做不到,会非常麻烦,但是未来可能你只要跟它说一句话就好了,这样的话大概后面交换表格这种七八个连续的操作都可以省掉了。
大模型能力具体提供什么样的支持?
媒体:核心的只有一个问题,在金山今天上线的这些功能背后,所使用到的大模型能力具体都提供了什么样的支持?
金山办公助理总裁晁云曈:
刚才展示的能力里边,像演示里面,首先是语言模型的理解,其次理解了以后要分析意图,之后要执行。这里面除了常规的大语言模型的理解能力、分析能力之外,还有就是生成能力也包含在里面,包括写代码的能力。
其实今天演示的内容,说大语言的能力、模型的能力不是说一个模型去提供的,而是由多个模型组合提供的,所以这个是今天展示比较有意思的一个点。
金山办公副总裁姚冬:
其实我们有一套叫提示词集成开发环境的工具,我们把这个工具接入了很多国内的大模型,然后我们产品的开发就可以在这个工具上调试提示词和功能的配合,我们也发现国内不同家大模型的能力的确是有差距的,不是说谁好谁差,只是说各自有擅长的地方。我们在真正做功能的时候,每一个不同的功能有可能是用不同的后端的大模型实现的。
AIGC和办公软件结合是否还有难点?
媒体 : 从现在金山办公已有的经验来看,AIGC能力和办公软件的结合是不是还面临一些难点和问题?您怎么看外界API很难修改算法造成的难以定制化的问题?
金山办公副总裁姚冬:
这个技术其实出来也没多久,其实都有它的不成熟性,比如说从算法上,他对一些提示词或者对用户要求的理解还是有一些偏差,只能保证一个概率性正确。我们有时候会发现你跟它说一句话它不理解,换一种说法、改几个字可能就好了,仍然有一点不稳定性。
另外从工程上,我们看到说刚才演示的时候,偶尔会有点工程上的不稳定,重试一下就好了,或者偶尔有一点小问题,这个其实是技术在早期的时候必然的状况,相信随着时间的推移,工程问题和一些算法稳定性问题、正确率问题都会逐步改善。
第二个问题,是说我们和合作伙伴亲密合作,双方比较开放的合作配合的话还是可以改的,因为训练语料可以改,标注可以改,参数可以做微调,这个在技术上不存在什么困难,算法上都有办法的,而且微调的成本并不是那么高,即使是千亿级的参数的模型,只要数据标注做好了,微调下也就是一两天的事情,所以这个也是可以解决的。
未来办公软件竞争会集中在什么领域?
媒体:还有一个从行业层面的问题,办公软件的赛道是不是竞争点已经发生了一些变化,未来办公软件的竞争可能会集中在哪些层面或者领域?
金山办公助理总裁晁云曈:
办公软件其实有一个挺传统的认知,大家觉得它是一个工具,我觉得在AI进行加持以后,看法产生了一个变化。从原来的单纯的工具变成了四个维度的竞争。就是您在脑海中想象我们出去野营的时候搭一个帐篷,帐篷有几个支点。第一个支点是用户场景,办公软件解决用户工作中的问题,场景肯定是五花八门的,这也是我们这个产品这些年来越做好像越复杂的原因。用户场景是由什么决定的呢?是由用户量、覆盖面。
第二个支点,是用户的数据尤其是企业的数据。咱们刚才谈到AI能够理解、分析,能够找到企业以前所有的数据,把它综合起来,比如说我问它咱们公司去年第一季度某某产品MAU是多少,和现在对比是怎么样,这个问题要问一个人它绝对会傻眼,但是如果问一个AI,AI的能力上限是难以想象的,所以企业里面的数据被AI加持以后,将会得到活化重新释放出价值来。
这个维度的竞争是企业里面的数据在各个平台上的数据沉淀量,在我们用户这边,多少用户的数据,多少企业的数据能够开放给AI进行操作,这当然也是一个隐私的问题,但是从根本上来说,这个决定着竞争一条线的长度。
第三个竞争线的长度,是产品和服务的能力。举一个例子,咱们的电子表格里面4000多个API,这就相当说我要操作数据,我要做数据分析的时候,工具越多,我越能够得心应手,但是遇到的障碍就是工具越多我反而越不太会用,这个在AI加持也会发生一个翻天覆地的变化,换句话说,哪怕是一些以前身体比较瘦弱的人,在有了蒸汽机、内燃机以后,他仍然可以去做以前做不了的事情,这个是AI带来的变化。
刚才说到第四个维度,就是把这个帐篷整个支起来的杆就是AI。
所以想象一下,AI的变化其实给办公软件带来竞争上的态势变化,现在撑起来以后,这四个支点共同决定了一个帐篷的体积,要是没撑起来这个帐篷体积太小了,或者某一个支点收回去以后,他都没有办法面对新的竞争优势。
AIGC会带来失业风险吗?
媒体:有观点称AIGC会对广告文案等岗位造成毁灭性打击,金山是怎么看待这些岗位被取代呢?
金山办公副总裁姚冬:
自从有AI之后,一些媒体们在网络上天天给大家讲“鬼故事”,吓唬我们AI来了谁谁要失业了,这一次都已经说到程序员要失业了,因为AI可以写代码了。
一个行业领域不会因为它的工作效率得到提升,这个行业就会消失。作为程序员写代码快30年了,其实30年来我们的开发效率一直在提高,我今天写代码完成一个功能的速度,是我20年前的几十上百倍,可能我今天随便用一两天写的功能,是我20年前大概要写几个月甚至一年的,我们开发效率提高了之后程序员也没有变少,程序员30年来一直在变多,而且还在持续地变多。
因为当一个工具产生提升了某种行业或者某种领域的效率之后,它不是取代这个行业的人,而是让这个行业的人能更多、更快、更好地去做事情,并且让他们去做到一些以前不敢想或者不可能做到的事情。
比如说就像我们今天基于AI的加持,基于这么多年来程序开发工具的效率提升,我们可以在短短一个月之内做出这么复杂的功能,这些功能搁到10年前搞不好要开发一年两年甚至三年都有可能,但是我们现在一个月就可以做到。会因为这个事开掉几个程序员?这是不可能的,我们反而会投入更多的人,因为会更快地有产出,更快地拿到回报。
所以说大家不用太担心AI来了之后失业或者某个领域被颠覆,但是大家可能要做一些适应和调整,这是肯定要做的,去学会怎么和AI配合,让他帮你把一件事情做得更快更好,然后你可以去做更大更重要的事情,谢谢大家!