对话DataFocus创始人：大模型会颠覆ToB行业吗？

作者：DataFocus发布时间：2023-07-03

编者按：年初ChatGPT引爆了AIGC，GPT几乎成了软件从业者最高频的话题了。如今时过半载，子弹仍然在飞舞，显然这波浪潮还远远没有到平息的时候。这是一次内部分享，我们有幸和DataFocus创始人JET畅聊了大模型的天南海北，匆匆整理以飨读者。

第一部分LLM大模型

Chatgpt究竟神奇在哪里？

JET：问答式交互，的确比传统列表搜索的方式好很多。Chatgpt比其他的聊天机器人有了质变，体验上完全不在一个境界。产品还是要死磕体验，谁都知道聊天机器人有用，就是没人把它做的足够好用。

ChatGPT多轮对话的支持很好，能够很好的结合上下文，5个回合的交互，基本上可以在一个主题下聊天，没有出戏的感觉，这个是用户体验和以前的聊天机器人不同的地方。当然了，也有报道说15轮以上的对话它hold不好，回答就容易跑偏，这些都可以通过扩展带入上下文作为Prompt来解决，但是成本更高。

代笔写点儿小文章，这个场景肯定是最先有人搞的。复杂点儿的，用这个训练专业领域的智能能客服也是被大量应用的方向。

Chatgpt的对话模式彻底把搜索结果列表干掉了，这极有可能会影响现有的竞价广告模式，从而引起商业模式的变革，就这点来说，谷歌的确紧张了一阵子，年初甚至有点措手不及，显得格外慌乱。

Chatgpt在哪些领域表现优异？

JET：要回答这个问题，得回看GPT的发展历史。其实早在两三年前，GPT2出来以后，就已经有不少创业团队接入其能力，运用最好的方向就是内容创作。之后直到chatGPT的出现，其写作能力进一步提升至人类水平，并且已经具备了很好的理解能力和多轮交互能力，这就使得其能力拓展至聊天、客服这类通用场景。可以说有了chatGPT，很多公司之前的努力都付诸东流，比如XX问问、XX客服、XX云小蜜等产品，基本上可以丢进垃圾桶了。现在，只需要花很少的功夫就可以用ChatGPT迅速训练出一个具备某项专业知识的智能客服，其表现要远胜于上面提到的智能客服产品，体验了GPT4.0之后，你会发现智能客服赛道的棺材板上已经钉上了最后一颗钉。

除此之外，基于ChatGPT的语言交互能力，有人构建了虚拟机器人社区，有人将它引入到游戏中，赋予游戏人物特定的人格，瞬间激活了虚拟女友，虚拟人生之类的各种应用，这是目前能看到的能较好落地的应用。

GPT是一个会彻底颠覆行业格局的东西吗？

JET：微软公司乱拳打死老师傅，他从搜索切入，对谷歌形成了极大的威胁，自身的成本反而不高。即使后期全线产品接入试用体验未尽人意，也不妨碍这次战略竞争的策略。GPT如果只是用作客服，价值是有限的，不太可能会对行业形成很大的冲击。人们对其的期待，更多的是微软的Office实践，只是将GPT用作自然语言交互接口，用于理解用户的输入，生成内容，或者进行一系列的动作编排。恰恰是后者，使之具备了大规模用于办公自动化领域的可能。这使得软件的大部分功能在学习成本很低的情况下，可能被释放给更大量的用户，这就极大地提升了生产力。这一点从GPT的插件商城也可以看出来，大量的插件做着更专业的工作，GPT则充当交互窗口，降低用户的交互成本。从这个角度来讲，Iphone时刻是成立的。大家想一想，这个生态成功的前提是什么？一个是门槛足够低的自然语言交互模型，一个是广泛被用于生产中的各行各业专业的API。在中国，我认为第一个问题难度有，但是可以克服，甚至突破的时间也就几年。但是第二点，将是无解的。中国是平台垄断型的互联网、软件生态。彼此互相之间封闭作业，各家自成一体。即使你有了智能的交互代理，也无米可炊，除了客服聊天，甚至各种垂直的聊天，比如情感聊天，游戏聊天，虚拟人格之类的，我们尚未看到有价值的应用。

让我们更深入一点。要想让智能代理能够产生更大的价值，创造更大的生产力，必须让智能代理可以从事复杂任务，解决深层问题。但是复杂任务的编排依赖于大量成熟的业务场景和开放性良好的API生态。

为什么会有Prompt工程这种东西？

JET：Prompt是个很有趣的东西，它给GPT提供了各种稀奇古怪的玩法，一开始，可以说从另一个角度引爆了OpenAI的传播。为什么会有提示词这种东西呢，这和大模型的基因相关。由于Transformer算法其实就是一个猜猜看接下来会发生什么的概率机，模型被海量的语料填喂之后，形成了天量的序列串网络。当用户使用时，必须要通过一些提示才能激活网络获得下一串最大概率的字符。这个网络是庞大的，多样的，随机产生的各种回答几乎都不会重样，大大提升了对话的真实感。

正是由于他这个自然语言生成，生成的内容是随机的，没法控制，因此，提示语就显得尤为重要，这就像巫师用来唤醒精灵的咒语。一开始大量的用户仅仅在提示词这里都可以找到很多乐趣。OpenAI在发布GPT模型之前，预先做了调整对齐，用人工进行了反馈强化训练，这就像预置了不少的套路，用户掌握了这些套路，则可以更高效，更准确的获得想要的内容。甚至一度有传，提示词工程师月薪都可以高达十几万了。为此，deeplearning.ai的创始人吴恩达教授甚至还开了专门的课程教大家如何设计提示词，这就有了Prompt工程这个东西。

Prompt提示词工程，告诉我们，哪怕是再智能的AI，也还是有使用门槛，那种想着躺床上啥也不干全靠AI的人又要失望了，未来的人跟人的差别不是你有没有AI助理，而是你会不会用，是否擅长使用的差别。还是那个道理，现在大家都有智能手机了，有的人学会用它学习、办公，有的人只学会了刷视频玩游戏。

微软2023年以来，动作越来越大，未来微软会通过OpenAI一统天下吗？

JET：大家注意看最近的几个数据，很有意思。一个是微软自去年以来bing搜索引擎的市场占有率，小幅上升后，继续下降，目前也仅仅只是超越了百度，离google还有极大的差距，可以说目前微软借助ChatGPT的这波热潮，带来的增量对撼动谷歌搜索引擎统治地位，几乎没有啥帮助。

即便如此，微软最近一个月仍然动作不断，先是发布了office copilot，github copilot，newBing，如今直接重磅炸出windows Copilt，还和chatGPT一同共享了50多款插件，接二连三的炸场搞得大家都有点儿审美疲劳了。

从战略上来讲，微软目前的每一步动作都像是在抢先身位，希望借助chatGPT的热潮进一步拓展市场份额。扶持NewBing这个亲儿子不遗余力，结果大家都看到了，也就增加了几个点的份额，还略有下跌。造成这件事的主要原因，一方面是GPT的流量并没有完全被微软吸收，而是被OpenAI的chatGPT吸收了，另一方面，则暴露了问题的关键，那就是目前的GPT使用者，仍然还是社会精英层的人士，这部分人群相比于数十亿普通网民来说，数量仍然是极其稀少的。这可能与GPT的使用，与提示词工程有点儿关系，提示词工程说得简单点儿，对用户的要求是要能够问得出好问题，或者说，要求用户能够很好地问问题。就这一点来说，门槛还是高了点儿。所以说，工具再好，也还是需要有学习成本。这个问题，要么通过长时间的普及学习来解决，要么通过降低提示词工程难度来解决（微软最近也有不少项目在做这个工作）。但是最终，微软和OpenAI费尽心力教育市场，教育用户，最大的价值还是会被整个行业获取，Google看起来落后，也许当他看清楚之后，很容易就可以追上。

可以说微软着急放出windows copilot，是希望通过windows的海量用户来垄断第一波红利，NewBing和chrome相比最大的差距就是用户量，当Google也有了palm之后，Newbing的优势就不明显了。这次用windows上阵，这是错位竞争，谷歌没有应对的条件，然后苹果躺枪了。在这场乱战之中，最赚的可能还是OpenAI，苹果有可能最后会整合第三方技术应对挑战。我很纳闷的是，为什么一年以来，Apple能这么淡定？

你对大模型的涌现能力怎么看，是不是只有参数越多涌现能力越突出？

涌现这个东西是科学家为了解释深度神经网络在一种评测基准下，其参数量和评测表现（得分）的非线性关系的描述。也就是说，一开始，随着参数量的增加，评测得分的提升并不明显，但是当参数量增加到某个量之后，得分一下子显著提高，这不是线性的，这是个阶跃性质的突变。无法解释这个现象，给取了个名字叫涌现。我也不知道这个原理，深度神经网络是个黑盒子，如何运作的人们现在是没法搞清楚。大胆的猜测一下，之所以会有涌现这种东西，也许是参数量达到一定程度之后，网络会自动生成抽象层，正是这些抽象网络的存在，使得模型看起来具备了某种意识或推理能力，虽然很有限，但比以前还是好太多了。如果是这样的话，那么是不是参数继续增加，当突破到另一个临界值的时候，会有更加抽象的概念层生成？那时候也许模型的意识会更加明显也更加聪慧。另一个层面来讲，如果不增加模型的参数，有没有办法通过降低参数量，提前让模型产生涌现呢？也许算法设计得更精巧一点儿，可以达到这个目的。我们继续观察吧，有可能很多聪明人已经在开始这方面的工作了。

大模型都出来3-4年了，发明者还是谷歌，为什么爆火的是ChatGPT呢？

JET：仔细研究ChatGPT的爆火，这是一个典型的又一个硅谷病毒式传播的经典案例。在正式发布之前，它精心做了将近1年多的调优工作，这种Fine tunning，我不认为是大模型上算法的多大改进，更多的是针对许多特定的使用场景进行的。比如结合代码生成的场景，让它学会写一段特定的代码，补全代码等等。或者让他写一篇常用的工作类的文案，请假条，情书，总结，周报，小结等等。这种细粒度的调优工作，一定耗费了不少时间，但是San Altman一开始就有可能规划好了这些引爆点。只要遵循硅谷的哲学：比现有的产品好上10倍-100倍，就一定会引发口碑传播，而当一个又一个场景被“发现”，这种传播就会形成一波又一波的声浪，从而形成一种巨大的舆论传播。

反观ChatGPT这几个月的传播，你会发现最初它就是在一些有影响力的工程师那里传开的，体验确实超过了他们以前见过的最好产品，于是各种Twitter转发，博客文章纷至沓来，从而引发一波又一波的舆论浪潮。

抛开它精心准备的病毒传播路径不谈，就chatgpt这个产品上来说，的确在各种常用场景上进行了大量的优化。目前来看，传播已经趋于平淡，就看后面还有没有继续核弹级的更新，否则这个话题将会逐渐淡下来。而谷歌也会逐步稳住阵脚开始反击。

大模型的终点是宇宙级超脑吗？

JET：建造一个超级金字塔的难度是远远超过建造一群小型金字塔的。GPT模型最大的意义不是越大越好，他最终的进化不应该是天网那样的东西，那样的话能量消耗会指数级增长。最稳定和平衡的状态，将是分布式的各种小型智能代理，就像微机取代大型机一样。未来一定是足够好的中模型经过特定领域的训练，成为一个垂直场景的优秀助理，而不是巨大模型笼罩之下的全能助理。

从prompt工程可以了解到，当模型过于庞大，知识过于繁杂之后，输入与输出空间的函数关系很难准确刻画，于是诞生了各种奇怪的prompt工程。这最终将会导致模型的精神分裂特质，也有可能会导致巨大模型在吸收过多信息之后无法使用的情况。因此，我更看好专业化或者专家化的中模型。投资人与其去追求下一个OpenAI，还不如多留意各种垂直领域的LLM应用。

大模型是AI最后的答案吗？

JET：目前的大模型不可能超越人类，其架构不比人脑更高明。一个最直接的证明就是爱因斯坦所接触的数学和物理知识肯定没有大模型多，莫言和村上春树也没有看那么多书。但是大模型经过海量数据的训练，依然只是看起来像是个八面玲珑的万金油。干啥都行，就是没有看到在某个领域能达到人类大师的水平。我猜想，人类大脑的神经网络和现有的大模型网络还是有着本质的区别的。这种区别目前很难搞清楚是什么。秀丽隐杆线虫简单的大脑和昆虫大脑的区别在哪里？不同物种之间的大脑构造的差异是什么？为什么人类的智商断层式的领先于其他物种？尽管羚羊或者猎豹的大脑比人类小的多，但是他们对于在高速中控制肌肉组织的能力相比人类来说却是大师级的。种种事实表明，我们对神经网络的理解可能还未窥门径。

大模型还会在哪个领域创造奇迹？

JET：从GPT4的表现来看，Transform架构被证实了是一种很有效的神经网络模型。这就是最好的神经网络模型了吗？这种基于序列的概率预测，目前的表现确实令人惊艳，泛化能力，理解能力都比以前有质的提升，但是始终在幻觉问题的解决上无法跨越，此外它明显还不具备人类的抽象能力，而这是人类智慧的基石。我认为，目前的模型架构，即使规模再扩大1万倍，也无法解决这个问题。需要全新的模型。

除了训练图像、语音等这类多模态的场景，继续扩大数据的维度外，为什么没有人尝试在运动上去训练出更好的机器人呢？想想看，人类的小脑更接近于靠直觉行事，如果能有一个好的空间搜索算法，也许可以通过模仿现有的大模型框架轻松突破和超越波士顿动力的机器人！

没有andriod时刻，只有chrome时刻

JET：大模型代表的能力是人机交互的范畴，而不是底层操作系统的范畴。乐观来看，也许大模型足够好的理解能力，可以进一步抹平人类和机器交互的摩擦，从最早的命令行代码交互，到基于图形界面的视窗交互，再到基于自然语言的交互。因此大模型被广泛使用，一定是赋能式的，它会被大量嵌入到各种已有的系统中，逐步取代已有的代码、拖拽等低效的交互方式，将人机交互进一步放大到随时，随地，并且降低工作门槛，赋予整个社会一个最低生产力标准。举个例子，在计算器出现之前，会计电算化算是一门高级技术工作，但是随着工具的普及，这个门槛被消除了。门槛被消除，会产生两类后果，一个是将这个需求领域的供需关系彻底变成劳动力无限供给，随之而来的就是这类任务将被最大限度普及。前一个变化会带来失业，后一个变化会重塑生产关系，在生产关系的重塑过程中，或许会产生新的工作机会。

总之，目前来看，大模型并不具备重构操作系统底层的可能性。一些人可能觉得OpenAI既然已经抢先，那么它就是未来的IOS，其他人还会有Andriod的机会。遗憾的是，这种机会是不存在的，即使真有，那个机会也是给Google留着的。

未来AI进化到Moss550的水平，可能会有不同吧，那是科幻世界，不知道我们的有生之年能不能看到。

GPT插件商城这条生态之路能走通吗？怎么看待OpenAI最新的函数调用功能？

JET：我认为很难在openAI的API上玩出多少花来。这也是前面我说到的，GPT只有chrome的机会，不太可能有Android的机会。基于OpenAI的API能构建的应用深度不够，一般不具备复杂的逻辑处理能力，这注定了它不能产生复杂应用，尽管OpenAI也在不停的优化GPT的复杂任务处理能力，但是目前来讲，要想获得很好的结果，还是应该尽量做简单交互，或者将复杂问题拆分成简单的多轮交互逻辑。一些开源项目也在专注于做这件事，比如agentgpt，autogpt等等，这些东西处理起真实世界的复杂任务依然效果不好。

此外，GPT意识到这些问题之后，它也开始提供了一些函数封装的功能，简单点儿讲，这个函数封装的功能其实就是希望将复杂任务拆成具体的一个个简单任务，以便开发者能够组合出更复杂的应用。由于大模型的基因如此，这种按照序列概率生成内容的方式，不具备更高层次的抽象能力，哪怕如今模型已经达到惊人的万亿参数，其抽象能力依然很差。因此，要想工程上能开发复杂应用，就必须进行人工的抽象，这相当于人类基于自身经验进行人肉建模，这和上个世纪的专家系统的思路无差，最后在这条道路上能跑出多少复杂的应用来，我们还需要观望。

能不能预测一下这波AIGC的未来趋势？

JET：任何置身其中的人，都很难做好趋势预测，我也不例外。与其说预测未来，还不如站在局中人的角度，提出几个问题，我们共同来围观一下，将来会有什么答案吧。

未来是否会有比Transformer更好的算法，能够更快地产生涌现；
1年内是否会出现单显卡能跑的媲美GPT3.5的LLM；
自然语言交互接口能否在2年内成为ToB软件的标配；
达到GPT4.0的语言能力的多模态模型2年内是否会出现；
世界模型2年内是否能达到12岁人类儿童的智力水平；
国产大模型2年内是否能达到如今GPT4.0的水平；
2年内会否出现算力大贬值，A100进入寻常百姓家；
2年内大模型进入发展瓶颈期，大量AIGC创业公司淘汰出局。
5年后由于大模型的应用，大量互联网内容均由AIGC产生，用户开始厌倦头条和抖音，大型真人秀节目变得更受欢迎；
由于内容的泛滥，互联网广告行业的价值将被极大稀释，品牌的成长变得更具有随机性；

第二部分GPT和数据分析

怎么看Chatgpt在数据分析领域的表现？

JET：微软公司展示过整合了GPT的excel以及office等copilot系列产品，我们可以看到GPT已经能够做简单的描述性统计、数据可视化等工作了。GPT4的演示中，我们也看到了更加通用的功能，用户可以通过上传excel数据，GPT就可以通过调用pyton代码进行常用的数据可视化和简单分析工作，甚至可以通过与人的交互进行简单的数据预处理工作。

从以上能力表现可以推断，GPT至少具备调用第三方工具进行数据可视化的能力，同时它也可以通过其语言能力对可视化结果进行解读，写一些数据分析报告。它也具备一些基本的分析思路，会通过常用的人类思路出发，通过比较、发现趋势、识别异常等方法去分析解读数据。但是这些能力均局限在：

数据要有较好的质量，过于散乱或不标准的数据表，它处理起来效率不高，甚至无法处理；
数据量理论上不能太大，毕竟GPT是个通用的语言模型，它并不能执行大规模的分析运算；
使用者要较好地表达自己的意图，否则GPT可能也不能提供高质量的结果。

我认为对于GPT最好的使用方式不是直接使用它来分析数据，而是调用它最擅长的语言处理能力，去理解用户的意图，并对数据进行总结解读，在此基础上，调用专业的大数据分析工具如DataFocus，去完成复杂、深入的数据分析工作，最终用户会获得更加沉浸式的使用体验。

GPT会颠覆BI这个行业吗？

JET：GPT从3.5诞生开始就一路狂飙，到现在，几乎已经通过病毒传播的形式完成了早期市场教育，大量非IT人士都已经了解到AGI、大模型、生成式AI等概念，也有非常多的用户通过api和bing体验到了其魅力。它最令人惊艳的能力，还是多轮对话的上下文理解，以及生成内容的丝滑自然。偶有破绽，但已无伤大雅，这就使得它具备了大规模被用户采用的基础。说到底，AI好不好用主要取决于使用体验，GPT经过半年时间的炒作，应该即将达到愚昧之巅。

但是说到他对行业的颠覆，还为时尚早。目前来看，我们能看到的GPT用于数据分析领域的几类落地应用有这么几个。一是通过ChatGPT对话，收集数据，生成图表，解释图表；一个是通过插件上传数据，进行描述性分析；还有一个就是利用GPT的代码生成能力，通过自然语言交互生成SQL。第一种ToC的场景居多，造点儿数据，甚至爬取点儿数据，不在意数据的准确性，简单的玩耍当然不成问题，如果收集数据足够多，成本可能是个问题；第二种场景，也是toC的居多，前提是数据要做较好的预处理，并且使用人员要善于提问，当然，仍然存在一个成本问题，要知道一张10MB的数据表，token可是很值钱的；第三种场景，也有很多落地项目，包括阿里的chat2DB，国外的Text2SQL.io，以及Y combinator孵化的几个项目。这类和Github的Copilot类似，主要用于提升数据库工程师的开发速度，用于快速生成SQL。总体来看，ToC领域的落地场景比ToB领域更多。

从BI行业来看，DataFocus、Thoughtspot是最早致力于自然语言交互方式的BI产品，但目前BI的主流交互方式仍然是拖拽。Tableau、PowerBI等产品也曾经尝试在拖拽交互之外增加了NLI的交互方式，国内如SmartBI、sugarBI、网易有数和亿信BI等也是这种技术路线，但是这种画蛇添足的方法，反而给用户带来了困扰，革命不够彻底。2021年初创企业北极九章、MagicBI等则是彻底采用了DataFocus和Thoughtspot一样的交互方式，只提供自然语言搜索的交互方式，这些产品都还不能提供免费试用，目前难以评估其效果。但是这种聚焦于自然语言一种交互方式的BI产品，才应该是未来BI领域最终的产品形态。

而ChatGPT出来之后，关于数据分析问答式交互，搜索式分析这种体验的市场教育工作，大大地减轻了。当大量的用户习惯于通过自然语言交互的方式获得答案之后，他们将会彻底接受类DataFocus的交互方式，拖拽式交互也将随着上一代BI产品引入GPT的能力而逐渐退出历史舞台。与其说GPT会颠覆BI产业，还不如说GPT将大幅改造BI行业，把整体的BI软件的使用体验提升一个档次, 从而大幅提升BI产品的采用率，促进BI行业健康发展。

DataFocus的关键技术是Text to SQL，大模型是否已解决这个问题？

JET：大模型出来之前，Text2SQL一直是NLP领域的一个细分的热门研究方向，也是一个难度极大的课题。其根本问题在于人类语言表达的随意性收敛到规范的SQL表述中时，很难找到一个很好的函数去刻画。大模型基于语言能力的涌现，很好地突破了这个问题。

从我们的测试结果来看，GPT3.5在Text to SQL上的表现已经超越了此前已发表的技术文献中的最好成绩，GPT4的准确率更是几乎可以达到89%以上。当然，要获得如此成绩，前提是你得认真地问问题，需要准确和完备的上下文提示。这个要求对于非技术人员来说，其实是很高的，换句话说，你首先得是一名有经验的数据库工程师，可以熟练操作数据库。这方面和用Copilot进行辅助编程体验差不多，如果你有很好的代码基础，GPT可以很好的提升你的生产效率，但如果你不具备这些技术基础，就不能很好的发挥效率优势。

DataFocus也集成了GPT的SQL生成能力，用以给技术人员开发数据视图。但是更好的使用样例，还是把GPT和Focus Search相结合，提供关键词搜索辅助。这有两个吸引人的优势：一方面，使用者只需要能有效理解自然语言，不需要掌握SQL语言，就可以很好地操作；另一方面，可以通过这种方式熟练掌握关键词搜索技巧，从而最大限度地提升输入效率。可以说，关键词输入是最精炼、最准确的提示工程用例。

谈谈GPT出现以后，对DataFocus产品的冲击有多大？

JET：大家都知道DataFocus的搜索分析能力我们团队是潜心开发了近6年时间的。一开始我还以为被革命了。深入使用以后，我发现还是有差距，目前来看，直接利用GPT的API改造传统BI，增加自然语言查询的接口，很容易实现，但是使用体验还达不到工业可用的程度。这种不可行性体现在两个方面：一是真正商用场景上的数据分析，其复杂程度远高于OpenAI的Demo水平，你很难控制用户的使用方式，这将导致使用体验很难对齐；另一个是GPT的SQL生成，仍然存在准确度不够的问题，这在正式的商用场景上是不可接受的。在商业软件上引入不完全可靠的功能，有可能会得不偿失。

如今，半年过去了，GPT对DataFocus，甚至对数据分析行业的利好逐渐增多，由于对大众用户的普及，大家接受了问答式交互方式，不再质疑五年前DataFocus提出的搜索式分析，问答式交互的概念，也开始逐步认识到拖拽式分析方式要逐渐退出历史舞台。

聊一下关键词的问题。一开始我们就发现，数据分析工作要做好，提出好问题最重要。因此，如果放开让用户完全放飞自我进行自然语言查询，最终的结果就是状况百出，你会发现除了输入法错误，俚语，表达方式错乱以及摸棱两可的问题之外，更可怕的是用户的问题跟数据的相关性完全无法控制，这将导致大量的衍生问题，最终都导向一个结果，那就是用户体验参差不齐，根本就达不到一个工业软件的可使用状态。

其实GPT同样存在此类问题。大家现在看OpenAi，尤其是微软的各种demo演示，各种发布会演示，惊为天人，都感觉以后的工作就只需要一句话了，AI能把所有的事情都干了。这是最大的问题，这种用户认知和用户体验上的鸿沟至少还需要1年时间来填平，如果填不平，AIGC将沦为下一个元宇宙，尴尬地退出舞台。

DataFocus的关键词设计是出于什么考虑呢？这个我们以前也有讲过，你仔细琢磨一下就会发现，其实人类的语言交互包含大量的冗余信息，这些冗余信息导致了信息的模糊，语境差异等等丰富的场景化的东西。这些东西在数据分析的时候有必要吗？我们不是在演话剧，也不是搞社交，完全没有必要把问题弄得摸棱两可。如果有一套关键词体系，你会发现，输入效率有极大的提升，同时精准度也会有质的提升，这些都降低了计算的复杂性，降低了对硬件的消耗。那么关键词有什么好处呢？一是大幅提升输入效率和精准度，另外，也可以训练用户能够提出正确的问题。这就像你让车手在大草原上飙车，效果肯定不如在高速公路上好的原因。有一些简单的规则，会极大地提高解决问题的目的性，速度和效率。

GPT出来之后，DFC的产品演化方向是什么？

JET：积极拥抱大模型的能力，这是所有现有软件产品都必须做的功课。我们也不例外。尽管很早以前我们就一直在教育市场，对话式的，搜索式的交互方式，拥有更高的效率，更丝滑的体验，但是，直到GPT风靡之后，大家才逐渐认识到这一点。GPT的多轮交互能力，意图识别能力以及总结写作能力，是目前最成熟的，最容易被用户认可的，应该有限引入。

DFC将会全面接入GPT这方面的能力，从而加强产品的体验，让用户体验到完全的AI驱动的数据分析软件，这将会在原来的基础上，产生更深的代际进步，从而真正实现让业务精英都成为数据科学家，人人都是数据分析师不再是口号。

前不久，DataFocus发布了小慧Beta版，借助语言模型的能力，强化DataFocus的用户体验。小慧的目标是降低用户使用门槛，提升使用体验：一是作为搜索辅助，可以帮助用户更快地上手搜索分析，用户可以通过完全自然语言的提问，展开数据分析，小慧会将用户的问题转化成DataFocus的关键词语句，从而确保数据计算的准确性，同时可以帮助用户理解和学习DataFocus的关键词搜索方法；此外，小慧还可以支持在移动端直接通过语音查询分析数据。

第三部分聊聊ToB行业

有人说GPT将完全颠覆ToB软件行业，你怎么看。

JET：GPT将会全线赋能ToB软件行业，这是毋庸置疑的。但是说GPT会完全颠覆ToB软件行业，我觉得危言耸听了，或者至少言之过早。我的判断是3-5年内，toB软件的格局基本上不会有太大的变化。首先，强者恒强的逻辑不会变。这里面有两层含义，一方面toB的获客流程不象ToC那么简单，是一个复杂的过程，因此销售驱动型的软件企业，尤其是行业头部具备一定品牌能力的软件企业，仍然是不容易被撼动的。另一方面，ToB软件的迁移成本过高，客户也不太可能快速、大范围地迁移到新产品上去。此外，由于大语言模型是一种赋能型的服务，可以被所有人调用，因此，老牌软件公司，也可以通过调用API的方式引入GPT的能力。

虽然，总体上来说ToB软件不太会发生大的革命，但是在一些细分赛道或行业，的确会受到毁灭性的打击，比如一些客服软件，一些售后支持软件，一些内容创作软件，可能大概率都会消亡。因为这些都是GPT原生的能力，并且也很容易被使用，尤其是大量的开源生态、框架出来之后，开发一个售后服务支持软件的难度已经最大限度地降低。当然，除非一些垄断了独家数据或知识的企业，他们可以在其产品上集成GPT的能力，同时整合自身的数据优势，从而获得大模型AI加持，继续维持其竞争力。

最后，会有少量企业借助这一波大模型的AI热潮走出来。这类产品本身结合了GPT的问答交互体验，从根本上就创造了完全不同的用户体验，这类产品会随着GPT能力的增强，继续强化这种交互上的体验差异，从而获得一波用户交互体验范式转变的红利，成为新品类软件的领头羊。比如DataFocus，从一开始就基于问答的交互方式去构建，完全摒弃传统BI的拖拽模式；随着GPT影响的深入，并最终落地，大量用户将会最终接受搜索、问答作为默认交互方式，这样DataFocus将会完全区别于过时的拖拽式体验，而获得新品类产品的认知优势，成为搜索式分析产品的代名词。

SaaS企业还能投吗

JET：现在有一种论调是说SaaS在中国已经全军覆没，完全没有机会了。现在SaaS行业还值得投资吗？其实很多人并没有认识到SaaS的本质，有人觉得SaaS就应该是切入到垂直领域极小功能的最大市场化，这些人是Copy from American的信徒；也有人认为SaaS本质上就是软件的分期付款；还有人认为SaaS就是云服务。

在谈SaaS之前，我们首先得搞清楚软件服务这个行业，它包含至少两类典型的公司形态，一种就是做产品的，一种是提供开发服务的。后面这一类，国际上如Infosys，国内如中软国际、软通动力是最大的代表，也能上市，但是其没落的趋势是有目共睹的。我始终认为，提供软件开发服务，以项目定制为基本商业模式的企业，无论包装得多光鲜亮丽，也算不上是SaaS企业。

SaaS企业必须以软件产品为中心，这样才能够提供足够标准化的服务，才具备边际成本递减等规模效应。

搞清楚了这个问题，我们再来看国内的toB行业，为什么SaaS一直在底部徘徊，看不到欧美那种高光的表现？问题并不是出在在座的各位，问题出在市场上。要知道中国的软件服务市场是非常割裂的，否则你们很难看得懂为什么搞服务器的浪潮能在切入软件赛道搞得风生水起，一个市场上知名度并不高的航天云网是一家以软件服务作为主营业务的上市公司。上面这两家公司主营体制内市场，很多saas企业都懂，软件市场很大一部分在国企，在央企，在事业单位，但是这些都不太可能成为他们的客户。

于是，大部分没有特殊市场能力的saas企业仅剩的客户群体就是以民营经济为主的各类企业了，在这个客户群体里面，小微企业并不需要ToB的软件服务，他们可以借助一些ToC的工具解决问题。

如此贫瘠的土壤上并不能期望开出一片花海，难道就没有希望了吗？

我相信中国将会继续坚定的走市场经济之路，疫情三年的压力缓过劲儿来之后，民营经济也将重新焕发生机，到那时候，SaaS企业的生存环境一定会比现在好很多。至于体制内那一片大市场，一方面我认为SaaS企业仍然有机会进入这个体系，当然这取决于一些政策的变化；另一方面我们可以看到当仅仅只有市场能力，产品力和实施能力跟不上的那些软件公司在这一波数字化浪潮中把口碑搞砸了之后，一些极具竞争力的SaaS企业仍然有机会进入一些缝隙市场。当然，最后，我觉得有能力卷到国际上的SaaS企业也将收获另一片天空。

接下来，也许1年之内，随着美联储再次开启闸门，SaaS企业将有机会再一次领略山顶的风光，所以，对于有好的产品，好的口碑的SaaS企业，此时此刻，该出手时就出手，是一个聪明的投资人的选择。

对话DataFocus创始人：大模型会颠覆ToB行业吗？

第一部分LLM大模型

第二部分GPT和数据分析

第三部分聊聊ToB行业

推荐体验

相关资讯

ChatGPT会颠覆科技行业吗

对话澜舟科技创始人兼CEO周明：马上采取行动，拥抱大模型

ChatGPT和Sora会颠覆营销行业吗？

程邀｜对话360集团创始人周鸿祎：把大模型拉下神坛

Shopify创始人对话OpenAI CEO Sam Altman AI摘要

近期资讯

四川省鑫鼎顺玻璃取得双向打磨玻璃装置专利，具有打磨效果好且工作效率高的优点

如何轻松找回忘记的ID密码及提升账号安全性的方法

如何轻松设置QQ聊天背景，提升个性化聊天体验

如何轻松设置Windows 10的锁屏时间，提升使用体验与安全性

如何轻松打开华为手表蓝牙并连接手机的详细步骤解析

山西绿建智造取得中空玻璃加工用磨削加工机专利，避免玻璃破碎

如何轻松查看电脑主板型号的多种方法与技巧

晶安玻璃取得玻璃磨边机辅助组件专利，减少玻璃加工的时间

滕州市丰华玻璃取得钢化玻璃倒角装置专利，实现对钢化玻璃进行倒角的目的

四川佛能达取得防火玻璃生产用倒角机专利，方便对不同防火玻璃倒角过程中的限位工作

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响