关于AI大模型的10个暴论（上）

作者：AI全景图发布时间：2023-11-05

AI大模型

关于AI大模型的10个暴论（上）

#01从机器翻译看大模型应用落地

大模型正在经历的周期，就是几年前机器翻译经历的。

作为NLP（自然语言处理）中发展最成熟的技术，机器翻译走过的技术演变、产品落地和商业化，可作前车之鉴。

7年前谷歌神经网络机器翻译横空出世，机器翻译突然“说人话”了。统计机器翻译的词语堆叠，突然间流畅通顺。偶尔有疯子式的过译和漏译，但效果足够惊艳。我还记得那个被惊艳到的下午，还发了个朋友圈。

2017年前后，国内一批机器翻译创业公司出现了，大厂也开始组建机器翻译团队，腾讯翻译、阿里翻译、火山翻译、360翻译、金山翻译……

两三年间，出现一大批机器翻译产品，我兴奋地写下《机器翻译产品全景图》。

2020年后，机器翻译公司开始祛魅。技术门槛降低，业务起家的“传统”公司进入，并且做得比纯机器翻译公司更接地气，更落地。

现在的大模型公司顶着光环，好像想象力无限，但一看应用，清一色的对话加上一批大同小异的预置prompt。

随着Llama2等开源大模型的出现，也许用不了2年，大模型也会经历祛魅过程。当然，在这个过程中，一大批尝试性的产品会出现。

然后，“传统”公司进入，把大模型能力直接装进自己的服务中。大模型技术成功业务落地的同时，也意味着大模型公司的分化，可能会倒下一批，还有一批融合到垂直业务，变成一家家从大模型切入的垂直业务公司。

日光之下，并无新事。

#02 行业大模型是否是一个伪命题

几点思考：

• 加拿大计算机科学家里奇·萨顿那篇著名的《The bitter lesson》总结得好：只要增大模型，就可以大力出奇迹，大即是好。

• 从数据角度：一些私有数据大的领域，或者公开数据明显少于私有数据的领域，比如金融，医疗，jungong领域，不知数据优势能大到何种程度，但对于大部分领域来说，互联网的数据其实是更多的。

• 从类比人的角度：对于大部分行业来说，优秀的本科生短时间学习行业知识，比高中生学行业知识，会有更高的认知和应用。比如传统的nlp技术，其实就类似在初中高中就分流，比如中专大专、卫校技校。

• 智能某种程度上就是对现实建模，并且建模的准确度高，能迅速反馈和解决问题。这种能力就是通用的。

• 类比识人：如果一个人在一个领域有成就，往往在别的领域也会有成就。一个人只能在一个领域有成就，底层能力不可迁移，说明不是一流高手。大模型也如是。

通用大模型正在eating垂直模型：垂直／行业模型一段时间的积累，被通用大模型的升级吃掉，如此循环往复。

#03如何看待国产大模型既卷模型，又卷上层应用？

国内大模型厂商几十家，欧美叫得出名字的一只手能数过来。有的朋友开始骂国内大模型厂商不争气：不务正业，不卷技术，模型都没做好，开始来卷上层应用。

我认为有几个原因：

• 国人对科技的态度确实重实用而轻科研，有点“务实”过头的文化和风气。

• 目前模型层和应用层之间似乎看起来很薄，除了类似Dify（模型私有化）和LangChain（中间件）、Zilliz（向量数据库）的中间层，看起来似乎还是太薄，还没有太多中间层的空间。另外，还有jasper.ai这样应用层被击穿的前车之鉴。

• 大模型的应用虽多，目前看起来也远算不上百花齐放。应用层考验对模型和场景的深度理解，以及打破互联网惯性的ai-native思维，极其考验产品经理的产品力。

• 电刚刚发明的时候，大家应该也在卷电灯行业（我瞎猜的，没有考证）。

正好昨天有朋友问我建议，我能分享的是：

• 大模型公司一定会做应用，这个传统在机器翻译时代就存在了。谷歌翻译插件不就是一个杀手级应用吗？所以，接受模型公司会下场的事实。

• 有人把大模型类比于操作系统，类比于个人电脑。认为大模型之上会叠加很多层。比如芯片上面的服务器，数据库，硬件，软件，甚至软件也分层。大语言模型上面会是厚厚的一层。

• 这种类比有一定借鉴意义，但第一性原理告诉我们，类比是危险的，基于事实的层层推理才符合物理。

• 大模型上面有多厚，现在没人知道，但值得尝试在上面盖房子。开始了才会看到下一层是什么，行动产生信息。

• 吊诡的是，从另一角度看，大模型的边界已经显现（王建硕的观点，非常认同），就像window95奠定了Windows的格局，iphone4定义了智能手机（回想一下，从iphone5到iphone15的十一代，和iphone4有什么实质区别吗？并没有。

• 一面是模糊，一面是清晰。上一层可能在当下很薄，在未来很厚。我们现在最缺乏的，是一种“自律的自由”：一方面是对大模型边界的认知，一方面是从旧桎梏中释放的自由和想象力。

#04 大模型预示着脑力时代的终结？

写专利的时候，简单写了个规则，请GPT4给我设计了一个算法，算法有模有样，我试着请它写专利交底书提纲，它也写得有模有样。

今天的大模型就是这样——没有一项精通，但在几乎所有领域都有模有样。

想象你开了一个巨大无比的公司，以极低成本招来了各行各业人才，并且达到了行业中等水平……再把范围扩大，整个社会突然涌入几乎无限的“中等人才”供给……这难道不是一个巨变的开始吗？

“搬砖”的工作在未来不会再有了，考虑到Agent之类智能体的组合能力，未来的世界，如果不能在一个领域做到极致，仅仅因为每个公司都需要那么一个岗位（这是目前大部分机构的招人逻辑），这样的岗位早晚要自动化。

我们的世代，很难想象秦朝组织数十万人，肩扛手推修万里长城的方式，有多浪费人力。未来的时代，也很难想象今天的白领和程序员，处理成批的文档和代码，有多浪费脑力。用四个字形容：暴殄天物。

脑力劳动的时代在渐渐远去，创造力的时代徐徐来临——不论前景是好是坏，纵观人类历史，这无疑是一个巨大的终止符和未知的开始。

#05 打造一家三年后的主流公司

• GPT3阅读了24T、3000亿词的文本语料，覆盖了几乎所有行业岗位从业者的岗位知识。除了少部分没有联网的职业，大模型角色扮演几乎覆盖所有职业。

• 想象你开了一家100人的公司，除了你，其他99个是AI。AI产品、AI设计、Ai开发、AI测试、AI项目经理、AI客服、AI市场、AI销售、AI财务（只是不需要行政和人力：）

• 当然这99个AI有三个问题：

◦ 能力中等：都不是专家，但经过微调能达到中位数水平。

◦ 信任问题：他们可能会出错，有幻觉，恐怕每个岗位要增加一个对应的岗位QA（监工）。

◦ 如何协作：虽然有Agent的概念，实际落地还有点远，可以放到AI agent的话题谈。

• 目前大部分公司，都在依靠人力杠杆产生的规模效应。特别是大规模的流水线项目，比如翻译，编程，设计，研究，文案，编辑，那种密密麻麻的大片工位……可能有巨大的AI红利未被释放。

• 如果不是一个公司，某些平台也可能失去竞争力，比如Upwork、猪八戒网，这类职业和技能大军组成的平台。未来可能会出现虚拟数字人版的upwork和猪八戒网。

• 今天正处于虚拟个体到虚拟组织的演进阶段。三年后，虚拟和人类混合组织就是主流公司，甚至虚拟为主。

关于AI大模型的10个暴论（上）

关于AI大模型的10个暴论（上）

推荐体验

相关资讯

关于ai绘画我有些思考。(含暴论，谨慎观看)

有关 AI 与产品经理的三个暴论

论ChatGPT关于提升英语发音的建议

论关于GPT发展的异样感及其思考

加速分化：关于大模型走势的十个判断

近期资讯

中航光电获得实用新型专利授权：“一种连接器”

掌握圆柱体积计算的基础与实际应用技巧

龙利得获得实用新型专利授权：“一种防拆防伪识别功能箱”

中远海特获得发明专利授权：“一种吊装路径规划模型构建方法及系统”

长飞光纤获得发明专利授权：“一种光纤模场匹配器及其制备方法”

新手指南：轻松注册与使用QQ的详细步骤与技巧

忘记微信登录密码？教你轻松找回的方法与注意事项

豪鹏科技获得发明专利授权：“锂离子电池及电子设备”

手机显示“紧急呼叫”的原因及应对方法解析

手把手教你制作精彩陀螺视频，分享创意与技巧

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响