无声处的惊雷：OpenAI和微软的竞争悄然开始

作者：李智勇发布时间：2024-11-18

在OpenAI 开源了个Swarm演示Multi-Agent后，微软则开源了magentic-one。虽然演示的功能不太一样，前者关于业务逻辑处理，后者关注文件访问这些基本操作，但这也是个Multi-Agent的例子。横向比较，微软的比OpenAI的略好，可以解决实际问题，真能用。但关键却不在这里，而是当你把两个项目放在一起做比较的时候，你就会发现一种无声的竞争已经开始。

我们有理由相信，随着Multi-Agent的智能原生程序变的越来越关键，这种竞争也会变得越来越激烈。

很多做战略分析的同学未必愿意读代码，愿意读代码的同学未必愿意花心思发现这种竞争的导火索，所以我在这里挑个事，还是把这事再说说。

OpenAI Swarm做了一期AI碰撞局，记录参见：人类优先还是智能优先？（暨AI碰撞局第十三期小记），等我空了针对magentic-one很有必要再做一期，也用非技术的语言再说说这个项目，并且做个二者机制的对比。

AI的兵家必争之地

什么是AI产业的兵家必争之地?

备受关注的大模型其实基本不是，除非只有一家一骑绝尘，别人的模型水平是1，你是10。

如果大模型是竞争最关键的地儿，那其实OpenAI Swarm基于GPT-4o，微软magentic-one也是基于GPT-4o，大家没什么冲突。你做好模型，我用好模型，你好我好，根本没啥冲突的事。

关键就在于如果你预期的是超级应用，我预期的也是超级应用，那就随着超级应用的价值变大，那超级应用全链条的关键控制点上就会有你死我活的竞争。

OpenAI和微软之间暗搓搓冲突的根源倒不是在于某个应用，而在于谁对AI的基础设施有控制力。

那什么是未来各种超级应用的关键控制点？找出这个控制点就找到了AI的兵家必争之地。

OpenAI和微软的潜在冲突和下面这个被我随手画的简图有关：

其中智能原生应用相关的详细说明参见：真假◎智能原生（AI Native）应用极其挑战

因为我们在说微软，所以我们拿LLM based OS和过去的Windows做类比。

比如我们常用的Windows里面也封装有很多算法，但不管我们在Windows上写多少程序，也不会直接使用里面封装的算法，而是要通过Windows对外提供的接口。这些算法对你是透明的。谁知道Windows里面封装了多少了算法呢？

为什么这样呢，因为Windows里面不止有算法这些功能，还有账户管理、消息机制等把功能链接起来的部分。

上面两张图中，核心差异就是这个：

左侧的图仍然有系统的概念存在，而在右侧的图里，系统的概念消失了，模型不单履行逻辑判断的能力，也还取代了系统。

为什么这会导致剧烈冲突和竞争呢？

多大池子养多大鱼

智能原生应用因为数据所有权不同，所以注定有多个，但LLM based OS和LLM不是的。

这种基础设施是个超级大的大池子，但理论上在一个联通的市场空间里最后可能就剩下少数几个，并且Top1的占据50%以上的市场份额。

谁在AI时代干成这事，谁就是新时代的巨头。

OpenAI需要这个，而微软显然不会放过这个。

可左侧的构图里面有微软的位置，右侧的没有。

如果世界最终选择了右侧的图，那模型即系统，微软公司在AI这块地儿的基础设施上就没有位置！

一切刚刚开始

上面其实是一些猜想，这个猜想有个大前提：智能原生（AI Native）的应用会席卷各个应用场景。这还需要点时间，所以上面说的深层矛盾也就在开源项目上漏出一点端倪。

但数字的事最违反人类常规感知的点就是速度，假如说人类进化的速度是1，制度文化进化的速度是100，那数字的进化速度至少是100万甚至更高。

一两年前大家不知道智能原生到底是什么，但现在上述两个开源项目，每个都是智能原生的。

所以这种潜在冲突也可能在某个瞬间一下爆发出来，关键节点应该是智能原生应用的收入规模。

后续的走势

当前这类竞争会在无声状态开始，短期谁占优由用户的选择决定，但模型如果不继续迭代几次，应用的范围就还是会比较窄。微软这次开源项目附带的说明很直接道出了当前的状态。

1、2、3、4、5、6如果用一句话来简单概括就是你要把它放沙盒里面，然后人类看着点免得造成不可预计的损失。

具体来说就是下面这个任务在跑的时候没准就执行了别的什么，比如把系统搞宕机这种事是可能发生的。

https://github.com/microsoft/autogen/tree/main/python/packages/autogen-magentic-one

在这样一种前提下，这种新的智能原生模式不是不能用，而是范围会被限制的比较窄，你也不敢让它负责出错后代价特别大的事，比如直接做诊疗。

好消息是这种精度问题确定可解决，眼下不知道的是在通用的大模型上到底什么时候解决。

如果有足够的钱其实可以在比较垂直的领域走特斯拉 FSD12走过的路，如果没有那就必须等待通用大模型的升级，这二者其实等价。

理论上如果通用大模型足够强大，那专门训练一个E-To-E的模型和直接把数据扔给通用的模型其实并没有区别。

通用模型哪有什么智能边界！

终点上应用的边界其实是数据的边界。

不管怎么样，这里需要个拐点。否则我们上面说的就只有影子，而不会漏出真身。

这个拐点在技术上是通用大模型的进步，在商业上是出现一个Top的智能原生应用公司。互联网为什么变得如火如荼？本质是因为当年的BAT啊，BAT的那个收入量级确实足以启动一个时代。

这个临界点，我看美国人要到了。Tesla的FSD12就不说了，Glean的ARR一年翻4倍，5500万美金也不算少了。生意常在，而时代性机遇只有一次。

小结

更有趣的事情并不是老美怎么样，而是米国和我国的AI显然会分成两套很难联通的生态系，那国内的情况如何？走到最后米国和我国的生态系最终又会如何竞争、共存？互联网用了20几年来把这类问题交出答卷。从现在开始算，AI可能也需要这么多时间。所以潜在的小时代可能要过去了。

本文来自微信公众号“琢磨事”，作者：老李话一三，36氪经授权发布。

近期资讯

HUIPPT 2024-12-23

白钨选矿废水处理与回用技术

白钨选矿是一种常见的矿石选矿工艺，然而在白钨选矿过程中会产生大量的废水。这些废水含有大量的污染物质，如果直接排放到环境中会对周围的土壤和水质造成严重的污染。因此，如何有效地处理白钨选矿废水成为了亟待解决的环境问题。白钨选矿废水主要的污染物质包括钨、铜、铅、锌、草酸盐等重金属和有机物。传统的废水处理方法主要是采用化学沉淀、离子交换和生化处理等方式，然而这些方法存在着设备成本高、污泥处理难题大、操作复杂等问题。因此，针对白钨选矿废水的独特性和复杂性，发展一种高效、低成本的处理技术显得尤为重要。 [图片] 目

污水零排放13380177697 2024-12-23

电报的位置功能你有了解过吗？一个很新颖的功能推荐给大家，快来学习一下！

在 Telegram 中，位置分享与实时位置功能无疑是两项非常实用的工具，尤其在你需要与亲朋好友分享自己的位置或实时行踪时。这些功能不仅能提高你的效率，还能增加出行时的安全感，无论你是在旅行、陌生的环境中，还是与朋友约定见面，它们都能大大提升你的便利性。今天，我将向你详细介绍如何通过这些功能，让你的 Telegram 使用体验更加智能与便捷。首先，Telegram 提供了一个简便的方式来分享静态位置。只需在对话框中点击附件按钮，选择“位置”选项，系统会请求你授权访问设备的 GPS 定位。此时，Teleg

GemLibs 2024-12-23

汽车零部件设计之——油箱吸油口优化仿真APP

汽车零部件是汽车工业的基石，是构成车辆的基础元素。一辆汽车通常由上万件零部件组成，包括发动机系统、传动系统、制动系统、电子控制系统等，它们共同确保了汽车的安全、可靠性及高效运行。在汽车产业快速发展的今天，汽车零部件需求不断增长，其种类也日益繁多，功能愈发复杂，设计愈发精密。使用仿真APP能够在研发初期，在虚拟环境中对各部件在不同工况下的性能指标进行直观展示，从而识别潜在设计缺陷，指导设计优化。不懂仿真知识的设计工程师也能轻松上手使用仿真APP，只需在浏览器中打开仿真APP计算页面，简单设置各项参数，即可

仿真APP 2024-12-23

无声处的惊雷：OpenAI和微软的竞争悄然开始

AI的兵家必争之地

多大池子养多大鱼

一切刚刚开始

后续的走势

小结

推荐体验

相关资讯