文 |InternetLawReview
今年早些时候,美国联邦贸易委员会(FTC)要求五家公司提供有关生成式人工智能公司和主要云服务提供商的近期投资和合作关系的信息,包括Alphabet(谷歌母公司)、亚马逊、Anthropic、微软和OpenAI。2024年6月6日,美国司法部与联邦贸易委员会(FTC)达成协议,将分头调查微软、OpenAI和Nvidia是否存在反竞争行为。
与此同时,随着欧盟《人工智能法案》出台,欧盟委员会对人工智能调查的兴趣日益浓厚。2024年3月和5月,欧盟委员会分别向Google、Facebook和TikTok、微软发出了正式的信息请求,要求提供有关生成人工智能带来的风险和缓解措施。2024年7月16日,英国竞争和市场管理局(CMA)宣布启动针对“微软聘请Inflection AI核心团队”的调查,以确定此次招聘是否等同于“并购”。
这种竞争检查之所以如此紧迫,一方面,是因为竞争监管机构不希望再次被大型科技公司打得措手不及;另一方面,在人工智能大模型发展的内在条件上,似乎就带有“集中”和“限制”的属性。因此,不管是欧盟还是美国,都似乎更倾向于在科技公司成功占据了AI市场主导地位之前,进行“事前干预”。
一、人工智能发展内在“反竞争”属性?1、云基础设施和计算能力的壁垒
一些专家认为,人工智能的寡头垄断市场几乎不可避免。
对于AI初创公司来说,模型训练是一项昂贵的固定成本,也是其进入人工智能市场的主要障碍。仅靠投资人烧钱的方式很难持续承担这些成本。
而只有最大的大型科技公司(主要是谷歌、亚马逊、微软和Meta以及苹果和Nvidia,统称为GAMMAN)才拥有所需的云基础设施和计算能力,以满足最大型AI模型的训练需求。GAMMAN对关键资产的控制,将较小的初创企业限制在从属角色。
这就解释了为什么人工智能初创企业往往愿意寻求与大型科技公司达成合作协议。比如,最典型的就是OpenAI与微软的合作,用计算基础设施的使用权换取GAMMAN对其最新模型的使用权。又或者,AI初创公司也可以远离技术前沿线,专注于在特定任务上表现良好的小型AI模型,为大型模型“打基础”,以创建具有专有数据的应用程序。
图:大型科技公司与小型人工智能初创企业之间的合作协议(来源:英国CMA)
2、获取有版权数据的壁垒
许多高质量的文本、音频和图片AI训练数据集都受版权保护。作者原则上可以对其作品的使用收取许可费。这将引发额外的成本导致的训练数据供应缩减。这还将增加模型训练的成本,并减少模型开发者之间的竞争。
欧盟《人工智能法案》要求模型开发者遵守《版权指令》中规定的《欧盟版权法》,特别是第4条,该条授予商业研究的版权例外,但允许版权持有人选择退出此例外。在美国存在一定的法律不确定,有几起案件悬而未决。如果法院裁定不适用合理使用例外,人工智能投资者将面临惩罚性法定赔偿的风险。为了避免这种情况,最大的人工智能公司已经与大型媒体公司签署了数据许可协议。例如,OpenAI与《纽约时报》、贝塔斯曼媒体集团和Reddit新闻平台签署了协议。
如果各国严格执行版权法,人工智能模型获取训练数据的困难就增加了,规模较小的人工智能开发商和初创公司可能没有财力支付版权许可,以至于被完全挤出市场。
3、接触用户途径的便利性
AI模型开发者需要商业渠道来创造收入,以支付训练和运行模型的成本。
一些初创公司从头开始建立自己的商业模式,而且还比较成功。例如,OpenAI创建了一个收费的GPT应用商店,还向专业版ChatGPT的用户收取订阅费。在ChatGPT推出一年内就覆盖了1亿多用户。
然而,对于那些网络效应较弱甚至没有网络效应的人工智能初创企业来说,从头开始建立商业模式是很困难的。一种更简单的创收途径是与GAMMAN合作,将人工智能模型嵌入到他们成熟的商业模式中。例如,谷歌正在将自己的和第三方的人工智能模型嵌入其搜索引擎和其他服务中,对部分人工智能驱动服务的访问收取高价。
所以,尚未形成商业模式的初创企业也愿意与GAMMAN合作,将AI模型嵌入其价值链下游端——现有的GAMMAN面向用户的服务中;作为回报,初创企业在价值链上游端进行反向合作,GAMMAN授予初创企业访问计算基础设施和可能的训练数据的权限。
二、GAMMAN 和 AI 初创企业之间的“竞合”协议是否属于 “并购”?
基于以上原因,想要保持技术前沿地位的AI初创公司需要与GAMMAN签署竞合协议,以克服训练成本和获取客户的障碍。GAMMAN可以沿着整个AI价值链进行垂直整合,而初创企业主要覆盖价值链的投入和中间部分。
图:AI初创企业与GAMMAN的合作竞争模型(来源:Brugel)
竞争管理机构对这些交易和协议持怀疑态度,担心竞合协议可能会成为GAMMAN施加影响力并减少AI初创公司竞争的木马。其中一个重要的法律问题在于,GAMMAN从战略投资到挖走初创公司创始人和技术人才等行为,是否是一种只在规避反垄断监管的新的并购方式——“准并购”?
但竞争管理机构的几项调查迄今为止尚未找到任何确凿证据。
尽管欧盟委员会于2024年4月得出结论,认为微软对OpenAI的投资安排不属于收购,但它仍在继续调查是否对该安排展开正式的反垄断调查,理由是该安排可能会对欧盟内部市场产生扭曲影响。德国也是类似,在2023年11月确定该安排不受德国合并控制,但如果微软未来增加对OpenAI的影响力,它保留了重新审查的可能性。
美国反垄断执法机构如今也加入调查的行列。
三、生成式人工智能反垄断调查的突破口
如果“准并购”的概念在法律上难以突破,那么监管机构很可能将从生成式人工智能所依赖的一个或多个关键构件的控制寻求突破。
1、数据
与硬件不同,训练数据是非竞争性的,可以同时被许多人使用。然而,许多高质量训练数据来源都受版权和许可费用的约束。
特别是在专业领域或数据监管更为严格的领域(如医疗保健或金融)尤其如此。预训练或微调一个在这些领域拥有深厚专业知识的模型可能需要访问大量数据,而这些数据并不广泛可用,而且对于市场新参与者来说很难收集。
当然,仅仅拥有大量数据并不违法。然而,反垄断执法机构可能对公司对数据的控制进行特别关注,以分辨其是否可能减少数据的供应、造成获取的障碍、阻碍公平竞争的充分发展。
2、人才生成式人工智能的另一个重要投入是劳动力专业知识。开发生成式模型需要大量工程和研究人员,他们必须具备特定且相对稀缺的技能,并且对机器学习、自然语言处理和计算机视觉有深入的了解。公司能够获得和留住的人才可能不仅在生成式人工智能的发展路径上发挥关键作用,而且在发展速度上也发挥关键作用。
由于人才稀缺,实力雄厚的公司可能会有动机锁定员工,从而扼杀来自实际或潜在竞争对手的竞争。为了确保市场竞争和创新,必须允许具有创新想法的人才自由流动,而且至关重要的是,不要受到竞业禁止条款的阻碍。
英国CMA在7月宣布对微软聘请Inflection AI(OpenAI的竞争对手)核心团队所进行调查,就属于此类。另外,美国FTC于2024年4月23日宣布的全面禁止所有员工(包括高级管理人员)签署新的竞业禁止协议,也是为了促进IT人才的流动。不过很快就被法官挑战其合法性,前景尚不明朗。
3、计算资源
生成式人工智能系统通常需要大量计算资源。计算通常需要专用硬件,例如带有图形处理单元 (GPU)等专用芯片的计算机,或者通过云计算服务来获取计算资源。然而,芯片的运行维护成本和云服务价格都很昂贵,目前也只有少数公司提供,这增加了反竞争行为的风险。
如今,一些专用芯片市场已经高度集中,而且对服务器芯片的需求可能会超过供应。例如,对可用于训练AI的服务器芯片的需求激增导致短缺,促使AWS、微软、谷歌和甲骨文等主要云服务器提供商“限制向客户提供产品”。而高度集中的市场中的公司更容易采取不公平的竞争手段或其他反垄断法违规行为。
2022年,美国联邦贸易委员会针对英伟达(Nvidia)的诉讼进行两个多月后,英伟达宣布放弃了以400亿美元收购Arm的计划。此次合并如果成功,可能将扼杀多个处理器市场的竞争,包括云服务提供商的芯片。
四、关注:人工智能供应链中不同细分市场
未来反垄断机构针对人工智能的调查,将在一定程度上从主要的市场进入壁垒(比如模型训练成本)转移到人工智能供应链中不同细分市场的潜在竞争问题上。
同时,他们更愿意在反竞争行为之前,向市场提供保持这些细分市场开放和可竞争的方法,让新企业可以参与竞争,研究人员可以自由地转向能够最好地推进技术发展的工作,企业家可以继续创新。
英国竞争管理委员会提供的行为规则指导,可以为相关企业提供一些指引:包括对硬件和数据的开放访问、向人工智能企业和消费者提供各种商业模式、不降低他人竞争能力的合作伙伴关系、不偏向人工智能服务和模型、不搭售或捆绑销售。
企业应当在了解正在使用人工智能技术的性质、如何使用机密数据以及谁有权访问这些数据的基础上,避免使用有关公司使用人工智能的不精确和不准确的营销材料。因为这些材料可能会被误解为暗示公司或行业对人工智能的使用正在促进反竞争行为。
相关阅读
反垄断观察丨美监管者嗅到微软投资OpenAI的垄断味道,还有亚马逊谷歌
参考资料: