最近一篇文章《Google内部文件首次泄漏:ChatGPT 没有护城河,开源才是大模型未来》,显露了大模型大厂对开源技术竞争的担心。下面简要分析一下相关的技术优势、对硬件需求的影响和对市场的影响。
一、优势
开源大模型技术主要优势如下:
1)可定制性
开源大模型通过LoRA等技术可以在几个小时内在消费级硬件上完成语言模型的定制和微调,这使其具有极强的可定制性。
2)数据效率
开源大模型更加注重高质量的数据而不是海量的数据,可以通过精心挑选的数据集在很短时间内完成训练,这使其在数据利用率上具有优势。
3)私密性
开源大模型受个人使用许可的限制更少,更容易避开监管,这使其在涉及敏感任务时具有优势。
4)可扩展性
开源大模型拥有广阔的应用生态系统,个人和组织可以在其基础上开发定制化应用,这使其具有强大的可扩展性。
5)创新能力
开源大模型的未来发展空间更大,可以通过吸引更多研究人员和资源的参与来实现技术突破,这使其在创新能力上具有优势。
6)许可证优势
开源大模型相比于商业模型受到的许可证限制更少,这使其在发展和应用上更加自由,具有决定性优势。
7)市场竞争优势
与开源大模型竞争可能失败,开源大模型可以通过快速迭代和数量优势最终超越商业竞争者,这使其在市场竞争中具有决定性的优势。
因此,开源大模型技术的主要优势来自于其可定制性、数据效率、私密性、许可证优势、可扩展性和创新能力,这使其在快速发展的AI领域具有竞争优势,其中一些方案甚至值得OpenAI或Google等大厂反过来向开源社区学习。
二、对硬件需求的影响
而开源大模型技术部署门槛更低的原因主要有:
1)LoRA技术可以使模型微调成本大幅降低,普通PC就可以完成。
2)实时推理不需要太高的算力,普通GPU或CPU就可以满足。
3)许可证限制更少,个人开发者更容易获取和部署。
然而,开源大模型技术的广泛应用仍然需要大规模定制化硬件的支持:
1)大规模预训练需要高性能GPU集群和超大规模数据中心。
2)复杂的实时推理任务需要专用的AI芯片进行加速。
3)不同应用场景需要不同的硬件平台,如边缘计算需要边缘服务器等。
4)商业服务化部署需要高性能和高可用性的服务器群。
5)硬件厂商可以通过定制化硬件来实现差异化竞争。
所以,开源大模型技术的发展会同时推动两类硬件需求:一类是普通的商用PC,这可以降低应用部署门槛;另一类是高性能的定制化硬件,这可以支持大规模应用和商业化部署。这两类硬件需求之间会形成一定的互补关系。总体来说,开源大模型技术的发展会推动定制化硬件市场的持续发展,但同时也会通过降低部署门槛来扩大潜在用户群体。
综上,开源大模型技术不仅降低了普通硬件的应用门槛,也推动了定制化硬件的需求增长,两者之间存在一定的矛盾与互补关系。这种关系的变化将影响相关硬件市场的发展方向和格局。
三、对市场的影响
开源大模型技术的发展会对股市产生以下重要影响:
1) GPU生产企业股价上涨
GPU是开源大模型技术的核心算力来源,GPU需求的增加将直接推动相关企业如英伟达、AMD等的股价上涨。
2) 云计算服务企业受益
开源大模型技术的应用离不开云计算服务,这将有利于公有云服务提供商如AWS、Azure和私有云服务商的股价。
3) AI芯片企业成长机会
开源大模型技术的发展需要强大的AI计算力,这将为AI芯片企业如百度昱松、华为昇腾等带来增长机会。
4) 数据中心建设企业增长点
开源大模型技术的发展将推动更多数据中心的建设,这将有利于数据中心解决方案提供商和建设企业的发展。
5) 软件企业变现机会
开源大模型技术需要配套开发工具和软件服务,这将为相关软件企业带来新的变现机会。
6) 商业服务提供商盈利点
开源大模型技术的发展将推动“模型即服务”等新模式的形成,为相关商业服务提供商带来新的盈利点。
7) 人工智能服务企业受益
开源大模型技术的广泛应用将有利于依赖人工智能技术的各类服务企业,促进其业务增长。
8) 行业应用概念股上涨
开源大模型技术将在多个垂直行业得到广泛应用,这将提升相关行业应用概念股的政策预期和投资吸引力。
综上,开源大模型技术的发展将在多个层面上对股市产生重要影响,主要体现在GPU、云计算、人工智能硬件与服务、数据中心建设等行业上。这将给相关上市公司带来增长机会,提升投资者的信心和行业的政策预期,推动股价上涨。同时也存在一定的风险,如替代性技术出现将对相关企业产生冲击。
总体来说,开源大模型技术的发展将推动一段时间内的人工智能和计算机行业的热点行情,并从长期来看有利于相关企业的持续成长。但投资者也需密切关注技术迭代及使用场景的变化,以避开潜在的行业风险。
参考:
https://zhuanlan.zhihu.com/p/627050676
https://www.semianalysis.com/p/google-we-have-no-moat-and-neither