复旦大学计算机科学技术学院教授张军平
出品|搜狐科技
作者|郑松毅
最近,OpenAI对非支持国家和地区账号的封管力度再次加磅的消息在科技圈传的沸沸扬扬。
不少API开发者收到了来自OpenAI的一封邮件,“自7月9日起,OpenAI将开始阻止来自非支持国家和地区的API流量。受影响组织若希望继续使用OpenAI的服务,必须在其支持的国家和地区内访问。”
目前,OpenAI共支持161个国家和地区,中国内地和中国香港不在该支持名单内。
消息发酵当天,在很多人开始担心OpenAI API不再可用时,阿里、百度、智谱AI等国内AI厂商纷纷推出了“迁移服务”,通过价格优势来吸引用户,并提供与OpenAI API功能相似或具有差异化优势的API服务。
不难理解,这是在大模型“价格战”后,国内科技厂商等到的又一争抢客户时机。
OpenAI为何在此时加强封管?封管的目的是什么?会对大模型研发工作造成什么影响?迁移到国内的API是否好用?
带着这些大家关心的问题,搜狐科技与复旦大学计算机科学技术学院教授张军平聊了聊。
在张军平看来,OpenAI此举有可能是出于对国内大模型的封堵,主要是禁套壳、禁学习。
他认为,“国内大模型发展迅速让OpenAI也有了压力,就像美国不是也在说不希望国人过去学STEM,可能是类似的想法。”
清华大学长聘副教授、面壁智能首席科学家刘知远也有同样的看法,“OpenAI之前的使用协议就不允许对中国地区开放,只是现在邮件又特别强调了,说明国内大模型能力已经有了接替实力。”
这一说法并非无从例证,以阿里云最新一代开源大模型Qwen2-72B-Instruct为例,在斯坦福大学大模型测评榜单上,其排名全球第五,性能比肩GPT-4,且其API价格仅是OpenAI的1/50。
斯坦福大学大模型测评榜单:阿里云最新一代开源大模型Qwen2-72B-Instruct排名第五
这样的大模型对手,怎会不让OpenAI重视起来?
用OpenAI CEO山姆·奥特曼自己的话说,“中国将在大语言模型领域扮演重要角色,孕育出具有本土特色的独特模型。”
从当前全球AI战局来看,就算是OpenAI这样的“领跑者”,大模型技术进展也在肉眼可见地放缓。
6月26日,OpenAI针对此前展示的高级语音功能发布最新进展称,原计划在六月底开始向少部分ChatGPT Plus用户推出alpha版本,现在需要再花一个月时间才能达到发布标准。
除了鸽了说好的语音功能,一直被外界期待的GPT-5发布日期也是一拖再拖,本被业界预期会在夏季发布的GPT-5,按当前预测,可能延迟到了2025年底或2026年初推出。
张军平对此解释道,“模型越大,越不好训练,节奏放缓很正常。数据版权、安全风险监管、以及算力等问题都需要更好的解决方案。”
有一种可能是,以OpenAI为代表的AI“领跑者”在构建大模型更高级功能系统时遇到了更为复杂的问题。
如果说如今海内外在大模型研发领域都已经突破了从0到1的瓶颈期,那在从1到10的阶段,OpenAI还是站在了顶风处充当着探路者的角色,走的慢了些。
面对赛道上其他选手的奋力追赶,为了保住自己的领跑位置,加磅封管力度的确是可选方法。
话说回来,国内大模型对OpenAI API的依赖性到底有多大?离了OpenAI还能不能行?
据悉,OpenAI的API是一种工具,允许开发者将OpenAI的各种模型(如GPT-4)集成到他们的应用程序、网站或其他项目中。
通过使用API,开发者可以实现自然语言处理相关的功能,包括但不限于语料数据生成、模型微调、软件开发、自动化办公等。但也不排除有部分科技公司违规使用API,做“套壳”模型。
张军平介绍,“国内套壳行为还挺多的,尤其是初创公司,只需做一个交互页面,当用户给进来问题,直接发给GPT,回答完再从自己的壳里回复用户。用户是不知道这种情况的,一开始能赚很多钱,但实际上违反了国家数据安全法。”
“大厂至少现在不太需要这么做了,但在构建语料库方面可能还是会对OpenAI API有依赖,因为OpenAI的语料库是最大的,在无法获得公开数据集的情况下,可以通过向API询问和获取回答来重建大模型研发所需的语料库。”
但张军平也提到,“就算OpenAI API不再可用,迁移到国内大模型API也不一定就会落后,国内(大模型)指标又不是各项都差,有些还是领先的。”
有技术人员判断,OpenAI此举可能会对国内的AI开发范式造成一定影响,过去开发者会用GPT来进行产品路线验证,毕竟如果最好的大模型都没法把自己产品跑起来,性能差一点的模型无疑更难,可能要花更多的时间来进行产品验证。
张军平表示,“短时间内不好说有多少开发者会选择迁移国内API,毕竟这就像一场‘API现形记’,谁在用,谁在改,全都一目了然。”
也有开发者认为,“选择迁移国产API也不一定是因为OpenAI不让用了,对于一些项目而言,国产模型和GPT-3.5的水平差不多,虽然比GPT-4的性能要差一点,但价格的确实惠很多,也能实现目标功能。”