当前位置:首页|资讯|字节跳动|OpenAI

字节跳动账户被暂停!疑似用OpenAI训练自家大模型?业内人士:类似做法在国内不少见

作者:财联社发布时间:2023-12-18

字节跳动账户被暂停!疑似用OpenAI训练自家大模型?业内人士:类似做法在国内不少见

《科创板日报》12月18日讯(记者 黄心怡) 近日,外媒The Verge曝出字节跳动正在研发一个被称为“种子计划”的AI大模型项目,该项目在训练和评估模型等多个研发阶段调用了OpenAI的应用程序接口(API),并使用ChatGPT输出的数据进行模型训练,这违反了微软和OpenAI的开发者许可。不久后,OpenAI发言人Niko Felix发表声明,确认字节跳动的账户已被暂停并将做进一步调查

对此,字节跳动回应《科创板日报》称:今年年初,有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。在4月公司引入GPT API调用规范检查后,这种做法已经停止。公司在使用OpenAI相关服务时,强调要遵守其使用条款,也正与OpenAI联系沟通,以澄清外部报道可能引发的误解。

多名业内人士对记者表示,把GPT的输出结果作为训练集来训练自己的模型,在国内大厂里这种做法较为普遍,因为这样的开发效率更高。

▍字节跳动:部分工程师曾将GPT的API服务应用于实验性项目中

The Verge的报道中提到,字节跳动发言人Jodi Seth表示,GPT生成的数据在种子计划的开发早期就于注释模型,而今年年中被从字节跳动的训练数据中删除。Jodi Seth还在一份声明中表示,在字节的海外市场中的一些服务使用了OpenAI的API。但在国内的“豆包”,使用的是字节自主开发的“云雀”模型。

OpenAI发言人则声明称:“虽然字节跳动对OpenAI的API使用量很少,但在进一步调查期间,我们已暂停了他们的帐户,如果发现他们不遵守这些政策,我们将要求他们进行必要的更改或终止他们的帐户。”

之后,字节跳动方面向《科创板日报》记者介绍了公司使用OpenAI服务相关情况。今年年初,当技术团队刚开始进行大模型的初期探索时,有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。

字节相关负责人称,该模型仅为测试,没有计划上线,也从未对外使用。在4月公司引入GPT API调用规范检查后,这种做法已经停止

同时在今年4月,字节大模型团队提出了明确的内部要求,不得将GPT模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用GPT时遵守服务条款。

9月,公司内部又进行了一轮检查,采取措施进一步保证对GPT的API调用符合规范要求。例如分批次抽样检测模型输出结果与GPT的相似度,避免数据标注人员私自使用GPT。

该负责人称,未来几天里,会再次全面检查,以确保严格遵守相关服务的使用条款。

记者了解到,字节跳动所涉嫌违反的是OpenAI商业条款,其中提到“不得用使用(大模型)输出来开发任何与OpenAI的产品和服务有竞争的人工智能模型”。不过,这版条例的最早版本发布于8月28日。按照字节跳动的说法,其对于GPT模型的使用在条例发布之前。

▍业内人士:利用国外模型的输出结果来训练较为普遍

在OpenAI和字节跳动的矛盾背后,是当前ChatGPT引发的全球大模型热潮。《北京市人工智能行业大模型创新应用白皮书(2023年)》显示,截至2023年10月,我国10亿参数规模以上的大模型厂商及高校院所共计254家,分布于20余个省市/地区。

随着国内厂商加入“百模大战”中,争相推出自家品牌的大模型产品,有业内人士对记者表示,为了尽快跟上节奏,一些企业用国外模型的API先进行业务试水,训练模型的情况并不少见。

按照外媒的报道,除了调用GPT的API服务,字节也使用ChatGPT输出的数据进行模型训练。

某AI资深研发人士对《科创板日报》记者表示,把GPT的输出结果作为训练集来训练自己的模型,在国内大厂里这种做法较为普遍,因为这样效率更高

此前,创新工厂董事长兼CEO李开复旗下的“零一万物”大模型也被质疑完全使用LLaMA的架构,只对两个张量(Tensor)名称进行修改。

零一万物对此回应称:零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。不久前,零一万物又再度发声表示,公司内部经过几个周的国际国内法律研判,已经确认完全不涉及套壳、抄袭,并给出了进一步的澄清。

(科创板日报记者 黄心怡)


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1