被曝秘密使用OpenAI技术，字节跳动回应：小规模应用于实验性项目，4月已停止

作者：金融界发布时间：2023-12-17

近日，据凤凰网等多家媒体援引外媒报道，字节跳动在秘密使用OpenAI技术开发自家大语言模型，违反了OpenAI服务条款。目前，字节跳动的账户已被 OpenAI 暂停。

12月17日，字节跳动就此事对时代周报记者回应：公司在使用OpenAI相关服务时，强调要遵守其使用条款。我们也正与OpenAI联系沟通，以澄清外部报道可能引发的误解。

据字节跳动介绍，今年年初字节技术团队刚开始进行大模型的初期探索时，有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。该模型仅为测试，没有计划上线，也从未对外使用。今年4月，公司引入GPT API调用规范检查后，这种做法已经停止。早在今年4月，字节大模型团队已经提出了明确的内部要求，不得将GPT模型生成的数据添加到字节大模型的训练数据集，并培训工程师团队在使用GPT时遵守服务条款。9月，公司内部又进行了一轮检查，采取措施进一步保证对GPT的API 调用符合规范要求。例如分批次抽样检测模型训练数据与GPT的相似度，避免数据标注人员私自使用GPT。

此外，字节跳动表示：“未来几天里，我们会再次全面检查，以确保严格遵守相关服务的使用条款。”

据凤凰网科技报道，外媒获得的字节跳动内部文件证实，字节跳动几乎在开发代号为“种子计划”的语言大模型的每个阶段都依赖Open AI的应用程序接口(API)，由于字节跳动员工大量使用OpenAI的技术，以至于“种子计划”的员工经常达到OpenAI API的最大访问上限。

报道还提到：“字节跳动更多的是在“种子计划”的早期阶段使用OpenAI的技术。几个月前，公司命令该团队在“模型开发的任何阶段”停止使用GPT生成的文本。”

今年年初，由于ChatGPT的横空出世，各大互联网公司开始布局大模型，在今年年中各家基本初有所成，进入“百团大战”的局面。从时间线上来看，外媒描述中的时间节点与字节跳动回应中“年初应用于较小模型实验性研究，4月该做法已停止”的情况比较接近。

截至目前，百度、阿里、腾讯等多家头部互联网公司均已发布自研大模型并经历多轮迭代。同时，行业共识已进入积极探索大模型应用落地阶段，例如：吉利与百度联手打造的智能汽车极越搭载了百度的“文心一言”大语言模型，阿里在今年也推出了专攻音视频内容的AI产品通义听悟。

今年6月28日，字节发布“火山方舟”。但“火山方舟”并非自研大模型，而是大模型服务平台，字节方面称平台集成智谱AI、MiniMax、百川智能等7家AI科技公司及科研院所的大模型，对外提供服务。当时字节跳动方面对时代周报记者表示，“自研大模型探索中，暂无预期对外发布时间”。

据时代周报记者此前了解，字节跳动自研大模型代号“云雀”。最新消息为9月19日字节跳动旗下火山引擎在科技峰会上宣布火山引擎数智平台VeDI推出“AI助手”。据字节跳动数据平台负责人罗旋当时向媒体介绍，AI助手主要背靠的大模型就是自研的“云雀”。后续“云雀”发布时间一直未有新动态。

来源：时代周报