近日,据凤凰网等多家媒体援引外媒报道,字节跳动在秘密使用OpenAI技术开发自家大语言模型,违反了OpenAI服务条款。目前,字节跳动的账户已被 OpenAI 暂停。
12月17日,字节跳动就此事对时代周报记者回应:公司在使用OpenAI相关服务时,强调要遵守其使用条款。我们也正与OpenAI联系沟通,以澄清外部报道可能引发的误解。
据字节跳动介绍,今年年初字节技术团队刚开始进行大模型的初期探索时,有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。今年4月,公司引入GPT API调用规范检查后,这种做法已经停止。早在今年4月,字节大模型团队已经提出了明确的内部要求,不得将GPT模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用GPT时遵守服务条款。9月,公司内部又进行了一轮检查,采取措施进一步保证对GPT的API 调用符合规范要求。例如分批次抽样检测模型训练数据与GPT的相似度,避免数据标注人员私自使用GPT。
此外,字节跳动表示:“未来几天里,我们会再次全面检查,以确保严格遵守相关服务的使用条款。”
据凤凰网科技报道,外媒获得的字节跳动内部文件证实,字节跳动几乎在开发代号为“种子计划”的语言大模型的每个阶段都依赖Open AI的应用程序接口(API),由于字节跳动员工大量使用OpenAI的技术,以至于“种子计划”的员工经常达到OpenAI API的最大访问上限。
报道还提到:“字节跳动更多的是在“种子计划”的早期阶段使用OpenAI的技术。几个月前,公司命令该团队在“模型开发的任何阶段”停止使用GPT生成的文本。”
今年年初,由于ChatGPT的横空出世,各大互联网公司开始布局大模型,在今年年中各家基本初有所成,进入“百团大战”的局面。从时间线上来看,外媒描述中的时间节点与字节跳动回应中“年初应用于较小模型实验性研究,4月该做法已停止”的情况比较接近。
截至目前,百度、阿里、腾讯等多家头部互联网公司均已发布自研大模型并经历多轮迭代。同时,行业共识已进入积极探索大模型应用落地阶段,例如:吉利与百度联手打造的智能汽车极越搭载了百度的“文心一言”大语言模型,阿里在今年也推出了专攻音视频内容的AI产品通义听悟。
今年6月28日,字节发布“火山方舟”。但“火山方舟”并非自研大模型,而是大模型服务平台,字节方面称平台集成智谱AI、MiniMax、百川智能等7家AI科技公司及科研院所的大模型,对外提供服务。当时字节跳动方面对时代周报记者表示,“自研大模型探索中,暂无预期对外发布时间”。
据时代周报记者此前了解,字节跳动自研大模型代号“云雀”。最新消息为9月19日字节跳动旗下火山引擎在科技峰会上宣布火山引擎数智平台VeDI推出“AI助手”。据字节跳动数据平台负责人罗旋当时向媒体介绍,AI助手主要背靠的大模型就是自研的“云雀”。后续“云雀”发布时间一直未有新动态。
来源:时代周报