本报记者 李静 北京报道
近日,有外媒报道称,字节跳动在使用OpenAI技术开发自己的大语言模型,而OpenAI的服务条款规定,该公司所输出的模型不能被用于“开发任何与我们的产品和服务竞争的AI模型”。字节跳动虽然通过微软购买了OpenAI的访问权限,但是微软也制定了与OpenAI同样的政策。因此,字节跳动违反了OpenAI服务条款,其账户已被OpenAI暂停。
字节跳动发言人约迪·赛斯(Jodi Seth)对此回应称,GPT生成的数据在“种子计划”(字节跳动基础大语言模型的代号)的早期开发中用于注解模型,并且在今年年中左右的时候已从字节跳动的训练数据中删除。“字节跳动获得了微软的许可能够使用GPT API。“我们使用GPT驱动非中国市场的产品和功能。但在中国境内,我们使用的是自主开发的模型驱动‘豆包’(字节跳动旗下的AI对话机器人)。而且豆包只在中国境内提供。”
对于相关具体情况,12月17日,字节跳动相关负责人对《中国经营报》记者回应称:“公司在使用OpenAI相关服务时,强调要遵守其使用条款。我们也正与OpenAI联系沟通,以澄清外部报道可能引发的误解。”
字节跳动方面表示,今年年初,当技术团队刚开始进行大模型的初期探索时,有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。在4月公司引入GPT API调用规范检查后,这种做法已经停止。
字节跳动方面还表示,早在今年4月,字节跳动大模型团队已经提出了明确的内部要求,包括不得将GPT模型生成的数据添加到大模型的训练数据集、培训工程师团队在使用GPT时遵守服务条款等。“9月,公司内部又进行了一轮检查,采取措施进一步保证对GPT的API 调用符合规范要求。例如分批次抽样检测模型训练数据与GPT的相似度,避免数据标注人员私自使用GPT。未来几天里,我们会再次全面检查,以确保严格遵守相关服务的使用条款。”
对于Open AI切掉字节跳动API接口的做法,福资本创始合伙人、行行AI董事长李明顺认为,这其实反映出大模型公司害怕强应用,就像Open AI很怕亚马逊、Google、Mata推出大模型及应用。因为大模型逐渐变成明牌,大家较量的不再是技术底座,而是你有多少用户、多少场景、有多少的钱持续去找算力。所以用户数、场景、投资能力会成为这一波大模型竞争的核心,在此背景下,大模型本身的重要性就降低了。
就在12月16日,百度创始人、董事长兼CEO李彦宏再度发言表示:“过去一年,我看大家对于大模型的关注还在基础模型,没有在应用上,我有些着急。我们要去‘卷’AI原生应用,把这个做出来了才有价值。为什么大家不去认真做AI原生应用,而去关心大模型进展?这个进展对大多数人来说不是机会!百模大战是对社会资源的极大浪费,更多资源应该放在超级应用上。”
“像字节跳动这样拥有巨大用户基础的公司,是Open AI所害怕的,因为像字节跳动的很多产品未来会嵌入AI。”李明顺说道,尤其剪映(海外版为capcut)这样的短视频制作工具使用AI后,未来可能会成为全球第一的短视频工具,远远超过今天大家看到的pika、gemini等。“因为剪映、capcut在全球的月活已经有5亿~6亿人,在短视频工具中应该无出其右,剪映和capcut掌握了大量的用户,又有抖音、TikTok这些场景。未来如果把剪映或capcut拆分出来,有可能成为AI领域千亿美元级别的短视频AI工具。在这场竞争中,场景正在变得比技术重要。”
据了解,今年6月28日,字节跳动曾发布“火山方舟”大模型,但“火山方舟”并非自研大模型,而是大模型服务平台,该平台主要集成智谱AI、MiniMax、百川智能等7家AI科技公司及科研院所的大模型,对外提供服务。对于自研大模型的具体进程,以及应用落地的相关情况,字节跳动方面尚未有更多信息披露。
(编辑:张靖超 校对:颜京宁)