当前位置：首页|资讯|OpenAI

OpenAI现允许网站阻止其网络爬虫抓取数据

作者：IT之家发布时间：2023-08-08

OpenAI现允许网站阻止其网络爬虫抓取数据

IT之家 8 月 8 日消息，OpenAI 旗下 GPT 模型的训练需要大量的网络数据，这可能涉及到数据隐私和版权等问题。为了解决这些问题，OpenAI 最近推出了一个新功能，让网站可以阻止其网络爬虫（web crawler）从其网站上抓取数据训练 GPT 模型。

据IT之家了解，网络爬虫是一种自动化的程序，可以在互联网上搜索和获取信息。OpenAI 的网络爬虫名为 GPTBot，其会以一定的频率访问各种网站，并将网页内容保存下来，用于训练 GPT 模型。

OpenAI 在其博客文章中表示，网站运营者可以通过在其网站的 Robots.txt 文件中禁止 GPTBot 的访问，或者通过屏蔽其 IP 地址，来阻止 GPTBot 从其网站上抓取数据。OpenAI 还表示，“使用 GPTBot 用户代理（user agent）抓取的网页可能会被用于改进未来的模型，并且会过滤掉那些需要付费访问、已知收集个人身份信息（PII）、或者有违反我们政策的文本的来源。”对于不符合排除标准的来源，“允许 GPTBot 访问您的网站可以帮助 AI 模型变得更加准确，并提高它们的通用能力和安全性。”

但是，这并不会追溯性地从 ChatGPT 的训练数据中删除之前从网站上抓取的内容。

互联网为大型语言模型（如 OpenAI 的 GPT 模型和谷歌的 Bard）提供了大部分的训练数据，为 AI 训练获取数据已经变得越来越有争议。一些网站，包括 Reddit 和 Twitter，已经采取措施打击 AI 公司免费使用其用户帖子的行为，而一些作者和其他创作者也因为涉嫌未经授权使用其作品而提起诉讼。

推荐体验

相关资讯

OpenAI允许网站阻止其网络爬虫；谷歌推出类似Grammarly的语法检查功能

AI新闻 OpenAI推出新功能，允许网站阻止其网络爬虫抓取数据训练GPT模型摘要：OpenAI最近推出了一个新功能，允许网站阻止其网络爬虫从其网站上抓取数据训练GPT模型。该功能通过在网站的Robots.txt文件中禁止GPTBot的访问或屏蔽其IP地址来实现。OpenAI表示，允许GPTBot访问网站可以帮助AI模型变得更加准确，并提高通用能力和安全性。然而，此功能并不会删除ChatGPT的训练数据中之前从网站上抓取的内容。互联网为大型语言模型提供了大部分的训练数据，获取数据已经变得有争议。该举措被评

OpenAI 谷歌 ChatGPT 大语言模型

AiBard123工具导航 2023-08-09

OpenAI阻止网络爬虫抓取数据，避免数据被用于训练AI模型

驱动中国2023年8月8日消息，据悉，OpenAI旗下GPT模型的训练需要大量的网络数据，这可能涉及到数据隐私和版权等问题。为了解决这些问题，OpenAI最近推出了一个新功能，让网站可以阻止其网络爬虫（web…

驱动中国 2023-08-08

网站可以阻止OpenAI网络爬虫避免数据用于训练 GPT 模型

1.OpenAI现允许网站屏蔽其网络爬虫，以防止其抓取网站内容训练GPT模型的。2.阻止GPTBot可能是OpenAI允许互联网用户选择不让其数据用于训练其大型语言模型的第一步。

OpenAI 大语言模型

站长之家 2023-08-08

OpenAI推出网络爬虫GPTBot，允许用户禁止GPTBot爬虫收集数据

近期，OpenAI推出了一项名为GPTBot的新技术，它是一种网络爬虫，旨在从互联网上自动收集数据。据悉，这些数据将用于训练未来的AI模型，如GPT-4和GPT-5。GPTBot的出现引发了人们对数据采集和隐…

OpenAI GPT-4 GPT-5

AIGC未来 2023-08-08

OpenAI近日承认其推出了名为GPTBot的网络爬虫机器人，用于抓取和收集数据用于大模型训练

钛媒体App8月10日消息，据报道，OpenAI近日承认，其推出了名为GPTBot的网络爬虫机器人，用于抓取和收集数据用于大模型训练。目前还不清楚OpenAI的爬虫机器人在网上潜伏了多久，有些人怀疑OpenAI已经秘密收集每个人的在线数据长达数月或数年。

钛媒体快报 2023-08-10

近期资讯

安徽云乐新能源取得抓取机器人减震底盘专利，使装置移动更稳定

金融界2024年12月26日消息，国家知识产权局信息显示，安徽云乐新能源汽车有限公司取得一项名为“一种抓取机器人减震底盘”的专利，授权公告号CN222200610U，申请日期为2024年5月。

金融界 2024-12-26

苏州科瓴申请自移动设备的控制方法和自移动设备专利，有效防止漏割的草被识别为障碍物

金融界2024年12月26日消息，国家知识产权局信息显示，苏州科瓴精密机械科技有限公司申请一项名为“自移动设备的控制方法和自移动设备”的专利，公开号CN119179323A，申请日期为2023年6月。专利摘要显示，本发明公开了一种自移动设备的控制方法和自移动设备。

金融界 2024-12-26

南京山景科技取得自动化药房机械手结构专利，提高了自动化药房的入药效率

金融界2024年12月26日消息，国家知识产权局信息显示，南京山景科技有限公司取得一项名为“一种自动化药房的机械手结构”的专利，授权公告号CN222200612U，申请日期为2024年5月。

金融界 2024-12-26

泸州亿欣取得可旋转翻转式机械臂专利，能够牢固对物料进行夹持

金融界2024年12月26日消息，国家知识产权局信息显示，泸州亿欣机械有限公司取得一项名为“一种带有夹具的可旋转翻转式机械臂”的专利，授权公告号CN222200606U，申请日期为2024年7月。

金融界 2024-12-26

宁波埃美柯铜阀门有限公司取得机械手夹具专利，方便对爪夹进行更换

金融界2024年12月26日消息，国家知识产权局信息显示，宁波埃美柯铜阀门有限公司取得一项名为“一种机械手的夹具”的专利，授权公告号CN222200605U，申请日期为2024年6月。

金融界 2024-12-26

永越智能取得用于实验室服务机器人的柔性夹爪专利，结构简单、夹持方便

金融界2024年12月26日消息，国家知识产权局信息显示，福建永越智能科技股份有限公司取得一项名为“一种用于实验室服务机器人的柔性夹爪”的专利，授权公告号CN222200611U，申请日期为2024年5月。

金融界 2024-12-26

四川嘉拓智能设备取得非定心坩埚夹持机构专利，可提高夹持坩埚的成功率

金融界2024年12月26日消息，国家知识产权局信息显示，四川嘉拓智能设备有限公司取得一项名为“种非定心坩埚夹持机构”的专利，授权公告号CN222200609U，申请日期为2024年4月。

金融界 2024-12-26

深圳市龙方自动化科技取得双限位式单轴机器人专利，有效防止过载和超程

金融界2024年12月26日消息，国家知识产权局信息显示，深圳市龙方自动化科技有限公司取得一项名为“一种双限位式单轴机器人”的专利，授权公告号CN222200613U，申请日期为2024年4月。

金融界 2024-12-26

上海和璧自动化设备取得一种环状体取出工装专利，提高取出效率

金融界2024年12月26日消息，国家知识产权局信息显示，上海和璧自动化设备有限公司取得一项名为“一种环状体取出工装”的专利，授权公告号CN222200608U，申请日期为2024年3月。

金融界 2024-12-26

赛悟德半导体科技申请一种基于气体供应设备的自动化切换专利，实现 ISO 槽车自动化切换

金融界2024年12月26日消息，国家知识产权局信息显示，赛悟德半导体科技（上海）股份有限公司申请一项名为“一种基于气体供应设备的自动化切换方法及系统”的专利，公开号CN119179314A，申请日期为2024年11月。专利摘要显示，本发明涉及一种基于气体供应设备的自动化切换方法及系统，属于自动化控制技术领域。

金融界 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1