当前位置：首页|资讯|OpenAI

OpenAI阻止网络爬虫抓取数据，避免数据被用于训练AI模型

作者：驱动中国发布时间：2023-08-08

驱动中国2023年8月8日消息，据悉，OpenAI 旗下 GPT 模型的训练需要大量的网络数据，这可能涉及到数据隐私和版权等问题。为了解决这些问题，OpenAI 最近推出了一个新功能，让网站可以阻止其网络爬虫（web crawler）从其网站上抓取数据训练 GPT 模型。

网络爬虫是一种自动化的程序，可以在互联网上搜索和获取信息。OpenAI 的网络爬虫名为 GPTBot，其会以一定的频率访问各种网站，并将网页内容保存下来，用于训练 GPT 模型。

OpenAI 在其博客文章中表示，网站运营者可以通过在其网站的 Robots.txt 文件中禁止 GPTBot 的访问，或者通过屏蔽其 IP 地址，来阻止 GPTBot 从其网站上抓取数据。OpenAI 还表示，“使用 GPTBot 用户代理（user agent）抓取的网页可能会被用于改进未来的模型，并且会过滤掉那些需要付费访问、已知收集个人身份信息（PII）、或者有违反我们政策的文本的来源。”对于不符合排除标准的来源，“允许 GPTBot 访问您的网站可以帮助 AI 模型变得更加准确，并提高它们的通用能力和安全性。”

推荐体验

相关资讯

网站可以阻止OpenAI网络爬虫避免数据用于训练 GPT 模型

1.OpenAI现允许网站屏蔽其网络爬虫，以防止其抓取网站内容训练GPT模型的。2.阻止GPTBot可能是OpenAI允许互联网用户选择不让其数据用于训练其大型语言模型的第一步。

OpenAI 大语言模型

站长之家 2023-08-08

OpenAI现允许网站阻止其网络爬虫抓取数据

OpenAI现允许网站阻止其网络爬虫抓取数据 IT之家 8 月 8 日消息，OpenAI 旗下 GPT 模型的训练需要大量的网络数据，这可能涉及到数据隐私和版权等问题。为了解决这些问题，Open

IT之家 2023-08-08

OpenAI近日承认其推出了名为GPTBot的网络爬虫机器人，用于抓取和收集数据用于大模型训练

钛媒体App8月10日消息，据报道，OpenAI近日承认，其推出了名为GPTBot的网络爬虫机器人，用于抓取和收集数据用于大模型训练。目前还不清楚OpenAI的爬虫机器人在网上潜伏了多久，有些人怀疑OpenAI已经秘密收集每个人的在线数据长达数月或数年。

钛媒体快报 2023-08-10

BBC阻止OpenAI抓取数据，但对人工智能用于新闻持开放态度

10月7日消息，英国最大的新闻机构BBC发布了其在评估使用生成型人工智能（GenAI）的原则，包括用于新闻、档案和“个性化体验”的研究和制作。BBC国家事务总监罗德里・塔尔凡・戴维斯在一篇博客文章中表示，该广播公司认为人工智能技术提供了“为我们的观众和社会带来更多价值”的机会。

OpenAI 人工智能

砍柴网 2023-10-07

网络抓取数据用于生成式AI训练？英国ICO：合法利益是可行关键

数据来源方面，不少企业的数据源于公开网络抓取，也因此产生了相关纠纷，如OpenAI因数据抓取引发多起纠纷。纠纷背后，涉及网络抓取合法性问题，即通过网络抓取数据训练而成的生成式人工智能模型，是否具有法律依据？

生成式AI 人工智能 OpenAI 法律

21世纪经济报道 2024-01-25

近期资讯

经济实用，澳柯玛BCD-226WH：1054元到手，226升风冷无霜双门冰箱

#年货节好物集市#澳柯玛冰箱以其先进的制冷技术和优质的节能性能在市场上赢得了良好的口碑。同时，澳柯玛冰箱在节能性能上也表现出色，普遍配备高效压缩机和优质绝热材料，符合国家能效标准，使用户电费开销明显减少。澳柯玛BCD-226WH冰箱以其1054元的到手价，成为市场上性价比极高的选择。

小米地瓜 2024-12-26

去水印的技巧与方法：轻松获得无水印完美图片的指南

水印，大家都不陌生吧。很多朋友在网上看到的图片或视频，往往都会带有水印。这水印有的可能是为了保护版权，有的则是为了宣传品牌。虽然水印可以起到一定的保护作用，但有时候我们也希望能去掉这些水印，尤其是当我们想要分享或者使用这些图片时。不过，去水印可不是一件简单的事情，今天就来聊聊关于去水印的一些方法和技巧。

新报观察 2024-12-26

如何在QQ群中有效使用艾特全体成员功能提升沟通效率

在如今这个信息化的时代，大家都离不开社交软件，而QQ作为一款经典的聊天工具，依然在很多人的生活中占有一席之地。无论是和朋友聊天，还是在群聊中讨论事情，QQ都提供了非常方便的功能。今天，我们就来聊聊在QQ群里如何艾特全体成员，这个功能在群聊中是非常实用的，特别是当你有重要信息需要传达给大家的时候。

新报观察 2024-12-26

2024 年度央企十大国之重器投票开启

IT之家12月26日消息，“国资小新”于12月23日发起了2024年度央企十大国之重器投票评选活动，截止日期为12月29日。“国资小新”综合媒体报道和网友推荐，从2024年中央企业建设的重点项目中，选出20项既有传播“热度”又有创新“力度”的大国重器。

IT之家 2024-12-26

美的MR-195WE冰箱：1199元享风冷无霜，节能低噪的理想选择

#年货节好物集市#在家电市场中，美的以其高性价比和卓越的产品质量赢得了广泛的消费者认可。特别是在租房市场中，美的冰箱以其节能、低噪音和风冷无霜的特点，满足了现代都市人对于家电的多样化需求。

小米地瓜 2024-12-26

三星更新官网，确认 Galaxy Ring 智能戒指新增 14/15 号尺寸

IT之家12月26日消息，科技媒体MySmartPrice今天（12月26日）发布博文，报道称三星已在多个国家和地区更新GalaxyRing支持页面，将新增14号（型号SM-Q514）和15号（型号SM-Q515）两种新尺寸。

IT之家 2024-12-26

经济实用，海尔BC-90GHSDE0W9：519元到手，90升单开门冰箱

#年货节好物集市#选择小冰箱时，应考虑几个关键因素：容量、能效、制冷方式、噪音水平以及空间占用。对于小户型、宿舍或办公室等空间有限的环境，90升左右的单门冰箱通常是一个理想的选择，它能够提供足够的冷藏空间，同时保持低能耗和小巧的体积。

小米地瓜 2024-12-26

东莞忆联申请基于 UFS 的自动调温测试专利，可有效地提升针对 UFS 的批量化测试效率

金融界2024年12月26日消息，国家知识产权局信息显示，东莞忆联信息系统有限公司申请一项名为“基于UFS的自动调温测试方法、系统和计算机设备”的专利，公开号CN119181415A，申请日期为2024年9月。

金融界 2024-12-26

方正证券：AI对HBM需求旺盛可关注相关领域

【环球网科技综合报道】12月26日，方正证券发布研报称，HBM需求旺盛，是高成长赛道。AI对于HBM的需求旺盛，三大国际原厂不断迭代技术、扩充产能来满足下游需求。相比传统DRAM，HBM的制造流程的增量环节主要是封装段，建议关注HBM先进封装相关设备标的：精智达(测试机)、赛腾股份(检测设备)等。

环球网科技 2024-12-26

东莞忆联申请基于UFS的功耗自动化测试专利，提高UFS功耗测试效率

金融界2024年12月26日消息，国家知识产权局信息显示，东莞忆联信息系统有限公司申请一项名为“基于UFS的功耗自动化测试方法、系统和计算机设备”的专利，公开号CN119181414A，申请日期为2024年9月。

金融界 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1