您当前的位置：首页 > 电脑百科 > 站长技术 > 网站

网站可以阻止OpenAI网络爬虫避免数据用于训练 GPT 模型

时间：2023-08-08 14:46:32 来源：作者：站长之家

+ 加入收藏

本文概要:

1. AI target=_blank class=infotextkey>OpenAI 现允许网站屏蔽其网络爬虫，以防止其抓取网站内容训练 GPT 模型的。

2. 阻止 GPTBot 可能是 OpenAI 允许互联网用户选择不让其数据用于训练其大型语言模型的第一步。

3. 在获取用于训练 AI 的数据方面存在争议，一些网站和作者提出限制 AI 公司使用其内容的要求。

站长之家（ChinaZ.com）8月8日消息:OpenAI 现在允许网站屏蔽其网络爬虫，以帮助网站运营商防止其内容被用于训练 GPT 模型。

具体来说，网站可以通过在其 Robots.txt 文件中明确禁止 GPTBot 爬虫程序的出现，或者阻止其 IP 地址来实现屏蔽。

OpenAI 表示，通过使用 GPTBot 抓取的网页可能会用于改进未来的模型，但也会进行过滤以删除需要付费访问、包含个人身份信息或违反政策的内容来源。

阻止 GPTBot 可能是 OpenAI 允许互联网用户选择不让其数据用于训练大型语言模型的第一步。之前有一些尝试创建标记来排除训练内容的举措，例如去年 DeviantArt 提出的 "NoAI" 标签。然而，阻止 GPTBot 并不会从 ChatGPT 的训练数据中删除之前从网站上抓取的内容。

获取用于 AI 训练的数据已经成为一个越来越具有争议的问题。一些网站，包括 Reddit 和 Twitter，一直在努力限制 AI 公司对用户发布内容的免费使用，同时一些作者和创作人也因涉嫌未经授权使用其作品而提起诉讼。议员们在上个月的几次 AI 监管听证会上也关注了数据隐私和同意问题。

在获取数据方面，OpenAI 并未确认是否通过社交媒体帖子、受版权保护的作品或者互联网的哪些部分来获取数据。

据AxIOS报道，一些公司，如 Adobe，提出了通过反冒充法律来标记数据为不可用于训练的想法。包括 OpenAI在与白宫签署的协议中同意开发一种水印系统，以让人们知道某个内容是否由 AI 生成，但并未承诺停止使用互联网数据进行训练

Tags：OpenAI 点击:() 评论:()

声明：本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作，风险自担。如有任何标注错误或版权侵犯请与我们联系，我们将及时更正、删除。

▌相关推荐

OpenAI和谷歌再起纷争：AI的尽头是内容

日前，纽约时报的一篇报道称，人工智能公司 OpenAI为收集高质量训练数据而开发了一个语音转录模型Whisper。该模型主要用于转录 OpenAI 获取的超过 100 万小时的 YouTube 视频，也...【详细内容】

2024-04-09　　Search: OpenAI 点击:(1)　　评论:(0)　　加入收藏

AI产业的灰色暗面：OpenAI、谷歌、META如何搞训练语料

财联社4月7日讯（编辑史正丞）种种迹象显示，目前站在全世界AI领域潮头浪尖的这些公司，早在几年前就已经陷入对训练语料的“绝望”追逐中——为此他们不惜修改政策条款...【详细内容】

2024-04-09　　Search: OpenAI 点击:(1)　　评论:(0)　　加入收藏

为训练AI，OpenAI等科技巨头花式淘数据

[环球时报特约记者甄翔]《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频，形成对话文本数据，供其最新的AI学习...【详细内容】

2024-04-08　　Search: OpenAI 点击:(7)　　评论:(0)　　加入收藏

训出GPT-5短缺20万亿token！OpenAI被曝计划建「数据市场」

全网真的无数据可用了！外媒报道称，OpenAl、Anthropic等公司正在努力寻找足够的信息，来训练下一代人工智能模型。前几天，OpenAI和微软被曝出正在联手打造超算「星际之门」，解决算...【详细内容】

2024-04-08　　Search: OpenAI 点击:(1)　　评论:(0)　　加入收藏

报告称 OpenAI 采集了超一百万小时的 YouTube 视频来训练 GPT-4

IT之家 4 月 7 日消息，本周早些时候，《华尔街日报》报道称 AI 公司在收集高质量训练数据方面遇到了困难。今天，《纽约时报》详细介绍了 AI 公司处理此问题的一些方法，其中涉及到...【详细内容】

2024-04-07　　Search: OpenAI 点击:(6)　　评论:(0)　　加入收藏

ChatGPT官宣免注册，全球互联网变天！OpenAI将取代谷歌搜索？

新智元报道编辑：编辑部【新智元导读】OpenAI这份愚人节礼物，实在是太大了：今天起，ChatGPT不用注册，可以直接使用。用户狂欢，竞品颤抖，我们仿佛已经听到，谷歌搜索引擎这位巨人轰然倒...【详细内容】

2024-04-02　　Search: OpenAI 点击:(8)　　评论:(0)　　加入收藏

无需注册！OpenAI宣布放开ChatGPT使用限制

工智能初创公司OpenAI宣布，即日起用户无须注册即可开始使用ChatGPT的功能。OpenAI在最新公告中写道：“让ChatGPT等工具广泛可用，让人们能够体验到人工智能的好处，这是我们使命的...【详细内容】

2024-04-02　　Search: OpenAI 点击:(6)　　评论:(0)　　加入收藏

开发者再分享 OpenAI Sora 生成的短视频：树叶大象、彩虹瀑布等

IT之家 3 月 19 日消息，OpenAI 今年 2 月推出 Sora 模型之后，迅速成为 AI 圈内头条，能够基于用户的一句话，生成最长 1 分钟的视频，效果接近实拍。OpenAI 目前并未向公众发布 Sora...【详细内容】

2024-03-19　　Search: OpenAI 点击:(12)　　评论:(0)　　加入收藏

奥特曼承认OpenAI名不符实：我们需要大量资金

OpenAI首席执行官萨姆·奥特曼最近在一次网络直播中表示，OpenAI可能不是这家人工智能公司最理想的名字，至少事后看来是这样。他在与莱克斯·弗里德曼的一次播客访...【详细内容】

2024-03-19　　Search: OpenAI 点击:(8)　　评论:(0)　　加入收藏

别等OpenAI了，全球首个类Sora抢先开源！所有训练细节/模型权重全公开，成本仅1万美元

【导读】OpenAI Sora还没用上，国产Sora刚刚正式宣布全面开源！「Open-Sora 1.0」所有的训练细节模型权重全面开源，1万美元64块GPU复现，训练成本直降46%。图片来源：由无界AI生成不...【详细内容】

2024-03-18　　Search: OpenAI 点击:(18)　　评论:(0)　　加入收藏

▌简易百科推荐

访问网站显示不安全是什么原因？怎么解决？

访问网站时显示“不安全”，主要原因以及解决办法： 1.没用HTTPS加密：网站还在用老的HTTP协议，数据传输没加密，容易被人偷看或篡改。解决办法是网站管理员启用HTTPS，也就是给网站装...【详细内容】

2024-04-08　　JOYSSL爆爆　　　　Tags:网站　点击:(4)　　评论:(0)　　加入收藏

SSL证书过期后网站还能正常访问吗

当SSL证书过期后，尽管网站的服务器仍然可以处理请求并提供服务，但是浏览器会在尝试建立安全连接时检测到证书已过期，并显示警告信息告知用户该网站的安全证书已过期。这会严重...【详细内容】

2024-03-27　　　　见方天地　　Tags:SSL证书　点击:(11)　　评论:(0)　　加入收藏

HTTPS网站怎么实现

HTTP协议迁移到HTTPS，以提供更加安全的网络环境并增强用户信任。那么，如何将一个使用HTTP的网站安全升级到HTTPS呢？我们需要理解HTTP和HTTPS的区别。HTTP，即超文本传输协议，是一...【详细内容】

2024-03-27　　倏然间　　　　Tags:HTTPS 　点击:(6)　　评论:(0)　　加入收藏

SSL证书即将过期，不更新可以吗？

SSL证书是用来保护网站数据传输安全的重要工具，通过数据加密和身份认证两大功能，为网站提供了一个安全、可信的网络环境。由正规CA机构所颁发的SSL证书都具有一定的使用期限，通...【详细内容】

2024-03-27　　帝恩思DNS　　　　Tags:SSL证书　点击:(7)　　评论:(0)　　加入收藏

网站运营的好与坏主要决定因素是内容与seo优化

在这个信息爆炸的时代，网站如雨后春笋般涌现，如何在众多网站中脱颖而出，吸引更多的访问者，成为了每一个网站运营者关心的问题。我们不禁要问，是什么决定了网站运营的好与坏呢？答案...【详细内容】

2024-03-26　　易华合讯　　　　Tags:网站运营　点击:(9)　　评论:(0)　　加入收藏

网站制作不再难：小白也能上手的建站教程

在互联网高速发展的时代，网站已成为企业、个人展示自身形象和实力的重要窗口。过去，网站制作对于许多人来说是一项技术活，需要专业的知识和经验。但随着技术的进步，现在即便是没...【详细内容】

2024-03-24　　一度旭展互联网科技　　　　Tags:网站制作　点击:(5)　　评论:(0)　　加入收藏

想建个网站赚钱？先来看看这篇建站指南吧

随着互联网的飞速发展，越来越多的人希望通过建立自己的网站来实现创业梦想或者赚取额外的收入。但建站并非一蹴而就的简单事情，它需要综合策划、设计、技术和运营等多方面的知...【详细内容】

2024-03-21　　一度旭展互联网科技　　　　Tags:网站　点击:(4)　　评论:(0)　　加入收藏

个人站长的出路在哪？

个人站长的出路在于不断适应互联网的发展趋势，积极寻求创新和变革。以下是一些个人站长可以考虑的出路：转型为内容创作者：随着内容营销的兴起，越来越多的企业和个人开始注重内...【详细内容】

2024-02-29　　　　简易百科　　Tags:个人站长　点击:(39)　　评论:(0)　　加入收藏

网络环境和用户需求不断变化，个人站长该怎么办？

个人站长是一个相对特殊的群体，他们通常以个人身份独立运营网站，没有大型企业或组织的支持。由于缺乏资源和大企业的光环，个人站长需要更加注重策略和技巧，才能在竞争激烈的网络...【详细内容】

2024-02-29　　　　简易百科　　Tags:个人站长　点击:(33)　　评论:(0)　　加入收藏

AI时代个人站长还有出路吗？

AI时代，个人站长依然有出路，但需要进行一些调整和转型。首先，利用AI工具可以帮助个人站长提高效率和产出质量。例如，利用AI进行内容创作、智能推荐、用户画像分析等，可以大大提升...【详细内容】

2024-02-29　　　　简易百科　　Tags:个人站长　点击:(43)　　评论:(0)　　加入收藏

推荐资讯

AI是万灵药？Meta要把大	考研调剂第一次失败后
高职单招是什么意思？	在饭局上喝酒，要学会3
汽车不停能开多少公里	三证齐全，中国“飞的”
小米SU7被大卸八块，雷	视频号，从抖音挖来一个

站内最新

栏目相关

· 访问网站显示不安全是什么原因？怎么解决？

· SSL证书过期后网站还能正常访问吗

· HTTPS网站怎么实现

· SSL证书即将过期，不更新可以吗？

· 网站运营的好与坏主要决定因素是内容与seo优化

· 网站制作不再难：小白也能上手的建站教程

· 想建个网站赚钱？先来看看这篇建站指南吧

· 个人站长的出路在哪？

· 网络环境和用户需求不断变化，个人站长该怎么办？

· AI时代个人站长还有出路吗？

· 互联网创业这么热，为何个人站长消失了?

· 好网站包含哪些方面

· 网站开发中的内链策略：如何理解并有效运用内链优化？

· 如何有效利用CDN提升网页加载速度

· HTTPS采用高安全的TLS加密，可为什么Fiddler抓到HTTPS包能解密？

· 2024年，百度全面启用ai，个人站长还有空间吗？

站内热门

网站可以阻止OpenAI网络爬虫 避免数据用于训练 GPT 模型

网站可以阻止OpenAI网络爬虫避免数据用于训练 GPT 模型