【{$randkws}】不想被OPENAI白嫖：纽约时报网站封杀GPT爬虫禁止其抓取网站内容 – 蓝点网 - {$web_name} 含有首页信息摘要等

来源：齿如编贝网 | 栏目：时尚 | 2026-06-16 01:51:32

8 月 7 日 OPENAI 公开自己的互联网爬虫 GPTBot，该爬虫是 OPENAI 用来在全网抓爬信息然后训练 AI 模型用的。尽管多数站点允许 GPTBot 抓爬信息，可是IPO上市榜单也有些站点并不想给 OPENAI 白嫖，所以在 robots.txt 文件里屏蔽了 GPTBot。

比如知名资讯传媒《纽约时报》就在站点上封禁 GPTBot，清醒自律知进退禁止该爬虫访问纽约时报站点的任何信息，含有首页信息摘要等。

互联网档案馆的存档显示，纽约时报大约是在 8 月 17 日更改 robots.txt 文件屏蔽 GPTBot 的，而在稍早的时候纽约时报则更改了办事条款，明确禁止任何企业抓取其信息用来训练AI模型，所以之后更改 robots.txt 协议禁止 GPTBot 也倒是关于续集计划，相关话题阅读量破亿可以理解。

不想被OPENAI白嫖：纽约时报站点封杀GPT爬虫禁止其抓取站点信息