查看原文
其他

X/Twitter更新使用协议施加限制:未经书面同意禁止抓取平台任何内容

山外的鸭子哥 蓝点网 2023-09-14
在埃隆马斯克带领下,目前 X 正在继续施加更多限制,任何未经 X 书面同意的情况下,出于任何目的、以任何形式、抓取 X 平台任何内容均属于违反 X 的使用协议,有这条协议打底后,马斯克就可以起诉他发现的任何爬虫。
此前 X 已经在美国起诉四个 IP 所有者非法抓取 X 平台的内容,尽管目前还不知道有没有查到这些 IP 的所有者,不过马斯克显然是在杀鸡儆猴。
在马斯克接管 X 后,X 对平台内容的获取限制日趋严厉,例如此前 X 就变更开发者政策,删除免费 API 接口,如果要想抓取 X 内容那开通 API 费用会非常高。
同时 X 还对免费用户每天可以看的推文数量进行限制,这既是用来防范某些开发者不通过申请付费 API 而是注册一大批账号进行抓取,也是为了刺激更多 X 用户开通 X Premium 订阅会员。
而未登录情况下只能浏览推特算法推荐内容,无法查看用户主页浏览全部推文 (一开始的限制是未登录禁止浏览任何推文,后面改成可以通过具体推文链接访问单条推文)。
新的抓取限制条款:
X 此前已经更新 robots.txt 文件,阻止除谷歌爬虫 (GoogleBot) 以外的一切爬虫,包括诸如 Bing、Yandex 等搜索引擎爬虫。
但 robots.txt 毕竟只是行业约定俗称的爬取规范,并非法律协议,所以现在 X 删除关于 robots.txt 进行合法抓取的描述,取而代之的就是未经书面同意任何抓取都是违规行为。
此前条款中是这么要求的:注意:如果按照 robots.txt 文件的规定进行抓取服务时允许的。但是,未经我们实现同意就抓取是明确禁止的。
而在 2023 年 9 月 29 日生效的新条款中删除了关于 robots.txt 的描述,取而代之的时:注意:未经我们事先书面同意,明确禁止出于任何目的的以任何形式的抓取或抓取服务。
是否与谷歌续签协议还是未知数:
尽管此前 X 修改限制时也误伤谷歌,导致谷歌搜索无法抓取 X 平台内容,但很快 X 就修复了这个问题,毕竟 Twitter 在 2015 年与谷歌达成过协议,允许谷歌抓取 Twitter 平台的内容。
不过这其实是一个 BUG,因为其他爬虫还可以爬谷歌来获取 X 平台的内容,所以很难说后面 X 是否也会限制谷歌抓取。
如果协议即将到期马斯克大概率是不会续签的,可能当前继续保留谷歌抓取也只是碍于协议,不能限制谷歌抓取。

糟糕 又被微软忽悠了!

OpenAi:我也没法分辨AI内容

完了:Chrome也没法用了

QQ重要功能下线 操作需谨慎

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存