查看原文
其他

爬虫有风险,入行需谨慎...

The following article is from 蓝点网 Author 山外的鸭子哥

点击关注公众号,一周多次包邮送书

来源:蓝点网(ID:landianwx)作者:山外的鸭子哥

从事爬虫工作的网友应该对相关案例都有些了解,但如果你觉得还是问题不大的话可以看看下面的聊天记录。来自网友分享的聊天记录截图,注意是单独聊天记录的所以是从左到右、从下到上阅读,因为爬虫要被判刑。当然也不必纠结是不是开局一张图内容全靠编,真刨根问底的话最高人民法院决书网搜关键词就能找到案例。

先看聊天记录:

以上图片来自@YufanSheng

大概情况是什么样子:

这名网友分享的情况大概是自己所在公司爬某宝的信息被人发现并报案,核心是绕过风控系统继续抓爬内容。正常情况下是个大型业务网站就有风控系统来防抓爬 , 但是做爬虫这工作至少90%都涉及怎么绕过风控系统。
如果想办法绕过风控系统,那对不起,你可能涉嫌违反刑法第285条规定:非法获取计算机信息系统数据罪如网友所在公司就被直接端了,即便不是负责爬数据的员工都受牵连,如果直接负责爬数据那后果可想而知。
所以各位如果从事爬虫工作的话千万不要觉得这是公司要求的,有问题公司担着、领导担着、我就是干活的。真出事的时候不仅要退还所有工资到时候还是要继续担刑事责任,即便是被判缓刑也意味着你有了犯罪记录。

如果真在从事爬虫工作:

如果你目前正在从事爬虫业务那你应该仔细考虑自己从事的工作是否违规,尤其是牵涉绕过风控系统的内容。如果查看大量判例就会发现凡是涉及绕过风控系统,最终被认定非法获取计算机信息系统数据罪的概率极高。
而风控系统是个非常宽泛的概念,简单的包括以 IP 地址访问频率限制、UA信息甄别、通过验证码校验等等。目前是个网站基本都会限制同一个IP地址短时间高频访问,大型网站也基本都配备验证码机制防止高频访问。
确实想要绕过这些限制非常容易比如IP地址代理池,然而一旦选择绕过限制那就已经涉嫌违反刑法相关规定。所以安全起见还是谨慎从事爬虫类业务吧,尤其是涉及对大站的爬虫,大站一旦报案想要跑路基本来不及了。
·················END·················

推荐阅读

• 招银网络二面:Exception 和 Error 有什么区别?• 原来树状数组可以这么简单?• 为什么要用读写锁?它有什么优点?• 微软继续拆分VS Code Python扩展,再推三款独立扩展• 聊聊 Java SPI 机制• JVM 八股之首:三大垃圾收集算法• React官方团队出手,补齐原生Hook短板

👇更多内容请点击👇


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存