我是Python集结号,目前从事Python网站开发和爬虫工作。
爬虫本身作为一种技术,不存在违法的问题,关键是用爬虫爬什么,以及怎么爬。
哪些类爬虫是违法的呢?
1、为违法违规组织提供爬虫相关服务
比如验证码识别服务贩卖,破解APP,如淘宝支付宝之类。
要记住识别验证码不违法,但是用来谋利就可能违法。
曾经有一个程序员为公司开发极验破解某网站,结果公司被查,自己也锒铛入狱。
所以在做爬虫的时候,需要对自己的爬虫应用到哪方面有个了解。
2、个人隐私数据的抓取与贩卖
比如手机号、身份证、家庭地址等。
有些网站并没有对用户数据做很好的隐藏,使其暴露在网站上,只要你进行谋利,那就要负法律责任。
3、侵犯商业版权,即抓取无版权的数据
比如有一些资料网站,你在上面看到一些文章,这是文章作者授权给网站使用的,而你是没有版权的,
如果你抓取这些数据,并且进行贩卖谋利,都是要负法律责任的。
以前经常有人问我,能不能抓取裁判文书网或者天眼查的数据,我都是坚决拒绝的。
政府网站绝对不碰,这是我的原则。
4、利用爬虫攻击网站
说起来这一点,很多人不太理解,爬虫怎么能攻击网站呢?
我们做爬虫的时候会用到多线程,多进程和分布式,主要就是为了提高我们的爬取效率,但是当我们的效率提高以后,对服务器的请求也会增大,如果不加限制的爬取,可能近乎于DDoS攻击,造成网站瘫痪,这时就不是爬虫了,就变成网络攻击了。
还有就是做爬虫经常会与反爬虫做斗争,但是也要注意不要突破的太厉害,比如网站限制IP访问频率,你就更换IP无限制请求。最好是网站限制一秒钟访问一次,你提高到0.5秒一次就可以了。
以上就是爬虫可能违法的四种情况,除了最后一种,前面三种在不谋利的情况下个人做,还是没有多少限制的。
就怕不知不觉变成第四种。
我们做爬虫有一个词叫做:爬虫道德。就是在做爬虫的时候,也要考虑目标网站的压力。
上面介绍了爬虫的违法情况,
那么爬虫会违反那些法律条款呢?
1、侵犯公民个人信息罪
《刑法》修正案(九)中将刑法第二百五十三条进行了修订,明确规定违反国家有关规定,向他人出售或者提供公民个人信息,情节严重的,构成犯罪;
在未经用户许可的情况下,非法获取用户的个人信息,情节严重的也将构成“侵犯公民个人信息罪”。
2、非法获取计算机信息系统数据罪
根据《中华人民共和国刑法》第二百八十五条规定,非法获取计算机信息系统数据、非法控制计算机信息系统罪,
是指违反国家规定,侵入国家事务、国防建设、尖端科学技术领域以外的计算机信息系统或者采用其他技术手段,获取该计算机信息系统中存储、处理或者传输的数据,情节严重的行为。
刑法第 285 条第 2 款明确规定,犯本罪的,处三年以下有期徒刑或者拘役,并处或者单处罚金;情节特别严重的,处三年以上七年以下有期徒刑,并处罚金。
3、非法侵入计算机信息系统罪
《刑法》第二百八十六条规定,违反国家规定,对计算机信息系统功能进行删除、修改、增加、干扰,造成计算机信息系统不能正常运行,后果严重的,构成犯罪,处五年以下有期徒刑或者拘役;后果特别严重的,处五年以上有期徒刑。
4、侵犯商业秘密罪
《反不正当竞争法》第九条,以不正当手段获取他人商业秘密的行为即已经构成侵犯商业秘密。
而后续如果进一步利用,或者公开该等信息,则构成对他人商业秘密的披露和使用,同样构成对权利人的商业秘密的侵犯。
这一条之前有个“车来了”涉嫌偷窃数据,被警方立案调查。
结语说了这么写,会不会吓到想要入行的朋友?
其实只要你没有非常大规模的采集、获利,没有设计隐私敏感信息,比如实名信息,基本上就不用担心爬虫违法。
添加上方▲技术, 在线咨询
复制微信号
声明
一、本站原创内容,其版权属于本网站所有。其他媒体、网站或个人转载使用时不得进行商业性的原版原式的转载,也不得歪曲和篡改本网站所发布的内容。如转载须注明文章来源。
二、本网站转载其它媒体作品的目的在于传递更多信息,并不代表本网站赞同其观点和对其真实性负责;如侵犯你的权益请告诉我们立即删除;其他媒体、网站或个人转载使用自负法律责任。
发表评论
2021-11-13 05:08:07回复
2021-11-13 13:44:40回复