加入收藏 | 设为首页 | 会员中心 | 我要投稿 温州站长网 (https://www.0577zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

多家大数据服务公司遭警方贴封条,“爬虫”为罪魁祸首?

发布时间:2023-01-08 10:07:19 所属栏目:大数据 来源:网络
导读:
据媒体报道,9月11日,知名区块链机构公信宝被杭州市公安局西湖分局古荡派出所贴上封条,未透露被查原因。
公信宝系知名区块链机构,公信宝官网介绍,公信宝目前主要包括三方面业务,分别

据媒体报道,9月11日,知名区块链机构公信宝被杭州市公安局西湖分局古荡派出所贴上封条,未透露被查原因。

公信宝系知名区块链机构,公信宝官网介绍,公信宝目前主要包括三方面业务,分别是GXChain、布洛克城、点对点数据交易平台。

天眼查数据显示,公信宝运营主体杭州存信数据科技有限公司,成立于2016年10月,法定代表人为黄敏强,注册资本750万。在公司的股东信息里,“中国比特币首富”李笑来持股比例为7.5%,天津真格天弘资产管理合伙企业(有限合伙)持股比例为7.5%。公司大股东和最终受益人均为黄敏强。

天眼查截图

天眼查截图

另据官网显示,杭州存信数据科技有限公司为10多个区块链项目提供链上开发服务,为200家互金企业提供基于区块链技术的数据交易/交换服务,为上百万个人用户创造区块链世界的第一张数字身份。

天眼查数据还显示,杭州存信数据科技有限公司流出的疑似公信宝产品价格表的图片,其产品或包括社保、京东、电信等数据抓取服务。近期多家数据公司被曝因爬虫问题被调查,存信数据被查原因或涉及爬虫问题。

有分析认为,公信宝被封,大概率是因为“数据”的事情,而不是因为“区块链和发币”的事情。

因为最近很多为网贷提供数据、爬虫抓数据、洗数据、购买黑数据的数据公司都被查被抓,员工被约谈。

据每日经济新闻报道,近日杭州多家大数据服务公司遭警方贴封条,停止运营商爬虫服务。9月6日,有消息称杭州魔蝎科技被警方控制,一位核心高管被带走调查,同日,上海新颜科技也被警方要求协助调查。9月10日,有消息称数据服务公司聚信立暂停对外提供用户授权的运营商爬虫服务。

上海一位消费金融公司高管向每经记者表示,爬虫产品被停可能是因为爬虫得到的信息转给第三方是不合规的,对于较多依赖运营商数据进行风控的公司来说影响较大。“你自己爬可以,但是不能把爬出来的信息给到其他人。不过监管现在并没有一个很明确的说法。”

爬虫是违法的吗?

网络爬虫也叫网络蜘蛛(spider),是一种用来自动浏览网络的机器人,它方便用户自动化、高效率地浏览互联网并从互联网上获取数据。通俗来讲,爬虫就是一项计算机技术,就是顺着URL(网页链接)由一个网络爬向另一网络,获取数据。

其实,爬虫作为一种计算机技术就决定了它的中立性,因此爬虫本身在法律上并不被禁止,但是利用爬虫技术获取数据这一行为是具有违法甚至是犯罪的风险的。

爬取数据是有可能触犯法律的,但要具体情况具体分析。爬取数据操作分为爬取的行为和爬取获得的数据两方面。

爬取行为的法律风险

爬虫目前能造成的技术上影响在于野蛮爬取,即多线程爬取,从而导致网站瘫痪或不能访问,这也是大多数网络攻击所使用的方法之一。由于爬虫会批量访问网站,因此许多网站会采取反爬措施。

由于网络爬虫会根据特定的条件访问页面,因而爬虫的使用将占用被访问网站的网络带宽并增加网络服务器的处理开销,甚至无法正常提供服务。在《反不正当竞争法》第十二条第二款中我们可以发现,法律会对爬虫的这种行为进行规制。

即经营者不得利用技术手段,通过影响用户选择或者其他方式,实施下列妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为:…(四)其他妨碍、破坏其他经营者合法提供的网络产品或者服务正常运行的行为。

因此,如果网站运营者已经采取了一定的反扒措施,而爬虫开发人员基于经营的目的、强行突破网站运营者采取的反爬措施,并客观上导致了网站无法正常运行,则很有可能构成上述规定所表述的不正当竞争行为。

强行突破某些特定的反爬技术措施,还会构成形式犯罪的行为。

《刑法》第二百八十五条规定,违反规定侵入国家事务、国防建设、尖端科学技术领域的计算机信息系统的,不论情节严重与否,构成非法侵入计算机信息系统罪。《刑法》第二百八十六条还规定,违反国家规定,对计算机信息系统功能进行删除、修改、增加、干扰,造成计算机信息系统不能正常运行,后果严重的,构成犯罪,处五年以下有期徒刑或者拘役;后果特别严重的,处五年以上有期徒刑。而违反国家规定,对计算机信息系统中存储、处理或者传输的数据和应用程序进行删除、修改、增加的操作,后果严重的,也构成犯罪,依照前款的规定处罚。

如上所述规定,爬虫开发者在获取数据过程中,一旦突破某些技术防护措施并且操作不当,造成严重后果的,将会构成犯罪,面临牢狱之灾。

爬取获得的数据的法律风险

数据一般分为两大类:个人数据和非个人数据。

如果爬虫爬取了个人信息(PII)信息,而为用户未授权或者授权不充分带来的法律风险很大。爬取个人信息还有可能会面临牢狱之灾,《中华人民共和国刑法》第二百五十三条之一所涉的“侵犯公民个人信息罪”及第二百八十六条之一所涉的“拒不履行信息网络安全管理义务罪”就是爬虫在个人信息爬取过程中经常触碰到的“红线”。此外,未经被收集者同意,即使是将合法收集的公民个人信息向他人提供的,也属于刑法第二百五十三条之一规定的“提供公民个人信息”,可能构成犯罪。

爬取非个人数据(non-PII)数据总体风险较低,但轻则可能构成侵犯著作权(在被爬取的数据具有独创性构成作品的情况下),如果有竞争关系大数据爬虫,还可能因实质替代获取不正当竞争优势、干扰或破坏他人网络服务的正常运行,涉嫌构成不正当竞争;

重则可能因绕开技术措施非法获取数据,涉嫌侵犯商业秘密(严重情形涉及刑事责任),涉嫌构成非法侵入计算机信息系统、非法获取计算机信息系统数据罪等罪。

总结一下就是爬虫本身技术不是非法的,但是爬虫行为和爬取数据具有很高的风险,如果未经允许,将爬取数据用来进行商业行为,将面临法律问题。

(编辑:温州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!