如何利用爬虫收集个人信息?利用“爬虫”采集数据的刑事风险全解析

近日 , 魔蝎科技、新研科技等数据服务商陆续被公安机关查处 。据介绍 , 其调查原因与爬虫、数据等相关业务有关 。两家业内知名数据服务商被立案后 , 行业纷纷下架 , 暂停相关数据服务 。业内甚至出现了一个笑话 , “爬虫玩得好 , 细胞早进 。数据滑 , 监狱食物吃久了 。”
“爬虫”(Web) , 即按照一定规则自动爬取互联网信息的程序或脚本 。作为一种技术或工具 , 爬虫本身就是非法和合法的 。与机器人相关的高犯罪风险的关键是:机器人用于谁?用在什么地方?

如何利用爬虫收集个人信息?利用“爬虫”采集数据的刑事风险全解析

文章插图
图片来自网络
从数据生命周期来看 , 基本可以分为数据采集、数据存储、数据处理、数据传输、数据交换和数据销毁等阶段 。目前 , 在数据生命周期中 , 犯罪风险最高的是数据采集和数据交换环节 。在所有数据类型中 , 犯罪风险最高的数据类型是公民个人信息 。
在大数据行业 , 公民的个人信息主要通过外部收集和自行收集获得 。在外部获取方式中 , 个人信息通过直接购买数据存储、购买API接口或爬虫等方式收集 。在自行收集的方式中 , 有用户自己填写的方式 , 也有获得用户授权后通过爬虫技术收集的信息 。
其中 , 通过爬虫方式收集公民个人信息 , 是一把永远悬在数据服务商头上的达摩克利斯之剑!该行为面临的犯罪风险主要分为以下几类:
一、侵害公民个人信息犯罪的刑事风险
《刑法》第253条之一规定 , 窃取或者以其他方式非法获取公民个人信息的 , 构成侵犯公民个人信息罪 。此外 , 根据《关于办理侵犯公民个人信息刑事案件的司法解释》 , 除了花钱购买个人信息外 , 获取个人信息属于违法行为 , 不花钱接收或者交换个人信息也是违法的 。从实践来看 , 非法获取公民个人信息的方式主要包括窃取、购买、接受、交换、入侵计算机信息系统或利用其他技术手段等 。利用爬虫程序窃取公民个人信息 , 属于典型的侵犯公民个人信息罪 。
以马某侵犯公民个人信息案为例 。2018年2月至2018年4月 , 马某利用自己编写的爬虫程序窃取APP和网站的用户信息以牟利 , 然后通过微信聊天卖给苏某 。XX拥有姓名、联系方式等公民个人信息约20万条 , 非法获利总额2.4万元 。法院认定 , 马某犯侵犯公民个人信息罪 , 判处有期徒刑三年两个月 , 并处罚金4万元 。
二、侵犯商业秘密和侵犯版权的刑事风险
通过用户的授权爬取信息 , 即数据服务提供者通过向用户索取特定网站的用户名和密码来爬取网站的信息 。一般而言 , 在全国工商信息管理系统、最高人民法院裁判文书网等公共网站上抓取相关公开信息不构成行政违法 , 也不构成相关刑事犯罪 。
如果爬取的是商业营利性网站 , 运营商除了要求用户名+密码登录外 , 通常会采取技术措施防止他人恶意登录和攻击此类网站 。在获取用户的情况下授权 , 从刑法的角度 , 很难认定为侵犯公民个人信息罪 。但可能涉及侵犯商业秘密、侵犯著作权等相关法律规定 , 甚至构成侵犯商业秘密或侵犯著作权罪 。
如果数据服务提供者通过用户授权大规模爬取竞争对手的相关数据 , 并将爬取的数据认定为经营信息或技术信息 , 可能违反《反不正当竞争法》第9条侵犯商业秘密 , 涉嫌不正当竞争 。上述行为给商业秘密权利人造成的损失超过50万元的 , 依照刑法第二百一十九条的规定以侵犯商业秘密罪定罪处罚 。肇事者将面临最高七年的有期徒刑 , 并处以金刑 。