“爬虫技术是一项工具,但被居心不良的人使用,就可能出现大问题。”一位互联网消费金融平台风控总监感慨说。
尽管近日51信用卡被查主要源自其委托的催收公司存在冒用国家工作人员暴力催收行为,但在多位业内人士看来,这种暴力催收行为离不开爬虫技术的“配合”。
“比如有些互联网消费金融平台通过爬虫技术能时时掌握借款人行踪与地址定位(未必获得用户允许),然后将此信息转交给催收公司,由后者上门轮番暴力催收,无论借款人跑到哪里,暴力催收就如影随影,如此部分借款人心态崩溃,容易走上不归路。”这位互联网消费金融平台风控总监透露,此外有些平台在未获得用户授权的情况下,通过爬虫技术掌握借款人与亲朋好友的通话记录,由此向这些亲朋好友施压督促他还款,导致借款人感到脸面丢失,也容易走上不归路。
他坦言,这背后,与某些平台通过爬虫技术过度收集并贩卖借款人隐私信息息息相关。
多数情况下,借款人看到的授权协议仅仅显示平台将通过后者授权的账号,只能登陆相关网站邮箱与手机桌面查看所下载的APP。但事实上,这些平台的爬虫技术早已突破授权协议使用范畴,开始抓取借款人在网站邮箱与手机桌面的大量各类数据,其中不少涉及用户极其隐私的个人信息“另有他用”。比如他们会将借款人地址定位信息“交给”催收公司进行催收回款,或将借款人其他隐私信息卖给其他平台作为信贷风控决策依据等。
“在欧美国家,这种行为肯定是触犯法律的。”一位曾在美国开发爬虫技术的金融机构技术总监向21世纪经济报道记者透露。
记者多方了解到,目前中国对用户隐私信息保护的相关法律正在加速完善,比如正在征求意见的《个人金融信息(数据)保护试行办法》规定,(金融机构)不得非法从从事个人征信业务活动的第三方获取个人金融信息,以及金融机构不得以“概括授权”的方式取得信息主体对收集、处理、使用和对外提供其个人金融信息的同意。
被玩坏的爬虫技术
上述金融机构技术总监直言,爬虫技术在欧美国家金融领域的使用相当普遍,比如在洗钱监管方面,不少金融科技公司通过爬虫技术抓取各类公开信息,以此完善涉嫌洗钱者的名单以及其人际关系网,从而不放过任何一个漏网之鱼。
“在中国,爬虫技术显然被玩坏了。”他透露,相比欧美国家金融机构通过爬虫技术只能抓取公开信息或经用户授权的个人信息,中国不少P2P平台都存在利用爬虫技术过度收集用户隐私信息行为。具体而言,比如用户授权P2P平台只能访问他浏览过的网站页面或邮箱里涉及信用卡账单的邮件,手机桌面APP下载软件等信息,但在实际操作环节,这些P2P平台利用爬虫技术抓取用户在这些网站的消费行为,私人邮件内容,还有个人行踪及地址定位等隐私信息。
这也是引发暴力催收事件频发的主要原因之一。比如P2P平台将用户地址定位“交给”催收公司,由后者不断上门轮番对借款人进行暴力催收加快回款速度,而部分借款人发现自己走到哪里都被暴力催收,最终心态崩溃并走上不归路。
此外,很多P2P平台还通过用户“授权”,通过爬虫技术抓取用户在银行的大量个人信息,包括个人以往借贷还款记录,职业、婚姻状况等数据,并将这些数据与用户提交给平台的个人数据进行交叉验证,以此判断用户真实的还款能力与还款意愿。但事实上,这种用户“授权”所抓取的内容,是银行需保护的用户隐私信息。
这也引发不少银行与P2P平台的纠葛。近日市场传闻一家银行向51信用卡发函,直指后者通过爬虫技术对银行用户信息进行全方位大量抓取。由于银行未与51信用卡签订相关授权书——允许后者从银行系统获取用户个人信息,因此银行认为51信用卡此举构成侵犯公民个人信息罪,要求后者停止这种抓取用户个人信息行为。
监管加强保护个人隐私
面对爬虫技术过度收集贩卖个人隐私信息所造成的社会问题,欧美国家相关部门一直在加强从严监管力度。
去年5月,欧盟出台了《通用数据保护条例》(简称GDPR)。这份法案的最大杀伤力,是过去互联网机构习以为常的、利用爬虫技术过度抓取用户行为数据的做法,因涉嫌侵犯隐私变得不再“合法”。
它之所以被称为史上最严的数据保护法案,主要在于两点,一是任何企业只要在欧盟市场提供商品或服务,或收集欧盟公民的个人数据,都将受到这部法案的管辖。比如中国跨境电商平台提供“面向欧洲的特惠产品”“欧洲区包邮”等采购服务,或在商品价格上标注欧元价格,就可以被视为在欧盟市场提供商品或服务,将受到GDPR的管辖;二是GDPR法案规定跨境电商等网站经营者不得擅自将用户姓名、银行账户、IP地址等个人信息用于其他业务用途,反之这些网站经营者若要将用户信息用于其他业务用途,需与用户重新签订一份授权协议并明确标注新的用途。
这导致不少跨境电商等互联网平台抱怨客户服务体验大幅下降。因此它们一直尝试游说欧洲相关部门能适度放宽GDPR对个人信息获取使用的监管要求,但鉴于对用户隐私信息的从严有效保护,欧洲相关部门没有松口。
美国奥斯顿律师事务所(alston&bird llp)合伙人kenneth g.weigel此前接受本报记者采访时表示,美国法律则主要从“未经授权故意访问”“超过授权访问权限””从任何受保护的计算机获取信息”三大维度判断爬虫技术公司是否过度收集使用用户个人隐私信息。按照《1986年计算机欺诈与滥用法》,只要爬虫技术公司在抓取用户个人隐私数据时存在上述三种状况,基本都被判定败诉与巨额赔款。
值得注意的是,近年中国在保护个人隐私信息方面的法律日益完善。早在2017年5月8日,最高法院、最高检察院出台了《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》,对爬虫技术过度收取滥用个人隐私数据做出严格入罪规定。
正在征求意见的《个人金融信息(数据)保护试行办法则规定金融机构不得非法从从事个人征信业务活动的第三方获取个人金融信息,以及不得以“概括授权”的方式取得信息主体对收集、处理、使用和对外提供其个人金融信息的同意。
“在2017年《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》出台后,相关部门曾抓了一些利用爬虫技术过度收集滥用个人隐私数据的P2P平台技术人员,但由于当时处罚力度不够重,并未引发很多大数据风控机构与P2P平台高层重视,如今多家爬虫技术公司被查与相关高层被抓,足以凸显相关部门正采取雷霆手段整治爬虫技术过度收集滥用个人隐私数据行为,从而净化个人隐私信息保护领域。”上述平台技术总监指出,经此一番行业动荡,利用爬虫技术过度收集个人隐私信息牟利的公司未来生存空间也被大幅压缩,目前很多银行与持牌金融机构已经暂停与这类机构的各类大数据风控技术合作。