新京报:莫让恶意爬虫“爬”掉大数据营销伦理

互联网大数据营销乱象表明,加快构建合理而明确的网络营销和数据采集边界,必须与互联网“黑产”的壮大赛跑。

▲新京报在“X·15特刊”中对郑州共赢科技有限公司的“鹰眼智客”大数据营销系统进行曝光。图片来源:新京报网]article_adlist-->

利用爬虫技术,从购物网站爬取店家手机号用于营销;借助软件,通过微信附近的人,进行“站街”钓鱼营销……8月20日,新京报对郑州共赢科技有限公司的“鹰眼智客”大数据营销系统进行曝光。8月23日,当地相关政府工作人员表示,辖区办事处已和警方对接,警方正在对其介入调查。该公司相关负责人称,“将积极配合有关部门调查。”

这家标榜“中国互联网营销服务第一品牌”的企业,在其官网宣称:“有你所需要的一切”,大有无远弗届之意。可对用户来说,这种未经允许就抓取一切数据的爬虫技术越强大,就越让人害怕。而此事所反馈出的互联网大数据营销中的乱象,或远不只是一家企业的违规这么简单。加快构建合理而明确的网络营销和数据采集边界,必须与互联网“黑产”的壮大赛跑。

爬虫技术为互联网信息传播而生,它本身并无“原罪”,关键在于如何合理利用。很显然,从记者调查的情况来看,有公司利用该技术做二次数据封装和用户引流,通过数据贩卖和流量牵引来牟利,不仅逾越了既有的法律边界,也构成对用户权益和其他平台利益的侵犯。

有报告指出,出行、社交、电商占恶意爬虫流量目标行业分布前三位。而登录使用这类APP,已构成绝大多数网络用户的“日常生活”。如果每个用户的浏览痕迹都可能被恶意爬虫“生成”大数据进行二次营销,这无异于将置个人信息于“裸奔”状态,个人也几乎无招架防范之力。因此,在源头强化对恶意爬虫行为的管控,势在必行。

随着移动互联网下沉到社会方方面面,网络大数据营销行业的出现有其必然性。但是,互联网精准营销首先要保障大数据的“取之有道”,像被曝光的企业这般,开发一套系统,在未经任何授权的情况下,肆意对各个互联网平台的用户数据进行“爬虫”,这在一定程度上就相当于“窃取”和“掠夺”。个人信息和互联网平台的信息安全因此受到威胁,大数据营销行业本身也将陷入失序化和污名化的境地。

今年5月,国家互联网信息办公室发布的《数据安全管理办法》征求意见稿明确规定,网络运营者采取自动化手段访问收集网站数据,不得妨碍网站正常运行;如自动化访问收集流量超过网站日均流量三分之一,网站要求停止自动化访问收集时,应当停止。且“网络运营者以经营为目的收集重要数据或个人敏感信息的,应向所在地网信部门备案。”而在实际执行当中,还得厘清“网站正常运行”的标准,并明确未及时停止和按规定备案的惩戒机制。

从国外经验来看,这种备案制或许可以是双向的——信息收集与使用环节都需要。如在一些国家,不愿接听营销电话的电信用户,会有专门的注册登记渠道,一旦营销企业或个人违规对这类用户造成电话骚扰,用户权益可获得专门的法律保护。

当然,大数据营销也是一种新业态,在行业监管不完善、标准滞后的大背景下,目前所出现的乱象,也可看作是行业发展之初的一种必然。具体监管上,不妨体现审慎包容。但无论如何,这种建立在数据来源合法性存疑之上的网络大数据营销产业,是该有一个系统性的规范了。