大数据黑市:内鬼、黑客与清洗者调查

DeGao 2025-09-05 02:15:19

来源:证券时报网

你是不是有过这样疑惑,刚跟朋友聊完投资、美妆、买房、贷款等日常话题,怎么就收到涵盖抖音、腾讯新闻甚至一些影像网站推送与聊天内容相关广告,还有每天陌生来电、垃圾短信,而巧合多次,让人只好怀疑各大商家利用APP权限申请窃取個人秘密,

对于個人秘密,人们从未如当下这般焦虑,

3月15日,315晚会曝光智联招聘、前程全程无忧、猎聘网等由于缺乏管理,大量個人简历遭遇泄露,被倒卖形成黑色产业,除这個,内存改良大师、超强清理大师、手机管家Pro打着清理内存旗号,却经由技术手段连续获取手机中信息,涵盖应用列表、定位信息、通讯录等,互联网运用者数据泄露再次变成公众Follow焦点,

近期,证券时报记者潜入多個数据交易千人QQ群,来自各行各业运用者秘密数据被贩卖触目惊心,时常有人在群里喊单,“出一手GM〔股民〕、WD〔网贷〕、BJ〔保健〕信息,拼多多、淘宝、京东一手网购数据,须要数据咨询……”这些数据根据行业划分被明码标价,不光这般,还有五花八门爬取数据软件,“爬”上网站,“嵌”入APP,“铲”下数据,

而在整個数据交易过程中,内鬼、黑客、爬虫软件开发商、清洗者、加工者、料商、买家等寄生于此,催生出一個巨大规模数据黑市,证券时报记者经由深入调查采访买卖双方获得大量一手材料,试图揭开数据黑市交易全链条,

APP权限申请泛滥

2020年网飞出品一部最新纪录片——《监视资本主义:智能陷阱》中,形象地向人们展示这样一副场景:

社交软件后台“三名就业人员”正在紧张地分析眼前这個年轻人,他在每张图片下停留多长时间,什么样情感更能让人引发共鸣,什么样广告会诱惑他点开,这三個人一個叫停留意向,根据停留时间帮你选择下一個推送内容,让你一直滑动屏幕;一個叫增长意向,让你尽大概多邀请你朋友加入增加社交依赖;一個叫广告意向,确保你在对某物感兴致时精准为你送上一条下单链接,

这一切行为背后也就是所谓算法模型,而精准算法背后都是依托海量数据作为支撑,于是将人数据化,

那么这些数据从何而来?

获取权限,是大大小小商家经由APP或者小程序收集运用者秘密数据最先個步,当你在安装一款APP时候,上万字运用者协议,呈现在你5.5英寸手机屏幕上,你会逐字看还是高速按下“同意”?而“不同样意”很大概导致APP退出无法运用,

合法、正当、必需,是APP运作商采集运用者信息法定原则,反而,APP越界索权现象已是不争事实,

证券时报记者从衣、食、住、行、社交、娱乐、投资等方面对25款APP相关权限获取实行统计,发现、运用者社交圈紧密相关通讯录权限已经变成APP权限标配,除这個,这些APP还会经由一些特定功能读取通讯地址、手机存储、照片、甚至记录面部识别、日历还有通话记录,手机APP权限申请已经到泛滥成灾地步,


图1:APP权限获取情况

以美图秀秀为例,实难想象,一款P图软件要获取一個人这么多信息,涵盖搜索记录、浏览记录,甚至是日历、地理位置,仔细阅读美图秀秀個人信息呵护政策发现,若将美图秀秀内容共享至第三方平台时,还会读取运用者应用列表信息,美图秀秀还会向游戏协作伙伴供应身份证号信息,甚至还会向协作伙伴共享运用者付款信息,

条款中还声明,根据现代移动互联网产品互联互通特性,产品大概接入美图关联公司或外部协作伙伴上线其他产品或功能,比方说在运用钱包功能时,美图大概从第三方获取运用者手机号、授信额度、还款金额、放款成功状态、逾期状态等,


图2:美图個人秘密政策截图

也就是说,只要运用者运用美图软件并授权,美图秀秀不光可以从自家APP上获取运用者信息,还会从第三方平台上进一步获取运用者更为祥明具体信息,

还有日常所用搜狗输入法,在权限申请中发生通讯录,甚至访问运用者位置信息,拍摄照片、录制影像;实属不解一款敲字工具为何还要访问运用者通讯录、相册这些敏感信息,影像软件要求读取运动数据,资讯类APP却开启相机、麦克风录音权限等,

“这种行为其实十分普遍,国内运用者大概对個人信息呵护意识并未很强烈,这给企业很大选择度,行业称之为‘占坑’,有些数据现在不须要,但并非代表以后不须要,在获取运用者授权后抓取到运用者信息显然越多越好,”某金融科技公司大数据风控架构师肖强称,

当下接近所有APP都在想方设法获取运用者信息资料,因碎片化信息一旦被整合,便具有商业价值——运用者每一次输入、浏览、地点、消费、就业、旅游、求职招聘、吃喝玩乐都被互联网工具记录在案,于是形成万亿级其他大数据,这些大数据在算法分析加持下不光晓得你在看什么,甚至还会晓得你将要做什么,于是做到精准营销,

可喜是,APP过度申请权限收集数据正在被增强监管,

3月22日,国家互联网信息办公室、工业、信息化部、公安部、国家市场监督管理总局联合印发《常见类型移动互联网应用程序必需個人信息范围限定》,明确地图领航、就时通信、网络购物等39类常见必需個人信息范围,要求运作商无法因运用者不同样意供应非必需個人信息,而拒绝运用者运用APP基本功能服务,

但是,肖强向记者表达,“大概大家都晓得APP在收集個人秘密数据,但除这個,运用者数据还大概同时被隐藏在APP里第三方SDK〔软件开发工具〕收集,”

SDK收集运用者信息可以祥明到什么层次?北京网贷协会数据保障专家韩洪慧表达,“SDK一旦嵌入,倘若你注册登陆这個APP,并默认授权,所有行为数据都能记录,它会在不知不觉中中爬取手机通讯录、聊天记录、银行账号密码口令、短信、通讯录、位置信息等,”

因为这個,运用者授权APP采集個人信息,但往往并非晓得自己個人信息在何时、以何种方法被共享给第三方SDK,很多APP“秘密政策”内容关于共享相关表述中,最常见是“大概会将运用者個人信息共享给第三方”,但接近没有APP会在秘密政策中祥明列举所谓“第三方”究竟涵盖哪些,

对于個人信息保障忧虑,折射出是运用者日益敏感神经,更是运用者缺乏对個人数据知情权、主动权表现,SDK对于运用者来说,犹如一颗隐藏“定时炸弹”,危险性不言而喻,

SDK供应商泄露、滥用运用者信息非常隐蔽,甚至变成泄露运用者秘密源头之一,

谁窃取运用者秘密?

数腾科技一位祝姓销售经理向记者表达,他们有自己特殊渠道去拿取一些数据,其中最为最先选渠道就是经由第三方SDK获取数据,

“这個渠道拿到数据会更精确,类似漏斗模式,会把数据根据需求实行筛选,比方说网贷行业运用者数据,运用者登陆XX普惠,运用此款APP就要授权,一旦授权SDK就会收集这個运用者所有登陆痕迹,其他消费金融公司倘若也运用这家SDK软件开发包,同样也能共享,”

记者进一步追问具体是跟哪家SDK友商协作时,祝经理以“敏感信息”为由拒绝透露,

无法忽视是,运用者個人信息经由网络倒卖非常猖獗,近期记者潜入多個千人QQ群,发现群里时常有人喊单出售来自各行各业公民個人信息,

“白酒、老年保健、男性男科保健、医疗、网贷、京东、淘宝、运作商实时数据……全部一手资源,带微信、实名,手拨百出6-12以上〔注:人工打电话100個电话,有6-12個以上能接通〕,外呼万出80以上〔注:机器呼叫,10000個电话有80個电话是可以被接通〕接通率高,添加率高……”


图3:数据交易QQ群截图

另外,甚至还有采集個人信息系统展示,号称可以采集国家级老板私人联系方法,


图4:個人信息采集系统展示

记者以买家身份接触一位QQ名为“空城”卖家,并提出先测试数据真实性为由,要求对方供应股民個人信息数据,

为证明自己数据来源,空城给记者供应一张数据来源截图,收集股民個人信息来自各大证券公司APP,广发证券、中投证券、国泰君安等都中招,


图5:股民個人信息来自各大券商APP

正如空城所说,QQ群里确有一部分人在卖数据时候打着“公司内部信息”旗号公开倒卖数据,“内鬼”监守自盗是個人信息流入黑产要紧渠道之一,可以接触到大量個人信息职业,并非高门槛,岗位职级也不须要太高,泄露源大概来自各层级,

2020年,公安机关打击利用就业之便窃取、泄露公民個人信息违法犯罪行为,各行业内部都有涉案人员,查获重点行业内部涉案人员500余名,而这但是是冰山一角,

一位叫吴青〔化名〕网友最先选从事数据采集软件开发,他向记者展示如何经由他们研发软件从京东、淘宝以及拼多多电商平台获取到运用者信息,这款软件叫价3800元,运用者只要购买,就能经由后台根据自己需求,比方说行业、地区、性别等导出自己想要数据,

除“内鬼”泄密,还有经由各类技术手段窃取公民秘密,

在调查采访过程中,黑市数据交易市场非常活跃且采集数据软件五花八门,其中一款名为汇容客APP,号称“全网最全大数据获客软件”,其销售经理向记者称,“咱们这款软件是全自动采集,只要搜索根本词,就能在各大网站、三大地图、三大运作商搜索出你想要客户资源、群体,不光是获客功能,咱们还能供应营销素材,带货影像;每档功能都会对应不同样价格,”


图6:汇容客APP价目表

当记者问及跟哪三大地图协作时,该销售经理称最先选是腾讯地图、高德地图以及百度地图,同时是经过授权运用他们数据接口,并向记者发来跟三大地图运作商盖章合同协议,


图7:汇容客出示获得三大地图运作商授权书

就此记者向百度、腾讯以及高德公司求证是否授权汇容客运用平台运用者数据,对方均一致表达不清楚这家公司,也不会将API〔数据接口〕随意授权,腾讯内部相关人士向记者称,这個章是假,字体不同样,

为力证此款软件数据爬取本事,上述销售经理称可以帮忙后台注册后先测试,随后记者下载此款APP,发现这款软件可以根据地理位置、行业、客户类型等实行搜索,而后导出相应运用者数据,同时一键添,


图8:汇容客APP数据提取示例

“因只是体验所以你不会看到客户手机号,这也是咱们公司为维护其他会员权益,咱们会跟一些第三方SDK协作,也会跟一些大互联网公司实行API数据接口对接,咱们跟腾讯、百度、华为、阿里、抖音、快手、美团、饿么都有战略级协作关系,资源高度整合,”该销售经理称,

记者发现汇容客软件上显示数据来源最先选为地图数据、工商数据、抖音、快手、阿里盼望、美团、饿么、京东互联网巨头,

针对软件所提及数据来源,证券时报记者向腾讯、阿里、美团、京东等都一一核实,多数均表达并未将API数据接口跟名为汇容客第三方共享,仅快手表达不回应,阿里公关进一步称,集团无法能允许该公司经由API接口爬取货调用蚂蚁运用者信息,目前已经在深入调查此事,

公开资料显示,汇容客采集软件运作商为厦门惠榕软件科技有限公司,成立于2019年5月13日,注册资本1000万元,法定代表人为黄忠,网站公开内容显示,汇容客覆盖1.5亿+企业信息,10亿+联系方法,涉及家装、建材、美容、确保、金融、房地产、电商、服务、药品及医疗器械、新零售、旅游、教育等300+個行业品类客源数据,

“能从这些网站爬取到运用者数据绝对是用相关一些技术,其实爬虫技术并非神秘,‘爬’上网页,‘铲’下数据,而后再实行加工清洗,这类软件众多,大一部分是在全网实行无差别爬取客户资料,后面经由加工实行精准分类,由此还延伸出职业清洗数据、标注人,”特意编写爬虫代码阿强向记者透露,

除内鬼、经由技术手段之外,黑客是盗取大量個人信息另一要紧源头,从今以后前京东运用者密码泄露大事到如家酒店运用者数据泄露,网站、黑客在运用者数据上一直在实行着旷日持久攻防战,

而黑客经由技术入侵网站盗取公民個人信息并非难,少则几天多则一個月,况且很少被管理员发现,在黑客圈子里,大家都有個默契,入侵网站获取权限、信息后,都会互相交换数据,互通有无,让盗取公民個人信息库越来越大,掌握個人信息也越全,

2020年国家级公安机关在“净网2020”专项行动中,侦办黑客攻击及新技术犯罪案件1782起,共有2952名涉案黑客被抓获,事实上更多黑客依然潜伏于地下,

個人信息经由内鬼、网络技术、黑客等渠道流入数据黑市,并进入大大小小各层级代理“料商”手中,

料商倒卖,個人信息明码标价

料商,就数据中间商,他们上通数据源头下达数据买家,是地下数据交易市场非常要紧一個角色,個人数据就是经由料商以不同样价格在黑市流转,料商甚至还会发展自己代理商,层级越高料商数据源越多,数据信息更全,

前文提到祝经理就是行业料商之一,他向记者表达,仅包含個人普通信息比方说电话号码、微信、QQ号;平均拿货本钱价每条信息在4毛左右,卖离开单条价格在7-8毛左右,每条個人信息约赚3-4毛左右,“我每個月销售数据流水大概在40-50万元,金融、教育、医美等行业都做,这块需求量会相对大,”

记者在与多位料商接触采访过程中解到,祝经理并非一级料商,一级料商进货本钱在0.15元/条左右,类似祝经理二级料商进货本钱为0.4元/条左右,三级料商进货本钱0.7-0.8元/条,对终端售卖均价在1.2-1.5元/条,

上述但是是数据黑市交易中普通秘密数据价格,在数据黑市中,还有料商特意从事“渗透数据”交易,所谓“渗透数据”就是所有信息都能够被抓取,除电话号码、微信等基本信息以外,还包含运用者身份证号、出行记录、开房记录、通话记录、人家成员、就业、婚姻状态、户籍所在地等,

有料商甚至在QQ群里直接将“渗透数据”明码标价,查询個人简易信息15元/条,包含姓名、性别、手机号;中级信息50元/条,除简易信息外,还包含户籍地址、身份证号、照片;高级信息100元/条,在中级信息基石上还包含现住地址、开房记录、车辆信息;VIP客户600元/条,


图9:“渗透数据”明码标价

“‘渗透’数据价格这么低,一种大概是非常陈旧個人信息;另一种大概就是以批发商角色直接跟黑客以最底价格拿货,况且要数据交易量非常大,至少10万条起交易,黑客才愿意冒这种风险,正常行情价仅通话记录,叫价在1500元左右,开房记录价格在2200-2500元左右,人家成员信息在300元左右,”网名“风”料商称,

记者在采访中解到,为防止无效数据、浪费人力,目前黑市数据交易一般都是采纳定制化需求,就买家先提离开需求,比方说须要哪個行业数据,须要多少条,包含哪些個人信息,而后经由转账提前预付,料商再根据买家需求去针对性获取数据,

据不百分之百统计,国内個人信息泄露数达55.3亿条左右,平均算下来,每個人就有4条相关個人信息泄露,车辆、房产、地址、职业、年龄、电话号码、身份证信息等在黑市上频繁流动,

国内著名信息保障团队“雨袭团”去年10月发布报告称,在一年半时间内,高达8.6亿条個人信息数据被明码标价售卖,個人数据基本处于裸奔状态,

终极流向,买家精准推销、诈骗

“本人求购炒股投资信息,数量上不封顶,有料找我!”一位买家在QQ群内发布这样一则消息,很快就有多位料商经由私聊向其专家推荐手上数据资源,

在经过沟通、比价之后,上述买家告诉记者,他已经从一位料商手中拿到10000条投资個人信息,包含姓名、电话号码、微信,价格为1元/条,记者进一步追问拿到这些数据最先选用途,该买家表达,仅仅是为推销投资产品,

综合多方采访,购买個人信息最多是那些须要推销广告、出售假冒发票、发布垃圾信息、以及从事网贷催收人,其中房地产中、投资公司、确保公司、母婴以及保健品行业、教育培训机构是对個人信息趋之若鹜重心群体,

被盗取個人信息也不乏用于诈骗,比方说保健品运用者信息最先选针对老年人,特意用来诈骗;学生信息,则用来推销教材、家教信息,或以中、高考加分为借口实行诈骗,

记者在与买家接触中发现,他们大一部分人都晓得买卖数据交易属于黑产,但依然作此举动,一個要紧原因在于经由正规渠道打广告,比方说百度竞价名次,获客本钱在60-80元/左右,而经由地下黑市买运用者数据,本钱能缩减十分之一,

从信息收集到信息售卖再到信息利用,每一個交易环节环环相扣,而由此引发“灰色产业链”让人难以估量,据猎聘网发布《现代网络诈骗分析报告》称,目前中国网络黑产从业者已经超过40万人,依托其实行网络诈骗行业人数至少有160万人,“年产值”在1000亿元以上,

在调查采访过程中,黑市数据交易利益链已经可以清晰划分为四级,最先個级黑客或内鬼、高精深网络软件盗取公民個人信息;第二级盗取公民個人信息进入料商手中,料商奠定自己信息数据库;第三级,是料商连续发展代理商,将数据实行倒卖;第四级就是信息运用者,也就是数据终极流向买家手中,他们拿到信息后,实行电话营销或实施电信诈骗,

数据合规交易痛点

海量個人信息地下市场规模多大,目前没有准确数字统计,但从公安机关专项打击行动中,可窥一斑,

2020年国家级公安机关深入推进“净网2020”专项行动,全年共侦办网络犯罪案件5.6万起,抓获犯罪嫌疑人8万余名,其中,侦办侵犯公民個人信息类案件6524起,抓获犯罪嫌疑人1.3万名;侦办黑客攻击及新技术犯罪案件1782起,抓获犯罪嫌疑人2975名;侦办网络黑产类案件1万余起,抓获犯罪嫌疑人1.5万名,扣押“手机黑卡”548万余张,查获涉案网络账号2.2亿余個,火速阻止1850万余张物联网卡流入黑市,

但很显然,这并非黑市全貌,贵阳大数据交易所业务经理陈经理向记者表达,“目前经由正规渠道实行数据交易不多,更多数据大概还是在黑市交易,”

贵阳大数据交易所是国内最先家大数据交易所,2015年4月正式挂牌运作,喊出后世3-5年每天交易量达到100亿多亿元口号,如今,交易所成立已经6年,陈经理向记者透露,目前交易所日成交量远远没有达到当时定下意向,

大数据服务商聚立信CEO罗皓以及陈经理都同时提到,数据交易过程中引发数据确权、数据回溯、交易过程中保障性、合法性、秘密性保障等难题,迄今为止还没有得到很非常好搞定,尤其是数据确权,比方说数据采集、加工、采用、交易等环节大概有多参与方,什么情况下什么类型参与方可以获得数据权利,在实践中尚无达成一致共识,

目前可见红线是来源是否合法,以及交易数据是否脱敏〔涉及敏感信息实行去個人化,秘密化搞定〕,但难题在于,在数据流转过程中,其中掺杂非法来源以及未脱敏数据实际上很难被发现,

另外,数据开放层次还远远不够,导致市面上合法流通数据品类、数量有限,玩家们难以施展拳脚,

像腾讯、阿里这样互联网巨头,在持有海量数据同时自身还能实行大数据云计算闭环,他们更希望是打包成数据产品、服务卖出,比单纯买卖数据更值钱,也更能防止法律风险,这些玩家共享数据意愿不强,这从腾讯、阿里与贵阳大数据交易所自合同到期再无续约就可窥见,

但从技术角度来讲,目前已经有一种技术可以实行B2B之间数据合规化交易,大数据服务商星云Clustar CTO张骏雪向记者表达,目前公司已经采用一套“联邦学习”算法,简单理解,就是根据双方现有数据去一道奠定一個坐标体系,这個坐标体系就是所谓建模,建模完成后,就能较为精准判断客户处于坐标体系保障点还是危险点,但是在建模过程中,双方并非晓得互相运用者资料,无需担心运用者秘密被复制泄露,

根据张骏雪介绍,上述联邦学习算法目前只是搞定B2B之间数据合规化交易,且最先选还是用于银行金融机构之间数据交易,且本钱较高,并未被大规模应用,

大成律师事务所律师肖飒告诉记者,個人信息合规运用目前在中国较大层次依赖于公司自我约束,各大运作商对于运用者秘密是否尽到呵护责任,如何在公众秘密呵护、商业模式中探寻一個平衡点值得深究,在呵护個人权益前提下规范、保障、有序地利用個人数据,释放大数据红利。

很高兴你能耐心的读完我的文章,你一定不想在AI时代错过原创、深挖的消息,请关注DeGao的Twitter,不迷路!

相关资讯