造假、黑客、攻击,这些我们在当今互联网时代都深恶痛绝的词汇在近几年随着大数据技术的不断发展和广泛应用已经治理的很多了。当今,很多创业团队都在很多业务层面上进行着创新,然而对于这些新业务的发展,有很多骗子和不法分子正是从网络安全、数据安全以及硬件产品攻击等很多地方对创业团队下手。
我们都知道,现在很多企业都应用了大数据和云计算技术,更是有越来越多的企业在利用这些新技术来保障自身内部的数据安全和网络安全,那么对于那些不法分子和骗子,大数据又该如何去进行防范,不给他们可乘之机呢?
大数据与骗子的博弈
对于O2O行业,薅羊毛、刷单和垃圾注册可能瞬间拉倒一个平台,对于互联网金融来说,恶意借款、信用欺诈同样让公司蒙受巨额损失。最可怕的问题是,这些遭受损失的公司可能根本无法定位到对手在哪。哪里有压迫哪里就有反抗。在这个“盗匪猖獗”的凶险环境里,出现了专门使用顶尖技术实现反欺诈的“民兵”。
对于大数据技术来说,如何找出骗子呢,那就需要把骗子的各个行为特征进行数据创造,然后在各个数据维度上的特点,并且判断出潜在的风险,足够大的数据量就像一瓶显影液,在浩如烟海的人群里让骗子现形。
坏人永远不希望受害者带着警察找上门。所以,在干坏事的时候,他需要一个代理IP。任何一个互联网用户访问某网站的时候,都会被分配一个IP地址,和网站通信的过程就相相当于邮寄一封封信。因为需要回信,所以所有访问者必须填写自己的地址。而“他们”显然不希望自己的真实IP被知道。所以他们会通过代理软件,通过一个跳板访问网站,这样就可以隐匿真实的IP地址。
代理IP只是评价一个访问者是否具有风险的千万条规则中的一个,想要定位到具体的人,还需要其他的判定条件,例如:精准地定位到这个人手中所使用的设备。
指纹如何能帮到你
如果面对面,我很容易识别出你用的是什么手机什么电脑,你的设备会在我心中留下一个对应的形象;但是下次见到你,我都很难判断你手上的手机究竟是不是和上次一模一样的那个。而如何能在千里之外,只通过数字和代码就为设备打上独一无二的“指纹”,则更加艰难。
很多账户通过同一个 IP 地址登录网站,这件事情有可能发生。例如一家公司的 Wi-Fi 可能连接了100名同事,此时他们共用一个 IP。但是这100名同事中有10名登录淘宝的可能性很大,这并不是异常。所以在这个情况下,IP 并不能作为判定条件,而是要采用更精细的设备指纹。一个特定的设备上,如果有10个账户登录淘宝,这样的行为本身就是一种异常,表明注册刷单的可能性很大。
几个账户同时在一个设备上登录,而这几个账户又曾经在其他设备上登录过。根据这样的“交叉登录”行为,可以勾勒出一个团伙使用的的所有设备。当然,设备指纹作为一个重要的维度,还要结合 IP、用户提交的身份证信息、用户其他行为等等,就可以很精准地描绘出团伙的行为和规模。
大数据主动出击
对于企业用户来说,由于身处不同的行业当中因此在数据应用和数据管理等方面大家都拥有自己不同的需求,不同的模式,对于某些数据而言,分散在各行业各平台之中,并没有明显的价值,而一旦被汇总到统一的系统中,价值就会呈几何数级增长。
如果一个人在A平台上提出了借款申请,而大数据显示他在B平台因为拖欠贷款已经被追债玩失联。这个时候系统就会提示A平台这个用户存在巨大风险。如果一个人在A平台上提出了借款申请,而大数据显示他同时在BCDEF平台都提出了借款申请,说明这个人对钱的渴望程度非常高,这可能表明这个人的经济状况不佳,存在一定风险。
所有技术手段,例如判断账号的交叉登录、同一设备多账号登录、某一类特定归属地的电话号码用户登录,其实都采用了多组数据组成多个规则的方法,对潜在的风险进行筛查。而为了精准地揪出“坏人”,还需要高质量的情报,所以各大羊毛党论坛、qq群成为了非常重要的情报来源。