5月25日下午,观数智库创始人涂子沛作为嘉宾参加数博会“对话大数据时代”活动,和《大数据时代》作者维克托·迈尔-舍恩伯格、电子科技大学大数据研究中心主任周涛等国内外知名专家学者一起,就大数据时代的理论和实践进行了巅峰对话。
对反恐而言,数据就是证据!
胡一虎:之前美国政府在追捕本拉登中,大数据平台扮演非常重要的情报分析角色,假设没有情报分析帮助,很难掌握本拉登等人在哪里。有了大数据以后,国家的安全会不会受影响?
涂子沛:为什么数据在反恐当中有非常广泛的应用?因为数据是对事实、客观世界的记录,就此而言,数据就是证据。数据在治安、反恐领域有广泛的应用。我们是在千千万万数据、信息当中,把一些数据变成信号,然后去核实这些信号。比如,一个恐怖分子经常旅游、变迁住址就是一个信号,购买爆炸物也是一个信号。无数信号叠加后,就可以判断,他出了问题。
胡一虎:我联想到埃及航空。有很多西方媒体就说,对乘客进行登记和大数据分析,有没有跟所谓的恐怖分子有关联?用这样的思维,会降低未来发生恐怖袭击的机会吗?
涂子沛:大数据一定会让国家更加安全,但是前提是掌握大数据技术的国家。
胡一虎:假设发达国家大数据技术特别好,那么在技术上比较差的国家,很可能会受到这些发达国家的制约。
涂子沛:我认为结论是正确的。竞争就是科技的竞争。这也是要培养大数据人才的原因,安全的竞争就是技术的竞争,就是教育的竞争。
隐私已半死,要法律来做人工呼吸
胡一虎:对于如何让大数据跟反恐、国家安全的关联性强化,舍恩伯格的看法是?
舍恩伯格:前面几位已经都说得很好了。我想关键在于拿尽量多的数据,用非常智能化分析,放到一个大背景下讨论,关键必须明白我们是面对一种博弈。我们希望获得多少安全,我们希望存在多少自由,这是一个博弈、取舍。
我说的自由,不是人民和政府之间的自由,而是消费者和大公司之间的自由关系。
比如,亚马逊前几年做了这样的探讨,来衡量我对某种产品的偏好。如果他认为我很喜欢,会显示更高的价格。这是一个例子,可能有些公司不会做这样的决策,但有些会做。后面几年大家反对以后,亚马逊推翻了这样的做法。多少自由、多少方便,需要消费者在方便和风险之间平衡。
周涛:第一点,每个人没有能力保护自己的个人隐私,这方面的尝试都会失败;第二点,我们希望未来但凡一个企业,非常恶劣地使用个人隐私,谋取不正当的利益,我们一定要给予他重处。
这个光靠法律没有用,涉及到知识、信息这些比较虚拟的东西,立法基本上没有意义。我们需要利用科学和技术手段,具体怎么通过技术、知道所有隐私数据在哪个点、哪个线被泄露,把这个信息交给法律机关,才能让法律真正可以执行。
涂子沛:刚刚谈到,法律不是解决问题的最终手段,我的观点恰恰相反,隐私确实半死,需要法律续一口气。今天,隐私问题是一个崭新问题,人们从来没有去解决过。
为了获得更多反恐信息,要检索大量信息,可能侵犯你的隐私,但是这个隐私是牺牲给了国家,这没有问题,这是为了让大家更加安全。但我们今天看到是隐私牺牲给了大量的公司、商家,这就不行了。这个问题是,我们极度需要立法,规范商家的行为。
技术只是辅助,立法才是根本
胡一虎:原来好多报道,人在40岁后,邮箱里莫名其妙经常收到很多推销“伟哥”的邮件。我不希望这个东西出来,把它删除,能这样保护吗?
舍恩伯格:孩子不断成长,一直希望买更大的衣服。我的孩子已经6岁,还买尿布的话他肯定不高兴。
隐私也是一样,随着数据不断增长,我们需要的不仅仅是现有关于保护隐私的法律、法规的数量增加,甚至可能要有不同的角度保护隐私。数据如何使用?我把我的数据完全保护起来,还是有很多的东西流传到互联网,因为你们会拍我的照片,放上互联网,这是我没办法控制的。
没有因果性的相关性毫无价值
提问者:我注意到舍恩伯格过去演讲提到,大数据改变了一种思维,我们只需要知道“是什么”而不需要知道“为什么”。“知其然,知其所以然”,和你所说是不是一种矛盾?
舍恩伯格:我不是说去寻找这个所以然没有用,我实际上是说,有时候要知道为什么非常非常的难,有时候你以为了解了,实际上你并没有了解。简而言之,我不是认为寻求因果关系是愚蠢的、没有意义的,我说的是,不要总以为找到这个原因很容易。
涂子沛:这个问题很有意思,我们谈到,只关注这个相关性,恰恰是中国人传统的思维——模糊相关,不注重精确。但是,大数据时代不是,没有因果性的相关性是没有价值的。
从数据看,贵阳这个地方的高考升学率可能跟硅谷刑事案件发生率都有相关性,但是经不起因果关系的推敲。归根结底,还是要落到因果性,不能被相关性所迷惑。如果被相关性所迷惑,大数据会给我们带来汪洋大海的相关性。
周涛:首先,我同意舍恩伯格和涂子沛想法,追踪因果,是科学的最终精神。相关和因果之间不是互相敌我的关系,而是相辅相成的关系。