大数据可以治理雾霾?通过大数据能揪出骗子?如何看待大数据开放与个人隐私保护……在14日举行的首届中国大数据应用大会以及下午举行的5个分论坛上,权威专家以及行业领袖围绕智能制造、大数据核心技术、地理信息与大数据、宏观经济大数据等当前热点领域全面展开讨论。
“在成都召开的首届中国大数据应用大会,是目前国内第一个以应用为主题的大数据专业会议。”中国大数据专家委员会副主任委员刘汝林说,大数据已成为信息技术产业中最受关注的领域之一,随着大数据从概念转向应用发展,大数据应用进入蓬勃发展的机遇期。
本次大会搭建“大数据与智能制造应用论坛”“大数据核心技术论坛”“大数据与金融创新论坛”“大数据与媒体联接力论坛”“经济大数据论坛”“大数据健康医疗应用论坛”“政府及信用体系建设大数据论坛”“大数据人力资源论坛”“大数据与地震研究研讨会”“大数据地理空间信息论坛”“大数据产品及解决方案对接专题活动”等11个论坛活动,吸引了天使投资人、硅谷著名连续创业家斯蒂夫·霍夫曼、中国信息经济学会秘书长王明明、广东金融学院副校长王醒男、波士顿咨询中国区总经理张越、美国德克萨斯理工大学终身教授林漳希等资深专家,以及银行、基金、证券等相关部门领导、行业专家和企业高管等,纷纷在各分论坛上亮相,现场展开对话,探讨大数据技术产业发展给各行各业带来的机遇和挑战。
大数据 安全
“私密性数据不要放在网络上”
中国大数据专家俞能海谈大数据开发与隐私保护
中国大数据专家委员会委员、中国科学技术大学信息处理中心主任俞能海
在7月14日下午“大数据核心技术分论坛”中,中国大数据专家委员会委员、中国科学技术大学信息处理中心主任俞能海教授分析了目前大数据时代人们的隐私困扰。
俞能海教授说,在Web2.0时代,用户就是数据的产生者。用户在网上产生了大量的数据,留下的足迹却难以消除,其隐私有被泄露的风险。
大数据隐私保护成了难题
“众所周知,大数据有4V特征,volume(大规模)、velocity(速度快)、variety(种类多)、value(有价值)。”俞能海说,从隐私保护的视角来看这四个特征就是:大数据为别人窥探隐私提供了更多的线索和途径;我们的隐私被稀释在大量数据中,但是其中可能蕴藏高价值的信息。
俞能海讲到,目前大数据“使用权”正在挑战隐私需求。“如果多个平台联合,长期连续对用户行为数据进行挖掘并用于非法行为,这就侵犯用户的隐私,因此需要深入研究分析大数据背景下如何保护用户的隐私。”
然而在大数据时代保护隐私,是非常困难的。
他举例,某些公司利用社交媒体的自拍照开发人脸识别技术,通过人物表情来判断是否能发送针对性的广告或进行市场研究。而随着黑客攻击手段不断提升,人脸识别认证将出现风险,不法分子有可能伪造人脸视频通过身份认证。
隐私保护成为潜在的消费需要
俞能海带领他的研究团队正在开发一些隐私保护技术,例如抗机器学习隐写技术,通过嵌入干扰信息,使其做出错误判断。
俞能海总结说道,大数据开放存在隐私泄露风险。隐私泄露是互联网、大数据发展带来的时代忧虑,但是忧虑背后孕育着新的需求和机遇。因为隐私保护是一种潜在的消费需要,迎合这种需求可以创造价值,比如加密手机。但是在基于大数据挖掘的情报获取背景下,加密通信本身会带来信息泄露,因为加密本身已经表明了数据的重要性。
如何应对上述危机?俞能海说,“信息隐藏是面对上述危机的一种思路”。对话/
企业挖掘大数据需要一个度
记者:普通人如何保护自己的隐私?俞能海:只要用了数字产品就可能防不胜防,这不是危言耸听。因为有时候隐私被泄露,用户自己本身是不知道的。因此非常重要的个人信息、私密性数据不要放在网络上。
记者:对于企业来说,数据使用和挖掘需要有个度?
俞能海:对。虽然这是一个大数据时代,我们要对数据进行挖掘分析,但是我们需要认识到,大数据的应用需要掌握一个度。有些数据是不必要的,甚至是无效的、冗余的信息。这就需要我们根据大数据应用的环境和应用背景进行选择。当然数据要应用,最关键的问题就是安全和隐私。
记者:从信息安全的角度来看,政府掌握的数据能否进一步公开?
俞能海:我个人持谨慎和保守意见。为了更好地服务社会,政府需开放一部分数据,但是开放到什么程度?需要认真研究。从社会稳定或者国家安全的角度,有些数据是不宜公开的。 封面新闻记者张元玲
倪光南院士:网信安全应有“一票否决”权
通过大数据能否揪出骗子?“通过他的活动数据,分析以后,能够预测这个人信誉不好。”
大数据对个人隐私会不会带来影响?“网信领域要安全与发展同步推进。也就是说,既要用好大数据,也要保护好用户隐私。”中国工程院院士倪光南表示,网信安全要作为前提,有权“一票否决”。
7月14日,首届中国大数据应用大会在成都举行。中国工程院院士、中国大数据专家委员会顾问倪光南作了题为“自主创新发展网信技术”的报告。 大会开始前,倪光南院士接受了封面新闻记者的专访。
核心技术只能自主创新
倪光南指出,发展网信技术,有四种途径:引进但必须安全可控;引进消化吸收再创新;通过别人开发;依靠自己的力量自主创新。“到底选哪一条?尽管不能一概而论,但关键核心技术只能走自主创新道路。”
倪光南说,网信领域有一个很重要特点:核心技术作用非常大,垄断性很强,核心基础和基础设施非常重要。这与汽车核心技术不同,如果在网信领域仅使用别人技术,受制于人将是最大隐患。因此,自主创新更适合中国网信领域发展的道路。
倪光南认为,网信领域想通过引进、仿制,实现引进、消化、吸收再创新的模式,比其他领域难得多。其结果往往是引进了垄断而未真正引进技术,主要原因在于:首先,网络空间大国利益的博弈,常常导致对某些信息核心技术的封锁和保密;其次,网信领域往往有极强的垄断性,任何创新如与现有垄断体系不兼容就难以成活;第三,传统产品容易分解成许多小零件而被各个击破地消化吸收,但信息技术往往难以被分解,单项技术的复杂度极高,如包含数千万行源代码或数亿个晶体管,以至于极难在有限时间、有限投入下被消化吸收,更谈不上再创新。
安全有权“一票否决”
大数据就在每个人身边。那么,用好大数据的同时,是否会影响个人隐私安全?关于网信安全问题,倪光南院士更为关注。他表示,网络信息发展的同时,还需要强调网络安全的重要性,将网络安全思想在网信领域牢牢建立起来。
倪光南表示,在网信领域,要把发展和网络安全同步推进。“不能只搞信息化,忘记了网络安全。或者说搞了网络安全,又忘了信息化。把网络安全信息化结合在一起,安全是发展的前提,发展是安全的保障。我们主张,网络安全要作为前提,有权‘一票否决’,一个项目如果安全方面通不过,就不要考虑了,这是网信领域的工作跟其他领域工作不一样的地方。” 封面新闻记者梁波
大数据 应用
“雾霾的问题在哪里,可以通过大数据对症下药”
清华大学数据科学研究院院长俞士纶谈大数据应用
7月14日,在首届中国大数据应用大会上。针对大数据应用、政府数据是否应该做出更多开放等问题,封面新闻记者对清华大学数据科学研究院院长俞士纶进行独家专访。
记者:你怎么看待大数据和大数据应用的?
俞士纶:各种产业都可以了解到大数据给他们带来的机会和影响,如果你没有看到大数据对你这个行业的影响的话,这个行业可能就会垮掉。比如传统的零售商,他没有想到电子商务的出现,如果不做出改变可能就会垮掉,即使比如出租车,他没有想到各种网约车的出现,他们就会受到冲击。所以说,大数据这种技术,它会对很多产业产生影响。
记者:大数据的应用,现在处于什么阶段?
俞士纶:就是说,我们有一些行业,比如电子商务行业,它们是完全了解大数据对它们的影响,并在思考怎么利用大数据使它们变得更好。但是有一些行业,它们已经开始意识到,但是没有什么进展。
比如像医学的话,大家都在说什么精准医疗,但目前只是口头上在说,还没有什么实质性的进展。
比如说有一个人,如果患了癌症需要化疗,医生说,这个化疗对最多的人有效,那我们就使用这个。如果没有效,我们就用另一种对较少人有效的药,但这不是精准医疗,这只是根据统计学得出的结论。
但是如果我们能够通过大数据把一些资料,比如某种药对某个病情能起到30%的作用,某种药对这种病能起到60%的作用,我们把这些信息综合到一起的话,就可以有效地去利用这些药物为我们服务。
再比如说,在北京的话,雾霾、环保的问题比较大,我们是可以通过大数据来了解雾霾的,雾霾的问题在哪里,我们可以通过大数据来对症下药,使一些问题变得没那么严重。
记者:您认为政府数据是否应该做出更多的开放?
俞士纶:对,政府应该做一个领导性的举动,要把更多的数据公开。
政府有很多数据,比如医疗数据和交通数据甚至是卫星影像,应该在适当的时候开放。因为政府要推动一个产业发展的话,它会有产业政策,但是大数据产业要发展,就依赖于政府开放和分享一些数据,这样的话,才能对大数据产业的发展起到推动作用。
数据挖掘就像是“挖金子”
欧洲CIO联盟主席谈大数据改变生活
欧洲CIO联盟主席Frits Bussemaker
“几年前,你会看到一个CIO (Chief Information Officer,首席信息官)在负责他们的数据系统。然而现在你会看到,数据来自营销人员、销售人员以及商业人员,他们 也 在 负 责 数 据 。”Frits Bussemaker说,随着数据的爆炸,数据是每个人的工作,而不只是创造了数据系统的CIO。这是他认为目前大数据时代带来的最大的变化。
大数据定位塞车路段
Frits Bussemaker列举了大数据应用的两个例子,Fitbit(运动追踪者)检测地震和手机定位检测塞车路段。
Fitbit是美国加州的一家制作可穿戴设备的新兴公司,这些设备收集了每晚人们的健康信息。公司整理数据看到,某天凌晨3点钟,人们的心率有大的攀升,后来他们意识到这是由于地震把人们震醒了,这样就可以检测哪些地方发生了地震。
另外一个例子就是用手机定位来检测塞车路段。智能手机有定位功能和地图应用,因此可以掌握人的运动轨迹,从而判断路段是否塞车。
信息被采集用户要有知情权
大数据时代,我们该如何处理个人隐私安全和大数据应用之间的关系?
Frits Bussemaker称,总的来说,当信息被采集时人们需要有知情权。由他们来决定是否允许自己的数据被信息技术使用,确定将要共享自己的数据,并由此获得某些别的回报,或者实现某些价值。数据抓取方需要设置底线,保障这种知情权。当然,那是商业数据。
信息由某个人自己发布时留下的痕迹是主动的,而数据阴影是个人活动中被收集的痕迹是被动的,是在你不知情的情况下提供了数据。那样的话很有可能造成数据滥用。
“因此最关键的就是,人们是在是否知情的情况下,共享自己的数据。”Frits Bussemaker告诉封面新闻,现在世界都在讨论隐私与大数据应用的问题,但是由于对隐私的理解不同,数据产生的方式也不同,因此这个问题难以解答。“但是趋势是,人们正在试图将二者进行平衡。”
大数据人才非常稀缺
Frits Bussemaker将大数据挖掘比喻成挖金子。
“你必须挖掘很多无用的沙土,挖掘深入,才能找到金子。同理,我们要收集很多的数据,很多数 据 都 不 是 有 用 的 。”Frits Bussemaker说,我们要做的是收集数据,有效地保存数据,甚至甄别哪些数据是我们需要的,哪些是不需要的。
Frits Bussemaker说,目前市场对于数据科学家有很高的需求,但是他们的量实在是很少。虽然有很多技术人员可以建立数据库、开发系统,但是很少有人能够理解数据的价值。这是一个相当大的挑战,因为这需要有商业知识的储备,因此这些人才非常稀缺。
大数据 推进
大数据应用是产业链的“牛鼻子”
中国大数据专家委员会秘书长诠释大数据应用大会的意义
7月14日上午,在成都世纪城国际会议中心大数据应用大会现场,中国电子学会、云计算专家委员会、中国云计算技术与产业联盟、中国大数据专家委员会秘书长林润华接受了封面新闻记者的采访——
记者:为什么把首届大数据应用大会放在成都召开?
林润华:首届中国大数据应用大会选择成都最主要的原因:第一,成都电子信息产业的基础比较好。还有一个重要的原因是,成都市的大数据应用和信息化应用工作做得非常好,在很多领域有示范案例。同时大会得到了成都市人民政府的支持,主要是基于这三个方面的原因。
记者:这一次大数据应用大会的意义在哪里?
林润华:这次大数据应用大会首次以“应用”作为核心主题,而且首次在成都召开。这个对于推动大数据的产业的发展、带动技术的创新都有重要的意义,因为只有应用做好了才能拉动产业的发展,才能带动技术的创新。所以它是一个产业链,应用是一个“牛鼻子”,是一个核心。
起底成都大数据应用
成都大数据管理局局长王锐详解成都大数据应用现状
在大数据发展应用上,成都一直走在前列。2015年,成都成立了大数据管理局,王锐任局长。那么,成都大数据应用是一个什么状态?将来怎么发展?7月14日上午,封面新闻记者专访了王锐。
记者:成都在大数据发展方面,现在是一个什么样的状态?
王锐:成都在发展大数据方面具有良好的基础条件。成都是国家级的通讯枢纽,大数据发展离不开网络和带宽的基本条件。
第二个方面,成都有很好的软件发展基础,成都是西部地区首家软件名城,我们软件发展在中西部地区占40%,这样为大数据产业发展奠定了良好的基础。
第三个方面,在安全的基础上促进数据开放。
记者:此次会议是论大数据应用,“应用”这两个字有什么特别的意义?
王锐:大数据更多的是提升政府的治理能力。举个很简单的例子,我们去办理相关事项需要盖很多的章,很多要证明你是谁,你是你,这些低级的问题在大数据时代就能很好地解决,当你刷身份证的时候,后台的数据已经支撑了你的房产、社保、家庭、出生,乃至于证明你的身份,这些就是很好的应用场景。