前言:
大数据是一个事关我国经济社会发展全局的战略性产业,大数据技术为社会经济活动提供决策依据,提高各个领域的运行效率,提升整个社会经济的集约化程度,对于我国经济发展转型具有重要的推动作用!2016年,由中国首席数据官联盟与网加时代网发起并承办,北京大学信息化与信息管理研究中心、中国新一代IT产业推进联盟、数邦客协办的"影响中国大数据产业进程100人"大型人物专访活动全面启动,被采访对象分别来自政府、产、学、研、企各个领域,他们将从不同角度,不同层面向大家阐述当前大数据产业热点、难点、疑点问题,为中国大数据产业健康、持续发展探索经验、保驾护航,敬请关注!
第二十六期专访人物:中国首席数据官联盟专家组成员,北京明略软件系统有限公司董事长 吴明辉
吴明辉,中国首席数据官联盟专家组成员,北京明略软件系统有限公司董事长,北京大学数学学士、计算机软件与理论硕士;拥有20余项国内外发明专利;多次获国际算法大奖。拥有超过15年的软件开发经验和11年的软件开发管理经验,曾亲自负责和指导过多个大项目的研发管理和项目实施,包括网络数据监测分析、精准营销大数据平台、大数据挖掘分析平台、企业级大数据平台项目等。
本期特邀嘉宾中国首席数据官联盟发起人刘冬冬,就大数据如何发挥自身大价值向吴明辉先生发起提问。
刘冬冬:大数据蕴藏着大价值,在您看来怎么样才能让这"大价值"得以实现?
吴明辉:大数据价值在于与各类行业的融合应用。中国大数据应用前沿调研报告》指出,在大数据的价值链中"数据、技术与思维三足鼎立"。对于数据、技术及思维的掌握决定了大数据能够创造多少商业价值。
以金融行业为例,在数据方面,金融行业的数据已经非常之多;技术方面,大数据时代传统金融行业面临新的技术难题,传统的分析方法难以适应大数据的管理需要。企业需要更有效的数据挖掘算法;在思维方面,国外金融机构已经将大数据技术在风险控制、运营管理、营销支持及商业模式创新等领域进行了全面尝试,但大数据的更多价值还有待发掘。
可以说,通过数据采集、数据商品化、数据整合,应用提供商将产业内、不同产业间、企业内、不同企业间的安全数据流通与共享变为可能。大数据与产业融合成为四通八达、全面连接发展的面。
再比如说,电网的数据和税务数据连接起来,通过客户的用电量,就可以知道产生了多少税收,这就是数据价值的一种具体体现。此外,大数据还可支持决策。他指出,现在,每个行业都在联网,创新、生产、管理、客户、竞争对手等各种数据,融合联通后,通过分析这些数据,就能够实现优化行业的投资结构等,并支持决策者把好的资源分配到最好的内容上、服务上。
刘冬冬:大数据蕴藏着大价值,所以很多人都在想如何进行数据交易,觉得只有交易才能发挥其价值?
吴明辉:随着大数据时代的到来,数据本身也在商品化,数据已经逐渐成为一种新型生产要素,由此产生了数据交易的新兴环节。今年以来,与数据交易相关的各种平台正在遍地开花。那么,数据真的可以交易么?数据的交易在实际操作过程中会面临哪些问题?
我们的经验来讲,直接交易原始数据确实存在很大风险。但数据公司可以通过一些巧妙的方法去做好数据的挖掘和加工。在数据交易过程中,应清楚地认识到数据的交易理念与传统交易的不同。一方面,同样的数据可以产生很多不同应用;另一方面数据可以重复利用。这就意味着交易原始数据在产权和所有权上会出现很大问题。我在做交易的时候,你把我的数据买走了,之后你继续卖怎么办?硬生生地将原始数据做交易实际上是对数据行业非常大的挑战。
还有数据的所有权问题,举例说,如阿里巴巴很多数据的所有权其实是在每位顾客手里,消费者在阿里网站上消费,阿里得以存储这些的数据,但本质上这些数据还是消费者的。如果这些数据在未经消费者允许的情况下给别人用,就侵犯了消费者的隐私。所以直接把原始数据进行交易会产生很大的法律风险。
针对此问题,公司不会直接对原始数据进行交易,而是更愿意基于一些数学模型,在数据上做加工,然后将加工的结果提供给客户,这样可以不侵犯原始数据的安全性和隐私性。"以明略数据为例,公司在帮助银行、税务客户采集各种数据源时,采集过程不会直接拿到原始数据,而是建造一个数据挖掘黑盒子,将数据进行一定加工,生成的结果给客户使用,原始数据当场就清理了。这样可以保证原始数据在今后具有反复利用的价值。"
刘冬冬:数据的价值所在,如何让数据更安全就显得尤为重要了,您怎么看大数据安全问题?
吴明辉:我们都知道,从斯诺登事件后,我们整个中国政府,包括企事业单位,大家对数据安全都很重视;实际上这个问题对于全世界各国家都是一个问题。我们看到的这个数据安全在大数据领域是尤为重要的,为什么呢?因为传统的IT系统,它们都是一个个孤立的系统,而到大数据时代,我们所做的工作,最核心的就是要把一个个系统连接起来,连接起来之后就会引发安全问题。首先是数据量很大之后大家会需要使用大数据的软件技术产品;而绝大多数大数据软件技术产品都是源自于互联网的开源系统,比如像(Hadoop)。而互联网的开源的大数据软件本身都是互联网公司发起的,他们都不是为了安全考虑的,互联网都是开放自由的一套系统,所以我们花了很大的人力物力投入在互联网上的开源软件包括(Hadoop),我们要确保这个软件真正到我们政府领域里面实施的时候,它是自主知识产权的,是可控的,里面的每一行代码经过审计的;同时我们在这里面要确保,它的这种各种各样的安全方面的功能,这是第一方面。另一方面我们把各种不同的部门,甚至不同的企业,不同组织的数据连接到一起之后,有涉及到我们数据的权限问题;比如说在公安领域里面,可能不同的警种对数据的访问权限也不一样;不同级别的行政区划我们的单位或机关,对数据安全的访问级别也是不一样的。所以我们会在我们的安全大数据平台MDP上面提供整个用户的认证,用户的授权,包括我们数据的一些防火墙等这样的一些功能。这些对于我们的整个政府数据的大数据处理是至关重要的。
刘冬冬:前段时间机器人与人的围棋大战狠狠地火了一把。您怎么看大数据以及人工智能对生活工作的改变,未来的发展趋势是什么?
吴明辉:实际上我们每一个在中国的消费者或者说每一个公民其实大家对大数据并不陌生。我们中国的整个互联网,尤其是移动互联网在全世界范围内发展的都是非常的顶尖的。像我们的微信,阿里、京东这样的电商平台,每天上面都有大量的大数据应用案例。比如说我们在电商平台上购买一个商品,实际上它会有很多的其他的关联商品推荐给大家,这背后都是需要利用大数据来去做分析和推测的。包括今天我们的互联网金融,然后很多很多的消费者他可能之前并没有在这个银行办过信用卡和银行卡,也没有提交过太多的信息。我们可以基于这个消费者,在互联网上的很多行为,对他进行风险分析。把他的信用模型的分析,从而给他一个授信的额度,从而让他更好的进行消费,所以我们在金融,在互联网上都有很多的案例了。当然在安全领域就更多了。
因为我的研究生的专业就是学人工智能的,所以我是非常非常认可人工智能技术在未来的各行各业里面的长期的应用。应该说在过去的十年到二十年里,计算机的发展,更多的是在取代人类的机械活动。包括我们的各种各样的3C产品,它的IT产品都是在取代机械劳动。那未来我相信,越来越多的计算机它可以取代人类的智力劳动。但是,计算机的这种智慧的发展,它到目前为止,还是依赖于人的智慧的。举个例子:比如说我们今天讲的AlphaGo,它本身是根据在中国或者说是全世界的这些职业棋手下出来的棋,通过不断地学习,规划总结以前这些棋手的棋谱,大概全世界可能一年有一万多个专业的职业比赛的棋谱,它通过学习这个之后,它就可以学习出一个更好的模型。那实际上,我们明略数据在公安领域里面,我们的目标也是一样的。我们通过跟我们全国各个省、市,我们的一线的优秀的探长们,大家一块儿紧密的合作,把大家的这种破案的方式方法也很好的学习到我们的系统里面。我们的目标也是成为将来可能中国甚至是全世界最优秀的探长这样的一套系统。