大数据产业的出现代表着工业革命新时代的到来,预计2025年中国大数据市场规模将达到1万亿元。但如何获得高质量的大数据,如何让大数据在市场中有序流通是个棘手问题。因为大数据的使用涉及到个人和国家的一些秘密信息。所以,在大数据被应用之前,需要界定大数据使用的标准、大数据安全的边界、大数据的责任主体等问题。
由于以上限制,大数据产业目前面临的最大难题就是数据孤岛。1月11日,在工信部电子一所相关部门联合上海敬众科技成立国内首个航旅大数据中心的研讨会上,上海大数据联盟常务副秘书长马慧民表示,国内官方数据的共享开发渠道还不畅通,虽然官方的数据量非常大的。一些大企业如阿里旗下的一些板块,想要用数据,需要跟政府谈合作,但企业需要和每一个政府部门去谈,企业希望能与一个政府数据总的代理机构来协商,譬如水电煤、社保、房产这些数据有由一个总代理方来管理。企业直接跟总代理谈就好了。而不是让企业找各个政府部门去谈,如果没有统一的代理方,就没有人长期对这些基础数据的质量负责任。而且数据服务,需要持续完整的数据。如果没有总代理,做这些工作只是额外的对外公共服务,无法让这些数据实现商业价值,服务质量无法有效保障。
官方数据割裂之外,企业数据也缺乏流通。中关村大数据产业联盟副秘书长陈新河称,大数据产业前景巨大,目前国内大数据市场已经达到1000亿人民币,预测到2025年中国的大数据产业会是一万亿元,可能有十倍的增长。“但国内企业即便如BAT的大数据也不开放,都自己采集了供自己用。我认为他们是农民,自己种了土豆自己吃。”
如何让BAT从农民变为商人,让他们的数据通过流通交换产生价值。陈新河指出这涉及到数据的外部性问题,比如说交通数据本身服务于交通,路况数据、路况信息,这些信息的社会价值很大,但经济价值并不很大,数据从内部到外部性的延展,价值的提升是指数级的。但必须让这种数据通过流通来实现,要让BAT种的土豆不光自己吃,还交易出来,让麦当劳、肯德基去用。
此外企业数据的流通也涉及标准问题,陈新河打了个比方,如果自己种的土豆自己吃,把土豆是切成方的还是圆的,都没问题,但一旦涉及交换,就涉及到标准。比如说社会学意义的性别,在facebook上有80个,这就给交换带来了困难,这就需要对标准进行规范。
标准之外还有数据安全问题,公众对此有很多误解,陈新河分析道,“电讯运营商是在向外卖数据,但很多人把这误解为运营商把号码卖给谁了,其实运营商对号码、数据的管控是非常严格的,即便卖也是脱敏的。但社会对这个问题的认知,存在很大误解,只要提到卖数据,就是运营商卖电话号码,医院卖生孩子信息,房地产商卖户主信息。”
其实这些问题是可以解决的,需要建立一个有制度约束的组织来推动数据使用的标准化、规范花。目前中国数据交易存在灰色交易市场,产业要想健康发展,就要把歪门邪道的东西砍掉,否则正规的产业没法发展。我们要通过有资质的政府机构和大数据企业合作,促进规范安全,安全制度的制定,引领整个行业。
政府在现阶段的大数据产业中居于中心位置,如果组织得力,不仅可以实现数据有效交流,还能实现数据增值。
深圳市大数据产业研究与应用协会秘书长赵春雷称,正在筹建的广东省的大数据交易所,准备把政府数据统一到同一个平台,同时用技术手段对应用场景进行挖掘,把数据质量变得更好。赵春雷举例称,大数据一定要有应用场景,譬如通信运营商有自己的门店,现在的营业厅基本是卖手机,业务的很好,柜台上所有展示的都是手机,写着什么型号什么配置。如果一个门店一天进出100人,最后在柜台完成传统通信业务交易的只有10个,那么按传统方式,只能拿到这10个成交数据。其他90人只是去看门店代售的手机,但 如果通过克隆统计、人脸识别等技术把这90个人的数据也抓到,再拿到运营商的后台做数据匹配,大部分人的数据就可以分析出来。因为每个人到了营业厅里,有行为轨迹,如同逛淘宝,鼠标一点,行为轨迹就出来了。顾客看过哪些手机,看手机的时间长短和频次都可以分析出来。把所有营业厅的数据和运营商后台的数据做整合,然后分析挖掘,这些场景数据就有很大的变现价值,而且这样的场景很多。
数据共享不只是把数据放在一起,真正的共享应该是虚拟场景的共享。赵春雷举例称,以机票订购网站为例,因为机票信息从网站走,机票与身份证、银行卡等信息绑在一起,这些机票订购数据可以跟银行合作做风控,也可以为出行目的地的商家引流,通过积分等手段让乘客到店里消费,然后双方来分成。
赵春雷强调,未来做大数据,一定要从细分市场去做,以此实现传统制造业企业的转型。“很多传统制造业企业,在前端玩命自己营销,在后端已经积攒了一些数据,但不知道这部分数据有没有价值,真是抱着金饭碗在要饭。我们通过大数据能让它们保持传统业务的同时,把所积累下来的数据、应用场景的数据变现为应有的价值”
破除数据孤岛任务艰巨,不可一蹴而就,在具体的政策成型之前,大数据企业如何介入这些敏感数据业务?以目前案例看,大数据专业企业与权威部门合作,是介入敏感数据市场的现成通道。在这次论坛上,工信部电子一所中小微企业成长中心主任刘利群对澎湃新闻表示,大数据应用的标准、法规、政策还在探索中。而工信部擅长处理数据信息技术标准的规范与统一等问题,更是工信部职责所在,所以工信部相关部门正在联合相关大数据提供者一同来开发。刘利群称,“医疗和航旅这样的专业数据处理,专业大数据团队是内行,但在数据的规范标准制定,技术标准上不如我们,而且大数据资源不是任何人拿了都可以用的。所以各种专业的大数据团队选择与我们合作,来解决大数据规范使用的问题。”