11月23-24日,“2017互联网+智慧中国年会”在北京召开。本届年会以“智绘城市 数造未来”为主题,以数字政府、智慧城市、互联网+政务服务、数据治理、信息社会等为主要议题。会议由中国社会科学院信息化研究中心、北京国脉互联信息顾问有限公司联合主办,国脉海洋信息发展有限公司、浙江蟠桃会信息技术有限公司协办,共有来自全国部委、省、市、区县电子政务、智慧城市、大数据主管领导、行业专家、企业代表、主流媒体千余人参会。
拓尔思副总经理 文雅
在24日上午举行的“数据治理与大数据局发展定位研讨会”上,拓尔思副总经理文雅发表了《以“数据治理”推动政府服务创新》的主题演讲,以下是主要内容(根据现场速记和录音整理,未经本人审核):
一、数据治理与数据管理的区别和联系
我认为数据治理跟数据管理有很大的联系和区别。这张图足以说明,数据治理是贯穿数据管理的全过程,注重战略规划、组织以及后续绩效监管等,所以从这个角度来看,两者之间紧密不可分。如果数据治理仅仅只是通过技术手段去做,我认为可能是不成功的,所以数据治理必须有一套体系框架,今天不详细讲了。
二、地方政府的大数据治理困境
下图是我们拓尔思在最近三至五年间遇到的困难,包括在市场上宣传很好的案例,深入进去会发现大家遇到的问题有很多的共性。
第一个是央地关系与跨部门协同。由于国家每个层级的政策分布不同,造成了在数据治理领域里的差异化,比如说省级政府的统筹特别突出,但在实际的公共服务办理、数据治理应用层面、创新层面上,应该怎么定位?部委、上级单位每天发了很多的文件和行动大令,把战略制定的高、大、远,对于地方政府来讲应该听谁的?部门之间文件打架的时候听谁的?
第二个是驱动机制。数据治理是一个生态系统,需要社会上很多不同角色的功能机构厂商和政府共同建设,最核心的是如何处理好政企关系。在大数据产业链里,最早介入的应该是国脉互联,那在这个领域,需要做很多基础性工作,会有很多的互联网巨头、应用公司、技术公司等。政府最怕的是什么?渡过蜜月期,大家形成一条链上的蚂蚱,这个时候如何处理政企关系显得尤为重要,最好要避免数据绑架。
数据开放前几年很热,现在很多政府已经做了基础的数据开放,但从质量和价值方面来看,还是值得探讨的。因为数据治理要取得所谓的最大价值化,是要通过数据对决策产生帮助,所以会提出从数据开放到代码或算法共享,这势必会带来一些改革。如果还没有实现算法共享,必须让相关区域机构一起来共同推动。
第三个是深层问题。大家举了很多的例子,比如精准扶贫,但是精准扶贫的数据从哪里来?由现有的信息系统汇聚而来?但在实际生活当中,最需要扶贫的是山区,是根本没办法上网的那些人,我们系统里采集的数据能真正代表哪个群体?产生出来的结果对扶贫有哪些真正的改进?
另外,你们的决策、结论可靠吗?科学吗?合理吗?当计算、架构、算法开始算了才发现有缺陷或者出了事,问责谁?这些问题可能是很多领导会考虑的。我之前有接触过一个用户,他们想在产业经济方面做一个数据创新应用,现在很多的大数据应用都是偏向宏观经济类或者比较弱势的民生类,我们后来讨论到宏观经济分析,发现一个问题,用什么模型?国内、国外的?国内哪个专家和大学的?不行,中国的体制下本身公布的数据都不敢用,怎么还敢用模型?如果得出错误的数据,是没办法承担责任的。
数据并不等于证据,学医的做任何决策,都要有一个证据,大数据治理一样,怎么去评估?能不能用?这些才是整个大数据治理面对的需要去破壁的深层次的问题。
三、拓尔思参与的政府数据治理实践
拓尔思这几年有很多的实践,今天只是分享一点我们的心得。第一个要强调的是建立与完善数据标准是数据治理的基础。
第二个要强调的是数据质量管控是政务数据治理的核心,这个方面有足够的经验,前两天央视播报的新闻提到公安部有一个云搜索,目前在全国整个公安体系产生了很大的效应。
我们在数据治理的整个过程共花了3年时间,汇聚了大量政府内部数据、公共类数据,包括个人网络社交数据等。最早接触这个项目的时候有300多个种类、400多张表,很复杂,最后只剩下150多张表,经历了很多考验。数据的质量是最核心的,因为在这个环节遇到不少问题,即使你说谁报的数据谁负责,但仍然负不了责。数据的质量,除了技术手段,还需要一些业务模式去辅助,这个是我们做的一些分析,有基于人,有基于案件的,有基于组织的。
第三个要强调的是数据开放与共享是数据治理的生态关键。我们享受了政府开放数据的红利,承接了国家企业信用信息公示系统项目。
第四个要强调的是业务创新是实现数据治理的最大价值化,这里从三个层次,第一是全球数据,我们投的公司,它的平台可以做很多的全局决策,看上去都很美好,其实都遇到过很多问题,比如说给企业建档案,做企业画像,大家会发现,对于企业来讲,很关键的指标是税收,我们会发现,所有汇集起来的税收数据是标头数据,这是大项目里遇到的共同问题。第二个层次,在某一个垂直领域进行创新,面对大量数据,通过模型对数据进行一系列处理、加工,最后把整个模型输出。目前互联网PPP金融企业监控的占有率是非常高的。
拓尔思案例:金融大数据平台
最后一个层次,面向公众的政务服务方面。这是2014年做的案例,是跨部门的应用融合。由教育部牵头,我们做了一个“积分入学”系统,涉及到多个部门,花费上百万,现在基于共享机制,大概三个星期就可以把它做出来,后期则是大量的数据梳理工作。
拓尔思案例:“i厦门”
政府数据治理这项工程,不是一个资源禀赋和机遇的问题,更多的是涉及到政府的理念,包括管理模式、政企合作模式,最后我们希望,拓尔思不仅是在这个领域里和大家共同成长,接下来的成长阶段,也希望能和大家共同前行。