开放数据在政府和社会中扮演着越来越重要的角色。开放数据是所有人都可访问、没有使用或传播限制的数据。开放数据必须是数字、可机读的格式,因此可以和其他数据结合变得更具实用性。本文以英国完善数据开放提升政府服务质量为研究对象,探讨如何利用开放中央和地方政府产生的大量数据来加强问责制,优化政府工作并助力经济发展。
一、通过开放数据加强问责制
(一)政府目标
政府制定开放数据政策的主要目标是提高公民对政府问责的能力。英国政府于2012年6月发表的《开放数据白皮书》“释放潜能”中给出了更多关于政府作为的细节,包括“创造透明社会”的举措。开放公共服务数据将会创造出一个“信息图书馆”,帮助人们对政府问责。政府称之为一种完全不同的统治,比如开放数据将赋予国内任何一个人质疑钱如何使用的权利。公共领域会放入更多的数据,英国开放数据网站data.gov.uk会更加引人注目,人们可以通过它搜索到政府公布的数据。《信息自由法》的修改将会更加方便公民使用公共部门的数据集。
(二)问责制的障碍
有证据表明,通过开放政府数据能够加强问责制。政府最初明确地将问责制作为开放数据的主要目标,但近来已被其他需优先考虑的事项取代了。观察人士指出,重点已经从提高政府透明度和问责制的民主目标转移至鼓励增长的经济目标。
“FullFact”是一个独立的组织,该组织提供建议和信息帮助人们检查政治家和媒体宣称的真实性。该组织承认,政府议程“默认开放”已经帮助开放数据设立了一个正确方向,但是政府在加强问责制的实际表现上受到了批评。开放数据是一件伟大的事情,我们看到的还太少、太迟,且做得不够好,因为它从起步就受到了限制。
政府研究所观察到,不同部门和数据集之间,政府数据的可访问性、质量和描述方式都差别很大。有确切证据表明,一些已发布的数据存在着准确性和质量上的问题。英国数据服务中心(UKDS)是由经济和社会研究委员会创建的数据资源中心,向研究人员、教师和决策者提供所需的数据。UKDS告诉我们,政府发布的数据中有无数(可避免的)错误的例子。UKDS举了一个例子,财政部最近发布的无人认领的房地产列表中,显示出已经转到王室名下的详细财产,原因是前任主人已死,而且没有家庭。UKDS指出,至少有132人的出生日期(超过总量的1%)是在死亡日期之后的。一些婚姻和年龄状况表也是错误的——例如,显示有一个两个月大的寡妇!UKDS批评政府数据缺乏质量控制机制。OwenBoswarv是一名数据顾问和开放数据积极分子,同时也是Defra网络透明控制板的非执行董事成员。在能力范围内,他向我们提供了一些至关重要的证据,显示政府将小的、低价值的数据集不加区分地全部丢在data.gov.uk网站上。英国营造出一种错觉——已开放了9000个数据集(撰写本文时),听起来很多,但有质量的数据集仅仅占总数的多少呢?
据开放数据用户组的主席HeatherSavory所言,问责制也因官方太过谨慎的态度,受到了阻碍。开放数据用户组的存在是为了帮助政府了解人们的使用需求,统计这些人正在使用或以后会使用到的数据集。Savory女士告诉我们,对于开放数据,公务员中已感知到风险,他们可能会因数据的不完美而感到担心。但Savory女士观察到没有数据集是完美的,她还表示出对技术团体可以处理这些问题缺乏信心。然而热衷于利用开放数据的局外人可能会对政府说:“只需给我所有的原始数据,我自己会处理。”TomSteinberg也有相似的观点,他关注到政府明显不一致的处理方式。他指出,GDP数值可能是白厅官员最关心的数据,政府会经常发布并修订GDP数值,但是对于一些不是很重要的数据集政府很少发布,因为不愿因此犯错误。
StephanShakespeare认为,这些困境是可以解决的,他在调查报告中写道:“数据双轨发布”政策的理念是“追求完美不应该成为障碍”。政府要同时履行“即使不完美也要发布”的命令和“以高质量为核心”的承诺。这种双轨政策在客观条件的限制下,可以将效益最大化。该政策将减少发布迟缓的借口,政策中提到“先放出来,再改善”。
报告还提到,最终目的是要公共部门尽可能发布高质量的数据,并愿意把数据从轨道1移到轨道2中。Shakespeare解释道,轨道2存放的是需要整理并以高标准发布的数据集,轨道1是其他剩下不需要整理的可快速发布的数据,剩下的留给数据学家尽他们所能去处理。
Shakespeare建议,政府应该采取“数据双轨发布”的方法,这是一种既实用又实际的双效方式。该方法明确了追求完美不应该成为一种障碍;政府要同时履行“即使不完美也要发布”的命令和“以高质量为核心”的承诺。定期发布不完美的政府数据将提供一个强大的动力去改善它。我们推荐政府应该采取Shakespeare提出的数据双轨发布方法。政府应该及早发布“即使不完美的数据”,同时致力于保证“高质量的核心”。只要政府认清数据的局限性,不完美的数据也可以利用。
其他受访者指出,data.gov.uk网站设计上的局限性导致公众不容易访问,因此对公众缺乏可用性。统计学家JilMatheson抱怨data.gov.uk网站甚至还没有统计访问量的功能。具体化才能帮助人们更好地理解。
很难评估政府在加强问责制上的表现。开放数据这个概念很难定义,并且现在没有合适的办法来决定什么数据应该发布。这令开放数据的支持者声称革命正在进行中,而怀疑者则说什么都没有改变。
官方经常强调,在data.gov.uk网站上可以找到13000多个数据集。但目前还不清楚这些只是经过简单复制的数据中有多少已经在其他政府网站上公布过了。这些数据集或小或大,很多部门可能会通过发布更小的数据集或经常做更新来“增加”开放的数据。以这样的方式,根本无法带来额外的公共效益。在这种情况下,评估这一重要议程的进展是很困难的。简单地将数据“放在那里”不足以体现政府对公民负责。
可以通过要求政府发布一个明确的开放数据列表,指明哪些数据已成为开放数据。
(三)外包和透明度
将开放数据的原则应用到所有提供公共服务的组织,包括那些私营和公益部门。在频繁外包公共服务的新世界中,这一点尤为重要。
然而,将公共服务外包潜在地破坏了问责制和开放数据的原则。RufusPollock博士是开放知识基金会的主任,他也提出了这个问题,担心开放数据的原则不会写入政府采购规则。并且他认为:“有证据表明,在美国和英国,风险和威胁最大的是服务外包,一旦外包出去,所有的信息都没了。”TomSteinberg也认为这是未来的一个关键性问题,他认为,可能对于公众,问责制是真正的问题,毕竟提供公共服务的是公司,并不是政府机构本身。
积极地说,开放数据可以帮助提供公共服务的私营和公益部门在各个层面上改善绩效,ODI认为“如果持续发布公共服务提供者的绩效数据,开放给服务用户和外部专家,可以加强竞争并增加选择依据。”
信息委员会建议政府发布私营供应商在提供公共服务上的详细绩效数据,并认为:“尽可能充分地开放这些信息以供公众监督,将提高公共资金的使用效率,也有助于建立公众对服务外包的信心。”该委员会欢迎政府在《国家行动计划》中的承诺——采取措施确保服务外包的透明度,满足信息自由的要求。
(四)采购和开放数据
几名受访者呼吁,应对所有公共部门的采购程序进行改革,鼓励开放数据,特别是在IT领域的合同上。例如,TomSteinberg认为:“只有将条款写在信息系统的采购程序内,开放数据才能普及。”信息委员会提出了类似的观点,还鼓励通过系统设计提高透明度,建议公共机构在采购和设计新IT系统的时候,要考虑到开放数据的需求。
开放数据原则不应仅适用于政府部门内部,还要应用在与私营公司之间的合同中。
因此建议,为政府提供外包产品和服务的公司应该作为与政府签订合同的发起部门,根据同样的条款开放所有数据。应该把这项规定写入一个通用的合同标准条款中,在财政年度2015-2016年初,通过政府引入并实施这个规定。
(五)数据所有权
对于当前中央和地方政府是否能决定提供数据,几位受访者表示不确定。NigelShadbolt爵士注意到,目前白皮书中的公共数据原则已作为政府政策得到认可,问题是他们是否正在履行。Nigel爵士认为,推动数据开放还有一段路要走。这种情况下,他说:“人们认为需要立法来解决面临的困难和挑战。”
其他建议提到,目前安排发布开放数据还缺乏必要的影响力。开放知识基金会的RufusPollock博士担心,即使开放数据用户组也必须说服其他组织提供开放数据:“HeatherSavory做货币工作,但非常有趣的是,她要去说服土地注册局做这个或说服别的部门去做那个。”他说,这些信息都在《信息自由法》的管辖范围之内,理论上他们应该更有效地执行。
信息委员会办公室陈述了对当前开放数据法定规定的理解,提到于2013年9月1日生效的《信息自由法》修正案,可归结为:旨在实现开放数据,授予请求者权利,在开放许可证下,访问开放的、可重复使用的数据。在某些情况下,公共机构可以对许可证收费。修正案也给公共机构指定了义务,作为信息自由法的一部分,要求公共机构主动开放早先所需的数据集。
但很多受访者仍存在一些困惑,这么做对当前开放数据的法律作用范围产生了什么影响。TomSteinberg提出应该扩大《信息自由法》,使人们可以有类似访问电子数据集的权力来访问纸质文件。
开放数据用户组的HeatherSavory说,她相信最近的立法已经有效地加强了数据权,因为它规定了公共机构的法定责任,要求发布数据用于重复利用。虽然她同意现在仍没有一个清晰的法案,但现有法律的复杂网络中已有对发布数据的推动,并且公共机构有责任开放数据用于重复利用。
信息委员会认为,开放数据和信息权,是“相互支持”的。这是因为必须赋予公众一项权利,“拉出”政府的信息并使政府承诺主动“推出”数据。StephanShakespeare和NigelShadbolt爵士都主张明确立法,制定数据权;Nigel爵士发现政策变来变去,但立法是一种能坚持下去的方式。
Hurd先生很清楚开放数据没有法定权利,除了改进《信息自由法》以及转变欧盟指令(2003/98/EC号指令《鼓励公共部门信息的重复利用》),他反对任何进一步的立法。
政府持有的“数据权”概念混乱。一方面,部长说,政府没有数据权。但有证据表明,实际上,已有推动将政府数据以开放格式发布的行动。
政府需要认识到公众所拥有的“数据权”,正如《信息自由法》中赋予的公众的权利。政府应该阐明其政策,立刻作必要的立法。
(六)隐私和开放数据:风险管理
如果有数据权,就要承认“隐私权”。能听到大量证据表明开放数据会有涉及个人隐私的风险,可能会造成公众对开放数据形成错误认识。“FullFact”组织指出,开放数据的声誉可能会因公众对隐私的担忧而受到影响。很快就会建立远超出我们想象的更大的个人信息公共存储机构,但是偶尔的隐私泄露错误将会引发大量的公共争议。
经过调查,医疗数据事件证实,数据的发布会引起公众的特别关注。2014年初,英国有一些反对人士和医生针对英国的医疗数据计划发出一系列的反对声音。英国国家医疗服务系统对该计划的解释为:通过增加利用医疗记录帮助改进医疗质量,例如确保及时并准确地将数据提供给国家医疗服务系统委员会,这样他们就能更好地为病人设计综合服务。在未来,获批的研究人员也可能从中受益。健康和社会保健信息中心将把通用系统中提取的个人保密数据与其他健康和社会保障系统中提取的个人保密数据相连接。对于医疗数据的风险,令人担心的主要问题是将个人医疗数据开放,并且以公共目的而收集的数据将被私营部门利用并赚取利润。甚至连强烈主张开放数据的支持者,如StephanShakespeare也表示尊重医疗信息的敏感性。Shakespeare先生针对医疗数据的一般问题评论道:“我想得很清楚,个人医疗数据的泄露可能会导致受害者极其痛苦,这是重点要避免的。”
NigelShadbolt爵士注意到,年轻人时常在社交网络和其他数字媒体上说“放弃隐私”。然而他发现年轻人对待隐私态度的变化规律:年轻人以一种非常微妙的看法来看待什么可以开放,什么不可以。可以看到一个趋势,随着他们的成长,从完全无所谓的态度到形成隐私意识,待到他们需要工作面试时,他们会变得更加担心隐私的问题。
Pollock博士提出犯罪数据的复杂性问题。他认为当英国首次发布犯罪数据时引发的全部争论都围绕着发生过强奸的房子在哪里,进而联系到什么人显然跟这件事相关。很明显,这个争论将会继续下去。Pollock博士认为,最令人关注的数据是和个人信息有关联的数据,前一个实例中涉及的隐私是必须要保护的。但重要的是,某些情况下的事件会涉及到公众效益。例如,我们有资格了解上市公司的董事们,而这并不涉及隐私。
Shakespeare先生提出了一种保证隐私不泄露的方法。他称之为“避险技术”,这意味着使用者可以访问数据,但不能下载。可以远程访问数据,但不能从数据库中删除它。
英国的部长们也相信,在开放数据和个人隐私之间一定可以达到一种令人满意的平衡。虽然一再强调政府的立场是要求数据在默认情况下应该开放。他们明确表示,根据定义开放的数据不是个人数据,政府非常重视隐私的问题。部长们解释,匿名化技术意味着在保护每个公民的同时,仍然可以发布数据。他们给出了一个犯罪数据的例子,把一些街道合并分组,以防止受害者被认出。
在发布数据时,避免违背个人的意愿是政府的责任。作为医疗数据计划的一部分,政府计划将国家医疗服务系统中的病人数据匿名发布供学术和医药研究,这令公众非常担忧。明确目标就是要消除公众对个人隐私泄露的担心。然而,同等重要的是,要向公众解释开放数据可以使公共服务担起更多的责任并回应社会的需求。最近关于开放医疗数据的争议,表现出公众对于隐私的担忧将会阻碍到数据开放。
(七)促进参与
部分受访者认为,政府应该承担责任,采取大胆的措施促进公众参与,利用数据对政府问责。例如OwenBoswarva很欣赏支出数据和绩效数据采用可重复利用格式增加其可用性,但他认为,这不能替代征询民意和开放决策的意义。
Worthy博士认为,为了给公众带来真正的问责权和参与感,还需要清晰的问责机制。他称“足不出户的审计”是很吸引人的主意,尽管取得了一些成绩,但终究没能实现,部分原因是信息不一致所致,因而怀疑并理解它并不容易。Worthy博士观察到,足不出户的审计也需要一类特定的人来担当:任职于地方政府,有足够的工作热情,熟悉政府的工作流程,有积极性和技能,并愿意奉献时间。兼具所有这些品质的人很少见。
“Invovle”是一个通过研究和实践促进更多公众参与到公共生活的团体,它认为:公众目前不了解开放数据如何应用到自身或者不了解自己关心什么;研究发现,公众普遍对开放数据的认识不足,部分原因在于开放数据被认为是一个抽象的问题,对于日常生活的好处并不显著。
尽管专家们可能会大量使用开放数据存储库,如data.gov.uk以及类似这样的存储库,但根据“Invovle”调查,普通公民不太可能访问。然而“Invovle”也提到政府和社会潜在为公民提供信息的地方,他们已经访问到了——在线的,如为电视牌照付费;或离线的,如手术医生的候诊室。
“Invovle”还敦促政府推广一份数据参与性指导,该套指导是由PracticalParticipation的主任TimDavies和WebFoundation的开放数据协调员共同带领一个小组开发的。他们称之为“五星级开放数据评测系统”,一个用来评测数据的可用性和可访问性级别的系统。如果政府采用,系统将旨在鼓励数据发布者允许所有人无区别访问,使信息和数据以各种各样的方式被利用。“一颗星”表明,组织发布的数据是完全根据需求而定的;而“五星级”表明,需要与用户密切合作,并且在该组织与其他组织的合作下整合的数据源。
很明显,鼓励参与到开放数据运动不是一件简单的事。似乎表示中立都会被他人视为有政治动机,就像Worthy博士告诫的,尽管技术通常作为一个中立的东西,但它也可能是极具政治性的。他提到地方政府的支出数据是非常政治化的,它关乎地方政府与中央政府的对抗。
没有迹象显示“足不出户的审计”会按照承诺出现。很少证据表明内阁已成功地鼓励更多的公众参与到利用数据对政府问责的活动中。
开放数据很重要并在各方面都影响着人们的生活。然而政府和一些专家有时过多地使用专业术语,令没有专业知识的人产生疏远和混淆。政府鼓励更多人参与到开放数据运动中所做出的努力会被抵消。
“Invovle”推荐政府应该采取一套星级评测系统,用来评测并向议会报告,通过开放数据提高对部门的问责。政府应该期望各部门制定计划令发布的数据达到五星级别。
(八)关于问责制的总结
近年来,一些有效果的措施已加强了问责制,促进了公众的参与,并积极地在推进,例如建立了开放数据用户组。然而在开放数据上,还有许多事情要做。
应该取消政府发布数据的限制,可能会从中免除某些数据集,但这应视情况而定,提供必要的保留以维护国家安全或保护个人隐私。
内阁必须为开放数据提供更高的优先级,确保更有价值及相关的数据是开放的,并且建立机制鼓励人们使用它对中央政府和地方政府问责。应设立目标发布全新的政府数据集,而不是复制现有的。
二、开放数据和经济增长
(一)开放数据带来的经济机会
有相当多的证据显示,如果英国开放更多的政府数据,将会创造出更多的经济发展机会。这种潜能是基于支持新数据业务的发展和改善现有业务的绩效。需要承认的是,广泛访问过多的数据和信息将会破坏现有市场的结构,导致一些企业获利和一些企业亏损。但是有证据表明,不论哪种可能性,消费者都将是获利方。
2013年,一份由Deloitt独立撰写的关于公共部门信息的市场评估写到,对消费者、商业和公共部门而言,公共部门信息的价值在2011、2012年度约有18亿英镑(根据2011年价值估算)。Deloitt还指出,公共部门信息的使用和重复利用会对下游产生更大的影响,除直接客户以外,还作用于社会的所有领域。该研究还保守估计,公共部门信息的社会价值在2011、2012年度会超过50亿英镑(2011年价值)。
(二)理解数据市场潜在价值
如果政府想依靠开放数据来刺激经济增长,关键是政府制定的政策要基于对市场数据的清晰认识,并且政策可以给更广泛的经济领域带来好处。受访者很清楚,英国在开放数据领域具有很多的经济优势。Stephan
Shakespeare解释了他称之为“数字革命”的两个阶段。第一个阶段是在系统之间建立连接,他认为硅谷是第一阶段的大赢家;现在的第二阶段就是基于数据,其实正在发生,英国可能会成为第二阶段的领导者,因为英国拥有最大最连贯的数据集,有专业知识,并且每个人都有共同的愿望做成这件事。Nigel
Shadbolt先生详述道,鉴于英国的大小和相对均衡的性质,有一个真正的机会来展现,以数据驱动的经济和社会价值将如何实现。Nigel先生将英国与美国作对比,美国是一个大型的联邦体系国家,大部分有价值的数据都在各个州内,并且州与州的法律各不相同,美国在一定程度上受限于这一现实。因此,英国有了一个真正的创新机会。
有几个受访者谈到英国政府还没有认识到开放数据的市场,也没有意识到开放数据给私营部门带来的真正机会。NigelShadbolt爵士主张政府应该更加积极地投入。在某些方面需要承认,英国领导着世界。他警告说,“发表就会带来机会”这种想法是远远不够的。他力劝政府要为开放数据提出积极的要求。
2012年,英国政府成立开放数据研究所(ODI)。它声明其目的是促进从开放数据中创造新的经济价值。ODI描述自己是一个开放数据的成功榜样,并且其他19个国家正在效仿。ODI支持许多在开放数据领域的初创公司,包括OpenCorporates,它是世界上最大的开放数据库的公司,该公司存有4900万家公司的数据。
如果某个国家想成为新产业的国际中心,那么一定要加快开放数据的脚步。随着其他国家意识到开放数据带来的经济潜力,他们将迅速地赶上英国。Shakespeare先生说过:“想成为领袖,我们必须对此要有很强的紧迫感。”HeatherSavory说:“政府并不了解白厅与商业世界之间的速度差异。”Savory女士表示自2012年以来ODUG申请过500份数据,政府在应对时缓慢的速度令她感到失望:“这些创业公司想要一个明确快速的回复,如果涉及到隐私数据无法提供时,需要明天就被告知不行,因为这样的话他们可以去做其他的事情。”因此,她认为“这里存在着两种文化”。
还有证据表明政府预测错了数据市场的方向。TomSteinberg说:创新的本质是看到别人无法看到的价值。
政府已成立或已支持了很多可以帮助英国企业充分利用公共部门开放数据的项目和机构。现在说他们会多么有效还为时过早,但有证据表明,除非政府能意识到关键数据集的经济效益在国际竞争中日益增长,并理解开放数据市场快速前进的趋势,否则会阻碍英国企业的进步。
(三)对使用数据收取费用
政府对数据收费的经济影响是调查的核心。各党派政府在数据收费上有着悠久的历史,而且一些受访者承认,在某些情况下,收费是有理由的。Stephan
Shakespeare说:“获得一份详尽的数据时或许需要付出一些代价,所以我不认为所有的数据都必须免费。”NigelShadbolt爵士承认,“我们可以想象,人们可以出售数据背后的增值服务,同样的这类数据应该要收费。英国气象局就是一个很好的例子,其先进的气候预测模式就是在全球范围内寻求到并购买的。”
然而,许多受访者认为只有在费用减少或免除的条件下,英国经济才会完全得益于广泛利用政府的数据。OwenBoswarva说:“通过消除信息不对称,提高信息流动性可以使参与者在更平等的基础上协商交易,开放数据有巨大的潜力来创造更加公平的市场。”因此,他认为“对公有数据集收费,特别是当数据持有人具有垄断权的情况下,依靠这些数据,有实力的拥有者可以轻松地收取许可证费用,因此以往市场会被扭曲。”
当政府的支出面临着严峻压力时,当然是可以考虑如何向开放数据收费。我们从ODUG听到一个可替代的方法,即生成的数据作为法定注册的结果,如:土地注册、投票注册、注册支付议会税或商业利率、注册规划申请或建筑法规许可证等等,注册的费用应该包括开放数据收集这一项。
一个激进的新方法是为政府提供开放数据资金。一些数据可能会偶尔适度地收费,但这应该成为例外而不是规则。公共法定注册费用的适当一部分应用于确保数据收集,必要时正好可以成为开放数据。由英国交通管理局持有土地注册数据和车辆注册数据,由英国国家医疗服务系统持有的医疗数据都是相关的例子。
(四)营运基金的利弊分析
政府征收的很多数据费用是由营运基金负责。财政部定义营运基金是“公营公司,必须通过交易活动获得运营经费。”
关于这些与数据相关的基金对于经济的影响,我们听到了相互矛盾的证据。Experianplc是一家信息服务集团,也是开放数据用户组的成员,该集团的经理Paul
Malyon个人批评了营运基金产生的影响。他呼吁“抛弃”营运基金这种模式。
TomSteinberg指出:“营运基金在现代经济中扮演着重要的角色,这意味着他们需要通过一个强大的实体独立监管,例如Ofgem或Ofcom。”他相信“独立、健全的监管是必要的,因为在某种程度上,营运基金的高级管理面临着体系内的刺激,这对更广泛的经济不是好事。”ODI评论道:“不论多么好的监管,依据商业条款为公共部门信息设下许可证必然限制了它的使用,削减创新并会扭曲竞争市场的下游。”
Fallon先生后来向公共数据组的成员提供了详细的数据费用和来自营运基金的收入。这些金额的数目基于多种因素,示例中包括每年来自地形测量局的264英镑的数据费,这些数据用来帮助房地产中介绘制地产图并分析销售趋势,还包括来自知识产权办公室的500—5000英镑,这些钱用来访问专利或商标数据库。可支持伦敦市中心四公顷建设开发的数据的报价是45英镑。2012—2013这两年,知识产权局收入43342英镑,地形测量局收入1.4亿英镑,但我们被告知“少量”的收入来自于数据服务。
抛开金融需求不讲,营运基金通过数据免费或降低收费为许多小型企业提供一些有限的帮助。部长引用了营运基金为中小企业提供帮助的几个案例,包括为开发者颁发地形测量局数据的使用许可证。自2011年4月以来,超过600个组织获得了使用许可证,可以免费使用付费数据集。尽管担心收费,ODI认为,营运资金正走向“通过注册费用支持数据开放的模式”。ODI总结道:“没有理由说明,营运基金不能成为开放数据的领导者。”
(五)核心基础数据的价值
大量证据表明,尽管政府部门及公共机构尽了最大的努力,还需要做更多的工作来鼓励公共部门数据的使用,以支持经济增长。许多受访者敦促应该用一类数据和其他信息做关联,可以使创新更容易。ODUG解释说:“有一些数据是实现其他数据集意义的基础,这类数据的发布是有价值的。这样的数据一般被称为‘核心基础数据’,数据项将被使用在许多数据集内作为标识符区分相关记录。”ODUG给出的例子包括:地址、邮编以及地理坐标;统计地理编码或行政区域;公司注册号码;增值税号码;国家医疗服务系统号码。
StephanShakespeare说:“如果一些事物对所有人都有潜在的价值,那么就是一个非常强大的理由让这些事物自由。”NigelShadbolt爵士举了一个历史的例子,他认为是可以体现变革经济价值的核心材料——美国气象数据的发布。他说这些气象数据帮助美国创建了二级保险市场,现在价值80亿美元。JilMatheson是国家统计学家,他强调一个可靠并全面的国家地址寄存器的特殊价值,他说这是“有效统计和开放数据的基础,以及很多其他目的的基础,是拥有一个高质量、具有广泛用途、可用并可访问的地址寄存器。”
最近,关于邮编地址文件被皇家邮政私有化的政策,许多受访者对此表示特别的批评。NigelShadbolt爵士解释其重要性,说这个文件“是一个潜在的共同效益,几乎每一个可以想到的先进服务实现都会涉及数字的使用;一切发生的地方,一切实现的地方,不论是服务业还是商业”。丹麦政府发布了他们的地址文件作为开放数据,据预测他们的投资回报将高达发布成本的40倍。
ODUG说,允许皇家邮政将邮编地址文件私有化作为商业数据集,以及地形测量局作为邮编地址的交易增值分销商,这两个决定表现出“全然不顾政府对开放数据所做的任何承诺”。Matheson女士作为国家统计学家,她的关注点是“确保邮编地址文件在维护下且可用,并且对所有用户开放访问”。
关于邮编地址文件的决定,Fallon先生为政府进行辩护,称这是“皇家邮政的一个组成部分,它是业务依赖的基本营业资产,皇家邮政负责收集数据并确保它的更新”。Fallon先生还认为:“皇家邮政会增加相当大的成本收集和维护这些数据并确保它的更新。他们从使用这些数据的公司收回一些成本是合理的。”
部长指出,2013年7月皇家邮政宣布允许“独立的微小型企业免费访问邮编地址文件为期一年的时间,在扩展这项优惠中,皇家邮政已延伸至83%的英国中小企业”。
FlyingBinary是一家紧密参与政府开放数据工作的公司,其首席执行官JacquiTaylor怀疑这项优惠的价值,称“向微小型企业提供免费邮编地址文件是没有帮助的”。他们说这是因为“它需要几个月的时间把这样的产品推向市场,而且一旦皇家邮政落入私营部门手中,就不能保证未来邮编地址文件数据的价格”。
一些政府数据集有着直接的巨大的经济价值。关于允许小型企业及其他企业继续访问邮编地址文件,部长和皇家邮政做出了很多承诺。收到的证据表明,这种保证的可信度值得怀疑。邮编地址文件已经包含在销售业绩内,来促进皇家邮政上市的股价。这采取的是快速的但是狭窄的观点来衡量这些数据集的价值。为了公众的效益和英国经济效益的最大化,邮编地址文件应该作为一个公共数据集和国家资产被保留,并全部免费向大众提供。追求短期的收益将会阻碍经济的创新和增长。这是一个不能接受的并且不必要的私有化结果,不同于部长的论点,开放数据不会“被跨国大公司吞进”。
皇家邮政卖出邮编地址文件是错误的。政府永远不能犯类似的错误。公共部门数据的公共访问权再不能被出售或让出了。
(六)确保公平访问
商业创新和技能部提供资金建立了四个新的行政数据研究中心,以保证研究可以基于政府部门之间的关联数据进行。但对数据中心的访问还存在一些问题,目前仅限学术访问。我们问Fallon先生,私人和其他机构未来能否访问它,部长说:“我认为你有充分的理由,通过访问匿名的政府数据来帮助制定商业决策和改善,例如商业投资的有效性。”
有人担忧研究委员会和学术研究人员对政府数据的态度。当新的政府数据需要被更广泛使用时,政府应该为学术界提供特权,政府毕竟用的是纳税人的钱。
(七)关于开放数据和经济增长的总结
英国政府在开放政府数据上是一个先行者,但其他政府正关注着英国,并准备迎头赶上。如果英国政府不抓住这个机会,具有成长潜力的企业将被数据收费、法律和行政限制而阻碍,而其他国家正在发展他们的数据工业基地并悄悄地领先于英国。政府寻求数据收费收入最大化是极端狭隘的,而这些费用特别是对最具有创新能力的小公司严重不利,这些公司很可能会帮助英国在新的经济领域成为全球性的领导者。
需要尽快开放核心数据,最重要的是,要允许所有企业(例如应用程序开发)免费访问,这些企业可以将核心数据配合其他数据取得进步。最后,地形测量局和地方政府协会共同拥有GeoPlaceLLP公司,因此政府应该特别保证GeoPlaceLLP公司数据的公共所有权。
各部应当要求列出所有执行的调查和行政系统,让公众知道哪里可能产生哪些数据,且应该给议会和公众提示和清晰的账户,包含所有来自于数据销售的收入。
政府必须和企业紧密合作,并且通过提供所需的环境培养新的开放数据企业。开放数据协会是一个受欢迎的发展机构。该机构作为一个知识交换中心的同时,一直致力于帮助一些基于开放数据的初创企业的发展,但它的影响力还远远不够,需要更广泛的推广。
三、通过开放数据提高政府效率
(一)开放性和政府效率
一些受访者敦促政府要抓住机遇,通过开放数据来改善自己的绩效并意识到公共服务的问题。政府研究所发布了大量的案例作为效率的补偿,该研究所告诉我们:“当数据以比较的方式呈现给公众会更加清晰,可以方便公众更好地利用数据,帮助政府内部做更好的决策。”ODI说,开放数据对政府的好处包括“启用外部协作来提高数据质量,有效地减少重复工作和节省信息使用费”。ODI观察到,开始估算潜在的节省为“政府采取果断行动,开放数据提供商业基础”。
StephanShakespeare说:“让数据可用的原因之一,当你开放数据,专业性会大幅增加。”NigelShadbolt爵士引用了一个社区与地方政府部门实践的例子,“将所有地方政府的统计数据做比较和互连”。他说,这“非常好,部门在很多报告中开始使用这样的数据”。Nigel爵士还提到英国公共卫生网站“延年益寿”,将死亡率和发病率结合并发布,这个方式“使公众非常好接受”。他说在这个网站上“将开放数据带进了生活,并在全国上下引发一场关于发病率、死亡率、死亡率变化的非常令人关注的讨论”。
部长告诉我们:“我们看到越来越多的部门利用自己和其他部门的数据来推动他们的政策和规划。”并给出了一个交通部的例子,“综合使用自己的数据和私人数据来支持项目,例如交通指挥,并积极地根据更多的信息了解交通事故的影响”。另一个例子是关于社区和地方政府部门的社区预算和困难家庭计划,部长告诉我们,“这个计划表明,想为弱势群体设计服务、投入服务并实现更好结果,信息共享是关键”。
(二)限制效率提高的主要瓶颈
我们听到的证据表明,政府遗漏了一些使用开放数据的重要机会。FlyingBinary公司法人JacquiTaylor描述了她指导的一家智慧城市公司所遇到的困难,这家公司通过ODUG向英国环境、食品和农村事务部申请访问数据,以“挑战”共同农业政策税。Taylor女士说,分析相关数据产生的结果“会对英国公共有限公司带来巨大的好处”。然而,“英国环境、食品和农村事务部尚未公布这些数据,虽然ODUG正试图尽快使这些数据发布。”
改善政府的另一个障碍是为一些数据集设置许可证限制。重要的核心数据,例如地址和地理空间数据等“基本上要向数据持有人(特别是公共部门)购买获得”,ODUG认为这种情况会阻碍政府有用数据的流动,“最初由公共资金资助的公共任务所产生的数据仍需要公共资金来回购。”这个数据已经由纳税人支付两次,但它仍然受到限制。
几乎没有证据表明,政府通过使用自己的数据来改善政策和绩效。部门需要充分利用他们拥有的记录和信息,以确保其运行效率。向其他部门开放数据会加强政府的信息基础,可以改善政策的制定。数据开放的好处不仅包括开放度和问责制的加强,也为外部专家增加机会对数据本身的质量和精度加以检验、提出建议并改善。
内阁府应该更积极地确保各个部门最大程度地调动社会和经济在开放数据上的潜力,尤其是提高自己的效率和效力。为此,应该采取如下行动:①要求生产部门,于2014年底前给出一个详细的、有时间节点的计划,通过使用数据提高他们的绩效;②确保所有用于支持政策工作的数据与政策声明一同发布;③以前各个部门必须通过支付获取由政府自身产生的数据,2015年1月前要停止这种落后、浪费的行为。
由英国统计管理委员会领导的国家统计局,也应该站在这场运动的前沿,树立榜样。
四、加快实现开放数据
需要做什么能够帮助政府实现开放数据的三个主要目标。为什么不能开放更多的政府数据,为什么不能让更多人访问,为什么不能发布得更快。
(一)提升数据处理技能
一些证据显示出公务员的数据技能薄弱。NigelShadbolt爵士承认,政府“在大数据领域已经做出实质性的投资”,但“大多是在硬件领域,人工技能仍作为基础需要加强”。无论是公有还是私营部门,有足够技能的人,更需要利用“自身的能力开发新兴数据市场”。
Nigel爵士说,公务员中存在着“一个真正的挑战”,“经证明,公务员大多都毕业于哲学、政治学、经济学专业”。然而想要改善现状,并不需要大量的人员,部门里有一个或两个榜样产生非常高质量的数据,15个部门中的4到5人就能创造出巨大的差异。
FlyingBinary是一家和政府部门合作的公司,该公司认为“公务员的数据解读能力都很差”。采取行动是十分必要的,“对整个公务员群体进行教育,并创造出文化氛围来改变影响他们”。如果高级官员对该现象不给予重视,不改进政策和成果,不能从部门的经验中学习,开放数据运动是不太可能进行下去的。HeatherSavory详尽地解释了这些文化问题。例如,她说公务员有时认为,开放数据会带来风险,“这很自然,因为他们一直成长在保护公众的世界里”。
Hurd先生和Fallon先生概述道,政府已对增强私营和公共部门的数据能力采取行动。2013年10月,商业、创新和技能部门发表《抓住数据的机会:增强英国数据能力策略》。该策略围绕了三个关键领域,汇总了政府、产业界和学术界的行动指示:①构建人力资本——在英国发展强大的技能基础;②发展英国的数据基础设施、软件和研究;③促进数据共享和链接。
政府内部正在采取措施发展技能。政府的科学家和工程师们正在“增加对数据的分析利用,分析和解决重大政策挑战”。内阁府的政府革新小组负责“领导开放政策的制定工作,并会考虑采用新的政策工具和技术,包括有效利用政策内的数据并用于服务”。
(二)统计学家的作用
一些受访者认为,统计学家对开放数据的成功起着至关重要的作用。ODI告诉我们:“统计学家对开放数据的发展很重要,从事开放数据的人们需要向他们学习。然而统计学家产生的数据目前是以人为重点而不是程序。”为鼓励外部人员充分利用统计材料,ODI决定,“重复利用者需要访问底层匿名版本的数据”。AndrewDilnot爵士是英国统计管理局的主席,他说政府“预计发布所有官方统计的数据”,但又提醒道,只有“在没有泄密风险的情况下”能实现。他强调,统计学家要确保数据的质量并提供上下关联的数据,并警告说,随意发布的数据会危害到透明度和政府的信誉。官方统计学家要依据国家统计执业守则工作,产生的统计数据应该是可理解、易访问的,并附有客观、公正的评论。
钱被认为是开放数据的发展障碍。英国统计管理局说,“在国家统计局,开放数据的工作通常局限于现有的资源内,这可能会限制前进的脚步。”JilMathson表示,尽管存在约束,但国家统计局已经是data.gov.uk网站中开放数据的主要来源之一。
FullFact建议,政府统计学家应该为开放数据做更多的贡献,“不应仅仅将官方统计数据开放。官方统计学专家应该利用自身的能力领导这个领域。到目前为止,他们还没有。”根据FullFact所言,统计学家们不应该像个看守员似的,来决定什么统计数据我们可以看到,什么数据我们能用。他们必须像个推动者,以开放数据为荣,正如委员会强调的,他们的工作是赋予他人权利做任何他们想做的事。
FullFact建议,在TimBerner-Lee爵士方案的基础上,用一星到五星方案评估开放数据的可再用性。举例来讲,一星级的统计数据应该包括基本的原数据,如地理范围的统计数据和金融时间序列是否经过通货膨胀调整。五星级的统计数据将提供更多内容,包括与其他相关数据相关联。
许多公民和公务员缺乏正确解读数据的技能,一些公务员似乎并不赞成政府开放数据。尽管要考虑到国家安全和个人隐私的需要,公务员需要有意识地推进发布。他们应该停止像看守员一样守着政府数据,并成为鼓励广泛使用政府数据的推动者;让政策制定者更全面地理解数据问题将是关键。
政府统计学家有能力利用政府数据做更多的事,例如通过产生一系列新的统计数据。当统计学家应该活跃于产生新的数据集并和其他公务员合作带来更有意义、可用性更强的开放数据时,他们却选择了保持低调不作为。政府统计学家应该成为开放数据的主力军。
为促进更多人参与到开放数据,上面我们建议政府采用Invovle提出的“五星级”系统。第二个“五星级”评级系统是由FullFact开发的,用来评估政府统计数据的可用性,该系统将支持统计学家在开放数据上发挥更积极的作用。内阁府还应该通过该系统评估部门内开放数据的进展。
政府需要加快行动,鼓励培养出更多的数据科学家。因此,建议政府应该为培养数据科学家提出一个实在的时间表,并定下具体目标。政府还应该为公务员开办增强数据技能和开放数据意识的培训。
五、对中国的启示
英国在推进政府数据开放、解决数据质量不佳、提升政府服务质量等方面对中国带来以下几点启示:
第一,要通过立法保障数据开放的合法性和强制性。
第二,敦促政府在发布数据方面采用“数据双轨制”的方法,即根据数据的可访问性和利用程度分成两种发布机制,一种是快速发布,无需处理可直接访问利用,另一种是需要数据学家整理并以高标准发布。通过这种方式可以促使政府快速发布,并兼顾数据质量。
第三,对于发布后数据质量与可用性控制方面,可以采用“五星级数据开放评测系统”标识数据的可用性和可访问性,一星级代表原始数据,五星级代表数据集包含更多的关联数据。
第四,在应对隐私泄露问题方面,将数据设为只读格式,可以访问但不能下载。
第五,在提高公务员数据解读能力方面,一是培训公务员,使其增强数据运用技能和数据开放的意识,二是发挥统计学家的作用,鼓励与公务员合作带来更有意义、可用性更强的数据开放。