摘 要:[研究目的]对公共数据开放面临的来自技术、组织、环境三个层面的安全风险进行分析,并从当前治理现状与困局入手探索安全风险的治理对策。 [研究方法]以文献研究、案例分析、政策实证等方法结合 TOE 理论框架对公共数据开放面临的安全风险、治理需求、应对策略等进行研究。 [研究结论]应立足公共数据开放治理的主要问题,通过赋予利益相关主体的数据访问权,明确利益相关主体参与风险治理的路径;从引入区块链技术、建立数据资产台账、明确责任机制等方面增强治理工具的技术性和操作性。
1 问题的提出
数据作为当今时代下的新质生产力,对于经济建设的潜在价值不言而喻。 作为数据下的重要类目,公共数据具有获取成本低、体量庞大、可复制性、开放性等特点。 按照《浙江省公共数据条例》第 3 条的规定,公共数据是国家机关、法律法规规章授权的具有管理公共事务职能的组织以及供水、供电、供气公共交通等公共服务运营单位,在依法履行职责或者提供公共服务过程中收集、产生的数据。 截至 2023 年 9 月,我国已经有 27 个省份上线了公共数据开放平台,各政府开放的公共数据总集已达到 345853 个,无条件开放的数据集总容量更是超过 480 亿。 可见,公共数据开放既是大势所趋,也是应有之义,实践中也衍生出有条件开放、无条件开放、授权运营等多种开放形式。 公共数据开放以“ 公共数据作为国家提供给社会的公共资源—公共数据开放义务与利用法秩序建构—社会主体利用公共数据的权利冶 为逻辑基础,其虽然在焕发经济活力、满足公众需求等方面拥有极大价值,但也蕴含着个人隐私泄露、行政权力失衡、公众信任危机等风险隐患,对公共安全、国家安全、社会稳定产生巨大威胁。
公共数据作为政府数据的外延,其涵摄范围大于政务数据。 从这个意义来讲,已有政务数据开放的风险也属于公共数据开放的安全风险。 当前,学界对于公共数据开放安全风险的研究主要呈现为两种视角。 一是从宏观上阐释公共数据开放中存在的风险。如,夏义堃从国家安全、行政、社会、经济等多角度系统分析了政府数据开放的风险;王运等人以上海市政府公共数据开放的实践为例,总结出缺乏统一规划、利益冲突等隐患。 二是聚焦于公共数据开放中隐私泄露风险。 如,田新玲等从社会、政治、文化层面分析了公共数据开放与个人隐私保护的冲突;丁红发等通过数据生命周期分析了政府数据开放在各阶段存在的隐私泄露风险;黄如花等分别以英国、法国政府数据开放的个人隐私保护为借鉴,提出完善法律法规对防范风险隐患的重要性。 针对上述风险,已有研究从宏观上提出了应对策略。 如,刑会强提出应明晰政府数据开放中政府责任的承担方式以及侵权后的救济方式;商希雪等提出应以个人信息使用与保护的制度落实数据安全;胡逸芳等以加拿大政府数据开放为借鉴提出重视执行力提升与重视数据复用对于风险预防的重要性。 综上,公共数据开放的安全风险已经成为学界热点话题,但研究内容多集中于公共数据开放的个人隐私保护,未能深入到个人隐私泄露背后国家安全、公共安全、社会稳定等领域的风险隐患。 基于此,本文以 TOE( technology - organization - environ鄄ment)为理论模型框架,从技术、组织、环境三个维度分析公共数据开放中潜藏的安全风险,同时梳理现行公共数据开放的政策规范,总结出治理现状与主要症结所在,并提出相应的优化思路与应对策略,以期我国公共数据开放的向善发展。
2 TOE 理论框架下公共数据开放的安全风险
TOE 理论框架是一种基于技术应用场景的分析框架,被 应 用 于 分 析 企 业 采 纳 创 新 技 术 的 影 响 因素。 该理论认为一项技术创新被扩散与采纳包含着技术、组织、环境三重因素。 技术因素强调技术的可用性以及与组织结构的匹配度,组织因素聚焦管理结构、范围和规模,环境因素涉及了组织面临的环境和政策等。 随着研究推进,TOE 理论框架的适用领域已经从企业创新扩展到数字政府、数据资源开放共享,研究内容也从技术创新的障碍因素扩展到政府数据开放的提升路径。 公共数据开放依赖于技术创新,技术创新直接影响着公共数据开放与安全的平衡。 因而,在公共数据开放的语境下,TOE 理论框架一方面可以从技术、组织、环境三个维度分析其中的阻碍因素与应用路径,另一方面也可以根据三个维度下阻碍因素的应对方法与应用路径的方式,反推出潜在的风险。
2. 1 技术维度
技术维度主要包括技术管理能力与技术设施建设能力两个方面。 公共数据开放依托平台实现,数据开放平台是连接公共数据发布端与获取端的载体,在技术层面存在着技术设施建设能力不足下技术研发外包引发数据泄露风险、数据处理技术自身安全风险。
2. 1. 1 技术研发外包引发数据泄露风险
公共数据开放平台建设的核心是技术,具体包括数据采集与整合、数据存储与管理、数据发布与交互以及去匿名化、数据脱敏、区块链加密等技术手段对开放数据的预处理。 受制于成本和技术等多重因素的影响,公共数据的收集与平台开发,政府一般采用公私合作、购买服务等方式交由商业公司进行。 如,广东涉企服务平台“粤商通冶、青岛市金融智能风险监管平台“鹰眼 360冶等项目,多为企业根据政府要求对公共信用数据、金融数据等公共数据进行开发。 这一过程中,存在着承包企业内部监管不足、政府监管不足下数据泄露的两个风险点。 其一,承包企业内部监管不足造成数据泄露。 公共部门将数据让渡于承包企业时,不可避免地放弃了一定的控制权和监督权。 在此过程中,企业内部职工可能因过失意外泄露数据或故意出卖数据资源,特别是医疗数据、税务数据、军事数据等直接关联公共隐私与民生的领域,一旦数据泄露将造成不可逆的后果。 例如,美国国防部一台存储3TB 内部军事电子邮件的服务器因工作人员过失在线暴露两周,造成大量敏感数据外泄。 其二,政府监管不严造成数据外泄。 政府委托商业公司技术研发,负有监管责任,如若政府监管不严或未能明确商业公司的权力与义务,受托企业可以利用其获得一手数据的优势地位,进行不正当竞争,甚至在驱利背景下外泄数据。 现如今,民众更加关注数据权利,也注重个人信息保护,一旦数据集被不正当利用或外泄,公众隐私将产生泄露的风险,民众的数据权也受到威胁。 例如,希腊曾发生过利用爬虫技术从开放数据资源中获取企业与个人的税务登记号码,并由此推断出个人与企业的商业行为。
2. 1. 2 数据处理技术自身安全风险
技术漏洞是公共数据开放安全的重大隐患,存在于数据的传输、储存、处理和交换等过程中,黑客和网络攻击者可以利用这些漏洞入侵公共数据开放平台,窃取或篡改敏感信息,引发数据泄露。 此外,当前各数据平台主要采取以隐私计算为代表的数据处理技术,实现数据“可用不可见冶。 作为一种数据“出域冶手段,此类技术的出发点是将数据交给市场主体安全使用,实现数据流动与数据安全的协同保护,但其自身存在不容忽视的风险。 其一,隐私计算无法真正实现匿名化,加密数据无法完全杜绝数据画像、挖掘、汇聚。 公共数据通常是从医疗、教育、交通等公共服务中收集而来,蕴含着大量敏感个人信息,如若隐私计算不能将其中的个人信息“抹除冶,个人信息与隐私权将受到侵害。 其二,隐私计算根据技术逻辑的不同存在密码学、人工智能、硬件三种路径,不同路径各有优势与局限,但实际中并未形成统一的使用场景与技术规范,在不同数据开放平台间产生了互操作性问题,容易造成数据泄露。 其三,隐私计算过程具有“半透明性冶,攻击者可以伪装成诚实参与方窃取运算结果、破解可信环境或植入恶意代码,恶意参与方可以将病毒通过反汇编语言输送至目标设备中。
2. 2 组织维度
公共数据开放的终极目标是实现公共数据资源的增值利用和价值最大化。 要达成这一目标,离不开组织的行为与资源支持。 在以政府为主导的公共数据开放过程中,政府作为组织者面临着行政权力俘获风险、数据治理能力与组织失配风险、府际间差异化加大风险。
2. 2. 1 行政权力俘获风险
政府是推动公共数据开放的主导者和组织者,诚如前文所述,拘泥于自身技术能力不足,政府一般将公共数据开平台建设、运营外包给第三方。 毋庸置疑,此种技术外包模式直接解决了政府能力不足的困境,提升了公共数据开放的效率。 但是从实践维度看,在资本与技术的支撑下,一些技术龙头企业可能借此形成“技术垄断冶,冲击传统公共权力的结构和秩序,形成对行政权力的“俘获冶。 具体表现为两方面:一是管制俘获。 政府的技术能力“失位冶 和信息不对称极易导致其在与技术提供企业的合作中处于弱势地位。 如果政府内部缺少专业的技术型人才,那么就有可能造成技术方案审查不到位、合同权利与义务不对等情况出现,技术提供企业也可能借此窃取公共数据或利用优势地位在与政府的谈判中不合理获利。 此外,技术外包企业还可能通过运营许可进行违法违规操作。 二是控制市场。 技术外包企业通过自身技术开发建构了公共数据开放平台,实现了“平台即基础设施冶、“平台即交易市场冶及“平台即商业生态冶 的社会绑定。 于此意义上,技术外包企业纯粹的市场行为主体角色被打破,成为了多边市场的话语中心,存在着扰乱市场秩序、引发市场失灵风险的可能。
2. 2. 2 数据治理能力与组织失配风险
我国传统的科层制政府管理体制呈现出纵强横弱的特点。 在此条件下,各部门、各地区政府间将所持数据视为“专有财产冶,协同开放的难度较大。 数据的可复制性、便携性的最大优势在于消除了时间、地域的阻碍,但在各级、各地政府尚未达成一致,没有一致的规范性文件时,数据便难以发挥这种优势。 因此,政府组织架构如果无法适应当下的平台建设、数据技术日益发展,不能达成统筹规划的发展方案与政策文件,组织与技术间将产生失配的风险。 此外,当前对于公共数据开发的潜在风险并没有明确、完整的认识,公共数据开发中也随时可能出现尚未发生过的风险。 由于法律法规并未明确规定相关主体责任,政府可能以技术外包为借口逃避责任,或是为了逃避责任而提前将关键技术节点外包,在发生风险后将责任推卸给技术提供方。 于此情景下,政府的数据治理能力将 “ 止步不前冶,难以与技术的发展速度相匹配。
2. 2. 3 府际间差异化加大风险
在数字政府建设和数字经济发展的驱使下,我国已开始全面部署和推行公共数据开放。 截至 2023 年8 月,我国已有 226 个省级和城市的地方政府上线了数据开放平台,其中省级平台 22 个,城市平台 204 个。与此同时,各地方政府也颁布了一系列公共数据开放的政策文件。 由于地方固有的区域特征和差异化的政策驱动,加大了府际间差异化风险,消减了公共数据的应用价值。 一是可能加剧府际平行区隔。 当下的公共数据平台和公共数据开放政策以“省冶、“市冶为单位,缺乏国家的统摄,这种结构可能造成“省-省冶、“省市冶、“市-市冶间运行标准各异,进而加剧数据孤岛和数据垄断,从而形成地方“数据割据冶,严重制约公共数据的流通,与公共数据开放的初衷相背离。 二是可能加大府际数据开放差距。 目前,推动公共数据开放是政府绩效考核体系中的重要组成部分。 政府可能受到考核的“裹挟冶而推动公共数据开放工程,而不对开放平台进行可持续投入与经营,甚至在各地政府间产生不正当竞争,仅在政策文件、平台前期建设下功夫,而不深究平台长期运营,前期的资金、技术投入也不能得到收益。 如,甘肃、河南、新疆、青海、宁夏的数据开放平台就出现了上线后又无法访问的情况。
2. 3 环境维度
在环境维度,公共数据开放涉及了政策、经济、社会、文化等因素,其中与政府所处的内外部环境最为密切,尤其是国际环境。 立足全球数据安全治理、国际外在影响下的压迫性和技术迭代的大环境,公共数据开放可能会带来情报安全风险和国家数据主权安全风险。 总体国家安全观视野下,情报安全先于国家安全而存在,是保障国家安全的重要因素之一,而数据主权是国家对本国数据的生成、存储、流动、分析和利用,免受他国和组织干扰的权力。
2. 3. 1 情报安全风险
当今社会,国家情报安全已不再局限于军事、公安、意识形态对抗领域, 开始扩展到文化、社会、民生等领域,获取情报的方式也经由人员情报、信号情报、图像情报进入开源情报,并以网络开源情报为主要特征。 开源情报是国家安全情报的重要组成部分,一般是指通过公开途径、运用合法手段对公开信息和资料的系统性搜集、处理和分析而得到的情报。 据国际情报专家的估计,目前西方发达国家的国家情报之40% 到 95% 都是以开源情报的形式获取的。 伴随着互联网技术的发展,网络信息资源成为开源情报获取的主要途径。 然而,由于网络信息资源质量的参差不齐、形式纷繁复杂,以此获取的情报极易失真,甚至遭遇“反情报冶。 公共数据开放所带来的公共数据的权威性、真实性、广泛性,规避了以往互联网信息资源质量不高的弊端,在一定程度上威胁着我国的情报安全。 一方面,公共数据一般由相关机构在履行公共管理与服务职责时获取,在获取阶段已经历过审查,相比其他种类数据具有真实性。 开源情报以此为基础获取的情报比较准确,避免了遭遇“反情报冶。 另一方面,公共数据辐射的领域极为广泛,涵盖了水务、电力、燃气、通信、公共交通、民航、铁路等等,单行业数据“暴露冶或许并不会产生严重的安全问题,但当海量的不同领域数据汇聚在一起时,经过加工与分析将有可能产生巨大的情报价值。
2. 3. 2 国家数据主权安全风险
数据主权作为大数据时代各国竞争、发展下的产物,事关国家数据安全、国家数字空间权威、对抗数据霸权等重要领域。 由于我国公共数据开放尚处起步探索、中央尚无规范文件的阶段,公共数据开放中暗含国家数据主权遭遇侵犯的风险。 具体而言,一方面,数据开放过程中需要大量硬件设施与关键数字技术,尽管我国正在加快推进网络系统与硬件设备,但尚未做到完全不用开源产品和国外产品,关键技术受到出口国家的操控。 例如,在国际顶级域名主服务器领域,我国无法实现技术独立,需要依赖美国服务器与其他国家网络的“域名冶之间进行数据传输。 此外,在实现技术独立前,我国始终无法实现公共数据开放的自主全产业链,在国际竞争、矛盾多发的当下,一旦引进技术被出口国切断,公共数据开放项目也将面临停转的尴尬境地。 另一方面,数据开放平台承载的数据价值高、敏感性强,极易受不法数据窃取者“关注冶。 当前,我国各公共数据开放平台的安全保护技术体系明显不健全,一旦在数据收集、存储、开放、运营、使用任一阶段发生泄露、入侵等问题,极有可能造成国家秘密泄露。
3 公共数据开放风险治理的现状及困局
目前针对公共数据开放的治理措施对于数据安全风险防范具有一定的效用,但从实践来看,公共数据开放风险治理在利益相关主体参与风险治理的路径和治理工具等方面仍然存在一定缺陷。
3. 1 公共数据开放风险治理的基本现状
我国关于公共数据开放风险治理的规范,主要集中在地方颁布的政策和规章。 为全方位呈现当前我国公共数据开放风险治理的现状,本文以 2023 年 12 月31 日为时间结点,围绕当下公共数据开放风险治理的主体和工具,对浙江、山东、江西、江苏、广西、广东、福建、云南、上海、武汉、成都、青岛、重庆、德阳、常德、南宁、无锡、马鞍山、鞍山等 21 省市颁布的公共数据开放管理办法进行了实证分析(见表 1)。
总的来说,应对公共数据开放风险已经在 21 部政府规章中得到了体现。 治理主体涉及了县级以上人民政府、大数据主管部门、公共服务机构、国家安全机关、网信部门、省政务服务管理办公室、大数据发展局等。治理工具上,数据开放目录、数据分类分级,数据安全评估,数据预警、数据脱敏、数据生命周期全过程管理等制度已成为各地应对公共数据开放风险治理的主要工具。
3. 2 面向多层风险的治理困局
公共数据开放的安全风险体现在技术、组织、环境三个维度,因此其治理也应以满足民众对技术的期望与信任、防止行政权力的异化为出发点。 此种复合性、多维性的治理目标要求政府职能部门既关注到技术治理的重要性及其落实,又要关注到政府与社会公众、企业间的良性互动,满足社会公众的期许,真正实现公共数据开放的善治。 然而,现有公共数据开放风险治理在利益相关主体参与治理的路径、治理工具上存在欠缺。
其一,利益相关主体参与治理的路径不畅。 从 21部地方公共数据开放政府规章来看,承担公共数据治理的主体多为国家公权力机关、且职权较为分散,鲜见公民、社会组织、公共管理机构等非政府组织。 于此组织结构下推动公共数据开放风险治理,面临两方面挑战。 一是治理主体权责分散,各部门缺乏有效配合,存在“九龙治水冶 现象。 公共数据开放的风险治理需要系统防范、综合治理,分散化的权力结构安排导致了跨部门间信息共享和协同性差等问题的出现。 二是企业、个人、社会组织的主体性作用发挥不够。 按照数据生命周期理论,公共数据开放涉及数据收集、存储、处理、传输、交换、销毁等多环节,涉及了国家机关、企业机构、科研人员、个人、社会组织等多方利益。 作为社会力量的企业、个人、社会组织,其主体作用的发挥直接影响公共数据开放风险治理的效果。 已有政府规章大多未对企业、个人、社会组织的参与进行规定。
其二,治理工具尚待优化。 从治理工具的类型来看,这些制度以前端风险预防为主,缺乏末端的治理制度。 预防固然是公共数据开放风险治理中的重要一环,但末端的法律责任不能或缺。 现有法律法规宽泛的规定了公共数据开放的违法情形,但违法主体所承担的责任仅限于责令停止参加数据开放活动,缺乏惩罚性措施,对负有安保义务的行政机关也未规定不履行法定义务的后果。 惩罚性措施的缺失易造成市场参与主体、行政机关的不正当行为或怠于履行监管职责,政府内部决策也难以得到有效执行。 从治理工具的规定来看,规定过于宏观、可操作性不强。 如,《上海市公共数据开放暂行办法》 第 23 条,“数据利用主体应当遵循合法、正当的原则利用公共数据冶,关于“正当冶的标准、审查主体、违反的法律后果等均缺乏体系化的规定。 诸如此类宏观、缺乏可操作性的规定,在政策文件中屡见不鲜。 从治理工具的内容来看,缺乏对技术治理的支持。 已有研究表明,区块链、数字水印等技术对于数据开放下的个人隐私风险管控有重要作用,但现有政府规章却缺乏对于此类技术治理工具的适用规则与适用方式。
4 公共数据开放面临安全风险的治理对策
公共数据开放作为新兴领域、重点领域,其难题是如何平衡利用与安全。 基于公共数据开放风险治理的困局,应赋予利益相关主体的数据访问权、增强治理工具的技术性和可操作性以化解当前利益相关主体参与治理的路径不畅和治理工具不健全的问题。
第一,赋予利益相关主体数据访问权
公共数据开放的风险治理需要考量不同社会主体间的利益需求,让多方利益主体参与到公共数据开放的治理过程。 唯此,个人、企业、政府才能出于对个人隐私保护、商业秘密保护、数据开放效益等价值的考量参与治理。 当前学界针对公共数据开放的风险治理,已经了提出了多元主体协同治理的理念,但如何协同只是从理论上做了阐释。 事实上,多元主体协同治理的核心是赋权,赋予利益相关主体数据访问权,对于监督公共数据开放过程中的不当行为和预防风险具有重要意义。 数据访问权是公共数据开放制度的权利基础[26],一般是指“在一定条件下赋予对数据访问具有利益的企业、消费者访问与使用数据的权利,也即在法律上使数据实际控制人负担允许他人访问数据的义务。冶2023 年 11 月,欧盟理事会正式通过的《数据法案》已对数据访问权做了详细规定。 未来我国有必要在公共数据开放的风险治理中落实这一制度设计,明确利益相关者可访问数据的范围与方式,同时为公共数据开放平台方设立接受数据访问的义务。 需要注意的是,公共数据开放场景下的数据访问权是出于监督的目的,而非共享。 因此,企业、社会组织、个人在访问数据时仅限于与自身利益高度相关的,涉及他人隐私、商业秘密、国家秘密的信息是被禁止访问的,即利益相关者只能在数据开放平台“访问冶 自身的何种数据被采集以及被开放的场景,以此来监督自己的数据权益是否受损,并有权向平台提出异议,请求平台删除数据或进行匿名化处理。 此外,为了保障利益相关者在获得知情权的同时不侵害他人数据权益,数据开放平台应通过设置用户认证、数据加密、权限控制来保证利益相关者的数据访问权限,搭建 RBAC(Role-Base鄄dAccess Control)模型,事先定义好数据访问的范围。
第二,增强治理工具的技术性和可操作性
a. 引入区块链技术增强数据安全。 区块链是一种去中心化的分布式计算技术,该技术可保证数据在区块链系统中不被篡改,得到安全存储。 区块链技术主要可以应用于数据存储与数据鉴证阶段,通过搭建联盟链的基本架构,将所有公共数据开放平台、公共数据提供主体、公共数据利用主体都作为区块链节点,打破政府部门与社会主体、政府部门内部的数据“壁垒冶。 在数据存储阶段,根据数据分类分级结果,对个人隐私、公众隐私敏感的数据使用多重签名技术,只有在获得平台方、数据提供方、数据利用方的三重密钥授权才可访问原始数据,以加固数据访问权限,防止隐私泄露;区块链技术可以永久地安全存储各类公共数据,企事业单位、社会组织、社会公众等主体可在授权下随时查验数据的存在性与真实性以及流通去向,实现公共数据开放的全过程监督与维护。
b. 依据数据分类分级,建立数据资产台账。 依据分类分级圈定出不予开放、有条件开放的数据,再分别建立予以开放和不予开放的数据资产台账,详细记录每一数据、数据集的内容、提供方、敏感程度、开放范围、涉及领域等安全信息。 对于不予开放的数据资产台账,根据台账内容实行覆盖数据生命周期的全过程监管,保证敏感数据不外流。 对于予以开放的数据资产台账,做到包含利用者身份信息、利用目的、利用场景在内的数据流通全过程记录,确保数据流通看得见。此外,对于所使用软件、硬件的采购、维修、更换、废弃同样记入数据资产台账,明确其中所记载的数据,避免数据在软件、硬件的流通中发生外泄。
c. 明确公共数据开放管理的责任机制。 公共数据开放是一个系统、动态的过程,需要明确各主体的责任与义务。 首先,政府部门之间应深入开展技术、管理层面合作,形成跨部门、跨地域的数据安全保护协作,对数据分类分级、脱敏、安全评估、预警机制等关键安全防范手段建立统一规范,整合监管力量,实现多部门参与的动态监管。 其次,明确平台管理主体责任,在未按规定记录公共数据开放和利用的全程行为或未履行平台监管职责时,对直接责任人予以处罚。 最后,引入惩罚性赔偿制度,当涉及个人隐私、经济安全、国防安全等关键数据泄露时,对责任主体实行高额的惩罚性赔偿。
5 结 语
公共数据开放面临风险治理的直接目的是预防、处理和祛除危机,最终目的是在安全的大框架下促进数据要素在经济市场焕发活力。 面临这种隐性的、多元性的风险隐患,一方面应当赋予利益相关主体的数据访问权,以此来监督公共数据开放的行为,从而预防风险的发生;另一方面,增强治理工具的技术性和可操作性,提升公共数据开放安全风险的治理效能。
↓↓了解更多资讯,请识别下方二维码↓↓
国脉集团是数据资产化专业服务机构,为数据资源拥有者提供专业、规范、合规的全流程数据资产化服务,包括培训、咨询和产品设计等,实现数据资源价值最大化。主要服务于政府数据管理机构、央国企数据运营企业、城市数据运营平台和数据富集型平台企业,打造数据资产网、数据资产研究院和产业专家网络等支撑体系,同时在营商环境与政务领域继续保持领先优势。
主要课程包括数据资产入表、数据经纪人、公共数据运营和政府CDO、数据精品等精品课程。
数据资产化服务:数据资产化战略布局、数据资产入表、数据产品开发及交易等关键任务;
数据要素×项目服务:政策扶持、案例奖项申报、金融支撑和市场变现;
数据产业园区和试验区咨询服务:园区规划、咨询、资源导入和生态体系建设