还数于民:公共数据运营机制的构建

2024-03-19 12:57 来源:国家信息中心大数据发展部
浏览量: 收藏:0 分享

     摘要:[目的/意义]公共数据运营日益成为推进数据要素化改革的工作重点之一,如何构建科学合理的制度体系至关重要。[研究设计/方法]梳理了公共数据运营工作中面临的五个关键环节的问题,以“还数于民”为指导思想,综合开发者、使用者、协同者、贡献者、监管者的各方视角进行了分析研究。[结论/发现]提出了统分结合的数据授权模式、持续滚动的数据源活化机制、跨层级跨地域的数据统筹机制、综合调控的数据收益分配机制、协同治理的数据运营监管机制。[创新/价值]提出的制度设计思路对于完善公共数据运营的制度体系具有积极的参考作用。

  1、引言

  随着我国数据要素化进程的不断加快,公共数据运营日益成为热点领域。2020年5月国务院办公厅联合相关部委首次启动了公共数据开发利用的国家级试点工作,范围包括上海、江苏、浙江、福建、山东、广东、海南、贵州8个地方,试点内容包括了探索业务管理和数据资源配置模式,涉及用公共数据进行增值开发来形成社会化的产品和服务。2021年3月国家“十四五”规划发布,正式提出了开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用。2022年12月党中央国务院发布数据基础制度的相关文件(即“数据二十条”),明确了探索建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制。截至2023年4月,已公开在数据条例或者管理办法等法规文件中写入数据运营的省份已有17个,副省级城市有10个。

  积极推动公共数据运营具有重要意义。从数据红利的角度上看,积极推动公共数据运营有助于丰富数据供给,释放数据价值。据统计,我国各类行业机构2021年共产生数据5.2ZB,其中政府数据年产量1100.4EB,在各行业中排名第一。公共数据的范畴比政府数据更广,其数据规模更加庞大。推动公共数据运营,依托公共数据形成市场化的产品和服务,将有效促进公共数据的社会化利用,通过市场作用充分发挥数据价值。从数据市场角度看,积极推动公共数据运营有助于培育公共数商,完善要素市场。全国各地数十家数据交易机构几乎都把依托公共数据生成的产品和服务作为重要交易标的,而目前已被开发的公共数据仅占总量的一小部分。随着公共数据运营工作的深入开展,海量的公共数据将逐渐被开发,必将产生一大批从事公共数据产品开发的专业数商,数据要素市场中的市场主体将会极大丰富。从数字经济角度看,积极推动公共数据运营有助于带动数字化转型,繁荣产业生态。党的十八大以来,我国数字经济取得了举世瞩目的发展成就,总体规模连续多年位居世界第二,已成为推动我国经济增长的主要引擎之一。通过公共数据运营,将更多的数据投入到经济发展中,能够为数字经济发展提供强大的助推剂。为此,研究如何更好地构建公共数据运营机制,既能够充分发挥数据价值又能符合公共数据所代表的公共价值取向,成为了本文关注的核心内容。

     2、相关研究综述

  公共数据授权运营在我国多地开始实践,也暴露出一些亟待解决的问题,引起了研究者的关注。目前相关研究工作主要是从合规管理、收益分配、实践总结以及制度设计等角度来进行研究,主要观点如下。

  (1)合规管理

  当前关于合规管理的各项研究主要是从法学的角度对公共数据运营正式启动前的授权机制的合规性进行探讨,侧重于公共数据授权运营的“事前”范畴,但所依据的法律内容略有不同。第一种观点以行政法为基础。例如吴亮从法理上分析了政府数据授权运营具备“基于特别用物的行政许可”与“基于公共用物的行政给付”两种不同理念,提出应以国家担保责任理论为指导进行制度设计。冯洋分析了公共数据授权运营的行政许可属性,提出应以竞争性授权为主要方式。第二种观点以投资法为基础。例如肖卫兵总结认为政府数据授权运营应被视为政府与社会资本合作的PPP模式,并给出了立法建议。袁强和石小兵提出了基于现有的基础设施特许经营制度来构建数据领域特许经营制度的构想。常江和张震分析了数据授权运营属于公共服务性质的特许经营的特性,认为存在“统一(或者说全面)授权运营”和“分散授权运营”两种形式。第三种观点是以反垄断法为基础。时建中分析了数据资源的特征、数据权利化的特性和数据法律制度的构建方法,特别指出了公共数据的处理和运营中应当引入竞争机制,杜绝公共数据独家授权运营,谨防公共数据授权运营机制被运营机构“绑架”或者“钓鱼”的风险。

  (2)收益分配

  当前关于收益分配的各项研究主要是对数据运营的结果即经营收益在不同主体之间的分配方法进行探讨,侧重于公共数据授权运营的“事后”范畴,其研究基础都是财税制度,但是切入点各有特色。例如,杨铭鑫等提出了数据要素参与收入分配的三层次制度进路,建议可以考虑采用行政/事业性费用制度和授权许可制度这两种方式构建公共数据授权运营与收益分配专项制度。童楠楠等研究了适配公共数据资源化、资本化、资产化价值生成路径,提出了数据财政、数据税收、数据金融的三层次利益分配框架,尤其是基于公共数据授权运营的数据财政机制构想。朱扬勇和谢波锋提出实现数据财政的主要工作和政策建议。时建中提出地方有关公共数据授权运营机制的制度安排要强化公平竞争审查和反垄断执法,防止公共数据授权运营演变为数据资源地方保护、垄断经营、索取不公平高价。

  (3)实践总结

  当前关于实践总结的各项研究的出发点都是各地方的实践案例,通过多个案例之间的对比来总结经验规律,其对比范围覆盖了事前事中事后的一个阶段或多个阶段,对比角度略有不同。例如,张会平等以成都市政府数据授权运营为例展开案例研究,从基本特性、价值共创逻辑、动力机制建构三个方面分析各类工作机制的内在机理,指出其基本特性是将政府数据作为国有资产进行市场化运营。中国软件评测中心联合国家信息中心等单位发布的《公共数据运营模式研究报告》汇集了全国近20个典型案例,总结提炼了三种运行模式,提出了“一座”“两场”“三域”“四链”的公共数据授权运营体系架构。王伟玲等分析总结了成都、北京、海南、上海、广东等地方的实践动态,研究设计政府数据授权运营的生态价值创造机制。周秀娟和王亚对成都、北京、上海、广东等省市的最新动向进行考察,从立法、司法和学术层进行了剖析。

  (4)制度设计

  当前关于制度设计的各项研究基本都是以宏观政策建议的形式提出,不同学者的关注焦点略有不同。栾国春分析了数据运营领域目前存在的数据规模不明、缺乏工作细则、顶层法律缺失的问题,提出了夯实法律基础、挖掘数据价值、完善要素体系的政策建议。概括分析了我国公共数据授权运营的发展状况和制度建设方向,提出了源头供给、运营机制、收益分配的政策设计要点。比分析了公共数据开放与授权运营在参与主体、授权内容和方式等方面的具体差异,认为授权运营有助于调动市场主体在挖掘数据价值的主观性和能动性,提出了基于应用场景的公共数据价值实现的新方式。

  综上,公共数据运营仍然存在一些问题有待进一步研究,例如如何更好地授权以防止数据源单位被数据运营机构恶意绑架,如何设计监管机制使得各方的权利义务得到平衡。与此同时,对比现已开展的各类研究,从实践中反馈的问题范围更广更深入。例如,2023年5月底数字中国峰会的电子政务论坛期间,来自政产学研各界的多位专家学者探讨了公共数据授权运营面临的多重问题和风险。数据源的瓶颈制约的问题在实践中非常突出,但在学术界的研究中占比相对较少,远不如其他问题研究得深入。当数据运营工作在启动阶段,普遍的关注焦点是授权问题。当数据运营机构获得了第一批数据授权之后,更大的数据源瓶颈问题就会日益突出。上述研究尚不能完全概括。除此之外,数据运营涉及到的实体类型众多,不同实体的诉求不同,分角色视角的机制研究目前尚不充分,如何将不同实体的诉求统一到一个共同的目标之下形成合力值得深入研究。

  3、公共数据运营工作中的关键问题总结

  “数据二十条”提出了公共数据按照不同用户和应用场景进行分类授权应用的原则要求。各部门各地方在实际操作中仍然需要细化设计数据运营的制度体系。其中的关键问题可总结为以下五个方面。

  (1)如何合法合规地进行授权

  开展公共数据运营首先要解决授权的合规性问题,具体内容包括满足哪些资格的主体可以获得授权,获得授权的主体数量有无上限和下限,按照怎样的流程完成授权确认等。现有的研究尚未能找到标准答案。即使是采用当前较为盛行的集中统一的特许经营模式,如果缺乏辅助配套的措施机制,仍然面临着垄断的风险。授权问题的关键是在授权管理过程中如何平衡效率和公平。授权越分散,越有利于公平,但不可控因素越多,管理复杂度越大,在实际操作中无法长期推行。反之,授权越集中,管理复杂度相对降低,但是可能造成竞争不充分,导致被授权主体提升业务能力的动力不足,无法达到良好的运营效果。例如,某地将公共数据所有场景的端到端开发工作都全部交由一家数据运营机构来处理,授权过于集中,仅一家公司无法熟悉和应用所有的业务场景,导致效率不高,也不利于发展更多市场主体和做大数据要素市场,需要调整优化。

  (2)如何让更多的数据释放出来

  综合分析各地方已开展的公共数据运营工作现状,很多还处在起步探索阶段,数据产品类型亟待丰富,可运营的数据总量不够。例如,从某地方数据交易所反映的情况来看,已收到400多个数据需求,目前只有100多个得到了满足,300多个尚未满足的数据需求中有很多与公共数据有关。公共数据原料供给不足,数据应用场景无法充分展开,运营机构的盈利能力自然也就亟待提升。没有足够的数据源做支撑,数据运营无法形成规模化效应,所获得的收益量少,直接影响后续的收益分配政策以及数据财政等领域的政策落地效果。

  (3)如何对业务进行安全管控

  数据二十条明确了公共数据按照“原始数据不出域、数据可用不可见”的要求以模型、核验等产品和服务等形式向社会提供。但目前社会各界对于数据运营业务的顾虑仍然较多。例如,国家数据基础制度的文件中提出了“原始数据不出域”和“数据可用不可见”的要求,某地方政务部门直接把“域”等价于单个系统,导致其中的各类数据都无法被外界进行合理使用。如何在事前事中事后对数据业务进行统筹管理,如何让投入运营的数据安全高效地发挥作用,还需要技术与制度的双重手段协同作用。

  (4)如何对收益进行分配

  数据需要经过采集、存储、加工、销售等多个环节之后才能实现市场化收益。提供数据和承担原始数据采集工作的机构通常是政府机构或者公共部门,其经费主要来自于财政,收入不能直接用于支出。进行数据产品开发销售的机构通常是企业,主要从市场上获取收益,收入可以自由支配。有些数据还涉及到特殊群体的个人劳动贡献,应予以补偿。如何制定覆盖各类主体和人群的复合性收益分配策略,是各方密切关注的问题。例如某地方采用的“大数据局+大数据中心+大数据公司”的工作结构,大数据局属于行政机关,大数据中心属于事业单位,大数据公司属于企业,彼此之间的直接资金结算受到较多限制,需要进一步研究如何统筹这些不同类型主体的利益关系。

  (5)如何进行监督管理

  公共数据的内容范围广,敏感程度相对较高,参与主体众多。如何调动各方力量对其进行综合监管,形成制度性监管,仍然需要进行系统性地研究和设计。例如,目前很多地方数据运营机构的负责人并非企业化的职业经理人,机构普遍采用的都是政府直管模式,由大数据局直接委派或抽调人员兼任,仍然采用的是行政化管理,需要进一步研究如何面向市场化的管理机制进行过渡或衔接。

  4、公共数据授权运营机制的构建路径

  公共数据取之于民,理应用之于民,还数于民。公共数据运营的制度设计应遵循“还数于民”的指导思想。“还数于民”存在狭义和广义两种含义。狭义的“民”是指每一个独立的个体。狭义的“还数于民”是指每个法人和个人都能够获取自己留存在各类公共机构中的数据。广义的“民”是相对于公共机构而言的社会群体,尤其是广大民企。广义的“还数于民”是指公共数据能够合理地被社会利用,让更多的群体受益。广义的“还数于民”有着更广泛的社会意义,它要求将正确的数据内容和数据收益以正确的形式传递给正确的实体。

  4.1公共数据运营相关实体角色分析

  根据不同实体在公共数据运营过程中所发挥的作用,从数据源单位开始,相关实体可以划分为数据提供者、数据开发者、数据协同者、数据使用者、数据运营监管者五种角色,其整体关系如图1所示。

image.png

  (1)数据提供者:负责提供可供运营的数据。以地方数据运营工作为例,直接提供数据的通常是各委办厅局。部分地方建立了由大数据局作为数据统管部门的工作机制,地方大数据局及其下属的地方大数据中心也可以代表政府作为数据提供者。(2)数据开发者:负责对数据进行开发,形成初级产品和最终产品。以地方数据运营工作为例,数据开发者既包括数据运营机构,也包括各个行业细分领域的专项开发商。(3)数据协同者:数据产品需求复杂多样,仅依靠单一的数据提供者所掌握的数据往往是不够的,需要融合多种外部数据。以地方数据运营工作为例,数据协同者包括中央部门、相关地方政府部门、公共企事业单位等多种类型。(4)数据使用者:负责提出数据需求,并通过场内交易或场外交易获得数据产品。以地方数据运营工作为例,数据使用者既包括企业和社团组织等法人实体,也包括社会公众。(5)数据监管者:负责对数据运营的全过程进行监督和管理。以地方数据运营工作为例,最常见的数据监管者是地方大数据局,还有负责管理数据安全监管的网信部门等。在上述五类角色中,数据提供者、数据开发者、数据协同者直接提供了数据资源和与数据相关的劳动投入,帮助形成最终的数据产品,本文将其统称为数据价值贡献者。

  4.2探索统分结合的数据授权模式,将数据权益还给开发者

  根据数据二十条中提出的三权分置模式,参考土地市场和证券市场的模式对现有的授权模式进行进一步优化,采用层级化的管理方式,探索建立一种由批发式授权和零售式授权共同组成的数据授权模式。公共部门拥有数据资源持有权,通过竞争性机制(例如招投标),以批发式授权的形式将数据加工使用权和数据产品经营权整体转移给数据运营机构,或者将全部数据分成几类后分别通过竞争机制选择若干个数据运营机构分别进行批发式授权。数据运营机构开展两类业务:第一类是赋能型业务,即数据运营商对原始数据进行清洗、脱敏等初步加工之后,可通过零售式授权进一步将数据初加工产品授权给针对特定应用场景和细分领域的专项数据开发商。第二类是自营型业务,用于补偿第一类赋能型业务所带来的收入支出缺口,即有充足技术实力和业务知识的数据运营机构可以对部分数据进行深度加工,直接形成面向用户的最终产品。若第一类赋能型业务达到一定规模可以实现盈利,或者通过政府补贴等方式来实现收支平衡,可以考虑缩减第二类自营型业务。

  能够获得批发式授权的数据运营机构的数量可根据各地的实际情况进行设置,初期适度集中便于管理,后期再视运行情况来确定是否调整和增加。获得零售式授权的数据开发商的数量原则上不受限制,特殊领域应引入两家及以上,防止数据垄断。其运行效果如图2所示。在这种模式下,第二层获得零售式授权的专项数据开发商对于细分领域具有更丰富的行业经验,可以弥补第一层数据运营机构的缺陷,第一层获得批发式授权的数据运营机构不能完全把控整个链条,可降低数据管理机构对其的依赖度。

image.png

  数据运营机构和专项数据开发商的选择必须有规可循,关键是把握住首尾两端:建立公平公正的遴选机制,明确数据运营机构和专项数据开发商的准入资格和工作流程;建立能进能出的退出机制,对于评估不合格的机构及时终止授权。

  4.3完善持续滚动的数据源活化机制,将数据内容还给使用者

  授权模式解决的是还数“渠道”,数据源活化之后才能提供可持续的数据“活水”,使得数据开发者能够真正获得数据开发出产品,满足使用者的需求。数据源的活化机制可以分为底线型机制和推动型机制两大类,如图3所示。

image.png

  (1)底线型机制

  底线型机制以数据分类分级管理机制为基础,集中体现为安全边界审查机制和安全应用许可机制。数据分类分级管理机制包括数据分类和数据分级两个方面。数据分类是为了更好地进行数据分级,细化落实安全要求。《网络数据安全管理条例(征求意见稿)》要求将数据分为一般数据、重要数据、核心数据,不同级别的数据采取不同的保护措施。在数据运营工作中,通常会将数据划分为四类、五类乃至更多类别,保护措施的等级和对应的要求将更加细化。

  数据安全边界审查机制是在数据分类分级管理机制的基础上确定可开发数据和可交付数据的安全域范围,把好数据出口关,防止数据泄露。当数据在安全域边界上进行跨域流动的时候,应根据审查机制进行严格审查,阻断不合规的流动。对于小批量的常规化的数据流动的审查可以采用审查软件自动处理,对于大批量数据或涉及敏感数据的审查则需要进行人工处理。

  数据安全应用许可机制是数据在安全域内进行合理流动时所必须遵循的规则条件。根据业务匹配规则,不同的账户和应用可以使用和处理与之匹配的数据,综合运用“可用不可见”的各类隐私计算技术,防止数据滥用。

  (2)推动型机制

  可持续的数据供需对接机制是推动型机制的核心。数据运营机构发布数据目录和数据产品清单,使得开发者和使用者可以了解应该如何申请数据,同时定期或不定期组织数据供需对接的圆桌会议,促进数据需求的转化落地。近年来,随着数据交易平台的蓬勃发展,可以利用数据交易平台来帮助公共数据运营机构发掘潜在的需求,加速供需对接。

  数据登记机制和样本开放机制是推动型机制的基础。结合国家正在统筹谋划的数据要素登记制度,形成面向公共数据产品的登记机制,进一步帮助数据运营机构明晰数据产权以及相关的责权利。结合公共数据开放平台,建立公共数据样本库并进行无条件和有条件开放,使得开发者和使用者能够便捷安全地了解数据和试用数据。

  激励机制和容错机制是推动型机制的加速器。建立数据供给激励机制,鼓励各数据源单位积极提供优质数据,对于贡献突出的单位予以信息化系统绩效考评成绩的支持,对于先进工作个人予以奖励。建立容错免责机制,对于出现偏差失误或者未能实现预期目标,但是符合政策引导方向,决策程序符合法律、法规规定,未牟取私利或者未恶意串通损害公共利益的,对有关单位和个人从轻、减轻或者免予追责。

  4.4建立跨层级跨地域的数据统筹机制,将关联数据还给协同者

  数据统筹问题目前突出地体现在央地数据协同领域。近些年越来越多政务系统采用中央大集中的建设模式,数据由地方部门提供,系统实现统一归集之后地方部门却无法使用。这其中很多都属于数据运营工作中的热点需求数据。地方政府贴近市场了解需求但手头没有数据,中央部门掌握数据但缺乏条件逐一做个性化开发。因此应建立央地数据协同机制,促进中央部门向地方提供数据,地方委托专业开发团队进行开发,形成符合当地市场需求的特色数据产品和服务。根据多个地方数据运营机构的调研反馈结果,部分央地协同的数据需求示例如表1所示。

image.png

  与央地数据协同机制类似,可以进一步建立多样化的数据统筹机制:

  (1)区域数据协同机制。我国正在着力推进区域协调发展,重要城市群建设、流域上下游合作、省际交界地区合作、东西部对口协作等各类业务协同的基础是数据的协同。将数据协同作为区域协调发展工作的重要组成部分,需要数据的地区可以跨区提出数据需求申请,促进持有数据的地区积极提供数据支持。与此同时,某个地区的好经验好做法也可以通过协同机制快速复制推广到其他地区。

  (2)事企数据协同机制。教育、科技、文化、卫生等领域的公共企事业单位持有大量的数据,很多数据都是使用政府预算资金来进行采集生产和加工整理的,具有公共属性,可以作为政府数据的有益补充。建立事企数据协同机制,促进公共企事业单位数据与社会数据的融合利用,充分发挥综合价值。

  (3)数据档案再利用机制。借助数字政府等专项建设工作,建立个人数据档案和法人数据档案,将同一个人和同一法人分散在各个公共部门的数据进行汇集,形成“一人一档”和“一企一档”。个人数据档案和法人数据档案不仅可以提供给政务服务应用,免去个人和法人重复提供信息的繁琐手续,也可以在主体授权允许和保障数据安全的前提下供数据运营机构来调用,满足更多的社会化应用需求。

  4.5构建综合调控的多次分配机制,将数据收益还给贡献者

  按照数据“由市场决定贡献,由贡献决定价值”的总体原则,完善数据价值评估机制,构建由初次分配、二次分配、三次分配组成的收益分配制度,让各阶段的贡献者获得应有的数据收益。初次分配主要通过数据交易来实现数据产品的价值变现。数据产品开发者获得收益之后,将进一步按照市场贡献度支付各种成本费用,包括数据运营机构的数据管理成本和数据协同者的数据开发费用等。二次分配主要通过政府调节的手段来使得数据收益在不同群体之间更加均衡。数据运营机构在初期通常都设置为国资参与,有的是国资控股或国资独资,便于集中进行整体的数据安全管控和费用结算。数据运营机构向财政缴纳经营收益,实现公共数据收益的公共化属性。被征收的数据收益可以进而反哺信息化系统建设和数据治理等工作。三次分配主要通过捐赠和救济等社会化行为来实现。充分发挥行业协会的作用,组织针对于弱势群体的数据权益救助。

  4.6优化协同治理的运营监管机制,确保还数于民安全有序

  建立覆盖数据运营事前事中事后的监管机制,数据运营机构在享受公共数据开发利用权益的同时也应向监管者提供经营行为和合规情况等业务管理数据,接受监管,以确保整项工作安全有序推进。监管机构牵头制定公共数据运营领域的专项管理办法,明确各方的权利和义务。在数据运营工作的筹备阶段,数据运营机构应将组织机构信息、运营业务执行方案和安全保障方案等进行上报和备案。监管者联合数据源单位进行安全审查和业务审查。在数据运营工作的执行阶段,强化数据运营机构的主体管理责任落实。数据运营机构应组建安全合规专家委员会,不仅对于自身的经营行为进行审核检查,还应依托数据管控平台等技术手段对与其进行合作的数据开发者进行数据流审查和业务流审查。同步强化巡查和审计,数据运营机构和数据开发者定期将数据合规审查记录和数据使用记录等提交主管部门,主管部门开展定期或不定期的现场或非现场检查。同步畅通举报投诉渠道,接受社会监督。在数据运营工作开展一段时间之后,可进入总结评估阶段,数据运营机构应进行自我评估,监管者委托第三方开展评估评价。

  5、结论

  “还数于民”是公共数据运营政策设计的出发点和落脚点,让公共数据成为数字经济的燃料和助推剂,惠及广泛的实体。基于“还数于民”的指导思想,全面构建分层分类的数据授权模式、持续滚动的数据源活化机制、跨层级跨地域的数据统筹机制、综合调控的数据收益分配机制、协同治理的数据运营监管机制,促进公共数据运营走入更加可持续发展的良性轨道,充分释放数据的经济红利和社会红利。

↓↓了解更多资讯,请识别下方二维码↓↓

  1701840725(1).jpg

国脉集团

国脉集团是数据资产化先锋企业,主要提供培训、咨询和产品设计服务。为数据资源拥有者提供专业、规范、合规的全流程资产化服务,提升机构数据管理服务能力,实现数据资源价值最大化。运用最先进的培训理念方法和平台工具提供高绩效培训服务。研发“一头一体两翼”企业数据资产化咨询服务方法论,提升数据资产化战略设计、就绪度评估与咨询、入表和产品化全流程咨询服务。基于战略思维和实操需求研发“易”系列产品,并与数源方合作研发系列数据产品。

主要课程

主要课程包括数据资产入表、数据经纪人、公共数据运营和政府CDO、数据精品等精品课程。

数据产品

主要产品:数据易投、数据易贷、数据易保、数据易售。

标签:

责任编辑:chenshanliang
在线客服