一、问题的提出
当前,我国数据要素估值、定价、价格形成和收益分配等机制尚处于初步探索阶段(李雪梅,2024)。2022 年 12 月,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称“数据二十条”)提出“探索数据资产入表新模式”。此后,相关部门贯彻落实党中央和国务院的部署,加快推动数据资产化新规施行。2023 年 8 月,财政部印发《企业数据资源相关会计处理暂行规定》,明确数据资源的确认范围、会计处理标准以及披露要求等,标志着我国企业数据资源会计核算正式进入实践阶段。2023 年 12 月,财政部印发《关于加强数据资产管理的指导意见》,提出“全面识别数据资产价值影响因素,提高数据资产评估总体业务水平”,并有侧重地针对公共数据资产评估作出单独规范要求,强调“开展公共数据资产价值评估时,强化公平、公正、公开和诚实信用”。至此,数据资源或资产核算的顶层设计逐渐完善,相关落地实践工作在全国范围内全面铺开。学界也积极围绕数据估值及相关机制展开研究,但由于数据要素的多样性特征,大部分方案在落地实践方面均面临诸多挑战。而数据资源成本核算是数据估值的重要依据,也是数据要素价格底线的重要参考。因此,开展数据资源成本核算研究,对于完善数据要素估值定价体制机制、推动我国数据资源核算及资产化进程具有重要意义。
从国内实践来看,部分省市、行业已开展符合自身特色的数据资源成本核算方法探索,通过印发实施方案或评价指南的方式,为我国数据要素市场化配置改革奠定了良好的基础,但也引发了现阶段是否需要从政府层面进一步规范引导数据要素成本核算的思考和讨论。基于此,本文旨在从落地实践角度,探讨我国数据资源成本核算机制的现状及面临的挑战,并围绕数据资源成本核算中的政府引导提出相关的建议,以期对完善数据定价机制提供有益参考。
二、数据资源成本核算的理论探讨
数据要素在社会生产经营活动中的价值释放,需要经历多次数据形态的转变。国内外学者提出数据价值链(Data Value Chain)的概念,将数据价值的创造、增值和释放的过程划分为不同的阶段。美国商务部经济分析局(BEA)在其发布的报告中,将数据价值链分为采集、存储、加工、销售和利用 5 个环节。国外学者聚焦数据链式模型的构建(Faroukhi,2020),提出数据生成、获取与预处理、存储、分析、可视化、共享和传输等让数据产生价值的链式步骤。国内学者同样按照数据价值的实现路径,出于不同情景的考量,开展价值链环节的定义。例如,一些学者将该过程细分为数据生成、数据采集、数据存储、数据处理、数据挖掘、数据应用等环节,或精简为数据收集、数据存储和数据分析 3 个环节。另外,中国移动通信集团有限公司结合长期产业实践经验,在数据价值链理论基础上,将数据要素资源化、资产化的具体路径归纳为数据缓冲层、基础数据层、算法融合层、数据应用层、交易交付层的层级结构。
尽管国内外政府部门、学界和产业界在数据价值链阶段划分或数据形态的认知方面有所差异,但数据在价值链中渐进增值的基础逻辑已然较为明确,即通过对原始数据投入劳动、资本、技术等生产要素,以“潜在价值—价值创造—价值增值”的演进路径形成可描述、可使用的数据资源或数据资产。而数据资源的成本核算就是对此路径下相关劳动、资本等活动的总投入进行量化及测算,并评估在核算期重置该过程需要投入的成本。
在具体实践中,数据资源成本核算不可避免将受到参与主体的主观影响,各主体专业背景上的差异使其核算的出发点有所不同。以“数据二十条”为例,其中提出个人数据、公共数据、企业数据,参与数据价值链的主体可为个人、政府部门、企业三类。企业旨在通过企业数据资源的盘点,提升企业生产经营活动的效率,降低未来业务环节的不确定性及运营成本,提高企业整体竞争力,实现企业资产及预期收益的价值倍增。政府部门旨在盘活公共数据资源,改善公共服务效能的同时,构建公共数据市场体系,推动经济增长,形成“数据财政”。个人主体目前主要通过参与政府部门、企业两类主体的数据运营活动,在保障自身隐私的基础上,提升社会生产效率和竞争力,促进创新和发展,最终反哺自身生活生产水平提升或产生直接的收益。在不同出发点下,各类主体对于成本核算方案的设计及实践有所差异,也使现阶段数据资源成本核算难以形成共识,产生以下两个方面的难点。
一方面,间接成本是否应该分摊、如何分摊。数据价值链各环节投入可划分为直接投入和间接投入,两者差异在于是否直接服务于数据资源生产过程。直接投入产生的成本相对较为容易确定,可通过物价或人力相关费用支出进行核算;间接投入则较难量化,需综合考量上游成本向数据价值链下游分摊的合法性及比例。以公共数据采集获取过程为例,一些观点指出,公共数据是公共管理和服务机构在履职中产生、收集的数据,其采集过程作用于相应的公共管理及服务,相关的成本支出已通过税收的方式在一定程度上补偿。因此,在普惠赋能原则下,公共数据采集成本不应向下游分摊。还有一些观点则指出,向下游分摊成本是数据作为生产要素提升上游生产效率的表现。因此,公共数据采集过程产生的成本也可按一定比例由下游补偿,但分摊的比例则有待进一步研究。
另一方面,如何确定合理利润率。数据资源的场景依赖性、可复制性等特征导致数据资源的利润率较难评估。对于公共数据,虽然利润率可通过政府指导的方式确定,但是否需要对不同数据资源类型分类分级确定利润率有待考量;对于企业数据,在当前数据要素市场尚未活跃的背景下,企业通常难以评估数据资源的市场规模及需求,从而无法确定数据资源的销量,致使利润率设定的过程充满不确定性。
总体而言,现阶段成本核算难点主要出于合理兼顾、平衡各类参与主体之间劳动贡献和激励机制的考虑。因此,需要从已有的落地实践中,审视不同主体、不同行业对于数据价值链的考量,以实践深化理论的方式,破解现阶段数据资源成本核算的不确定性,最终讨论政府“有形之手”是否需要在该过程中发挥作用。
三、我国数据资源成本核算机制的实践探索
(一)国家层面
1.《电子商务数据资产评价指标体系》。2019 年6 月,国家市场监督管理总局和国家标准化管理委员会发布的《电子商务数据资产评价指标体系》(以下简称“评价指标体系”),是我国数据资产领域的首个国家标准,为我国电子商务数据资产价值的量化计算和评估评价提供了指导。在成本价值方面,《评价指标体系》将数据资产成本价值分为建设成本(数据规划、数据采集、数据核验、数据标识)、运维成本(数据存储、数据整合、知识发现、数据维护、设备折旧)和管理成本(人力成本、间接成本、服务外包)3 项二级指标和 12 项三级指标,并对每项三级指标项的指标项
目评价因素进行了枚举。整体上,《评价指标体系》为电子商务数据资产的价值评估提供了框架层面的参考,但其中涉及的可量化内容较少,未针对电子商务数据资产核算过程给出具体的公式。
2.《数据资产评估指导意见》。2020 年 1 月,中国资产评估协会(以下简称“中评协”)制定了《资产评估专家指引第 9 号——数据资产评估》(以下简称“专家指引”),以专家建议的形式为数据资产评估提供指引。2022 年,中评协进一步编制《信息技术、大数据、数据资产评估》团体标准。2023 年 9 月,在以上文件的基础上,中评协印发《数据资产评估指导意见》(以下简称“指导意见”),对数据资产评估对象和方法进行了明确。
《专家指引》对数据资产总成本计算方式进行指引,提出通过系统开发委托合同和实际支出计算数据资产总成本,并将总成本划分为建设成本(数据规划、采集获取、数据确认、数据描述等方面的内容)、运维成本(包含数据存储、数据整合、知识发现等评价指标)和管理成本(人力成本、间接成本以及服务外包成本构成)。而《指导意见》则指出,使用成本法评估数据资产时,应当确定数据资产的重置成本,包括前期费用(包括前期规划成本)、直接成本(包括数据从采集至加工形成资产过程中持续投入的成本)、间接成本(直接相关的或者可以进行合理分摊的软硬件采购、基础设施成本及公共管理成本)、机会成本和相关税费等。相较于《专家指引》,《指导意见》在成本核算条目设置方面更加简明扼要,着重考虑了数据成本存在大量间接成本的重要特性,这对于其他地区开展数据成本核算具有重要的指导意义。
总体而言,中评协所构建的数据资产评估体系中的成本核算部分明确了以创建数据资产生命的流程特点为主线,分阶段核算数据资产成本的思路。并且肯定了金融、电信、政府等不同类型的数据资产在关联性、复杂性、高效性、公益性等特征上的差异,其影响了各类成本核算结果。
(二)地方层面
1.福建省:基于公共数据资源的成本核算机制。2023 年 11 月,福建省在全国范围内率先探索公共数据资源成本核算及定价机制,印发《福建省公共数据有偿使用定价策略探索推进方案》(以下简称“方案”),为我国数据资源成本核算、定价提供宝贵的“福建经验”。根据《方案》,福建省公共数据资源成本核算按最低成本核算原则开展,总成本以汇聚共享为界,分为汇聚前成本和汇聚后成本两个部分。汇聚前成本根据建设系统的项目投资金额乘以数据成本评估比例推算得出;汇聚后成本则根据公共数据资源汇聚、治理、运维等各环节的相关项目政府投资金额分摊得出。例如基础平台建设成本、专项治理成本和运维管理成本等。该成本核算机制最大程度体现“降低成本、让利市场、服务社会”的宗旨,对促进公共数据开发利用具有重要意义。
2.贵州省:基于数据产品的开发成本估值机制。2023 年 2 月,在国家发展改革委价格监测中心的指导下,贵州数据所研发上线了全国首个数据产品交易价格计算器。该计算器通过建立估价模型,以数据产品开发成本为基础,综合考量数据成本、数据质量、隐私含量等多重因素,评估计算数据资产价值(潘伟杰,2023)。其中,数据资产价值为数据产品的开发价值乘以数据产品所应用行业的投资回报率、数据产品能够多场景应用的潜能比率得出,数据产品开发价值则由数据获取成本、储存成本、加工成本、维护更新成本及安全成本等计算得出。
贵州省提出的数据产品开发价值测算具有以下两方面的创新:一是引入数据血缘分析技术,通过数据血缘追溯数据产品形成的相关历史成本及相应信息;二是以标准化数据产品和定制化数据产品对数据产品类型进行进一步区分,定制化数据产品无须进行后续的价格计算,其价格计算结果等同于产品价值,标准化数据产品则按照用户选择的具体商业模式及市场规模等进行进一步计算,得出最终价格。整体上,贵州省的数据产品开发价值估算是基于卖方视角下的数据交易定价解决方案,其核心出发点仍是验证交易价格的合理性,为其构建的“报价—估价—议价”定价体系提供基础支撑。
(三)行业层面
1.银行业:《银行业数据资产估值指南》。2024 年3 月,中国银行业协会发布《银行业数据资产估值指南》(以下简称《指南》)团体标准。《指南》由中国光大银行牵头,中国工商银行、中国农业银行、招商银行、上海浦东发展银行等 12 家单位共同参与研究制定,旨在解决商业银行数据资产价值衡量难等问题,为实现商业银行数据资产价值全面量化、提升数据资产精细化管理水平及各类管理决策提供参考。
根据《指南》,银行数据资产估值体系由 4 项一级指标和 18 项二级指标构成。一级指标包括成本价值、经济价值、市场价值和数据内在价值,其中,成本价值进一步划分为规划成本、获取成本、存储成本、加工成本、管理成本、成本价值调整系数 6 项二级指标;数据内在价值进一步划分为数据规模、数据质量、数据应用、数据市场、数据安全 5 项二级指标。
同时,《指南》中对数据资产的估值对象进行了划分,分为原始类(外部获取类和内部采集类)、过程类和应用类(统计支持类和收益提升类)3 项一级分类 4 项二级分类,并强调梳理各估值对象价值来源,分析各类估值方法的适用性,针对不同估值对象采取匹配、合适的估值方法①。例如:成本价值可通过数据资产历史成本、数据资产的合理利润率、重置系数、价格调整系数等参数以成本法计算得出,其中数据资产历史成本为该数据资产达到预定用途的过程中发生的所有成本,包括数据资产的规划成本、获取成本、加工成本、存储成本、管理成本等。
《指南》为商业银行数据资产估值涉及的术语、定义进行了界定,确定了估值的总体原则、对象,并提供了完整的指标体系,以及具体的计算公式、算法示例等,对我国数据资源、数据资产的成本核算提供了重要的指导。
2.互联网行业:单资产价值评估方法。阿里巴巴研究院在《专家指引》的基础上,提出了一套单资产价值的评估理论和方法,将资产价值划分为基础成本价值和阶梯价值。其中,基础成本价值包括两个部分:一个是通过业务定义直接输入的财务发票;另一个则是通过图算法计算的血缘继承成本价值(李冬,2023)。基础成本按《专家指引》提出的成本条目进行逐项核算,血缘成本则按照血缘继承的规则,以图检索算法为基础,基于 Shapely Value 对数据贡献度进行计算(Ghorbani A,2020;Jia R,2019),归一化后得到具体的分摊比例,最后根据不同场景采用数据信息熵及信息熵贡献度(Jia R,2019)、数据贡献条数/ 列数(Ghorbani A,2020)、平均贡献等贡献度计算得到血缘成本(Ghorbani A,2019)。阿里巴巴提出的单资产价值评估方法已在其大数据平台和实际业务数据上进行了实践,方法的创新点在于详细设计了数据资产成本评估的计算过程,特别是为数据血缘成本设计了可落地的测算公式。
四、数据资源成本核算的经验总结与思考
从以上已在落地实践的数据资源成本核算方案来看,我国围绕数据资源成本核算的相关实践探索基本上遵循本文构建的理论公式,即依托数据价值链的全生命周期流程,对数据资源的各类成本条目进行逐项核算,成本汇总后形成数据资源重置成本。虽然由于不同数据资源的来源及加工过程有所不同,各项成本条目历史成本的量化和测算需参考具体的场景,但当前实践中也已呈现出以下的典型经验做法及问题。
1.强调衍生或间接类成本分摊,助力收益分配与激励机制完善。数据资源成本核算隐含了各方主体在后续交易流通过程中所能够参与的合理利益分配。目前已形成上游间接成本应向数据资源生产链下游分摊的共识。以数据采集为例,获取原始数据主要有直接采买、专项开发和内部生产经营活动产生三种方式。其中直接采买、专项开发的投入可作为直接成本进行测算,而内部生产经营活动的投入,则需测算出分摊成本后向下游传递。该共识凸显了数据作为新型生产要素,与其他生产要素协同互补,提升上游资本使用效率,最终促进经济发展的基础逻辑(曾晶和余泳泽,2024),也为构建科学合理的数据要素收益分配与激励机制打下坚实的基础。但现阶段如何准确测算间接成本则是一项难题。福建省提出的数据成本比例具有一定的参考意义,却依赖公共数据资源这一特定的场景,是否在其他行业适用、易用有待更多实践。
2.引入数据血缘解析能力,实现数据增值链追根溯源。数据在价值链中的沿袭、继承体现其不断增值的过程,如何在增值链中准确评估每次增值的贡献同样是保障数据要素收益合理分配的重点问题。从现有实践来看,引入数据血缘分析技术核算数据增值成本已成为趋势。贵州数据所、阿里巴巴研究院等机构提出的数据血缘分析方案具有一定的可操作性及可解释性,尤其是阿里巴巴研究院已在算法层面进行了实证分析,但其方案中提出的三种数据贡献度评估方式(李冬青,2023)是否足以对数据增值过程的投入进行测算,尚缺乏理论层面的探讨。同时,数据血缘分析能力严重依赖数据全生命周期的统筹管理以及强大的信息化基础设施,这对大部分政府部门及部分行业均存在一定的考验。
3.肯定客观资本成本,缓解数据资源归零效应影响。相比于其他较早提出的成本核算方案,中评协、中国银行业协会在最新的文件中以不同形式肯定了数据资源重置成本中可包含的客观资本成本,即合理投资收益或利润。其中,《指导意见》在计量数据资源重置成本中首次提出机会成本的概念,并作为投资收益能力的一种体现(丘开浪,2024)。本文认为将机会成本纳入重置成本能够缓解数据资源成本的归零效应,即在现阶段数据资源呈指数增长的背景下,虽然数字基础设施的固定成本和初次成本很高,但单项数据资源成本将短期内逐渐趋于零(李海舰,2023),从而导致收回成本周期无限延长。因此,机会成本能够一定程度保障数据价值链中各方主体的利益,防止在数据资源归零效应影响下,出现投入成本长期无法回收的问题。但机会成本如何评估、如何设置、是否适用于公共数据资源的成本核算等问题仍有待进一步探讨。
五、完善数据资源成本核算的政策建议
数据资源成本核算是一项自上而下的系统性工程,需各行各业进行进一步实践。考虑到当前数据要素市场规模尚小、数据交易正处于形成期,建议政府按照“适度指导、弹性兼容、创新融合”的原则,对地区数据资源成本核算试点工作进行科学布局,具体而言:
1.对总体原则和指标体系方面进行政府指导。数据资源的成本核算是基于数据资源的重置角度,依据在现有条件下重新形成该数据资源所需的全部费用确定数据资源的成本价值,其核算过程应该是客观的,其核算内容应该是可定性的。因此,建议在地区试点工作的开展过程中,适时印发数据资源成本核算相关的指南或标准,阐明数据资源成本核算的基本原则,明确数据资源的核算指标体系或框架,从顶层设计上对地方核算试点工作开展给予指导。
2.在具体量化测算方面由行业主体自主实践。数据资源种类众多,不同类型的数据资源在数据来源、数据加工等方面均有较大差异,在具体测算、量化的过程中需要分类讨论。因此,在当前数据资源成本核算不成熟的情况下,建议避免过早框定数据资源类型、来源、加工方式等涉及具体测算逻辑方面的内容,应鼓励试点主体对行业数据进行充分归纳和总结,以此找到不同类型数据资源的最优表达,进一步研判是否需要将试点成果转化为政府认可的标准或指南。
3.在最佳实践方面进行政府指导。当前各地在探索实践中已经形成一些创新举措和经验做法,例如:在核算过程中考虑数据之间的血缘关系、对各项成本根据相关指标进行分摊、设置各类成本的数据成本比例、评估重置成本中的机会成本等,这些经验做法对于各地测算工作的开展均具有一定的借鉴意义。因此,建议由政府牵头开展调研工作,吸纳各地的创新举措,精选精要,并向试点主体进行宣讲、指导,以此全面加速、优化数据资源成本核算工作的开展。
↓↓了解更多资讯,请识别下方二维码↓↓
国脉集团是数据资产化专业服务机构,为数据资源拥有者提供专业、规范、合规的全流程数据资产化服务,包括培训、咨询和产品设计等,实现数据资源价值最大化。主要服务于政府数据管理机构、央国企数据运营企业、城市数据运营平台和数据富集型平台企业,打造数据资产网、数据资产研究院和产业专家网络等支撑体系,同时在营商环境与政务领域继续保持领先优势。
主要课程包括数据资产入表、数据经纪人、公共数据运营和政府CDO、数据精品等精品课程。
数据资产化服务:数据资产化战略布局、数据资产入表、数据产品开发及交易等关键任务;
数据要素×项目服务:政策扶持、案例奖项申报、金融支撑和市场变现;
数据产业园区和试验区咨询服务:园区规划、咨询、资源导入和生态体系建设