本文为智慧中国年会组委会主任、国家信息中心原主任、国家信息化专家咨询委员会委员高新民在智慧年会上《树立数据发展观,重视数据基础设施建设》主旨演讲实录内容。
一、理解数实融合、数字化转型
不管是哪个行业、企业、政府、单位,所有的数字化转型,指的是所有业务活动网络化、数字化、智能化。网络化解决的是连接问题,很多人认为连接是万物连接,但连接到最后最重要的是数据连接。数据连接之后由数据产生智能,大模型是一种数据产生,尤其工业领域仍然是数据产生的一个主流方向,但在工业企业里,除了大模型还有知识图谱。另外是智能化,也就是科学决策。在工业领域科学决策是大模型增强的工作知识图谱。
所讲这些,本质上是以数据要素优化其他要素的配置和运营,以达到全业务链、全价值链高质量发展的目标。
二、数字基础设施
从功能视角,数字基础设施主要有通信网络基础设施、存储基础设施、算力网络基础设施、数据网络基础设施。新基建提了好多年,目前发展到通讯网络、信息网络为基础的新型基础设施建设,有5G、6G、光纤。存储基础设施,以IDC为主。算力网络基础设施,如东数西算。我认为数字基础设施这3个还不够,还要加1个数据网络基础设施。
要注意数字基础设施和数据基础设施是两件事情,不要混淆,在国际上也是这样认为。
三、数据的重要性
我把数据价值重要性分为数据本身的价值、数据价值化本身的价值和数据在场景趋同下产生的价值三个层次来理解。
1.数据作为基础要素,数据本身的价值;
2.数据与其他业务流程融合产生的价值;
3.数据作为生产要素流通产生价值。数据在流通过程中和业务场景融合也会产生更多的价值。
四、数据面临的问题及解决办法
目前数据面临的问题可主要概括为三类:
一是数据质量不高,有数据不好用。高质量数据成为服务与创新的重要基础,也是提升机构数据价值的前提。然而,数据质量不高的现象依然突出,给数据深入挖掘与高效应用带来困难。
二是数据流通不畅,有数据不能用。数据使用过程中普遍存在“不愿、不敢、不能”共享的问题,导致海量“三异”数据散落在众多机构和信息系统中,形成数据孤岛”,同时流通机制不灵活、不清晰。
三是融合应用不足,有数据不会用。数据来源众多、体量庞大、结构各异、关系复杂。从如此繁杂的海量数据中挖掘高价值、关联性强的高质量数据,需要高效可靠的数据基础设施保障。
以上三个问题限制着我们实现数据价值化。遇到这些问题,我们的出路何在?一是要树立数据发展观;二是要建设数据基础设施。
五、数据要素与传统要素的区别
为什么要树立数据发展观?是因为数据是新型的生产要素,它是跟其他生产要素不一样,有区别,主要体现如下:
一是泛在性。数据无所不在,我们也即将进入一切皆数据、数据即一切的时代。如时空数据开启了元宇宙时代。
二是映射性。数据是物理世界事实的描述和过程的记录,数据主权极度分散、极度不确定,如涉及个人、企业、机构、国家等数据主权。数据通常随映射对象的变化而变更。
三是易变性。数据随时空、场景、应用目的而变化,数据应用于不同地方会产生不同的价值。场景也是,比如身份证,在不同的场景会有不同的价值。
四是赋能性。数据本身价值有限,其增值链表现为DIKW,主要体现在对实体要素配置优化赋能。
五是重用性。流转是为了重用,数据易复制、可重用,其增值量与重用度正相关。
六、数据发展观四要点
由于数据要素不同的特性,要建立有别于其它生产要素的新型发展观,即数据发展观,十分必要。这里概括其四个要点:
一是尊重数据主权。我们现在强调国家数据主权,但数据主权不仅仅是国家有,所有的数据都有,企业有主权、政府有主权、个人有主权。数据主权比数据确权概念更广泛,它是一种持有权、控制权,当然也包括产权、收益权。
二是安全自由流动。即平衡数据安全和自由流动的关系。在安全的前提下自由流动。
三是多元流动机制。建立对不同数据的资源及场景的多元流动机制,包括开放、共享、授权运营再利用。另外就是建立市场化交易机制,市场化交易是很重要的一部分,凡是有条件能交易能确权的,认可这个价值,尽量交易。市场化交易是激动数据流动十分重要的机制,但不宜唯一化。
四是基于对象化的数据基础设施架构。数据对象化,开放共享、分布结构、管理灵活、安全可靠的数据基础设施是数据安全流通和价值化的基础,也是适应数据要素特殊性的出路。数据共享和流动的全流程治理机制,既可以保证数据安全,又为打破数据壁垒、弥合数字鸿沟提供了基础设施支持。
七、数据流通机制多元化,清晰化
数据要素资产化的前提:有边界,可识别,有潜在价值。
数据要素价值实现取决流通,与场景强相关,流通机制依场景而多元化,才是正道。
数据流通机制中,市场化是一重要选项,但不宜成为唯一。更应倡导数据共享(在共同体内)、数据开放,这两者也要明确尊重数据主权原则。
异构、异主、异地(“三异”)数据流通的基础是数据的互操作,然后依场景及规则选择流转机制。
多元流通机制:自用/机密数据、共享数据、开放数据、交易数据,要建立多元化的流程机制。
八、数据基础设施
数据基础设施包括数据互操作基础设施和数据建模基础设施,两者又由技术架构和制度架构支撑。数据互操作是基本要求,共享和交换是有约束条件的:需求、主权、安全。
数据互操作基础设施架构,见下图:
数据互操作基础设施架构主要由两个架构支撑:制度架构和技术架构。目前国际上针对制度架构出现了一个很好的FAIR原则:F是数据可发现;A就是可以访问,可以是授权访问,也可以是交易机制访问;I是互操作,一定协议标准下,进行语义分析;R就是可以重复利用。技术架构主要则是由一个叫做DOA数字对象的架构来支撑。国内,北大已经制定了基于DOA的数据互联网方案,这个方案目前已经在很多场景应用、推广,并在乌镇世界互联网大会得到科技大奖;国际上,就是欧盟推动的基于德国IDS国际数据空间的DOA架构。这两个都属于技术架构,但都基于不同的思路在推动互建。