通过介绍数据治理标准化国内外的发展情况,分析了《数据治理白皮书》国际标准研究报告的主要技术内容,着重解析了数据治理三维模型,提出了大数据治理标准化需求,明确研究报告对企业应用的价值和行业发展的意义。
关键词:数据治理、模型、国际标准
Abstract:Throughanalyzingthestandardizationofdatagovernanceathomeandabroad,thispaperhasdefinedtheprinciplesandpreparationideasofthedatagovernancestandards.Thepapermakesanattempttohelpthereaderstoexactlyunderstandthestandardaboutthree-dimensionaldatagovernancemodel.Thispaperalsoprospectsstandardizationrequirementoflargedatagovernance.Atlast,thepapermakesclearlythesignificanceofresearchreportfortheenterprisevalueandthedevelopmentoftheindustry.
Keywords:data;governance;model;internationalstandard
1背景
从国家战略“中国制造2025”到近日贵阳大数据交易所成立,以及马云推动的阿里战略:从IT(信息技术)到DT(数据技术)时代,都离不开一个关键词——数据。信息化和移动互联网推动着企业业务的数据化后,随之而来的就是大量数据沉淀,如何从数据中发现、预警问题到用数据解决问题、创新应用数据、创造价值,数据与业务相伴相生。
目前,数据治理及相关标准体系的研究是国内外研究的热点之一。2014年6月,ISO/IECJTC1/SC40(IT治理和IT服务管理分技术委员会)在悉尼召开第一次全会,中国代表团首度提出“数据治理”的概念,引发国际同行的兴趣和研讨。2014年11月,信息技术与标准化http://www.its.cesi.cn 在荷兰召开的SC40/WG1(IT治理工作组)第二次工作组会议上,中国代表提出了《数据治理白皮书》的框架设想,分析了世界上包括国际数据管理协会(DAMA)、数据治理协会(DGI)、国际商业机器公司(IBM)、高德纳咨询公司(Gartner)等组织在内的主流的数据治理方法论、模型,获得国际IT治理工作组专家的一致认可。2015年3月,中国信息技术服务标准(ITSS)数据治理研究小组围绕李克强总理提出的“互联网+”,调研了中国的企业实践,形成了金融、移动通信、央企能源、互联网企业在数据治理方面的典型案例,进一步明确数据治理的定义和范围。随着IT到DT的趋势认同,数据治理研究和应用变得越来越迫切。以此为基础,中国代表团于2015年5月,在巴西圣保罗召开的SC40/WG1第三次工作组会议上,正式提交了《数据治理白皮书》国际标准研究报告,经过讨论和表决,同意由中国国家委员会正式提出新工作项目申请,并作为ISO/IEC38505-2《信息技术IT治理ISO/IEC38505-1在数据管理的应用指南》的编辑。
2研究报告的主要内容
数据成为资产,还成为可以变现交易的资产,但又不同于传统的财务资产,数据的可拷贝、可重用以及数据的搜集、存储、使用都有其特殊性,数据还涉及到个人隐私、运行的安全;而当万物互联时,更需要数据的标准化,便于交换,这就是数据治理要解决的问题。研究和调查表明,数据治理不但与数据标准、数据产生过程的业务规范相关,也影响到IT治理、公司治理、业务策略及决策架构。
图1阐述了数据治理的核心理念。数据是资产,通过服务产生价值,数据治理是在数据产生价值的过程中,治理团队对其的评价、指导、控制,是数据治理的最基本概念。
图1数据治理核心概念
数据治理对于确保数据的准确、适度分享和保护是至关重要的。有效的数据治理计划会通过改进决策、缩减成本、降低风险和提高安全合规等方式将价值回馈于业务,并最终体现为增加收入和利润。国际提案InternationalProposal
中国数据治理特色可以分为三个层面:体制层面、管理对象层面和技术平台层面。
在机制层面,数据治理对依系统、依业务条线的集团总部-分子公司的纵向数据管控推动力、执行力强,效果较好。
在管理对象层面,中国数据治理的实践更符合中国企业特点。强调数据标准建设(数据元素、参考数据),行业性数据标准制定广泛(如:金融、电子政务、公安、税务等),较之谈“主数据管理”,数据标准可覆盖交易数据;强调指标管理。数据标准管理和指标管理在国外数据治理体系中未单独成一部分,而是分别归入主数据管理和业务元数据管理。
在技术平台层面,中国数据治理实践将主数据、数据标准、数据质量、元数据等几部分功能统一形成数据资源管理平台并作定制化开发,一站式数据管理用户体验更好。但由于多为软件开发商按项目方式开发,产品化程度不高,客户投资有一定程度的重复。
中国数据治理不足主要体现在两个方面:方法论层面和技术平台层面。
在方法论层面,跨业务、跨部门、跨系统的横向协同机制不顺畅,治理效果欠佳;在数据治理体系的中层和基层缺乏可操作的数据治理方法和标准,在技术平台层面,身份数据解析、数据标准化、数据匹配、数据语义等主数据、数据质量技术应用不佳,国外产品不能适应中文数据的特点;本地尚未有较成熟的技术和产品。
3数据治理模型解析
数据治理以目标和准则为导向,在明确的目标下,考虑重要的关注域和促成因素,并考虑影响促成因素和关注域的流程和活动,最终形成一个从由底层活动和流程到关注域和组成要素,再到战略的从底层到高层的业务逻辑,如图2所示。
具体实施的方法通常是自顶向下,从数据治理的核心内容顶层战略、组织、驱动因素到关键域、活动与流程,具体体现其标准要求。
图2数据治理的业务导向
研究报告中提出的数据治理模型和框架见图3。图3展示了数据治理的框架和模型,模型由三个框架组成:原则框架(模型顶面)、范围框架(模型正面)、实施和评估框架(模型侧面)。
图3数据治理模型
依据四个原则开展九个关键域的治理,范围框架明确了数据治理的主要工作,定义数据治理的范围和任务,分为三层,最下面为基础层,中间为保障层,上面为应用层。其中,应用层增加了大数据,将大数据作为支撑战略的应用特性加以提炼,并对基础层、保障层产生影响。
该模型明确了数据治理的三个主要方面:数据治理的准则、治理域和实施方法,如图4所示。这三个方面是组织和企业开展数据治理应该重点关注的方面。这也在国际数据治理的实践和研究中逐步形成了共识。准则表明了治理应遵守的准则,治理域展示了关注的内容,实施方法展示了如何实现治理的方法论。
在数据治理实施方面,应考虑两个重要方面:数据治理的实施周期和数据治理的成熟度评估。生命周期展示了依据过程的角度开展治理工作,成熟度评估可以帮助企业了解当前的治理水平,并且指明改进的路径。
图4数据治理要素
4大数据治理时代的需求分析
大数据时代的到来为各行业带来基于数据资产进行业务创新、管理创新的契机以及大数据技术建设需求,面向大数据环境和传统IT环境融合的趋势下,数据治理体系、方法、标准将产生新的思考和实践。
“互联网+”将加速各行业的移动信息化、物联网化,数据市场也迎来蓬勃发展,我们认为数据治理标准化工作未来的主要趋势如下:
数据资产的观念将在治理工作中得到进一步深化,未来数据作为一种服务将通过传递有用的信息为他人提供服务,逐步产生“数据及服务(Dataasa Service,DaaS)”。
大数据治理需求已经出现。大数据治理是广义信息治理的一部分,它制定与大数据的优化、隐私、货币化相关的政策与目标。货币化是将一项资产,如数据转换为钱出售给第三方或使用它来开发新的服务的过程。传统的公司治理模式,并不把企业信息作为一种金融资产列入资产负债表,除非从外部购买的有货币价值的。随着大数据分享、交易的兴起,企业认识到应该把大数据视作有财务价值的企业资产。数据治理和大数据治理有不同的关注点。数据治理是提供数据管理和应用框架、政策和方法,它的目的是为了保证数据的准确性、一致性和可访问性、合规性,而大数据治理更强调发挥数据的应用价值。大数据治理更关注将业务目标映射到数据分析,包括数据分类和数据建模。因此,数据治理是大数据治理的基础。
5数据治理的应用价值和研究意义
数据治理标准定位于组织对数据资产的管控与利用,以帮助提高目前许多企业的数据管理水平。通过企业现状的调研发现,大量冗余数据散落在多个复杂、毫无关联的信息孤岛中。使用数据的业务过程缺少统一的数据框架、一致的数据规范,导致跨部门的合作变得重复和紊乱,并进一步导致风险的显著提升和更为低劣的数据质量。因此,如何制定一个基于价值的数据治理计划,确保董事会和股东可以方便、安全、快速、可靠地利用数据进行决策支持和业务运行,是企业高层面临的挑战。
一是有效的数据治理有助于改善决策能力。企业对可信数据的需求呈螺旋式上升的趋势。数据治理策略和流程建立了必要的框架,用以把数据转化为业务价值。数据治理框架可以帮助企业在数据治理业务规范内更有效地管理数据,比如:为分散于各业务部门的数据提供一致的定义、建立企业数据管理,以及监管数据质量等。数据治理框架也有助于协调不同业务部门的目标和利益,并跨越产品和业务部门提供更为广泛和深入的数据。数据的质量必然会影响到据此作出的决策的质量。
二是有效的数据治理产生高质量的数据,增强数据可信度,降低成本。数据治理要求建立规则和标准以满足企业的业务功能。数据治理活动必须在遵循规则和过程的基础上加以严格执行。有效的数据治理可以产生高质量的数据,更高的数据可信度又会产生与业务目标保持一致、更有洞察力和更为高效的决策。随着重复数据的不断减少,源数据的质量不断提升,企业的数据清理费用会不断缩减;同时,通过在业务部门间推广标准程序,也可实现数据费用的降低。三是有效的数据治理有助于降低风险。如今的国际提案InternationalProposal
企业对数据通常是富有侵略性的。为了开展业务,它们通常会在一些关键领域搜集、分析和使用各种有关客户、产品、业务环境变化等方面的信息,但是意外的数据泄露无疑会对企业的业务产生较大的负面影响。许多企业由于缺乏正确的数据治理策略以及对正确使用数据的了解,导致敏感数据丢失。有效的数据治理可以为数据的访问管理、评估和管控风险、实现合规、明确数据利益相关人、建立决策权分配机制、明晰岗位职责提供全面支持,这必然会有助于保护敏感数据。企业通过对数据进行覆盖整个生命周期的、有效的治理,可以提供更具竞争性的产品,将其快速推向市场,并以较低的风险支持业务目标的实现。
四是有效的数据治理有助于提高合规监管和安全控制。合规监管和安全控制是数据治理的核心领域,关系到数据隐私、存取管理和许可、信息安全控制,以及规范、合同或内部要求的遵守和执行。一方面,数据治理应在业务的法律框架内进行;另一方面,数据治理政策和规则的制定应与政府和行业相关标准相一致。数据管理工作需要整个企业的努力,通过有效的数据治理可以降低因为不遵守法规和规范所带来的风险。在主要业务和跨业务职能间应用数据标准,为合规监管创造了一个统一的处理和分析环境。
6结语
就整体而言,数据治理已引发了激烈的学术兴趣和实践热潮。虽然不同的组织在数据治理方面有不同的侧重领域,甚至存在不一致的理解和解释,我们认为,数据治理是非常重要的,是大数据治理的基础。未来的数据治理标准要融合大数据治理的需求,并将来自不同组织的不同意见整合、汇聚,形成一个符合产业发展需求、业界急需、来源于实践、与国际水平接轨的数据治理标准。