在经营过程中,数据是金融活动的原始记录,蕴含着资金运动的规律,是业务运行的“晴雨表”。近年来,随着大数据与人工智能技术的发展,大数据技术及其应用的不断创新促进了数据的业务化,从数据中发现问题,找到解决方案,支撑业务创新和决策,数据已经与业务相伴相生。在挖掘银行数据价值的过程中,数据质量起到了决定性的作用,提升数据质量,对数据进行治理,是目前金融机构信息化建设中迫切需要解决的问题。
背景
2018年5月,银保监会颁布《银行业金融机构数据治理指引》(下称《指引》),强调:“从数据治理架构、数据管理、数据质量控制、数据价值实现、监督管理等方面规范银行业金融机构的数据管理活动”。《指引》明确提出要求银行重视数据治理工作、完善数据治理架构,与此同时,监管将加强数据治理的检查力度,将数据治理评价与监管评级挂钩。这是银保监会首次将数据治理提高到银行常规管理的战略高度,将银行数据治理工作常态化、持久化,也标志着我国银行业迈入数据治理的新时代。
数据治理的定义
数据治理这个名词翻译自英文Data Governance,国际数据治理研究所(DGI)给出的定义:数据治理是一个通过一系列信息相关的过程来实现决策权和职责分工的系统,这些过程按照达成共识的模型来执行,该模型描述了谁(Who)能根据什么信息,在什么时间(When)和情况(Where)下,用什么方法(How),采取什么行动(What)。从范围来讲,数据治理涵盖了从前端事务处理系统、后端业务数据库到终端的数据挖掘分析,从源头到终端再回到源头形成一个闭环系统。从目的来讲,数据治理就是要对数据的获取、处理、使用进行监管,而监管的职能主要通过以下五个方面的执行力来保证——发现、监督、控制、沟通、整合,最终目标是提升数据的价值,是企业实现数字战略的基础。
数据治理的意义
有人把企业的数据治理比作图书馆的书架,没有数据治理的企业相当于没有书架的图书馆。金融机构的数据治理是专注于将数据作为自身的商业资产进行应用和管理的一套管理机制,能够消除数据的不一致性,建立规范的数据应用标准,提高自身数据质量,实现数据广泛共享,并能够将数据作为金融机构的宝贵资产应用于业务、管理、战略决策中,发挥数据资产的商业价值。同时,数据治理将帮助金融机构更好地遵从内外部有关数据使用和管理的监管法规,成为信息化时代不可替代的竞争优势。
当前金融数据质量现状
近年来,随着金融领域数字化转型工作的不断推进,业务发展对系统支持及数据要求逐步提升。然而在数据质量标准、取数逻辑规范、数据报送监管等方面面临诸多困扰,其中不乏涉及主观人为或系统客观局限等因素。当前金融数据质量现状问题存在如下:
数据统计标准杂糅
数据质量打折
在数据统计标准上,尚未形成较为一致的统计规则及操作规范,导致在部分数据处理及提取上,存在指标含义不清晰、口径差异、规则不明确等问题,进而影响数据质量,对于数据仓库而言或影响其内部数据存在垃圾数据堆积的问题,使得数据可信度大打折扣。
数据分布零散
渠道之间存在壁垒
金融机构内部业务系统众多,系统内数据纷繁复杂,系统之间数据交互同样层出不穷。在数据尚未形成较为科学化管理之际,数据分布较为零散化,取数口径的一致性待评估,在历史数据的搜集与整合方面,大数据集中化管理同样面临诸多壁垒。
数据治理管理职责不明晰
金融机构涉及数据相关的部门众多,数据管理职责相互穿插并未有效区分,在数据问题的整改方面,数据管理主导部门缺乏高效定位,且在部门之间的协同沟通方面有待进一步加强。
数据治理措施及建议
数据治理难的不是技术,而是流程、协同和管理。大数据平台的建设旨在借助大数据技术支持,对数据获取、整合、应用及管理做到有机统一。数据治理应从源头保障数据质量,采取有效的治理措施,有助于更有效地展示大数据平台对大数据集群中的数据的合理化作用,有助于拓展高质量数据背后所衍生的数据意义及对业务发展的影响。
一是健全数据治理体系。长期存在的数据问题如同连环锁一般,使得进一步挖掘数据的深层次应用时障碍重重。因此,建立数据治理体系成为当务之急,在治理和管理数据中,将涉及组织、制度、人员、流程和技术等方面。
二是厘清数据权责关系。数据权责就是弄清楚谁对数据负责的问题,权责清晰,才能主动剖析和快速响应出现的数据问题,形成全员参与的数据治理文化。
三是数据治理需完善系统建设,提升数据采集机制,为精准营销、智能风控等业务条线的未来发展奠定基础。在规则制定上,需制定全行统一规范的取数规则,加强逻辑校验关系和数据异常波动分析,及时纠正系统取数差错,从根源上提高数据自动采集的准确率。一方面,面向自有客户加强数据的采集,包含客户行为、账户特性及金融服务倾向等,以此实现分析维度的多样化,同时应当从生命周期角度进行数据收集,并在系统中长期留存;另一方面,外部数据对于金融机构而言不虞匮乏,但需构建筛选外部数据如第三方机构的机制等,并在合作基础上加强对数据的自主管控力度。
四是建立全行级数据管控体系和基础规范,建立统一指标数据口径,将各业务系统分散数据往上集中管理,实现数据标准化、消除数据孤岛,以此连通行内全体数据,保障上报数据质量。
五是提高信息安全意识,完善数据安全管理。建立数据安全策略与标准,加强数据安全管理,杜绝客户信息泄露风险。同时,数据安全管理需加强业务连续性管理,强化信息科技风险防控,做好数据备份和应急管理。
业务发展亟需形成成熟的数据管控体系。在数字化转型中碰到的内部数据缺失、外部数据质量低等问题,在一定程度上影响了辅助决策,在数据应用方面,同样亟需摆脱应用场景狭窄,有数不能用、不好用的困局。完善数据治理工作,用数据全面支撑客户体验提升、产品创新及风险管理等应用,数据治理工作是一条业务与技术共荣共生的漫漫长征路。