企业数据湖中数据中台的最佳实践

2019-02-18 18:07 来源:北京神州云联科技有限公司
浏览量: 收藏:0 分享

  从2017年开始,以阿里京东为首的BAT公司热炒数据中台概念,很多做大数据的新老公司跟风推出数据中台建设方案,而很多想搞大数据的企业对数据中台概念比较模糊,不明觉厉,往往以为搭建大数据平台和做数据治理可以替代数据中台的作用,匆匆上马平台后达不到理想的建设目标。本着在这火热的市场中,为了让广大企业在建设过程中不走弯路,帮助大家厘清建设数据中台的思路、提供清晰的建设路径,我为大家详细剖析到底什么是数据中台,与数据平台的区别,以及如何构建数据中台?

image.png

image.png

  这就是数据中台的准确定义:

  数据中台

  数据采集交换、共享融合、组织处理、建模分析、管理治理和服务应用于一体的综合性数据能力平台,在大数据生态中处于承上启下的功能,提供面向数据应用支撑的底座能力。

  数据中台的意义

  数据中台对一个企业的数字化转型和可持续发展起着至关重要的作用。在数据中台蔚然成风之前,各个企业也都在用不同的方式来利用自身拥有的数据挖掘出潜在价值反哺业务。只是在这个过程中,也不得不处理着数据带来的各种问题,比如各个业务系统经年累月以竖井式架构存在而导致数据孤岛、数据不一致、数据整合效率低、数据共享成本高、数据二义性严重等等。因为这些问题实在是过于繁杂,企业开始建立数据团队,或者数据部分开始继续数据整顿工作,因此大数据开发工程师、数据治理工程师、数据建模工程师等一系列的工作职能应运而生。

  “数据中台,为解耦而生!”

  企业建设数据中台的最大意义就是应用与数据解藕!这样企业就可以不受限制地按需构建满足业务需求的数据应用。

  《阿里巴巴中台战略思想与架构实践》这本书更是把用中台战略把这个概念推向了一个极致。中台战略中,人们常说:大中台,小前台。在这种模式下,频繁出现的字眼是:共享。那么,到底共享的是什么?答案便是数据的服务。中台战略,并不是搭建一个数据平台,但是中台的大部分服务都是围绕数据而生,更加巧妙的地方是中台战略让数据在数据平台和业务系统之间形成了一个良性的闭环,也就是我们说的应用与数据之间解藕,并实现紧密交互。

  数据中台的建设阶段

  一般我们认为,数据中台的建设有三个大阶段:

image.png

  1、第一阶段:基础平台建设

  首先,先建设基础数据平台。由于大中型企业 IT 环境内的各个业务系统面向不同的业务场景,采集的数据类型多种多样,结构化、半结构化、非结构化数据存储格式各不相同,因此要解决数据存储问题。数据存储平台、数据仓库、离线计算平台、在线计算平台、流式计算平台等都属于基础数据平台范畴。

  另外,基础数据平台搭建完毕后,要考虑到多种类型数据资源统一管理的问题,那么统一的数据资源管理平台建设也在此阶段完成。

  2、第二阶段:数据共享建设

  在建设完基础平台以后,要打通数据孤岛,要从其他的业务系统、外部数据源中将数据采集到基础平台中,这包含批量上传数据、定期增量数据、实时同步数据多种方式,例如从 Oracle关系型数据库交换到Hadoop 平台中、文本图片文件上传到云存储平台中、APP 生成的数据采集到 Kafka中间件中等。

  信息系统建设发展到一定阶段,数据资源将成为战略资产,而有效的数据治理才是数据资形成的必要条件。在数据流转的过程中,可能会出现来自多个数据源的数据类型不统一、数据分类不统一、数据代码不统一、数据值二义性和数据域冲突等问题,则需要建立大数据治理平台对主数据、元数据、数据质量进行管理、做好数据全生命周期管理的工作。

  在数据运维角度来讲,要数据运维平台来完善大数据中心的管理和监测机制,实时监测运行情况,全方位对大数据平台进行运行维护管理。

  3、第三阶段:数据服务建设

  在最后一个阶段,就是数据服务平台的建设,要为具体数据应用提供统一的数据访问接口,允许开发者快速的、简单的接入并访问服务,有效实现系统间数据交换和互联互通,从而为上层各种数据应用提供统一的服务接口,而这个服务接口是统一的,可以为各种各样不同的应用提供统一的数据访问接口,当这样的个性化应用越来越多之后,各种服务不断组合,就会创造出很多可能性,进而提供创新的个性化体验和新的业务模式,这就是数据服务用于创造业务的阶段。

  那么除了基础的数据访问服务以外,还有需要使用数据进行算法分析,这就需要建设数据挖掘分析平台,主要包括数据预处理、算法模型管理、可视化流程编排、算法模型发布等功能。

  数据中台本身还是围绕向上层应用提供数据服务构建的,下一篇我将为大家介绍《企业数据湖中如何构建AI中台》。

标签:

责任编辑:bozhihua
在线客服