当前企业内外产生的数据越来越庞大,多个系统间更加离散存储,如何将数据有效存储、管理和利用,成为企业构建数据生态和实现数字化业务前必须跨过的障碍。企业的需求也催生了此方面的大数据公司出现,大数据公司帮助企业在内部构建内聚性数据管理生态系统,实现企业数据资产化方面,正发挥越来越大的作用。
近期Gartner副总裁兼分析师Donald Feinberg表示:“在迈向数字化业务的过程中,数据管理仍会处在核心地位,而技术成熟正推动数据管理现代化。”10月13日Gartner发布的数据管理技术成熟度曲线*(Hype Cycle for Data Management),揭示了2017年企业数据管理技术成熟现状。
2017年数据管理技术成熟度曲线
众多新技术接近成熟应用
报告中指出,近年来很多新技术不断被纳入技术成熟度曲线,比如数据虚拟化(data virtualization)、数据即服务(data as a service)、机器学习(machine learning)、非关系型数据库(non-relational)等。其中数据虚拟化、数据库即服务将在2内年成熟应用,而企业目前对分布式账本、自助式数据准备等技术期望颇高,技术走向成熟应用需要2到5年;同时企业对数据库加密、内存数据网络、数据集成工具包等技术期望正在恢复,并且这些技术可在2年内成熟应用。
云计算促进数据管理技术成熟应用
云计算(cloud computing)对于数据管理领域所影响力是巨大的。包括分布式数据存储Hadoop和对象存储SQL等云计算技术,也在数据管理领域有广泛应用。但尴尬的是,Gartner认为由于整个Hadoop堆栈的复杂性与可用性,导致许多企业重新考虑是否将其纳入基础架构规划中。因此,Hadoop被认为在到达“生产成熟期”之前已经过时。很多企业目前更青睐便宜、按需定价的云端选项。
另一面向云的对象存储SQL接口已处于“技术萌芽期”,并且将在2内年走向成熟应用。Feinberg认为:“我们预计这些接口代表着云数据库平台即服务(PaaS)的未来,这是因为它们是该领域内大部分云提供商及产品的重心。此类接口可以让各企业机构运用熟悉的SQL语法与云端存储的数据进行互动。对象存储非常适用于存储大量多结构数据,而这正是数据湖(data lake)的典型特征。”
4项技术将带来数据管理变革
在“2017年数据管理技术成熟度曲线”所列的其它35项技术中,有4项被认为具有变革性。
物联网技术核心:事件流处理(Event Stream Processing)
事件流处理是数字化业务、算法业务(algorithmic business)与智能商业运作(intelligent business operation)的主要支持性技术之一。包括分布式的事务流计算平台(DSCPs),可使用并行体系结构来处理高倍率的数据流,以执行例如实时分析和模式识别的任务。目前事件流处理正处在期望膨胀期,这项技术将在2年内成熟。
上千倍扩大数据交易速度:运营性内存计算数据库管理系统(Operational In-Memory DBMS)
内存计算曾被Gartner列为2013年10大战略性技术,内存数据库意味着从内存中运行整个数据库,可将数据交易速度从100倍提升至1000倍。因此面向交易的运营性内存计算数据库管理系统仍有望对商业价值产生重大影响。
但目前支持运营性内存计算数据库管理系统(IMDBMS)技术的基础架构仍然比较昂贵,并且行业未解决如何满足联机交易SLA所需要的高可用性。预计这些问题将在2-5年内解决并走向成熟商用。
确保数据主权:区块链(Blockchain)
区块链先成熟应用的领域是比特币,因为区块链具有的不可篡改、可信任、去中心化存储的特质,使其在数字货币领域率先得到应用。但Gartner认为在数据管理领域,区块链仍然缺乏成熟案例,成熟商用需要5-10年时间。
Gartner的建议是短期内,各企业机构极可能通过共享信息及基础架构而利用分布式账本提高运营效率。长期来看,随着可编程经济的发展和账本促进新生态系统的货币化,整个行业与商业活动将发生彻底变革。
交易可信化:分布式账本(Distributed Ledgers)
2016年Hyperledger项目意图建立一个跨行业、开放标准的开源开发程序库,使商业用户可建立自定义的分布式账本方案。然而目前分布式账本仍无法应用于大规模的关键任务情景,但由于有望改变行业运营模式并克服困扰公共账本的某些可扩展性、风险管理及治理问题,私有分布式账本概念正得到推动。Gartner对这一技术成熟应用也并不乐观,预计分布式账本技术将在5-10年内商用。