大数据的出现,会对传统数据库行业产生影响吗?

2018-11-02 15:49 来源:Oracle暨大
浏览量: 收藏:0 分享

  大数据对数据库行业的影响

  现在提到数据库,大家第一个想到的恐怕还是统治数据库行业已达三十年之久的关系型数据库。不过这种情形可能很快就会发生变化。

  向企业数据库发力的众多厂商各自的技术和手段可能有所不同,然而这些厂商都有一个共同点,那就是都聚焦在大数据这一热点之上。

  数据库厂商对大数据的关注是由数据发展的三个特征所决定的:数据量、数据产生的速度和数据的多样性。显然关系型数据库的概念在提出时并不能考虑到数据在今天的发展,因此根据今天数据发展的特点来发展新型数据库就显得有其必要性了。

  有些使用关系型数据库的企业发现随着数据量的增多加快,现有系统处理起来显得越来越力不从心,即便添置更多的服务器也只是延缓所出现的问题而不能根治。当这些企业逐步迁移到Hadoop等大数据平台后立即发现系统的容错性、可用性、稳定性和性能都得到了提升,一些帮助企业进行迁移的工具也让企业应用可以平稳地过渡到新平台。分布式计算的应用、64位寻址空间的使用和网络带宽的升级也直接或间接地促成了数据库技术的进步。

  除了软硬件条件的限制不复存在,更重要的是对数据库的需求也在改变。仅仅十年前互联网中大部分还都只是静态网站,而现在各种web service、在线购物等等已经发展得十分成熟,这些都要求数据库的扩展性必须得到提升。此外企业对于数据的使用也发展到了一个新的阶段。可能从前大部分企业只是记录一下交易数据比如卖了多少货然后生成一下报表,今天有了大数据分析这个工具企业拿数据做的事可就多了去了。

  从前我们的企业要么是没想到要进行数据分析,要么就是用了并不趁手的工具。

  在今天看来Hadoop有些过于重量级了。虽然它其实并不是一个数据库,但它却成为了很多企业进行大数据分析的核心。Hadoop让企业可以轻松地运行分布式并行系统,而且扩展也非常容易。容易扩展这一特性使企业可以以较低的开销进行横向扩展而非较昂贵的纵向扩展。

  关系型数据库一个可能的替代产品是众多的NoSQL数据库。NoSQL数据库中使用最为广泛的是MongoDB,它在数据库流行榜中排名第四。很多NoSQL数据库为了追求速度和性能在一致性上做出了妥协,但对于企业环境而言,数据一致性还是很重要的一点。NoSQL数据库通常也不能使用SQL进行查询,这对于企业中现有系统的集成是一项很大的挑战。尽管NoSQL的扩展型很好,但如果无法与现有系统进行集成那么在企业中的使用进程注定会很缓慢。

  另一个可能的替代产品是NewSQL,它在保持SQL查询接口和ACID特性的同时提供了较好的扩展性,所以未来几年的发展势头不可小觑。比如DeepSQL就采用了和MySQL一样的API和关系模型,因此对于应用程序来说无需任何改动就可以使用。不过DeepSQL自己使用了机器学习的方式来进行数据库的优化,免除了在不同环境中进行数据库优化所需的人力。

  此外Algebraix Data提供了一种全新的看待数据的方式。它在集合理论的基础上经过五年的研发创造出了一种将所有数据转化为数学对象并进行运算的方法,这种方法被他们自己起了一个名字叫做数据代数。据称Algebraix Data可以大幅提升计算的速度和性能。

  这些新技术是否能够适应市场的需求还需要时间来检验,不过在这些替代产品百花齐放的时候传统的数据库厂商也并没有坐以待毙。比如Oracle早在上世纪九十年代就发展出了支持非结构化数据的方法,在2013年发布的Oracle 12c中也加入了对JSON的支持。Oracle认为SQL是供商务分析人员使用的最好工具,他们不必成为程序员就可以从数据库中获得自己需要的信息。市场需要的并不是一个新数据库,而是现有的商业模式发生了改变,市场的大方向仍然是关系型。

  对于这些新的数据库产品来说,缺少云的支持也是一个严重的劣势,想要托管在别家的云服务中还同时与其竞争将是非常困难的。Gartner分析人员Rick Greenwald称新兴的数据库厂商来说其产品并不能满足市场上客户的所有需求,所以恐怕只能让传统数据库大厂降降价或者添加一些新的特性罢了,想改朝换代还早得很。所以现在这些新兴的数据库厂商恐怕没有几家能够避免被收购或者破产的命运。

  新技术的出现并不会成为关系型数据库的终结,因为关系型数据库自身也在不断的演进中,而且数据中总是会有一部分结构化的数据。不过随着物联网和非易失内存技术NVDIMM的发展新的数据库也会占有自己的一席之地。数据库行业的发展如何,就让我们拭目以待吧。

标签:

责任编辑:bozhihua
在线客服