近日,中国人民大学大数据统计实验室最新发布的研究认为,2016年国内大数据预计将突破1000亿元市场规模,未来四年将呈爆发性增长,2020大数据市场规模有望突破8000亿元,本土内存数据库将进入新蓝海时代。
国际标准组织大数据专家、柏睿数据科技公司董事长兼CTO刘睿民认为,中国的数据库行业将迎来颠覆性变革,由中国自主研发的核心技术软件也将迎来更多的话语权。2016年我国的内存数据库有望改写由甲骨文雄霸数据库市场的历史,中国的内存数据库市场正迎来新的拐点。
内存数据新蓝海扑面而来
“作为国内内存数据库厂商,我们公司已经收获了若干1000万元级别的大单,主要客户包括国家电网、中国移动、中国联通等。目前,国内的内存数据库行业已经走过了试水期,正在全面打开国内外市场。与去年相比,国内市场需求呈现递增趋势。”刘睿民表示,柏睿在海外市场也将有所突破,将和房利美(美国两房之一)在大数据实时分析领域有深度合作。
有关专家指出,作为一家创业公司,柏睿能够收获1000万元级别的大单,这并不是偶然,这里面有着深刻的时代背景。在大数据时代,人人都想多分一杯羹,未来世界必然是数据时代,谁拥有海量能被处理、分析、使用的数据,才能成为拥有未来数据金矿的人。从大数据中“挖出金矿”,是真正考验核心硬技术的阶段,而这一技术现阶段对全球都是公平的。
中国数据库崛起的主要标志是中国的核心技术获国际话语权。在美国孟菲斯ISO/IECJTC1/SC32“数据管理与交换”分技术委员会2016年全会上,刘睿民代表中国代表团将他拥有的流数据库标准提交的大数据技术提案“SQL对MapReduce及与之相关的流数据处理的支持”,当时该数据库各项指标准完胜美国、德国,获得SC32全会决议通过,即将成为2018国际数据库新国际标准。这是29年来中国首度在国际标准委员会独立提出技术提案并获通过。这充分说明中国技术业已全面突破国际大数据核心技术壁垒实现真正意义上的国产化。
近期,国外爆发了若干网络攻击事件,就是数据库无法处理互联时代海量多渠道并发数据导致的悲剧。刘睿民认为,互联时代数以亿计的智能硬件连接到互联网,其数据量大到惊人,倘若不解决核心技术问题,未来这样的事件,无论在国内还是国外都会频发,所以流数据库就是解决这一问题的关键所在。刘睿民并不担心市场,从订单可以看到,越来越多的企业正深刻认识到海量数据来临时,实时处理数据比仅存储更有意义。
刘睿民创办柏睿前,曾任多家世界级跨国IT公司的大中国区及亚太高管,归国前在硅谷Tandem公司师从图灵奖大神级得主JimGray,共同参与过TandemNonStopSQL/MP的内核编写。Tandem公司的MPP分布式数据库迄今为止依然在欧美的高端市场傲视群雄。因为有一个共同打造新时代世界级数据库的目标,刘睿民把最早期Tandem并行数据库的实现团队成员,也有长期供职于美国HP实验室的顶级系统架构师这些数据库行业的顶级专家整合到了一起。
早在2015年,柏睿数据就已经完成了数千万级的Pre-A融资,领投机构为蓝驰创投,这也是国内顶级基金蓝驰创投在大数据核心技术方向上插下的一个重要旗帜,而之后信中利及浦发硅谷银行的加盟也让公司更加从容应对市场。
中国谁能挑战甲骨文独霸江湖地位
一直以来,甲骨文无疑是计算机单机共享内存时代“皇冠上的明珠”,是核心基础软件中唯一横跨CPU、操作系统的关键性技术。所以甲骨文的成就一直被追随但从未被超越,而现在柏睿数据所创造的分布式流数据库技术植根于互联网时代的产物,它恰恰为解决数据流多并发导致的系统瘫痪问题而生,具备真正互联网的基因,解决了海量数据多渠道来临时数据处理能力的核心问题。
众所周知,传统企业级内存数据库尤其是MPP内存数据仓库由于技术壁垒非常高,市场一直由Oracle、SAPHANA、Teradata这三家国际数据库巨头牢牢把控。国内数据仓库领域,迄今为止还没有一家国产厂商在纯关系型MPP内存数据仓库方向上形成技术突围,此次柏睿数据在技术上的成功突围可谓是中国数据仓库领域的“诺曼底反攻”。
刘睿民早年留学海外,曾加盟惠普实验室主攻海量并行MPP数据库,曾先后参与NonstopSQL/MP、SQL/MX及Neoview的实现。2014年,刘睿民组建团队正式进军大数据MPP内存数据仓库引擎研究,公司拥有世界顶尖级的大数据平台研发团队,并在硅谷、澳洲以及印度设立了研发中心,创新性的推出了面向实时大数据分析领域的高性能分析应用平台RapidsDataPlatform(简称RDP),从功能上可划分为:RapidsHadoop、RapidsDB、RapidsStream,RapidsManager等产品,为行业客户提供了从大数据存储到分析挖掘的完整解决方案。
刘睿民表示,几年前,做技术的人都知道没有一个系统的使用可以绕得开数据库,数据量越多对数据库的依赖越强,而当时国内外的数据库市场被甲骨文数据库垄断,所以说没有系统可以绕开甲骨文的,但是现在,我可以自豪的说甲骨文已经属于过去式。2016年,我们的内存数据库将改写由甲骨文雄霸数据库市场的历史。面对海量数据多渠道并发时代,柏睿的RapidsDB内存数据库突破了传统基于磁盘的数据仓库技术,解决了传统数据仓库难以分析结构化以外数据的难题,并充分利用内存的高性能,通过线性扩展及整合方案为企业带来大幅度显著效益提升。流数据库现在还是非常新的一个东西,所以并没有大范围普及,但一些对技术前瞻性要求的行业如电讯、金融、政府客户已经在开始使用。