近日,由人民邮电出版社主办的“2017第四届中国国际大数据大会”在北京新世纪日航酒店举办,本届大会以“数据驱动,智能引领——共享数字经济新机遇”为主题,聚焦大数据全产业链创新与发展,务实推进大数据在各行业的落地应用,深化产业交流对接,引导产业与行业的融合合作,助推大数据产业务实健康发展。中国联通研究院大数据研究中心主任魏进武,对于大数据产业、技术发展有着深度的研究,在大会现场发表了主题演讲。
以下为演讲实录
各位来宾下午好,讲三个问题。第一是大数据产业当前发展到什么程度,第二是大数据当前的商业价值挖掘上我认为有一定的局限,第三就是下一代大数据发展的思考。
大数据产业生态圈里面三要素:数据、产品、服务,在这三个要素之间现在明显发展不均衡,价值是从左到右传递,最大的短板是在数据服务上,没有产生直接的商业价值,这是一个最大的短板。现在在这三要素之间发展的比较好的,我认为是产品和数据本身。也就是说当前三个要素之间是重在建设阶段,带动了一批的软件和新型硬件,以及整体的集群式的建设。整个这方面还是数据+需求的驱动远大于直接从客户侧来的刚性的需求,这是当前三要素发展的情况。
可喜的是在2017年,我们看到六方面大的变化。首先是政策驱动上,从国家层面上来看,大数据已经进行了应用时代。第二,各个企业不管是数据的拥有者,还是技术的拥有者,都在加大围绕大数据应用和产品研发。第三,业界对数据的思维和认知在不断的丰富,包括人才培养,包括资本逐利的倾向,还有人工智能热,也推动了大数据向下一代的发展。这是今年能看到的大数据利好的几个要素。
下一步随着物联网热,物联网带动下的整个产业链的发展,让线上线下一体化的方式,为大数据在物联网整个产业链内提供了一个大有可为的可以有很大想象空间的发展空间。这是2017年大数据的整体发展。
从国家宏观层面来看,也在强调整个数据经济的发展。云、大、物、移、智几大要素的综合应用,成为推动整个国家层面,包括围绕地域,以智慧城市为代表,围绕行业以智慧物流、智慧交通垂直行业为代表的新兴产业也在发展。催生了数字经济产业链内外市场需要的拓展,这是我们能看到的几方面。
我们预测2016年大数据产业有这么大的规模,具体数字是多少?只要不少零差不多。2017年也有高速的增长,但是从实际调研下来,这是2014年的数据,预期的投资回报和实际的投资回报差异还是很大的,这是从资本市场来看。
在座有做产业的,有做运营服务的,大数据这个论坛很火那个也很热,真正真金白银拿到手的相对来说很难,这是大的差异。也就是说市场这么大的空间预期,和我们实际的从业者运营的时候。或者是技术服务的收入之间有很大的差异。
这个差异在我看来有这么几个原因,不管是大数据的拥有者还是大数据技术的服务者,之所以能够给我们带来经济收益,可能有两大类的应用,也就是我们能给客户带来这两大类价值。一类是管理类价值,而管理类价值是面向结果的,比如说清晰的可视化宏观的视角,能有效的开展宏观的调控,管理类的应用。这种管理类的应用依托的是什么?依托的是大量的历史性批量数据处理和周期性数据加工能力,这块是存量数据的累计而产生的应用上的效果,突出在思维要素里面,这个突出在一个大的方面。目前90%以上能够挣钱的,能够产生商业空间的是这一类应用,所以这类应用的商业价值已经在很大程度上显现。当然这类大数据价值的市场空间还很大。但是另外一个更大的市场空间,就是大数据真正能给用户产生商业价值,也就是说用户因为用了你的大数据他能额外再挣到钱的应用,是面向过程的一类应用,这里面基本两大类,一类是营销类应用,第二类就是生产调度类应用,给用户带来什么价值?第一带来面向下游,贴近客户,让客户发现,面向上游的,包括物流仓储、配件配送,让生产更有效,生产成本更低,中间环节调度上衔接更紧密,这是能给客户带来的价值。这一类是大数据要面向过程而产生的价值。从大数据上来讲,这类应用产生真正的价值,首先大数据要真正的潜入业务流程当中去,这是第一个。
第二,数据不是大,而是要小、要快,这是最关键的。期待业务的每一步都能通过数据的计算而得来,这两类应用产生价值的话,大数据要突出快和灵。这块是想象的市场空间更大的空间,但是我认为在技术部署和应用模式上,有待探索的空间非常大。可能是下一代大数据的出发点。
我们这代大数据为什么只能产生管理类应用的价值?因为我说大数据全流程只走了半程,当前管理类应用大数据就是始于采集,终于可视化。只能做面向结果的呈现,这样的过程。其中有一大块,分析的应用怎么样反作用到真正的业务流程里面去,这块我认为现在没有做到。而可视化只能解决一个知道的了问题,所以也就是能够给出宏观管理事后知道的效果。
举个例子,大数据最核心的价值是把它当成一个工具,我是开酒店的,我希望我的酒店房子的空置率更低,客户的衔接更紧密,我希望大数据能给我提供这种能力。但是当大数据走到半途的时候,大数据没法儿提供这种能力的时候,大数据要展现大数据存在的价值,所以可视化出来。把大数据比作一个厨子来看,只是把中间的过程表达出来,表现我的厨艺很好,这是一个无奈之举。而真正我们希望大数据产生的是潜入我的主营业务流程里面带来的商业价值,这时候大数据就成了一个隐型的内功了,这时候大数据已经在业务流程里面无所不在,但是单列出来大数据这三个字消失了,我们不会说大数据怎么样,我们只会说它有这样的能力让酒店业开的更合适,这是一个原因。可视化不是大数据的目的,只是当前的一个无奈之举,这是第一个问题。
第二个问题,我们受能力的影响和整个业务流程再造的影响,我们不得不把大数据做的很旁路式,大数据起点在于采集,中间做了大数据的东西,非常大,80多PB,100多PB,1000多PB,按照旁路这一侧的分析结果和正向业务之间是有鸿沟的,现在说的所有的管理类业务大数据都是基于旁路这一侧不断的挖掘价值,我们面向做群体分析挖掘价值。群体分析只能和管理类应用,和事后对于过程的呈现,不适合做面向个体,也就是2C变成精准化营销,对客户一对一关怀的商业型应用。这种旁路式的大数据带来的都是离线式的周期,库内的运算,我们希望穿透正向的业务流程,穿透我的业务直达客户的触点,但事实上是达不到的,这是第二个问题。
如果说大数据发展到今天,发展了三代,第一代玩了一个数据游戏,就是设定一个结果,看一个指标,让大数据来看,发展的程度怎么样。当前我认为是第二代大数据,只是规模比原来更大,数据的异构程度比原来更多,能够分析的能力更强。整个这两类大数据,所有的算力依托都是依托在CPU上,都是基于CPU的通用服务器做依托,实现目前的应用。这样的应用我们也不是因为市场上的刚需而推动的,只是我们的技术,我们的产业推动它发展到了这儿,所以才有这样那样的需求,不管是出于某种程度上考虑的需求。
下一代大数据到底要解决什么问题?核心的一个问题就是要解决发挥大数据最大蓝海商业价值的问题。带来一个问题,大数据可能回归原来的初心,我们没有这样采集的时候,数据本身也是无处不在,只要信息化在发展,数据本身就在。所以下一步数据会发挥它的价值,但大数据的采集本身可能不再重要。
第二,大数据会回归的业务一层成为隐型能力,处理到各个环节去。也就是说我们下一步要做的是智能商业,不再像第一代一样商业智能。也就是说由第二代的IB。
第三,业务开展过程当中每一步的运作都离不开大数据的处理分析,这时候大数据本身作为一个独立的词、独立的产业可能是消失了,只是产业链的一环。
下一代大数据移动互联网的业务,尤其是我们作为运营商来讲,可能有最后面的投资建设,最前端的产品营销与渠道。大数据会整个参与到企业的生产组织里面去,这是一个宏观的,会从后面的投资一直穿到营销。从微观里面,大数据会潜入到我们的计费系统,我们的客户CIM,我们的CIM不再只是管开户流程的CIM,最终实现对可一对一2017中国国际大数据大会——运营商大数据论坛的商业关怀,这是移动互联网。
产业互联网这块可能会贯穿整个产业链,让做B2C的B和I2C的I变得更好,实现整个产业链能力的聚合、业务的聚合、产业链的聚合,让在这产业链里面玩的各个企业能够变得更好,变得什么更好?两方面,让这个产业链企业面向下游的时候可以自由的拓展市场空间,面向上游的时候以很低的成本调度生产,以高效的方式调度供应,这是第二个问题。
如果说下一代大数据要解决这个问题的话,核心的技术要素有这个个大变化。第一,计算和数据可能会分离,第二片外可能会代替库外计算,第三会代替数据离地运算,大数据服务业务流程的时候,数据不再是落地了。从部署上来看,片上运算和存储会潜入到生产各个环节里面去,而旁路式的数据只是起到模型训练的作用,开展以训练结果及时的到业务流程里面去。总结起来,一个是大型的数据库不再重要,第二个,库外的高速计算引擎是关键,第三,数据采集不再重要。真正回归到智能商业。第四是新型的芯片,片上芯片加片上存储,为主路式的大数据提供广阔的空间。这样的话下一代的大数据会带来计算主体由CPU变成芯片,计算的部署形态不再是旁路式的大批量的供大量数据沉淀的部署形态。第三,面向业务的算力的调度会发展各个阶段变化,不再是我们现在这样建设的调度局面。整个这样和下一代云计算,或者是霾计算,或者是雾计算,这种业务线模式结合起来,这是从生产部署上来看。旁路会变瘦,主路会变胖,主路除了正常开展业务之外,要承担大量的在线风险和在线数据落地的运算。
第三就是云、大、物、移、网、智的整合服务,这个会带来互联网+X,X端整体的升级,当X端整体升级了以后,我们的大数据的智能商业这块才有更广泛的空间,为什么?因为X给他提供了更多的利润空间,让他来把自己的产品,或者是自己的服务做的更好。未来我们作为大数据的运营者谁能决胜市场?三要素,第一主营业务流程潜入的深度够不够,第二,你的规模化运营组织能力到不到,第三,算力的部署和调度能力到多大。而这个不再取决于我采集了多少PD的大数据,规模的大小不再是决胜因素。
最后回答面向未来大数据是什么,个大的变化,算力主体的变化是第一个,第二旁路先主路的变化,这个从根本上来讲,算力的变化是最大的驱动力,这时候大数据作为一个智能的词会消失,谢谢大家。