2016年1月20日,2016全球大数据峰会GBDC2016在京举行。本次大会由全球大数据联盟(GBDC)、全球移动游戏联盟(GMGC)、世界O2O组织(WOO)、光合资本主办,中国互联网协会(ISC)O2O工作组、中国汽车流通协会(CADA)支持。期间,阿里巴巴集团阿里数据经济研究中心秘书长&阿里研究院高级专家潘永花,做了主题为《双十一背后的DT力量》的演讲。以下是她的演讲全文:
潘永花:大家上午好。今天非常荣幸受到邀请来和大家分享一下阿里对于DT,对于大数据的观点。今天非常高兴,是因为咱们的大会,刚才包括宋总也一直在讲DT的概念。DT这个概念实际上是阿里巴巴提出来的,是马总一直倡导的,我们认为DT是未来。所以我今天也是借着双十一的案例来跟大家讲一下我们是怎么来理解DT。
从2015年的双十一,大家也都知道,其实像整个的阿里巴巴在我们的零售平台上实现了912亿的销售额,在一天的时间内。而912亿,我们曾经做过一个比较,这个数字实际上比美国感恩节连续五天的销售额还要高。这也就是让我们看到了中国消费的力量,也是我们新经济,尤其在网络零售领域的一个驱动力了。但是在这个数字后面其实是不可忽视的,最关键的其实是,也显示了我们中国互联网公司在技术层面能够支撑这么大的一个场景,这个场景是什么样的呢?就是从全天的交易额来说,其实我们有68%是来自于无线端的。全天的包裹数达到了4.67亿。还有一个数字,实际上这个是非常考验你的计算能力和你的后台数据库的能力的,每秒创建订单的峰值数今年达到了14万笔,去年是8万笔,成交额达到10亿的时间点从去年的3分钟缩短到了今年的1分多钟。
从这个角度来说,我们背后到底是什么样的DT力量来支撑了双十一的大场景呢?从这儿大概总结了五个方面:第一,全球最大规模的混合云的弹性架构。实际上对于我们对于DT理解,我们认为云计算和大数据是硬币的两面是不可分的。像我们平时淘宝平台主要还是在专有云这样一个平台上。双十一极致场景之下,我们其实会把它部分的流量转到了我们公有云的平台之上,也是第一次这么大规模的在实践中用到了混合云的架构。还有就是我们数据中心的异地多活的能力。
还有特别值得强调的,在2015年双十一的环境中我们阿里巴巴研发的关系数据库承载了支付宝8.59万笔的每秒的峰值的交易的能力。而这个其实是在去年的时候我们只用这个承载了我们10%的交易量,而今年是完全用到了这个,也就意味着这个在某种程度能够支撑,也就是金融级别的关系数据库了。我们也支撑单个商家日处理我们4万笔订单。还有像ODPS,这个自主的大数据的引擎,其实在2014年的时候已经显示了它的实力,六个小时能处理到100PB的。
我们回到从IT到DT,我们认为正是IT的出现才成就了双十一的大场景。大家认为这两者差别没那么大,但是认为差异还是非常大的。我们认为DT是信息时代的第二次工业革命,而IT是信息时代的第一次工业革命。第一次工业革命在IT时代最主要解决的还是企业业务的本身的问题,我用来提升我的企业业务的效率,我用来改变企业业务的流程,这其实是数据和IT所起到的一个关键的作用。
到了DT时代,我们认为其实云计算就成为了像工业时代的电这样一个共用的计算设施,也就是在这样的情况下使用计算的能力不再是大企业的专利,越来越多的小企业,越来越多的创业者,可以利用云计算这样的平台,进行数据的创新,也就使得数据能够在这个平台上共享、开放、流动,然后激发新的生产力。这也是DT的一个核心。分享是核心,客户体验至上上核心,小企业是核心,开放透明是核心,然后思想的提升远远高胜于技术的提升,这就是DT的核心理念。
从数据的变化,我们认为在IT的时代更多数据用于查询,用于报表,IT更多的是意味着业务的数据化,但是这些数据到底能不能再产生新的业务呢?实际上在IT时代我们认为这个还是非常不明显的。到了DT时代,其实更多的意味着数据的业务化。数据的业务化也就是说数据其实会成为你创新的业务的一个核心的动力和源泉,成为你的商业价值的核心驱动力。我后面会跟大家分享阿里巴巴的DT化的过程。我们自己也在实践着从业务的数据化到数据的业务化的过程。因为像最初的时候,阿里巴巴本身它的不同业务也是在不同的时间阶段所成立的,也就不同的业务部门也会有不同的数据平台。最初的数据也是分布在不同的业务部门之中,也有数据库孤岛。
但是我们在制定了我们政策之后,在公司层面建立了相对比较统一的数据中间层,把大家共性的数据放在这样一个数据中间层之上,基于这个数据中间层我们就可以延伸出来越来越多的业务。在业务拓展过程之中我们也越来越发现了我们的云计算能力,也可以对外输出。所以也就成就了阿里云平台。在开这个会的时候,我们在上海云栖大会也在如期召开,而且在云栖大会上面我们也发布了我们大数据平台,数+平台,也是为了更多的基于数据的创业,创新的人员、企业,能够更快速的来实现自己的梦想。
我们的大数据体系,也正像我们理解的一样,我们认为核心就是三个方面:存、通、用。就是利用这个平台进行数据的存在。还有像刚才提到的数据中间层平台。用的话是我们可以延伸出来越来越多的新的业务。而在存通用的过程中我们不断完善自己的数据生态,包括数据的安全,包括整个数据的标准,包括整个数据的流程的管理,包括算法的共享,知识的共享等等。这也就是我们的一个生态。这是一个比较简单,比较容易理解的,就是我们的大数据的体系。
正是基于这样的我们的大数据战略,也使得我们基于大数据开始进行很多数据业务化的尝试,这样指的是大数据+金融的典型代表。这个叫蚂蚁小贷,我们也都知道,其实很多传统大的银行由于小微企业,它们的风险会比较大,所以大的银行,第一,它们不太会愿意贷款给这些小微企业。第二,小微企业申请贷款的时间很长的。对于阿里来说,我们有一个优势,就是我们通过我们的电商平台,我们积累了大量的商家的信用体系,基于这样信用的数据,我们构建了自己的信用评估模型。基于这个评估模型我们可以非常快速的对商家提供贷款。像我们平台上的商家,它们所获得贷款的额度都是不高的,基本上都是十万元以下的为主。但是能够非常快速的解决他们的至今流转的问题。也使得这种小微企业能够快速的把自己业务运营起来。在快速审批的同时,由于我们风险管控的模型基于我们的大数据做出来了,所以使得我们坏账率非常低,实际上是低于1%的。而这个坏账率和传统的银行比起来差异还是非常大的。
第二个案例,我们大数据+信用。我不知道在座的各位有没有用芝麻信用。芝麻信用其实是在我们2015年推出的新的业务这个是基于为个人提供的服务,比如像你的芝麻信用分达到一定程度后,可以用这个分去租车,去租房,订酒店,可以免信用卡押金等等,我们其实在拓展越来越多基于大数据出来的个人信用体系,来提供线下越来越多的服务。非常有意思的我在这儿举的,就从2015年8月份和高法的合作,因为高法公布的老赖的信息,实际上是我们通过把老赖的这些信息好发进行合作之后,他们输入到了芝麻信用体系里面,这些老赖的芝麻信用分就受到了很大的影响。
而芝麻信用分就影响了他在阿里平台上购物,影响了他在阿里平台订机票,酒店等等的服务。这就使得这些人主动的去还清了债务,也就帮着高法解决了一些问题。这个实际上是我们菜鸟的一个应用,但是知道其实菜鸟自己本身是没有物流配送人员的,它其实是类似于为商家和物流企业之间提供大数据平台,利用这个大数据平台我们可以帮助,比如在双十一之前,可以使物流企业为很多商家备货的仓库,包括它的运力,都可以提前做一些储备。因为我们大数据平台还有一个方面,比如这儿提到的,在我们双十一的时候,已经体现出来的,就是菜鸟鹰眼。它可以识别出来长时间没有送达的异常件,提醒快递配送,这样就能够降低异常件的比例,这个也是非常有意思的一个应用。还有像电子面单,这个实现其实可以节省大量的,大家做快递单子的成本,同时也能够实现快速的分拣,这其实也是典型的大数据应用。
最后再和大家分享一下,我们的DT是怎么来赋能到阿里系以外的企业。这个举了一个12306和12308的例子。12306大家买火车票普遍也有一些感受,在以前存在一些无法访问的情况,在去年的时候,我们和12306沟通过程中发现,它其实一个最大的问题,在于说查询这个环节,就是查询余票的环节其实是它的一个最大的瓶颈。于是我们把75%的查询余票的流量转到了阿里公有云的平台之上,尤其在过节的时候,所以就帮着12306解决了当时的这样的一个问题。而像12308它实际上是一家创业型的公司,它利用阿里云的平台实现了非常低的创业成本,实现了非常快进行互联网创新的效率,根据之前的统计,利用公有云这个平台可以降低创新创业成本70%,提升创新效率能高达300%。这不仅仅说大数据,也是云计算+大数据这样的DT力量,可以让回家的路不再遥远。
最后我们用马总的一句话结束今天的分享,就是人类正在从IT走向DT,只有让别人成功,你才会成功!谢谢各位。