2015年11月22日上午,大数据专家、阿里巴巴集团副总裁涂子沛在和君下沉庭院会议室为和君商学院学子作了一场题为《解读互联网+:云、大数据和新的商业模式》的演讲。此次演讲属于和君商学2015年24节气小雪讲座系列,深受听众好评。
涂子沛被公认为“中国大数据第一人”,留美经历使他视野开阔、思维先进。他的第一本著作《大数据》开中国社会大数据之先河,引发社会对大数据战略、数据治国和开放数据的讨论。第二本著作《数据之巅》展现美国数据文化形成、数据技术兴起、数据治国理念深入人心的历史,提出当前信息技术的发展已经让中国获得后发优势。
在这次演讲中,涂子沛提出:传统企业和互联网企业最本质的区别就在于数据化。互联网公司之间的竞争说白了就是数据竞争……种种金句俯拾皆是。总之,在涂子沛的眼中,一切都可以变成数据,一切变化都是因为数据。
在国内外互联网领先公司纷纷“进攻”大数据、云计算时,很多传统企业家还摸不清究竟何为“互联网+”、“大数据”、“云”。
起步已晚,来者可追。看完这篇演讲,是否能给企业“互联网+”改造带来启发?
阿里副总裁:涂子沛
以下为整理的深度长文,全文共六大版块:
涂子沛:很高兴今天能和大家分享,来到这里看到这么多同学感到很温暖,同学的眼神完全不一样的,我进来就能识别这种眼神。这让我想起十五年前,和大家一样在周末去参加培训。但有点区别,你们参加的是商业培训,我参加的是在职公共管理培训,因为当时我是一名政府官员。现在我还记得国家招收第一届公共管理硕士,手拿招生通告逐条对比报考条件我都符合,非常激动。今天回头看,我想说是:学习改变命运。后来我如愿以偿去中山大学读在职硕士,三年都是周末上课,没有大家幸福,因为南方没有暖气,冬天教室阴冷无比。我当时从来没有想过去美国,更没有想到会著书立说,就想完成硕士课程,做好一名公共管理者得到晋升。就在这个课堂上,我的人生发生了180°转弯。
这个转折源于一件小事。有一天晚上,一位教授打电话给我,他说:“子沛,我明天需要做一个案例分析,你能配合一下我做个PPT吗?”那门课是公共政策分析,我至今记得PPT是分析美国煤矿政策演变。我说可以。这时是周五晚上11点钟,我用了4个小时做到凌晨。第二天我上台给大家做了一个案例分享,结果给这位教授留下了非常深刻的印象,他对我说:“我觉得你应该去美国。”去美国哪里呢?他帮我选好了,是哈佛大学的肯尼迪政府学院。我从来没有想过去美国,这是我第一次听到。从那以后,教授就不停地告诉我:你应该去美国。我当时一心想着去当处长。后来我慢慢发现他给我提供了一个很大的视角,如果去肯尼迪政府学院,整个人生可能完全不同,因为不知道end day会在哪里。刚开始我不相信自己能去哈佛肯尼迪政府学院,教授一直鼓励我。他告诉我他成功地推荐过两个人去哈佛肯尼迪,然后把这两个人请过来跟我吃饭。吃完饭之后,我就发现他们也没有三头六臂,我应该也可以去,之后我整个人生就开始改变了。记得在美国,有一位老师在课堂上问我:“你为什么来美国?”我脱口而出:“全球化自己。”在那个课堂上,这个教授改变了我整个人生。
课前秀
1、学者非必为商 而商者必为学
我想把这句话送给企业界朋友:“学者非必为商,而商者必为学。”做学问的人不一定要从事商业,但是生意做得好的人一定要研究学问,而且是一辈子都在研究。这句话源自《荀子》中“学者非必为仕,而仕者必为学”,原义是读书人不一定都要做官,但为官者必须坚持学习以不负平生所学。如今面对商学院学子,我将此话稍作改动。
商业的成功不仅仅是凭运气、人脉,一样是凭修为、学养,需要研究问题,把握大势。研究问题的能力不是从天而来,而靠后天的修为。培根有一句话说:“人的天性犹如野生的花草,而后天的教育是不断去剪裁。”学习是一个终身的过程,如果你停止学习,其实你就停止进步。我现在最大的毛病就是行政工作很多,但是我还是要求自己,每天要有学习、思考、总结的时间,要不然就没有进步,也做不了一名好的商人。社会越来越尊重企业家,企业家为社会创造财富、提供就业机会和源源不断的动力,成为一位企业家是件很光荣的事情。
2、“互联网+”是超越互联
“互联网+”是一个很热的话题,有很多解释,最主流的解释是说互联网成为基础设施,它可以加外贸、教育、政府、金融……起初互联网最大的含义就是把机器跟机器互联起来,但今天远远不是。说“……+”的时候,我的一个想法是比它多,在超越它。事实上,互联的历史使命早就完成,我们今天在超越互联。
不管用到什么终端设备都能够连接起来,比如QQ上的消息微信上能收到,这是跨平台、跨设备的互联。阿里巴巴的“钉钉”把短信、微信、电话融会贯通到一起,界面和微信很相似。发一条短信给朋友,钉钉会记录朋友是看了还是没看。他看了之后没有采取行动怎么办?就可以“钉”他一下:把这条短信以电话的形式打到他手机上,接通电话,信息以语音的形式播放出来,确保他听到。这就叫“钉”,而且是免费的。
3、阿里巴巴捍卫了国家数据主权
2015年“双十一”交易额达912亿,创造了1秒钟14万笔成交量,我把它称为“数据之巅”(涂子沛曾出版一本书名叫《数据之巅》),全世界没有任何一个地方可以在一天之内累积这么多数据。马云说阿里巴巴表面上是卖东西,实际是在收集数据。网上传阿里巴巴的数据危及到国家安全。阿里巴巴的数据非但没有危及国家安全,反而是在保卫国家的数据安全。
当年阿里巴巴和eBay、亚马逊“打战”,把它们“打”出去。阿里巴巴占了中国业务的80%,而它们在中国市场的份额越来越少。假设当年阿里巴巴没有打赢它们,是它们占了80%,那接下来会发生什么事情?所有中国的消费数据就会累积在eBay、亚马逊上,最了解中国经济发展动态、中国人消费行为的就是奥巴马,不会是习近平。这些消费数据是笔财富,可以分析国民经济特点。从这个意义上来讲,正是阿里巴巴的努力把它们“赶出”了中国,把这些数据留在了中国,所以阿里巴巴是捍卫了国家数据主权。
数据化
数据化是传统企业和互联网企业的本质区别
“数据之巅”蕴藏了多少财富。如今开放生二胎,到底哪里的人会生二胎,想生二胎,统计部门不一定说得清楚。不仅是中国,全世界都一样,统计部门通过一层层行政渠道来收集数据。经济学说我们都是“利益人”,根据自己的利益来驱动来做事情。官员、数据收集者按照他们的想法上报数据,最终的数据和现实相差很远。但是在阿里巴巴的平台上,我们只要看一下哪个地区尿布的增长波动情况就可得知。不仅尿布,奶粉、婴幼儿用品可以形成立体的数据网络,最终得到的结论非常贴近现实。大数据可不是大,大数据是多源。从多个源头的数据去互相印证一个事实,这是“大”。
1、把消费者行为变成数据
如果没有电商,我们能不能创造数据之巅?上午去百货店买一个东西,下午再去,换了一个售货员不认识你。早上去一个柜台买一根项链,下午去另一个柜台买几盒奶粉,售货员也不认识你。在电商平台上,只要你去过一次,任何一笔交易,不仅仅是买,甚至是点击、浏览了一下,就被记录下来,你再来我就知道。随着消费不断的增多,我们看到你的消费规律,分析你的消费行为,进一步预测你需要什么。电商的数据化是把消费者行为变成数据。
2、科学指导备货
阿里巴巴每年为“双十一”要做很多的准备工作,保证平台上的商家能够成功,比如备货,备多了卖不完,第二天要继续打折;备少了,那这个活动就白举行了,人家下单你没东西给别人。“双十一”办了7年,因为这个原因阿里巴巴滋养了一大批电商网站,很多“双十一”卖不出的商品在这些电商平台上继续卖。如果让百货店卖912亿,1秒钟要完成14万笔交易,先别考虑百货店能不能容纳这么多车,它都不知道每个柜台该备多少货。我们通过一系列的数据化手段帮助商家管理库存:通过客户搜索、点击、浏览、开通预定,让商家分析到底该备多少货;通过查阅前几年的销售、价格弹性,商家把握好库存,这背后是一个数据驱动的过程。
3、准确找到客户
前两天我在飞机上看到的一条新闻《上周全国降温秋裤搜索指数暴增6118.8%》。天气变冷了,今年北京下雪特别早。淘宝上搜索秋裤的人上升了6000多个点,我们可以知道是哪些人在搜索,这些人在哪些地方,这代表商机。搜索皮衣的人也在增加,数据分析表明搜索皮衣的人一般都有汽车,我们把这两个现象结合起来去推送信息,提供个性化服务。
准确找到客户这是最难的。经济生活的本质是满足供和需的关系,供和需的关系都是以信息存在的,找到客户很关键。传统企业每晚把电商的数据扒下来分析哪些东西卖得好,卖了多少,然后马上传给自己的库存。小的电商把大的电商数据扒下来,用这个数据指导自己的库存。因为数据越大,趋势判断就越准确。
传统的企业怎么做营销呢?比如某电脑公司组织promotion event(促销活动),通常群发邮件通知营销活动在什么地点、什么时间,但这些都是已经买过它电脑的客户,或者派几个营销员在附件发传单。现在我们在网上找到最近搜索过电脑但是又没有买电脑的人,然后针对他们去做营销。我们做过实验,用传统方法只能卖1台,用我们这种方法可以卖10台,成交量增长10倍。
电商平台之所以能做这些本质原因在于所有的交易都在平台上变成数据了,当它们变成数据之后,事实上它们重现事件和商业行为。这些行为可以被分析,预测。数据表示的过去,但表达的是未来。所以阿里巴巴提了一句话:“一切业务数据化。”要把所有的业务过程变成数据,在数据上形成一个闭环。不仅仅商业业务,行政管理过程也要变成数据,全部变成数据。整个世界都在迈向数据化,我认为传统企业和互联网企业最本质的区别就在于数据化。如果一个企业把一切业务数据化做好了,那他今天就是一个互联网企业。今天的互联网不是“互联”,而是沉淀数据的战略基础设施。阿里巴巴和传统百货之间只有一点区别,就是阿里巴巴沉淀数据而传统百货没有。
什么是数据
今天所讲的数据可不是传统意义上的数据,此数据非彼数据,数据的内涵发生扩大。如果仅仅听故事不是学习,学习是把握事情的本质。只有把一件事情本质把握清楚了,知道它如何定义,你才深刻理解它。
1、数据的内涵发生扩大
“数据”是对客观世界的测量和记录。传统的数据是测量,比如测量气温把它变成数据。今天的数据爆炸不是测量数据的爆炸,是记录数据的爆炸。现在人们离不开手机,打开手机看微信朋友圈发的信息、图片、文字,这些是数据。所以我们不是离不开手机,事实上是离不开数据。
为什么数据的内涵不断扩大?原因在于另一个词——database(数据库)。这是一个外来词。数据库被发明之后,图片、文档、邮件……都存在数据库里。在西方,所有存在数据库里的东西都统称数据,然后才引起数据在中国内涵扩大,所有可以电子化的东西都可叫做数据。
所有的事情都在数据化,随着手机的普及,人人都有能力把自己的生活、所见所得变成数据。这引起很多社会变化,很多社会现象都可以由这个现象来解释。前段时间中央台某主持人由于在饭桌上不当的言论弄得自己很被动。在他说的时候,有人拿出手机录下来,变成数据,然后很快速地传播出去。其实可以推断以前他也经常这么说,但是没人记录变成数据。所以有段时间大家吃饭都把手机先交出来,才能随便说话。优衣库事件是在试衣间里把正在发生的事情变成数据传播出去。
2、我们走在数据的前沿
2015年双十一平台交易有68%是移动端交易,去年是40%多。美国这个比例远远低于中国,过两天就是美国Thanksgiving Day,就这个星期四,Black Friday是他们的shopping day。Black Friday是美国传统的“双十一”,第一个星期一叫电商打折日,所有的平台这两天加起来都不到中国一半。美国手机下单远远低于中国,而且中国的增速是美国的几倍。所以各位你们赶上了很好的时代,我们今天在数据领域面对的问题实际上是全球性问题,是世界前沿的问题。我们不能指望像十几年前美国在前面最先碰到提供解决方案,我们有一个缓冲。
阿里巴巴的上市代表着全世界开始关注中国,开始倾听中国的声音。马云先生前段时间说世界互联网公司第一梯队是四家公司——谷歌、Facebook、阿里巴巴、腾讯。一切关于数据的交易、伦理、风险、道德、隐私,我们碰到的问题跟他们是一样的。
3、数据的外部性使阿里巴巴变成一家金融公司
数据具有外部性。世界是普遍联系的,辩证法告诉我们,是千丝万缕互相关联的,所以可以从A现象推断B现象,数据不在于大,而在于多源。今天的事实就像个水晶体一样,来自四面八方的数据拼凑一个接近事实的画面。
阿里巴巴每卖一样东西平台上就留下一条数据。在2000年的时候,阿里巴巴累积了很多数据,突然发现这些数据可来做其他事情,比如金融。当时平台上有很多卖家,几百万、上千万卖家需要贷款,但是传统银行不给他们贷款,他们贷不到款或者很难贷到。平台上数据记录他们所有的营销情况,知道他们卖了多少,甚至推断他们赚了多少钱,掌握了他们的资质,知道他们是否稳定和波动情况,所以我们可以给他们发放贷款。贷款如何发放?我们开发100多个数据模型,3分钟填报贷款需求,1秒钟决定给不给他贷款。没有人决定就是算法,这个产品推出的时候叫阿里小贷,已经给100多万商家提供贷款。
阿里巴巴凭借数据的外部性从一个电商公司变成一个金融公司。数据之所以有用是因为数据的作用能够超出其最初收集者的目的。收集数据是为了这个目的,但事实上也可以用到其他维度上去,用到哪些维度上,你想都想不到。我们正在把阿里小贷扩大应用,原来是小微企业平台上的卖家,今天支付宝里都有芝麻信用分。芝麻信用分怎么给的?同样的道理,凭借数据。芝麻信用分好不好用?去租车、住酒店不要押金,因为你的信用分高;在机场可走快速通道,因为你的信用分高;去签证,可能资料不用提交,因为你的信用分高。信用在变成财富。
互联网金融就是把数据变成信用。金融领域的信用正在快速地数据化,今天信用就是数据,数据就是信用,跟人有关的一切的数据都可以变成信用。今天阿里巴巴很想和政府合作,政府有大量关于你的数据,如果我们得到这个数据,比如市民卡的数据,数据作为一个参数返回到我们的算法中来,可以给你的信用打个更精确的分。信用在全面的数据化,阿里小贷是中国互联网金融最早的探索。
Kabbage带来的三点启示
1、数据在资产化
几乎在相同的时刻,美国出现发放贷款的公司Kabbage。小微企业找到它要求贷款,Kabbage要求企业“提交”数据,提供企业ERP、财务、UPS账号。Kabbage登录这家公司财务系统的账号,把财务系统全部扫描一遍,判断能不能贷款;登录企业UPS账号,去查发了多少快递,收了多少快递,如果是皮包公司,一年可能只有几封快递。数据成为参数之后决定这家企业资质如何。
UPS是一家快递公司。它收集数据是为了更好地服务客户,方便客户查询跟踪物流信息,但UPS的数据在发挥新的作用。Kabbage即使拿到公司账号去UPS查数据,需要UPS同意授权甚至收费,这是一种商业行为。Kabbage最后是要付钱给UPS,按次、按月、按年我们不知道,但是可以得出结论:数据在资产化,凭借数据可以收费。
2、未来数据必须经用户授权使用
未来数据的使用都要经过用户授权。不要小看这句话,未来的变化、革命都蕴含在这句话里面。数据是由你而产生的,虽然是商业公司投资来收集这个数据,但是你才是这个数据的主体。今天很多公司都没有得到授权,未来是不是有些公司会不堪其重走不下去?今天是数据红利时代,每个人的数据红利被集中起来然后被消耗,但是大家没有意识到我们具有数据红利。数据是有价值的,是可以变现的,很多公司在做数据收集,经过个人授权,出钱购买个人数据。
杭州有家公司叫挖财,通过资金收集数据。用信用卡的人每一天都会受到信用卡的月结单,通过提供优惠券、打折券的方式收集月结单、消费数据。当它收集的足够多时候,就能看到一张更大的图,提供服务和咨询。比如A、B两家银行,A银行如果知道B银行的信用卡发给哪些群体,就知道自己该锁定哪些群体、商业策略。挖财就可以找到A银行,说你想知道B银行的情况吗?我可以告诉你。同样它也可以找到B银行说相同的话。它还可以为个人提供服务,看了个人银行消费情况,可以分析个人消费存在什么样的问题。
美国也有同样的公司,和挖财一样也不是用现金购买,而是提供每年三次免费查看个人信用报告机会。美国每次查信用报告需要70美元。这其实就是数据在资产化,但是要经过个人授权,这是我们未来5到10年即将会看到的变化。
3、为什么要上云?
这个例子还有第三个启示,就是要上云。企业找传统银行要求贷款,银行会派人去这个公司调查。调查本身就是收集数据,看财务报表、了解企业真实运行情况,最后形成一个数据报告,拿回去给银行决策层。银行决策层根据这个报告决定给不给他贷款。在这个过程当中,因为企业知道银行来调查,又想得到贷款,所以会有意无意提供虚假信息,甚至生造一套账本出来。总之,是“先有需求,后有数据”。
阿里巴巴平台上数据早就已经沉淀,企业的每一笔交易、经营情况都沉淀在平台上,然后企业要求贷款,这是“先有数据,后有需求”,而且这些数据是很客观,很真实的,所以阿里巴巴真正牛的地方就是1秒钟发放贷款。1秒钟发放贷款,传统银行永远办不到,传统银行需要几个星期、几个月、几个季度,很难有几天。更牛的是我们的坏账率远远低于传统银行。
数据都在企业本地,意味着Kabbage不能远程登录,要派人去本地查看数据,不能立刻做决定。如果有两套系统,无法保证看到的数据是真实的数据。这就是为什么要上云。云端可以7*24小时随时查看、整合,而且云是第三方,比如用的是微软的ERP、微软的财务报表、SAP系统,在这些第三方的云端,数据的真实性就解决了。
美国大多企业都在云端,而我们不是。云在中国最早的实践一定程度上也在阿里,最早淘宝门店在阿里上,服务器在自己家里。平时生意不好一台服务器就够了,过节的时候生意变好可能需要两台服务器,但为一年之内仅仅的几天买一台服务器又不合算,所以不愿意再买服务器。生意好的时候生意越做不下去,因为服务器崩溃。因此,阿里开发阿里云,商家租阿里云上的服务器。今天生意好分配两台,明天生意不好分配一台;生意好的时候付两台的钱,生意不好的时候付一台的钱。这样商家的数据就上传到云上了。
无论是中国还是美国,最早的云是为了节约成本产生的,小微企业不想买服务器,想租服务器。今天不仅仅是小微企业在上云,大的企业都在上云。云提供灵活性,数据在云上意味着7*24小时是活的数据,是可以融通的数据。在阿里云的平台上有家卖汽车票的公司叫12308,12305是卖火车票的。这家公司雄心很大,想把全国的汽车票放到一个平台上去卖。原来是在江西用自己的服务器,后来迁到阿里云上,前段时间搬到深圳去了。12308所有的基础架构全在云端,可以灵活搬迁。
上云有很多好处:
(1)数据在第三方,数据背书公众、客观、真实;
(2)数据7*24小时,随时可以被别人使用;
(3)异地可以查阅
互联网金融领域的创新核心就是云和大数据。大数据和云计算是一个硬币的两面,云是硬币背面。互联网金融是以云为基础的。
一切皆成数据
1、产业互联、人体互联将导致更大量级的数据爆炸
今天的数据已经铺天盖地,但还不是真正意义上的大数据。产业互联、人体互联将导致更大量级的数据爆炸。2020年,来自传感器的数据将占全部数据的50%。正在发生人体要联网,机器要联网,就是物联网。发微博、微信一天也许只发几条,智能手环每几秒钟就收集的心跳、体温、各种体能指标源源不断地传到云端。这两种爆炸量级完全不一样,即将要看到的爆炸才是超级爆炸,这种爆炸将把人类带入彻底的数据世界,一切皆成数据。
去年回国我看到一条新闻,一个游子在外打工,打电话回家没有人接电话,他很担心,放下手头的工作风尘仆仆赶回家里,一推开家门发现父亲心脏病突发猝死在地上,母亲瘫痪在床上活活饿死,这是个悲剧。如果智能手环戴在人的身上,最早发现这个人离开世界的是云和大数据。
无人驾驶飞机现在引起很多争议。美国最新的立法把它定义为远程遥控飞机,规定必须有一个人在背后遥控这台飞机。为了叫什么名字美国国会争了很久。无人机的nickname(绰号)叫“大黄蜂”,最早是为了执行军事任务,这个名字推到民用领域大家会警觉是不是侵占隐私。今天的企业家改名“无人驾驶飞机”。美国的军方和科学界认为叫“无人驾驶飞机”很愚蠢,就如汽车刚出现的时候叫“无马车”一样站不住脚,所以坚持叫远程遥控飞机。
阿里巴巴今年4月份的时候用无人驾驶飞机在北京送了一次货,亚马逊也在用无人驾驶飞机送货。用无人机送货噱头大过现实,只是展示这门技术,如果全部采用无人机送货将需要很多台无人机带来很多麻烦。佛山专门设立科室采用无人机收集证据,无人机最大的作用是收集数据。以前农场主用无人飞机航拍农场花费昂贵,现在一架无人飞机只要1000美元,农场主可以每天采集数据,软件自动对比,进行精细管理。电线是跨越高山、田野输送到偏远的地方,中国150万人人力检修电线是否老化需要更换,未来无人机飞行拍照即可。无人机的普及会带来空中数据爆炸,贴地十米飞行收集高精度数据,未来会颠覆Google卫星定位地图服务。
2、阿里面临的问题需要大数据来解决
阿里巴巴不是一家没有问题的公司,只是我们遇到的问题是前人没有碰到的问题,需要用技术手段一个一个去解决。平台就像高速公路,高速公路上有冒牌车,人们都要求关闭高速公路,这样不合适。造假折射的是一个社会问题,不是平台的问题。淘宝上造假、侵犯版权问题,可以开发机器识别图片;商品参加活动原来由小二决定,导致小二腐败,现在用数据分析自动分配决定哪些商品可以参加活动,无人工干预保证公平。
阿里巴巴现在服务3亿多客户,有2000多人在负责接电话提供客服,一天有几十万个电话打进来。未来要服务6-10亿客户,按正比算,需要四五千人接电话。目前很多客户在电话服务过程中会遇到“这不是我负责,我给你转到另外一个部门”的情况,经常需要重复讲述问题。之后,我们可以将语音变成文字,在客户说的时候就判断是什么问题,立刻转到负责人员。客户之前说的话全部转成文档调给负责人员,从而高效解决问题。阿里巴巴解决这些问题都离不开大数据。阿里巴巴不仅仅是电商公司、金融公司,还是家大数据公司,它用技术的手段拓宽商业的边界。
3、个性化是建立在源源不断的数据流之上
加拿大蒙特利尔市在2013年为120万市民提供个性化公共交通票价,每个人的票价都不相同,算法根据系统里累积十几年的数据来决定票价。这就是智能,人力无法完成,有数据的支持毫秒之间就可以完成。今天的商家都在推个性化服务,未来的个性化服务是基于数据流的个性化服务。客户源源不断地产生数据,商家根据数据来分析、预测提供服务。
手淘有3.5亿终端用户,要让每个用户打开手机淘宝看到的商品、新闻不一样,让用户看到的都是感兴趣的事物。人都处于信息过窄的局面,不感兴趣的信息根本不会打开,推行个性化服务之后这个效果要好5-10倍。每天打开手机淘宝的人的数量在不断上升,你越个性化,这个数量越上升。
互联网公司之间的竞争说白了就是数据竞争,首先有没有数据,第二点会不会用数据。如果收集不到数据或者数据断了,商家就不知道客户在想什么,要什么,就没有办法提供个性化服务。
4、新经济是以数据为基础的经济
我们面临的新的态势无论是叫知识经济,还是叫互联网经济、智慧经济,笼统地称为新经济,就是以数据为基础的经济。智能就是把重复性、常规性的、人无法完成的工作用机器去完成,智能的基础是把业务先变成数据,然后机器自动地去处理这些数据,用算法完成工作。没有数据,智能就无从谈起。大数据的标识是迈向智能社会,越来越多的工作会由算法代替,算法源于数据。今天所谈的人脸识别、工业制造4.0核心都是数据。目前阿里巴巴的业务还没有全部变成数据,还需要更加努力。
风雨交加、电闪雷鸣、镁光灯下发生的变化存在电影里,真实生活的变化是无声无息、不知不觉在身边发生的,需要细心去观察。我们有幸生在这样的一个时代,见证技术力量改变世界。原来很多社会资源是不可动、僵化的,互联网把越来愈多的社会资源盘活,产生更大的价值。时间、技能、智能、金钱在互联网的平台上可以自由地交换、整合、流动。这种盘活资源的能力是惊人的。
关于Uber网上有很多段子,有个人提前下班叫了Uber,一上车忐忑不安,再一看发现司机是自己的老板,也提前下班开Uber。几个月前我坐过一次Uber,让我大开眼界。一上车司机喋喋不休和我说话,我没有心思听他说话,因为我正在想出差的事情。对话慢慢变成个性化,司机问我:“涂先生,你知道我为什么来开Uber?”我心里想还能为什么呢?你有时间,有一部车,你想赚点外快。我没做声。他接着说:“我只接阿里巴巴门口的单,你到哪里能找到这样的机会可以和阿里巴巴的高管单独接触1个小时。花钱都买不到,可以跟他成为朋友,向他请教问题。”我一想对啊,确实是这样。所以开Uber的人抱着各种各样的目的。不排除有的司机只接女性的单,为了找到自己的另一半。司机可以选择性接单。人们怀着各种各样的目的在互联网上,亚当斯密的《国富论》曾说过,屠夫之所以卖肉,面包师之所以卖面包,都是为了自利,但是会有外利的效应。我们每天所需要的食物和饮料,不是出自屠夫、酿酒师或面包师的恩惠,而是出自他们利己的考虑。每一个人追求自己的利益,往往使他能比在真正出于本意的情况下更有效地促进社会的利益。自利的行为具有外部性,最后保证社会的资源盘得更活。所以亚当斯密说让市场的归市场,让市场自己调节。
互联网+一方面让经济活动的每一个领域信息变得更加对称,供需关系变得更加对称;另一方面,调动更多的资源,让资源流动产生价值。
开放数据
大数据不是矿藏,而是土壤,开放的数据即为土地上的河流,河流流过之处,就会孕育起发达的数据文明。矿藏、黄金是不可再生的,而土壤是再生的。数据可以重复使用,具有外部性。
去年8月份全球很多地方发生了月全食,无数人拿着手机对着月亮去拍照,苹果手机云当晚就收集到几亿张月全食照片。人们拍照时为了交流、分享和晒朋友圈,苹果公司请天文学家来看,天文学家惊呆了,世界上没有任何一个监测系统有这么强大,在同一个时间,在不同的角度、不同的地点把月亮记录下来,这些数据整合起来就有天文研究价值。
1、有些数据要开放
数据是迈向智能社会的土壤,而智能的基础是一切业务数据化。数据如此重要,要让数据流动起来,所以有些数据要开放。前段时间刷屏欧洲面包店公布不同天气情况下不同的销量特点,中国有些面包店也有数据化管理,但是天气情况数据没有开放,因此无法监测两者之间的关系。开放是天气的数据库放到互联网上,面包店老板下载天气数据和自己销售数据以整合,曲线就出来,很容易发现规律得出哪种面包在不同的天气卖得好还是卖得差,可以根据天气调整不同面包的产量。劳动生产率的竞争基本上走到尽头,今天就知识竞争,比的是知识生产率,发现顾客是数据驱动的。
最应该开放数据的是政府。纳税人供养政府,政府用纳税人的钱收集公共数据。天气、土地、人口、科研论文、实验结果这些公共数据都应该开放。数据开放可以盘活对内开放,《数据之巅》第六章详细地阐述了这个话题。今天谈这个话题不是着重与政治权利的问题,而是强调经济发展的问题。数据成为创新最重要的资源,推动知识经济、互联网经济、数据经济向前发展。
2、隐私怎么办?
大数据是柄双刃剑。保护隐私的核心就是保护自己的数据。数据在成为一种权利,数据成为隐私最大的载体。地下数据链条非常发达,快递员撕下快递单或者拍下来提交给另外的公司,可以得到每张都有2分钱的报酬。过去,我们选择记录什么;现在,我们选择不记录什么。
3、中国文化传统是轻逻辑和轻数据
中国是个差不多的民族,不追求精确,轻逻辑,轻数据,我们的文化传统对数据其实是不重视的。黄仁宇先生曾说:“中国仍然是亿万军民不能在数字上管理”,胡适先生也曾说过,中国最有名的先生是“差不多先生”。中国要在大数据时代的全球竞争中胜出,应该把大数据从科技符号提升成为文化符号,在全社会倡导数据文化和思维。《数据之巅》这本书的使命就是把数据从数字符号变成文化符号。
我的两本书《大数据》、《数据之巅》很多导演想把这本书改编成电影,在这个过程当中慢慢催生了我新的想法——做立足新科技、新知识、数据思维的中英双语自媒体,致力在世界上发出中国科技领域的声音。