甲骨文:“大数据”不是纸上谈兵,真正会用大数据的公司又有多少?

2016-07-11 14:07 来源:投资中国网
浏览量: 收藏:0 分享

甲骨文,大数据,创业,融资

  在现在创业公司的路演PPT里,如果哪家不提到自家的产品是如何运用大数据的,先不说投资人会鄙视,估计创始人自己都会不好意思。

  从2012年维克托·舍恩伯格写出了《大数据时代》一书开始,大数据热在创业领域已经持续了4年。2015年9月,国务院印发了《促进大数据发展行动纲要》之后,大数据更获得了政策上的支持和鼓励。

  在这期间,有很多创业公司凭借“大数据”的概念拿到了高估值和大额融资,但也有很多公司,他们说的大数据,也只是说说而已。

  而在甲骨文中国政府事物及业务发展部高级总监黄玮看来,大数据在当下中国创业公司里的应用还并未完全展开。

  黄玮认为,大数据的核心有三点:技术、数据和应用场景。其中技术虽然是很多人进入的第一道高门槛,但却是大数据的一个基础,而非核心。核心是数据的使用和应用场景的开发。

  “只要他们对一两个应用场景有一点经验,都能够吸收到很多的风险投资,基本上可以做一个创业型公司了。但是遗憾的是这并没有成为今天大数据应用的一个主流。所以我们就到处都在呼吁,所谓的大数据不能只盯住技术,只盯住工具,应该盯在第三块,通过应用场景反过来推动对于数据到底你要定义什么数据对你是重要的。”黄玮说。

  随后黄玮提了三个大数据的应用场景:风控、征信和机器学习。并列举了大数据在银行、电信运营商和飞机测试等场景中的应用。

  以下为经编辑的黄玮在2016商派互联网+技术创新大会上的演讲:

  我们先从大数据这三个大的核心来往下解释我们是怎么看的。说到大数据,三个内容是它的核心。

  第一,技术。或者说围绕着大数据所有的工具,你手上拿的工具你要干什么。数据来了怎么整合,存储,访问,我们怎么用它,还有可视化。数据是很多,你怎么看它。

  有很多比较直观的说法是,就像一个数据的湖,这个投影有什么东西,水下有什么东西,能不能有工具显示出来,而不是简单的展示一条鱼游过来了,而是有不同的层面的工具,能不能把所有的鱼放在一块展示出来,这就是可视化工具。这有相当高的技术,相当多的公司都在研究。

  作为甲骨文公司,包括很多IT企业从这块起家的,我们赚钱也是在这块技术和工具的变现。但是这远远不是大数据的核心,远远不是大数据的价值所在,它只是一个非常基础的部分。但是它会相当长的时间存在。而且大数据的技术和工具是变化最多的,最没有长期的生命力,基本上你的迭代很快,然后原来的技术很快就被淘汰。

  后两个才是真正的大数据的核心。我们说大规模的变现形成一个产业,形成一个新的经济模式,其实是在互联网化。大数据里的数据是非常关键的,现在我们已经进入到了一个阶段,不缺数据,太多的数据了。这个数据已经是所谓的数据仓库也好,集市也好,还是单位积累的数据也好,还是跟第三方合作大家共享数据也好,甚至你到互联网搜,你就会淹没在数据的海洋里,数据是很多很多的。

  我们说这个地方不是缺数据,而是怎么用,你怎么定义这个数据,我要什么,我要做什么分析,有什么模型。

  现在已经有相当多的IT行业里的领先专家说,咱们信息中心里的CIO和CTO未来随着前面大数据技术和工具越来越多,越来越转向用云的方式来提供服务。这些CIO和CTO是不是会把他的工作重心从关注T逐步的关注到D,成为企业的CDO,企业的主数据官。他来决定企业什么数据是核心数据,是要命的数据;什么数据是我们很要命,可是不能拥有的,我们要跟别人合作;什么业务是可以通过政府或者是互联网免费获得,但是对我们也是很重要的数据的。

  去定义数据策略,企业的首席数据官,也许是未来相当重要的--除了CTO和CIO--新的职位。

  第三,所谓的大数据来了,你来分析要干什么,我们叫应用场景。目前主要做大数据的公司,基本上可以在一和二上讲出一两个故事。只要他们对一两个应用场景有一点经验,都能够吸收到很多的风险投资,可以做一个创业型公司了。

  但是遗憾的是,这并没有成为今天大数据应用的一个主流。所以我们就到处都在呼吁,所谓的大数据不能只盯住技术,只盯住工具,只盯住有多大量上,应该盯在第三块,通过应用场景反过来推动对于数据,到底你要定义什么数据对你是重要的,从哪来。

  再反过来我要数据的话,我需要什么工具,怎么完善,怎么可视它,应该从后面往前面倒退对于数据的抽取,对数据的管理。

  应用场景,我今天只想说三个。

  一个是利用大数据做风控,做预警。有很多IT公司已经开始使用了。很典型的,像半天之内你的信用卡在两个城市出现了刷卡消费,肯定你的信用卡被盗刷了。车也是,两个小时内,像在北京,你如果在四环以内,两个小时同时拍到这辆车出现,肯定有一辆车是套牌。这在技术上是流式处理。

  还有一种要命的例子,就是P2P卷钱跑路了。投资前跟我说回报很高,但在很短的时间内,大概三个月或者是半年之内,突然间它的交易特别短,子公司和母公司之间互相投资,所有权之间很混乱,而且交易非常的频繁,而且你可以发现钱有往外倒的情况,可以预警这家公司在未来的40天内会卷钱跑路。

  这种应用如果倒过来看,全部是属于我们在技术上叫流式处理,这是第一种应用场景。

  第二种是大家都在讲的征信,但目前没有看到特别好的例子。到底要什么数据来征信,怎么评价这个人授信额度是高的,征信是各种行业内的分析应用。目前这个业务是非常热,很多公司说帮你做,这是需要相当深的行业了解,专家型的人才非常缺,通过分析结果反过来优化业务流程。这种人才也非常稀缺。人的因素直接影响到大数据的成功和失败。

  第三种,就是所谓的机器自我学习。目前在讨论阶段,有一两个城市的经验,怎么样利用人工智能技术跟机器自学习的手段,帮助我们前面说的模型逐步逐步的优化。这个东西相信发展的前景会非常广,发展的时间会非常长。

  我们看看这些行业怎么用,我举三个例子。

第一,银行的例子。银行对大数据的使用,探索也好,适用和最后的应用是非常早的。银行碰到这种,要防范风险,要贷款,压力特别大。它的典型应用场景,我要定义存款,怎么定价才能挣钱;包括风险评估,信用高了,不要有抵押。这是有很具体的要求,很具体的业务场景的定义。

第二,电信运营商的例子。这是非常简单的,很初步的机器自学习的实用型的案例。因为它要做精准的营销,打过去的电话找到的人就是他要找的人。刚开始的时候,这个分析模型是运营商自己定的,我认为电话号段在哪个哪个,每个月的电话费在800块以上,同时有国际漫游的记录等等,然后让他们上三G的包,月费的包。当时出来的时候,这个模型的精准的比例,达到对的3%。通过自我学习积累的时间,大概积累了两三个月的时间,精准营销的准确度提升到了10。

第三,飞机的测试。飞机出来以后要做测试,飞机的一个测试周期是很长的,基本上10个月的时间。大量的数据出现了,各种电的,包括跑道的,速度的,飞机升起来的机头的角度,下降的机头的角度,灯光,耳机,通过这个阶段测试你的问题。你飞了几年之后会不会出问题,得要做测试,预测未来两个月以后要换了,或者是三年以后要换了。这都要在生产完了以后,测试的时候得到。

标签:

责任编辑:admin
在线客服