《影响中国大数据产业进程100人》柳超:大数据是一种思维方式

2016-05-30 15:05 来源:数邦客
浏览量: 收藏:0 分享

前言:

  大数据是一个事关我国经济社会发展全局的战略性产业,大数据技术为社会经济活动提供决策依据,提高各个领域的运行效率,提升整个社会经济的集约化程度,对于我国经济发展转型具有重要的推动作用!2016年,由中国首席数据官联盟与网加时代网发起并承办,北京大学信息化与信息管理研究中心、中国新一代IT产业推进联盟、数邦客协办的"影响中国大数据产业进程100人"大型人物专访活动全面启动,被采访对象分别来自政府、产、学、研、企各个领域,他们将从不同角度,不同层面向大家阐述当前大数据产业热点、难点、疑点问题,为中国大数据产业健康、持续发展探索经验、保驾护航,敬请关注!

  第四十六期专访人物:中国首席数据官联盟专家组成员,"天眼查"创始人、国家"千人计划"专家 柳超

0IE3_@4L[39MLN2I4]L73IX.png

  柳超,首席数据官联盟专家组成员,国内首款企业信息挖掘系统--"天眼查"创始人、国家千人计划专家、北京市特聘专家、北京航空航天大学"大数据"特聘教授、CCF大数据专家委员会委员、国家下一代互联网产业技术创新联盟专家。曾任搜狗首席科学家,美国微软研究院总部研究经理。

  本期特邀嘉宾中国首席数据官联盟发起人葛涵涛,就大数据融合解决实际问题与柳超先生进行深入探讨。

  葛涵涛:关注到您在创业前是搜狗的首席科学家,已让很多人望尘莫及,又是什么触动您开始大数据创业的?

  柳超:这个可以追溯到我在美国的时候,大概是在2010年到2011年左右,我当时在美国微软研究院,带领数据智能团队。那个时候我带了一个来自于卡内基梅隆大学(计算机排名世界第一的学校)的博士实习生做项目,主要针对美国的Tech crunch,类似于中国的IT桔子。它里面有一个数据库,叫做Crunch base,里面有一些企业、背后主要人和这些人曾经任职的信息。我当时带领这个实习生和其他的合作者做了一个学术项目,就是看我们能不能从背后的关系来预测哪些企业能够得到投资,哪些可以融资成功,会得到投资之后,是谁来投资。我们觉得在社会上很多事情还是人来决定的,所以人是核心。当时我们做了一个纯学术的研究,通过关系来预测,看某些企业是否能得到融资,如果能得到融资是谁来投资的,结果是正向的,在某种情况下预测还是蛮准的。

  当时在美国,主要是做学术研究,也发了几十篇论文,刚发出来的时候,我觉得无所谓,就多了一篇论文而已,但是过了几个月,美国《商业周刊》评论并转载了这篇文章。这个事情对我来说还是蛮惊喜的,觉得在这个方面商业价值非常大。

  那个时候,中国的数据公开还是比较初级的,但当时觉得不能等到所有东西都有了才回国创业。于是,在2012年我就回国加入腾讯。在腾讯,我知道如何做产品,用什么样的理念和态度做产品。"开放"其实就是腾讯给我打下的烙印,开放不是一种态度,而是一种能力。在那里工作的几年,包括去搜狐做首席科学家,从零组建数据科学研究部,学到很多东西,不仅是实操层面,更有在精神层面的。

  回到您的问题,因为当时在美国觉得这件事情是值得做的,只不过当时时机不成熟,恰好在腾讯搜狗学到很多实际的东西。去年,觉得整个时机成熟了,就开始专心做天眼查。由于想的比较清楚,走的弯路也少一些,做产品,不是碰碰撞撞的,要准确定位,谋定而后动。

  天眼查是一个以"让每个人公平地看清这个世界"为使命的大数据产品平台。天眼查以企业查询和商业关系发现为切入点,打造了服务不同人群的天眼查系列产品,包括服务于普通人群的"天眼查-网页版",现日均百万级访问; 服务于精英人士的"天眼查-专业版",以及服务于金融、律师、媒体等有尽职调查需求的专业人士的"天眼查-企业版"已被四大会计事务所购买使用。我们以我们的技术优势同若干垂直领域的领导者进行深度合作,在各自领域变现出更大的商业价值。

  葛涵涛:我想继续追问一下,大数据创业方向有很多,怎么就选择了企业信息查询作为切入点呢?

  柳超:这个市场是巨大的,在中国特色的市场经济蓬勃发展,企业作为主要的经济实体,它的任何信息都有影响,因而这类数据的潜力无限大。又加之,政府对这一块的监管与引导越来越明晰,所以这个市场的潜力是无限的,我相信前景会越来越好。现在关于企业的信息很多,但是分散在不同的地方,工商数据、诉讼数据等。数据的过度分散,形成了一个"信息孤岛"效应。当你要发掘背后的商业利益关系,只能依靠手工制图,时间成本很大。我们做到数据融合,一站式地解决所有的关于企业背景调查的需求。现在市场面临的一个很大的问题是如何把数据产品化,要把数据真正运用到解决问题中去,所以我们选择了企业背景调查这一个具体问题,深耕之后,得到用户和合作合伙的肯定。

  (天眼查关系图谱示例:《欢乐颂》背后的商业关系图谱)

  葛涵涛:我们注意到您的项目主要是基于一些政府公开数据进行的加工,您能给我们分享一下在公开数据使用上的心得么?

  柳超:李克强总理倡导"政府掌握的数据要公开,除依法涉密的之外,数据要尽最大可能地公开。"政府数据公开是大势所趋,因此,大数据行业从概念到市场落地的发展趋势,无疑会使得对于公开数据的价值挖掘大有可为。包括天气数据、GPS数据、金融数据、教育数据、交通数据、能源数据、医疗数据、政府投资数据、农业数据等在内的原始数据本身并没有明显的商业价值,但经过数据整合分析之后,可以产生巨大的商业价值,使得原本价值极低的开放数据作为新的资源,帮助企业进行发展,聚焦新的商业机遇,特别是在开放数据影响较大的保健行业,金融行业,能源行业,教育行业。数据服务公司可以利用开放数据,帮助消费者挖掘数据的潜在价值,为企业和政府提供具有价值的商业数据。企业可以利用开放数据提高生产效率,减少资源浪费,降低决策失误风险。

  但是,机会也意味着挑战。由于公开数据多为非结构化数据,噪音大,挖掘公开数据的价值,相较于私有数据来说,对数据处理技术提出了更高的要求,所以,我认为,对公开数据的挖掘处理,无疑是检验大数据分析技术的最佳试金石。

  葛涵涛:前面您也提到了,这个项目在"关系"挖掘上下了很多的功夫,这是基于什么考虑呢?

  柳超:正如马克思所说,"人是一切社会关系的总和",要理解事物,就要理解关系,大数据的本质就是"连接",数据和关系展现很大的利益就是帮助我们更好的理解事物。再者,现在的数据都是分散的,大家依靠这样的数据来解决问题都是在盲人摸象,看得都不全。某些有劣迹的经营商大概会对数据和关系的展现比较敏感,对那些不诚信经营和弄虚作假的人当然会造成一定的担忧。大数据领域的改革创新,就在于改变原有大数据行业靠拉动需求侧的形式,转而对供给侧进行改革,也就是上述所说的将大数据做成受众广泛、社会化性质更强的产品,天眼查目前所做的就是这样一个人人能用、人人会用的大数据产品。这样的改革,不仅促使数据行业的改革创新,同时也为传统行业的供给侧改革提供了指引,推动传统行业由原本的需求驱动转变为供给侧驱动的发展模式。更重要的是,数据产品化能够帮助传统企业降低成本、防范化解金融风险。

  葛涵涛:可以介绍一下天眼查产品在实际应用领域的案例吗?

  柳超:一家公司上市新三板必须满意一个核心条件,就是此公司必须清除所有的同业竞争,也就是这个公司的实际控制人及与他关系非常紧密的人员不能在这家公司以外有相似或相同业务的公司存在。律师在调查分析这个问题时通常需要耗费大量时间精力,而通过天眼查专业版则能在五秒钟内解决这一问题,只需要输入公司名称、实际控制人,以及法律所要求的和实际控制人关系非常紧密的人名,点击"天眼一下",五秒内即可一目了然该公司及相关人员的关系图谱。

  以公开数据为切入点、以关系为核心的天眼查产品,在帮助传统企业或个人降低成本、防范化解金融风险方面提供了产品化的解决方案。例如,银行或金融担保机构可通过天眼查所提供的信息查询及关系挖掘服务,高效率获取更多更全面可靠的借贷企业的经营状况信息,以确保借贷资金的安全性,同时也为媒体在新闻报道中提供高效、可靠的线索查询渠道,优化信息求证方式。

  葛涵涛:作为一个互联网和大数据领域的老兵,创业过程中也不乏深度思考,那么您是怎么看互联网和大数据的发展的?

  柳超:确实思考了很多。互联网用一句话来定义,它是属于一种连接方式,是人访问信息的一种方式,通过互联网我们可以把人和人连接起来,信息跟人连接起来;大数据,如果我给它定义,它是一种思维方式。互联网和大数据都是由底层的技术进步以及社会进步来驱动的。从技术上来说,有三大驱动力,其实是有三个定律来确定的,第一个,我们最熟知的摩尔定律,每隔18个月会翻一番,这是可计算的;第二个是存储,其实也有一个定律叫奎德定律,大概18个月左右翻一翻;还有一个是尼尔森定律,是说带宽连接方式,大概24个月翻一番,计算、存储和带宽,就是网络连接,这三大驱动力,驱动了互联网,也同时驱动了大数据。所以这两个本源上面都是技术驱动出来的,当然技术驱动带动社会驱动,比如说这些东西需要用,以前用笔记账,现在用电脑记账了,就有了数据挖掘的需求。

  大数据是一种思维方式,并不是因为它是几个G,几个T或几个P来决定的是大数据还是不是大数据,我觉得是以影响力来定义的。一个数据可能非常稀少,但是如果你挖掘得好,做的事情有影响力,那仍然是大数据。所以从这种角度来看,很多领域,可能它的信息化程度还非常低,数据量还非常少,但是对于这种行业,可能一个很简单的分析,或许一个真的懂这个行业的人做一个非常切入痛点的分析,就能解决一个很本质的问题,它的影响是大的。前一段时间,我跟中国残联一个领导谈事的时候,发现一个很小的事情,数据很小,但是解决了很大的问题。残联有很多政策,比如说助听器。一个残疾人装了助听器,在他们信息系统里面留下一条记录,这个记录现在还是比较少的,但是通过简单的数据挖掘,我们就能知道,和这个受惠的残疾人非常类似的残疾人,在这个区域还有多少。后续的,我们是不是把这部分有需求的人发掘出来,这样更好地推动我们残疾人事业的发展。这个数据肯定不大,就一个数据库,几百个MB,但这个影响力你可想而知。在传统领域里面,大数据是一种思维方式,通过看起来的是小数据,但能够解决大问题。

  中国首席数据官联盟(中国CDO精英俱乐部)是国内首个以CDO为核心的公益性联盟,发起人是刘冬冬、鲁四海、葛涵涛。联盟遵循自愿、平等、合作的原则,为推动中国大数据产业创新发展而努力,为实现中国大数据产业全球领先而奋斗。联盟努力打造跨行业、跨领域的大数据精英交流平台,目前已经汇集了数万名来自国内外知名企业、科研机构、高校的大数据精英,已经成为国内最大的以CDO为核心的大数据智库。希望通过我们的努力,推动中国大数据产业的进步与发展,提升CDO(首席数据官)在企业中的地位,促进各行业的大数据应用升级,帮助企业实现以数据为核心竞争力的转型。

标签:

责任编辑:管理员

相关人物

在线客服