《影响中国大数据产业进程100人》马晓东:如何解决大数据释放大价值的最后一公里

2016-04-29 16:04 来源:首席数据官联盟
浏览量: 收藏:0 分享

前言:

  大数据是一个事关我国经济社会发展全局的战略性产业,大数据技术为社会经济活动提供决策依据,提高各个领域的运行效率,提升整个社会经济的集约化程度,对于我国经济发展转型具有重要的推动作用!2016年,由中国首席数据官联盟与网加时代网发起并承办,北京大学信息化与信息管理研究中心、中国新一代IT产业推进联盟、数邦客协办的"影响中国大数据产业进程100人"大型人物专访活动全面启动,被采访对象分别来自政府、产、学、研、企各个领域,他们将从不同角度,不同层面向大家阐述当前大数据产业热点、难点、疑点问题,为中国大数据产业健康、持续发展探索经验、保驾护航,敬请关注!

第三十二期专访人物:中国首席数据官联盟专家组成员,国云数据集团创始人 马晓东

blob.png

  马晓东,中国首席数据官联盟专家组成员,国云数据集团创始人马晓东,北京信息化协会副理事长,国家经济大数据联合实验室副理事长。

  本期特邀嘉宾中国首席数据官联盟发起人刘冬冬,就大数据可视化分析向马晓东先生发起提问。

  刘冬冬:可视化带来的价值有哪些?

  马晓东:数据可视化是利用视觉的方式将巨大的、复杂的、枯燥的、潜逻辑的数据展现出来,使用户发现关联规律,继而进行深度挖掘。数据可视化是大数据领域所有价值的终极呈现,也是业务人员能够参与到大数据分析发挥其主观能动性的桥梁。可视化可以促进业务部门和技术部门的紧密协助,提高运营效率。

  举个例子来说,如果给您历史上300年的飓风发生的时间、运行的位置、强度等详细记录,我相信您看数据很难从中得出什么结论。如果我们将这些数据灌入一个可视化平台,通过运动图展示,就能快速发现飓风的发生轨迹,就能看出"赤道无风,所有飓风都是从东向西"的结论。可视化实际上是把一堆杂乱无章的数据变成了得出结论的知识。

  再比如在营销领域,可视化工具可以把消费者大数据代表的"小世界"缩微化,使这个"小世界"能够作为一个整体展现在营销人员的面前,让营销人员从鸟瞰的角度,看到数据之间的自然分布状态,看到关于某个话题消费者不同的想法,以及这些想法背后的相关关系。这个缩微的消费者表达世界,可以让营销人员清晰看到整体消费者的状态,正在出现的趋势,弥补因为"盲人摸象"造成的认知局限。显微镜的出现发现了微生物世界充满的生命力和活力,互联网则像镜子一样把消费者表达的数据投射出来,可视化的工具则把投射在互联网上的消费者表达数据背后代表的影响消费者选择的"影响力"形象的展现出来,帮助营销人员更好的理解市场,理解消费者,发现潜在的市场机会点,同时更好的从营销角度提出策略假设,辅之以其他方法验证这些策略。

  在大数据的产业链条中,可视化是释放大数据价值的最后一公里。机器可以进行前期的分析和运算,辅助决策,而目前来看真正决策是由人来做,所以只有让人看懂了,机器分析和运算才有价值,可视化恰恰就是让人能很方便地看懂数据。

  刘冬冬:大数据环境下可视化面临哪些挑战?

  马晓东:对于大数据的存储、管理和处理任务离不开云计算,而与人交互离不开数据可视化。数据可视化不仅能够帮助数据的最终呈现,也对发现数据中新的信息气到了非常关键的作用。大数据以其大而庞杂的特点带给了数据可视化更大的挑战,这意味着数据在获取、分析、过滤、挖掘、表述、修饰、交互,都需要有所创新。

  超大规模数据可视分析中用户界面与交互设计的前沿挑战:人机交互在许多计算机科学领域的发展中一直是个需要重点解决的问题。可视化分析也不例外。数据量的显著增长不可避免地使得原有的问题更加复杂。以人为中心的用户界面与交互设计面临的挑战是复杂和多层次的,并且在不同领域都有交叠。

  在以往的数据可视化应用中,想要充分利用数据的复杂性来提供有意义的数据呈现方案,需对统计学、数据挖掘、图形化设计及信息可视化多个学科领域有足够的了解。在大数据时代,需要进行可视化数据应用的人群迅速扩大,需要新的、更加智能的数据可视化工具的出现,为更大范围的用户提供通过可视化接触大数据的机会。不同的用户需求必然导致可视化工具的发展,以往单依赖特定领域的过分分散复杂的的可视化工具逐步开始派生发展到跨专业的功能集成的可视化工具。新的可视化工具需要提供了一种快捷方式,仿佛是一个黑箱,允许非技术用户在不必学习如何使用复杂模型和多媒体软件的情况下,能够对一学科或多学科进行数据的可视化呈现。国云数据的魔镜就是这样的产品。

  大数据给数据可视化带来了挑战,同时也是数据可视化新的突破点。由于缺少低廉的资源库、开发框架和工具,基于高新能计算的可视分析应用的快速研发收到了严重的阻碍。而数据可视化的发展趋势又要求最终能做成一个黑箱,允许非技术用户在不必学习如何使用复杂模型和多媒体软件的情况下,能够对一学科或多学科进行数据的可视化呈现。要做到在大量数据情况下,精确的对可视化数据进行展示,包括对地理信息、工业流程复杂场景的可视化显示,一直是我们奋斗的目标。

  刘冬冬:大前面您讲到了大数据如何实现价值的呈现,进行人机交互,以及面临的挑战,那能不能举个例子讲一下如何通过大数据平台挖掘大数据价值?

  马晓东:好的,我讲一个乳业大数据的案例吧。乳业大数据平台是国内第一个行业性的大数据品台,在乳制品行业中,有很多信息是不透明的。 数据源分散,无法整合。国家统计局做的是采样数据。我们做的是将这些数据进行整合,打通数据孤岛。

  整个乳制品行业,由于数据分散,政府无法对整个乳业进行宏观把控;对于企业,也无法获取整个行业的数据,做日常的运营决策; 对于个人消费者,更不能了解乳制品行业的的精准数据。目前大家都在关注国外的乳制品,其实中国有些乳制品质量比国外的好很多,但因为数据信息的隔离,导致信息的闭塞。

  我们在做这个项目的时候,以数据工具运营思路,整合市面上乳制品数据源,包括企业、政府、行业协会的数据。从底层设计、乳制品行业的汇集和采集、乳制品行业指标库的梳理,到系统平台的运用再到乳制品行业的发布,打造了一个全流程的大数据平台。通过过个平台,让行业专家对乳制品行业日常运营进行分析决策,解决了许多乳制品行业性难题。

  刘冬冬:在我理解,要用好大数据,离不开数据分析师,数据分析师还得借助合适的工具才能把数据的价值挖掘出来,那在您看来,数据分析师应该如何去选择一款适合自己的工具呢?

  马晓东:我觉得最重要的是,这个工具能让分析更聚焦到他的擅长的地方去,如果说操作工具花掉分析师太多的精力,那这个工具就有问题了。所以分析工具要操作简单,并且具有丰富的可视化效果,满足不同行业以及多种场景的数据分析需要;同时内置丰富的公共数据源,能为分析师提供外部数据参考。这也是我们设计魔镜的核心原则。

  刘冬冬:中小企业往往没有太多的人力和财力,但又想用大数据,您有没有什么好的建议?

  马晓东:我们创业的初心是:"人人都能数据分析,企业用得起大数据"。针对中小企业和创业公司,我们免费开放"大数据魔镜"云平台企业版,并提供技术支持。让越来越多的孵化器和中小企业都能够数据分析,使用大数据。

  刘冬冬:大数据链接很长,大数据从数据到价值的实现过程也很长,往往有多方参与,那如何协作呢?

  马晓东:根据我们的经验,在技术方面从数据源开始,我们与多家厂商进行对接,我们可以通过ETR整合到系统中,或是通过API进行对接。我们提供非常方便接口,和所有厂商进行对接。

  另外领域应用方成,我们会就某个领域和业务专家、系统集成商共同进行行业研究,提出具有针对性解决大数据方案。

标签:

责任编辑:管理员

相关人物

在线客服