什么是大数据?
严格意义上的“大数据”是与“传统数据”相区别的。一般来说,我们将结构化的、行列分明的、可分类或可计算的、可以用表格方式呈现的、可以被传统的数据库软件存储分析的数字化文档——即便是海量的传统数据文档——称为“传统数据”。而“大数据”概念则虽然包含了传统数据的部分,但更强调了传统数据之外的那些非结构化的数字文件,比如文章、视频、音频等等。但是需要知晓的是,当我们脱口而出“大数据”这个词时,即便是专业人士,往往也在有意无意地混淆大数据与传统数据的区别,这是因为“大数据”的热潮带动了“传统数据的分析挖掘应用”的进一步发展,即便是看似与数据无关的一些传统行业中的中小企业也开始认真思索通过数据和数据分析(即便仅仅是使用传统数据)如何为自己的企业创造价值。
目前的大数据热潮会让人很自然地联想到18年前互联网兴起时汹涌的潮水与泡沫,联想到“大数据也必然要经历硅谷臭名昭著的技术成熟度曲线”,联想到大数据的落地自然也要经历那条曲线勾勒出的跌宕起伏……不幸的是,事实的确如此。而幸运的是,这一次,相较于当初的互联网大潮,人们似乎有了更多的心理准备。
大数据究竟为何迟迟不能在传统行业落地呢?
首先,大数据在技术端和市场应用端存在着信息不对称。大数据技术端可能存储着海量的数据,可能掌握着先进的计算和分析挖掘技术,但是并不了解市场的需求痛点。而市场应用端的专业人士则因为对大数据的工作原理和蕴含的高价值缺乏了解而空守金山不自知。解决这个困局的方法有二:一是从两端入手,大数据行业内人士必须深入到传统行业的业务流程中去学习、经历或体验;而传统行业的业内人士则要开放心态,主动学习和拥抱新事物。二是从中间入手,招聘寻找兼具一定大数据知识和传统企业行业知识的人才,作为沟通桥梁弥合两端的裂隙。
其次,数据互联的成熟度很低。当前的大数据源虽然貌似纷繁多样,电信数据、银联数据、房产车辆数据、WiFi数据、企业内部数据、网购数据、互联网数据等都能获取到,但是数据源之间缺乏有效的关联,导致大数据对于分析目标无法进行全面的描摹和了解,因此大大限制了应用范围。眼下市场上虽然一夜之间冒出了各式的“数据交易所”,但是仍然不能有效解决数据互联的问题。数据源之间的相互信任与合作是一个难点,数据信息的保密和披露法规不完善也是障碍之一,而落地变现场景的缺乏又使得这个问题的破局陷入了死循环。
其三,应用者普遍缺乏耐心和战略远见。一个企业的大数据战略布局是需要远见和时间成本的,战略远见不仅来源于核心领导层对于大数据知识的主动学习和思考,还要有敢于付出试错成本的决断力。同时,大数据项目投入的周期相对较长,前期繁复枯燥地整合内部数据孤岛、联合外部数据源的工作耗时费力而又障碍重重,如同万丈高楼的地基,虽然极为重要且时间金钱的代价不菲,却在表面上难以有显著成效可以彰显。另外,即便最终具备应用能力的大数据软件开发完成,往往也会因为受到数据源、分析技术,甚至是使用人员素质的限制使得短期内不能让企业领导者看到有亮点的投资回报率。但是,企业领导者应该认识到这是必要的学习成本,自己乃至整个企业经由这样的学习曲线获得了大数据领域的实操经验和能力。