作者张燕玲系中国人民大学重阳金融研究院高级研究员、全球治理研究中心学术委员会主任,本文刊于《中国金融》2017年第8期。
2016年底,国务院在下发的《关于加强政务诚信建设的指导意见》(以下简称《指导意见》)中指出,加强政务诚信建设,必须构建广泛有效的政务诚信监督体系,实施区域政务诚信大数据监测预警。大数据分析技术被提高到政务诚信建设监督体系有机构成的重要地位。而为了进一步落实《指导意见》,国务院办公厅又印发了《“互联网+政务服务”技术体系建设指南》(以下简称《建设指南》),通过加强顶层设计,对各地区各部门网上政务服务平台建设进行规范,优化政务服务流程,推动构建统一、规范、多级联动的全国一体化“互联网+政务服务”技术和服务体系。
市场调查(或民调)行业是大数据应用最早也最广的行业,今天我们所说的大数据分析,就是从昨天的市场调查与社会分析发展而来的。在市场调查史上,长时间内调查资料的收集方式,都是倾向于采访者和受访者面对面的接触。然而世界一直在变化,在过去的二十年间,随着科技的发展导致的数据化革命,比如数码化的存储方式,互联网、社交群体、智能手机等数据采集方式,也有了重大的改变,资料的收集比以前更大量、快捷和方便。因此,研究员也渐渐地从以前的采访者变成了已知资料的整理和分析者,研究的范围也不仅仅限于以前的数据和分析,而是将从广大的社交群体中获得的各方面的资料结合链接,所做的规模远比以前大得多。之所以能做到这一点,完全是拜大数据技术的产生所赐。互联网的发展使得对市场研究所需要的数据的收集可在深度和广度上极大地展开,互联网链接技术使得对海量数据(75.90-3.34%,买入)的整理分析更加方便快捷,研究者的视野空前拓展,研究成果的质量和效率大幅提高。因此说,包括大数据在内的数据化革命,推动市场调研行业开创了新的局面,市场调查进入数据分析时代。
说到数据时代,人们的第一反应就是大数据。其实,我们现在只是由于科学技术的进步,信息的传播、接受、储存、收集、整理以及分析的面宽量大,相比二十年前有了跨越式的进步,但绝不是所有行业、所有单位都已经用上了大数据分析技术和方法,因为在大多数情况下,我们所掌控的数据量还没有达到大数据的水平。而在数据已经大量集聚,但先进的数据分析技术和方法相对滞后的情况下,就会出现一些“伪大数据分析”现象,需要加以澄清。其一,选择性数据。就是在获取的各种数据中,按照调查预设的立场来选择那些对预设立场有利的正面的和反面的数据。在选择性数据基础上的数据分析,必然是片面的、主观的、不公正的、不科学的。其二,数据不充分、不全面,代表性不足。这种情况下,即使掌握的数据再多,也不能导引出正确的调查结果。其三,现在各行各业的数据库都是有核心数据和非核心数据之分的。核心数据都是有防火墙严格保护的,不会轻易与同行共享。在这种情况下,各行各业的所谓的大数据,都不是完整的,特别是核心数据不完整,其数据分析结果的质量必然大打折扣。其四,同一行业内评价或评估标准不统一,使用的数据各行其是,不但未能起到客观评估的作用,反而把评估的标准搞得更乱了。
之所以出现这些谬误,主要不是数据本身的问题,关键是掌握数据的人的问题。所以说,“伪大数据分析”现象应该引起我们的高度关注,强调行业自律原则和从业人员道德修养规范的国际准则变得非常有必要。
应时代的变化,作为国际市场调查行业道德规范和行为准则的制定者,ICC/ESOMAR(国际商会与欧洲市场和社会调查行业协会)于2016年12月8日发布了新修订版《市场、观点、社会调查和数据分析国际准则》(以下简称《国际准则》)。该准则上次更新于2007年,是被全球范围价值680亿美元市场研究部门所认证的行为准则标准,主要为那些依靠数据信息研究为商业和社会问题提出解决方案的专业人士们提供一套独特的指导原则。它保证了不论使用的是传统的信息来源还是较现代的信息来源,调查及研究人员都能在职业以及道德规范上,为被采集数据的大众和受聘的用户做到负责。
错误的数据分析有违客观、公正的《国际准则》,而“伪大数据分析”只是现象之一。所以说,大数据时代的市场与社会调查,要有与之相配的技术手段,更要有科技人员一贯秉持的客观、公正的职业素养和诚实、科学的道德准则。而这些高贵的行业品质的养成,只能是在《国际准则》的引领和约束下长期守信践诺的修为的结果。