大数据是个好东西。有了它,我们既可以从整体上更全面地把握事物矛盾运动的趋势,也可以从细处更深入地了解事物矛盾运动各方面的关系和作用方式。特别是,大数据使得作伪的难度加大了许多。其中的原因,就是大数据具有“大、全、原”三大特性。所谓“大”是指数据的规模大,这实际上是后面两大特性决定的,因为所谓的大数据,还具有“全”的特性,即它是基于全样本的数据而不是抽样数据,而所谓的“全”,又根源于“原”,即这些数据是在事物矛盾运动的原始状态(原生态)下生成并被记录下来的。具有这样特征的事物的数据量不可能不大。而且,这样的数据,在理论上只能通过互联网(包括物联网)记录和收集。
按照一般的认知,“信息与数据是相互关联的。数据是人类表征外部世界存在状态的初始化的符号,信息则是经过加工处理后具有特定使用价值的数据”, 美国信息管理专家霍顿将信息定义为:“信息是为了满足用户决策的需要而经过加工处理的数据。” 但在人类实际的认识发展过程中,依靠人体的感觉器官感知外部世界,并经由人脑处理转换生成信息的认识方式,在相当一个时期都是人类认识客观世界的主要方式。
计算机的出现,开始了人类采集和处理客观事物存在状态的“符号(讯息)”的新进程。这个进程使人类告别了旧的认识外部世界的方式,开始借助各种工具采集数据,而由“电脑”来处理数据。应当说,这是一个巨大进步。这个进步的意义,类似于自然科学对物质的认知从分子层面发展到原子层面。人类对客观世界的认知,也是先在信息层面实现,而后开始人工采集数据,直到当前能够借助互联网(以及物联网),自动采集和生成大数据,并借助人工智能进行大数据的分析和利用以大批量生成信息。而知识,则是进一步系统化结构化的信息。数据就是这样经过不断加工,成为人们在不同层面上认识外部世界和与外部世界互动的依据。
显然,大数据的出现是人类认识能力提升的结果。将这种认识能力转换成实践能力,是事所必然。在这个转换过程中,人工智能是必不可少的因素。这是因为,海量的、往往是非人眼可直观的大数据,只有通过计算机按照一定的算法逻辑加以处理才有可能在实践中产生应用价值。
当前,大数据结合人工智能产生的大量新应用,正如火如荼,在经济与社会生活的各个领域迅速发展。如信息分发的精准化、电商的精准化等。在社会治理领域,大数据也正在得到各种各样的应用。基于人脸识别技术的大数据应用对于缉拿犯罪分子产生了显著的效果;基于个人通讯工具位置的大数据应用也在救灾、疏导交通、预防人群过度密集导致踏踩事故等方面发挥了积极的作用。这些大数据应用的本质,就是通过数据分析,实现相关信息的匹配,从而提升信息处理和传播的效率,进而提升实际工作的效率。以“今日头条”平台开展的公益项目“头条寻人”为例,可以直接感受到这种大数据+人工智能应用的效能。头条寻人是2016年2月启动的一个公益项目,运营方依托大数据分析和人工智能技术,发挥用户规模庞大的基础优势,帮助各类失散家庭寻亲。数据显示,截至2018年7月27日,“头条寻人”平台共弹窗推送寻人启事43907例,找到6560人,其中包括2353位老人和627位未成年人。其中最年长的走失者101岁,最年幼的走失者仅3个月大。目前,头条寻人平均每日弹窗80多例寻人启事,每日最少找到10名走失者,最多一天找到29名。运营方举办的“两岸寻亲”活动截至2018年7月17日,共推送127例信息,成功帮助46个两岸家庭团圆。其中,寻亲成功者中年纪最长的有100岁的老兵,与家乡亲人失联时间最长的长达80年,最快的仅用了1个小时就寻亲成功。这个项目的最新案例是“寻找革命烈士后人”。运营方与川陕革命根据地红军烈士陵园合作,借助精准地理位置弹窗技术,将“寻找烈士后人”的消息发送到烈士家乡。今年7月9日开始推送信息,14日就首战告捷,找到并核实了河南新县籍红军烈士肖永贵的后人。活动开展以来,“头条寻人”平台已整理发布158条烈士消息,成功找到了28位革命烈士的后人。由于效果显著,民政部及全国1976个救助管理机构、公安部及各地警方、医疗机构、新闻媒体、志愿者组织与运营方达成了合作。
这些事例说明,在互联网时代的社会治理中,大数据与人工智能相结合,能够产生巨大的效果。如果善加利用,将极大地提升社会治理水平和服务水平,造福社会。但是也要看到,掌握着大数据的互联网平台运营者客观上也因此而拥有巨大的实际权力,平台运营者固然要善意地使用这一权力,而政府和社会也必须建立制度,把这样的权力关进笼子,以防止滥用数据背后的滥用权力。对于正在实施媒体融合战略的主流媒体而言,也要通过建设基于互联网的自主可控平台,尽力掌控大数据,实现“党管数据”的目标,进一步提升党和政府的社会治理能力,并确保关系到国计民生的大数据的安全可控。