大数据开启了信息文明,而信息文明正是更深入理解大数据的重要进路。人类信息文明之所以为大数据所开启,与大数据本身的深层内涵密切相关。
自第三次工业革命以来,信息化就使人类开始走向信息文明,但只是到大数据时代,才有了信息文明的真正奠基。信息技术发展的摩尔定律,使大数据呈加速度发展趋势。
作为更高层次的人类文明,信息文明的基础包括网络和大数据。网络是信息文明的物能基础,如果没有网络,人类就不可能主要以信息方式生存。大数据为信息文明提供信息基础。作为信息文明社会中人和自然、人和社会特别是人和人之间关系的量化,大数据是信息文明的信息关系基础。没有大数据,人就不可能成为信息文明意义上“一切社会关系的总和”。
谈到大数据,似乎更多与技术相关联,但事实上,作为信息文明的基础,大数据的深层内涵具有远比技术更基础的划时代意义。
首先,大数据具有规模整全性,它构成信息文明的本体基础。大数据的“大”不仅意味着数据量大,而且意味着维度全。而大数据之所以维度全,则因为大数据的获取只有最基本因而也是最少的在先设定。所有数据的获取都有在先设定,关键是在先设定的层次。而大数据由于不必有像取样那样的具体预设,其在先设定一般都到了哲学层次。在先预设越基本从而越少,数据相应维度就越全。虽然不存在完全意义上的全数据,就像不存在十全十美的事物,但以人类使用为标准,则可以就使用需要把大数据看作是全数据。大数据与小数据的根本区别,就在于大数据不是根据预先设定的具体目的由抽样形成的干枯数据标本,而是动态反映事物相互作用过程的数据流。
作为人类信息文明的基础,大数据整全性的另一个更重要特性,则是与技术设备的数据处理速度密切相关。对于人类来说,大数据不仅取决于数据本身,而且取决于技术设备的数据处理速度,数据处理速度决定了实时数据流状态。在此意义上,大数据涉及其与人类使用的关系。样本数据在取样后就与时间没有了实时关联,而大数据则是实时数据流。在小数据时代,我们只是获取标本;而在大数据时代,我们所获得的则是一个生存的数据基础。正是高速流动的数据,为我们提供了现实的无限可能性空间。大数据的整全性就包括数据流速这个至关重要的维度。这种不是凝固而是可以看作是自然生成的数据流,随着信息文明的发展,将越来越成为人类生存的主要基础。
其次,大数据具有结构开放性,它构成信息文明的创构基础。大数据不只是最初的文本,而是来自商业过程、机器、网络和移动设备的人类互作,包括电子邮件、照片、音频、视频等。大数据不仅具有来源和类型的多样性,甚至也不只是数据的结构化、半结构化和非结构化,而是意味着数据结构的开放性。数据结构不是完全决定于数据本身,而是涉及大数据相关关系的理解。由于大数据的特点之一是数据太多,信息不足,大数据“难”在理解,因而数据挖掘与人的理解能力密切相关。
最后,大数据具有价值生产性,它构成信息文明的意义生产基础。相对于取样数据价值密度低,数据挖掘是沙里淘金,大数据的意义与人的需要的关联性,决定了大数据具有与人及其需要的发展内在相关的价值生产性。大数据的价值生产性,建立在其规模整全性和结构开放性的基础之上。理解大数据的价值,关键就在于把握相关关系组合与人的需要及其发展的关系。
我们可以从两个层次研究大数据:技术手段和信息文明基础。作为信息文明的基础,大数据上启信息文明,下承信息哲学。大数据相关关系与人的需要及其发展之间的价值生产空间,不仅对大数据的哲学研究,而且对一般意义上的哲学研究都具有深刻启示。