《新型智慧城市基于大数据可视化平台应用研究》一文,主要论述了数据与信息之间的依存关系;数据流与信息流之间的逻辑关系。重点阐述了新型智慧城市可视化平台设计方法和大数据可视化平台的分析展现与应用,以及大数据可视化平台实现功能等。本文作者提供了对《智慧城市大数据可视化分级分类分析展现构成与内容》的大数据可视化分级分类一览表和相应的大数据可视化分析展现页面,这些都是本文作者多年的学术研究成果。本文对于深度理解数据与信息之间依存及逻辑关系和掌握智慧城市大数据可视化“最后一公里”分析展现应用的方法论会有所帮助。
关键词:新型智慧城市、数据、信息、数据流、信息流、大数据可视化、分析展现、分级分类、三融五跨、三中心一平台。
中央网信办在新型智慧城市建设“六个一”核心要素中指出:要建立一个开放共享的数据体系,海量数据是新型智慧城市的特有产物,通过对数据的规范整编和融合共用,实现并形成数据的“总和”,进而有效提高决策支持数据的生产与运用,进一步提升城市治理的科学性和智能化水平。新型智慧城市既是大数据产生的源泉,又是大数据分析应用的载体。因此研究新型智慧城市大数据的构成、分析、应用、可视化展现、就显得非常迫切和必要了。
无论是数据的采集,还是数据存储,都不是大数据的最终目标。失去对大数据的分析、应用、可视化展现的环节,即使珍贵如金矿一般的大数据也不过是一堆废铁而已。大数据的结构模型和核心路径就是通过采集、存储、处理、分析、应用、可视化展现的大数据全生命周期,整个大数据链条就算彻底走通了。
一、数据与信息之间的依存关系
我们从大数据结构模型中可以看到信息(信息平台)与数据(数据库)之间存在着相互的关系。客观世界是由物质、能量、信息三大要素组成。数据与信息是一种客观存在,既不是物质,也不是能量。研究大数据就不能不研究数据与信息之间、要素与要素之间、局部与局部之间、局部与全局之间、全局与系统之间、系统与环境之间的相互联系和作用,都是通过交换、处理、应用的信息平台和数据库来实现的。系统的演化,整体特性的产生,高层次人工智能应用的出现,都需要从数据与信息的观点来理解。数据与信息也是系统工程的基本概念,信息论是系统工程的理论基础之一。因此,研究数据与信息在新型智慧城市中的开发和应用,是新型智慧城市系统工程研究的重要内容。
数据与信息已经是当今社会的标志,互联网+,大数据、云计算、物联网、人工智能等新科技,都是基于数据与信息科技和信息化应用。数据与信息知识已经成为社会发展的第一推动力,数据与信息在社会生产和生活中已经起到不可替代的作用,并在继续不断的扩展信息的内涵和外延,信息化应用已经渗透到政府政务、社会民生、城市治理、企业经济的各行各业的方方面面。信息平台与数据库系统将在新型智慧城市建设中发挥不可估量的作用。
早在 1998 年 IBM 提出“数字地球”时,美国总统克林顿就指出“信息是被加工过的数据”的概念。我国信息化的前辈周宏仁教授也指出“数据资源是发展大数据产业的前提。数据资源是需要开发的,而开发的主要形式是构建不同功能、不同形态的信息系统”。这些至理名言充分说明了数据与信息之间的依存关系。
1.大数据的概念
大数据可分为广义和狭义的概念,广义的大数据系指:无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合。狭义的大数据系指:对于海量和复杂数据经过采集、抽取、挖掘、处理、分析后,而获取的具有经验,知识、智能、价值的信息。
2.信息的概念
信息的存在不以主体(如人、事物、设备)存在为转移,即使主体不存在,信息也可以存在。信息在客观上反映某一客观事物的现实情况。信息可以通过物质载体形式的数据、记录、文档、著作、影像等,也可以是意识形态中的概念、思想、宗教、信仰、愿景等;信息与四维空间无关,信息可以超越距离、空间和时间的约束,可以独立而永久的存在。从某种意义上讲信息属于“第五维空间”,也就是“虚拟空间”的概念。信息在主观上可以被接受和利用,并会影响人的思想和指导人的行动。信息与其他资源不同,不会象物质资源,如水、煤炭、电力等因为被使用而被消耗。因此信息是一个取之不尽,用之不竭的资源。
3.数据与信息的关系
数据与信息是信息系统中两个互为依存的最基本要素。数据是一切活动中产生的记录符号,数据可以通过加工和组合来表述现实客观世界的的特征(如对象、属性、事件、状态、活动),信息是被加工过的数据,是数据的解释和含义,而数据则是信息的原材料和载体。因此,数据与信息即相互独立,又相互密切关联。
二、数据流与信息流的逻辑关系
我们在了解了数据与信息之间依存的关系,我们就可以进一步通过了解数据流与信息流之间的逻辑关系,来更好的利用数据和信息资源。
我们从数据流与信息流之间的逻辑关系视图上可以看到,新型智慧城市大平台由城市级公共信息一级平台、行业级二级平台、业务级三级平台组成;大数据由城市级大数据库、行业级主题数据库、业务级应用数据库组成。多级信息平台和多级数据库系统之间存在着对应的物理与逻辑的互联共享的关系。多级数据库系统通过数据抽取、数据分析、数据应用分别提供给多级信息平台的业务应用、行业管理、决策指挥。多级数据库系统对多级信息平台的数据服务是通过数据流的方式实现的;数据流的数据服务又通过各级信息平台的应用和可视化分析展现形成信息流。信息流是实现智慧城市总体功能及各项业务和功能的基础和保障。
1.数据流描述
数据流是一组数据。在数据流视图中数据流用带箭头的线表示,在其线旁标注数据流名。在数据流视图中应该描绘所有可能的数据流向,而不应该描绘出现某个数据流的条件。数据流视图是描绘信息流和数据从输入移动到输出的过程中所经受的变换。数据流视图从数据传递和加工的角度,以图形的方式描述数据流从输入到输出的移动变换过程。通常数据流视图包括:
- 指明数据存在的数据符号,这些数据符号也可指明该数据所使用的媒体;
- 指明对数据执行的处理的处理符号,这些符号也可指明该处理所用到的机器功能;
- 指明几个处理和(或)数据媒体之间的数据流的流线符号;
- 便于读、写数据流视图的特殊符号。
数据流视图有两种典型结构,一是变换型结构,它所描述的工作可表示为输入、主处理和输出,呈线性状态。另一种是事务型结构,这种数据流图呈束状,即一束数据流平行流入或流出,可能同时有几个事务要求处理。
1)数据流视图组成元素
数据流视图组成元素包括数据库系统的外部实体、处理过程、数据存储和系统中的数据流四个组成元素。
外部实体
外部实体指数据库系统以外又和系统有联系的人或事物,它说明了数据的外部来源和去处,属于系统的外部和系统的界面。外部实体支持系统数据输入的实体称为源点,支持系统数据输出的实体称为终点。通常外部实体在数据流程图中用正方形框表示,框中写上外部实体名称,为了区分不同的外部实体,可以在正方形的左上角用一个字符表示,同一外部实体可在一张数据流程图中出现多次,这时在该外部实体符号的右下角画上小斜线表示重复。
数据处理过程
数据处理指对数据逻辑处理,也就是数据变换,它用来改变数据值。而每一种处理又包括数据输入、数据处理和数据输出等部分。在数据流视图中处理过程用带圆角的长方形表示处理,长方形分三个部分,标识部分用来标识一个功能,功能描述部门是必不可少的,功能执行部门表示功能由谁来完成。
数据流
数据流是指处理功能的输入或输出。它用来表示一中间数据流值,但不能用来改变数据值。数据流是模拟系统数据在系统中传递过程的工具。在数据流视图中用一个水平箭头或垂直箭头表示,箭头指出数据的流动方向,箭线旁注明数据流名。
数据存储
数据存储数据表示信息的静态存储,可以代表文件、文件的一部分、数据库的元素等。数据存储也表示数据保存的地方,它用来存储数据。系统处理从数据存储中提取数据,也将处理的数据返回数据存储。与数据流不同的是数据存储本身不产生任何操作,它仅仅响应存储和访问数据的要求。在数据流程图中数据存储用右边开口的长方条表示。在长方条内写上数据存储名字。为了区别和引用方便,左端加一小格,再标上一个标识,用字母 D 和数字组成。
2)数据流的分层结构
数据流视图根据数据流层级可分为顶层数据流视图、中层数据流图和底层数据流图。顶层数据流图表示整个系统;输出数据流和输入数据流为系统的输入数据和输出数据,表明系统的范围,以及与外部环境的数据交换关系。中层数据流图是对顶层数据流视图中某个加工进行细化,而它的某个加工也可以再次细化,形成子图;中间层次的多少,一般视系统的复杂程度而定。底层数据流图是指其加工不能再分解的数据流图,其加工称为"原子加工"。
数据流视图,首先将系统的输入数据和输出数据用一连串的加工连接起来。在数据流的值发生变化的地方就是一个加工。接着,给各个加工命名。然后,给加工之间的数据命名,给出文件命名。对于大型系统、巨系统或复杂巨系统,为了控制复杂性,便于理解,需要采用自顶向下逐层分解的方法进行,绘出分层数据流视图。即用分层的方法将一个数据流视图分解成几个数据流视图来分别表示。
3)数据流视图的表述方法
顶层数据流视图的表述:
顶层流图只包含一个加工,用以表示被开发的数据库系统,然后考虑该数据库系统有哪些输入数据、输出数据流。顶层数据流视图的作用在于表明被开发数据库系统的范围以及它和周围环境的数据交换的关系。
数据库系统内部视图的表述
即下层数据流图,不再分解的加工称为基本加工。一般将层号从 0 开始编号,采用自顶向下,由外向内的原则。画 0 层数据流视图时,分解顶层流图的系统为若干分系统,决定每个分系统间的数据接口和活动关系。
数据流表述的含义
- 数据流不是控制流,数据流反映数据库系统“做什么”,不反映“怎么做”和“如何做”;
- 数据流不是物质流,数据流反映的是能用计算机处理的机读数据,并不是实物,因此对目标系统的数据流视图一般不表述物质流;
- 每个加工的表述至少有一个输入数据流和一个输出数据流,反映出此加工数据的来源与加工的结果;
- 如果一张数据流视图中的某个加工分解成另一张数据流图时,则上层图为父图,直接下层图为子图。父图与子图的平衡,子图的输入输出数据流同父图相应加工的输入输出数据流必须一致;
- 局部数据存储,当某层数据流图中的数据存储不是父图中相应加工的外部接口,而只是本图中某些加工之间的数据接口,则称这些数据存储为局部数据存储。
2.信息流描述
信息流有广义和狭义两种。广义指在空间和时间上向同一方向运动过程中的一组信息,它们有共同的信息源和信息的接收者,即由一个信息源向另一个接受端传递的全部信息的集合。人们采用各种方式来实现信息交流,从面对面的直接交谈直到采用各种现代化的传递媒介,包括信息的收集、传递、处理、储存、检索、分析等渠道和过程。信息流的狭义定义是指信息的传递运动,这种传递运动是在现代信息技术研究、发展、应用的条件中,信息按照一定要求通过一定渠道进行的,在信息处理过程中信息在计算机系统和通信网络中的流动。
随着社会的信息化和信息大量涌现,以及人们对信息要求的激增,信息流形成了错综复杂、瞬息万变的形态。这种流动可以在人和人之间、人和机构之间、机构内部以及机构与机构之间发生,甚至物与物之间,包括有形流动和无形流动,前者如报表、图纸、书刊等,后者如电信号、声信号、光信号等。在社会经济生活中,随着商流、物流与资金流的分离,信息流的作用越来越重要,其功能主要体现在沟通连接、引导调控、辅助决策以及经济增值等方面。
1)数据与信息的表述
数据是指某一目标定性与定量描述的原始资料,包括数字、文字、符号、图形、图像以及它们能够转换成的数据等形式。信息是向人们或机器提供关于现实世界新的事实的知识, 是数据、消息中所包含的意义。 数据与信息是不可分离的。信息由与物理介质有关的数据表达,数据中所包含的意义就是信息。信息是对数据解释、表述和应用。数据即使是经过处理以后的数据,只有经过解释才有意义,才成为信息;就本质而言,数据是客观对象的表示,而信息则是数据内涵的意义,只有数据对实体行为产生影响时才成为信息。数据是记录下来的某种可以识别的符号,具有多种多样的形式,也可以加以转换,但其中包含的信息内容不会改变。即不随载体的物理设备形式的改变而改变。信息可以离开信息系统而独立存在,也可以离开信息系统的各个组成和阶段而独立存在;而数据的格式往往与计算机系统有关,并随载荷它的物理设备的形式而改变。 数据是原始事实,而信息是数据处理的结果。不同知 识、经验的人,对于同一数据的理解,也可得到不同信息。
2)信息流视图的意义
新型智慧城市属复杂巨系统,其建设的核心和基础就是数据、信息、知识、智慧。根据系统工程方法论的基本原理,从分解到综合总体规划,从定性到定量综合集成,信息流视图是建立新型智慧城市数据流、知识流、智慧流的中间流层,是建立数据、信息、知识、智慧相互关联的重要环节。
数据是信息的原材料,数据只是表示发生了什么事情?并不提供对事情的判断和解释,数据是行动和认知的可靠基础与依据。信息是人们对数据进行系统的组织、整理加工和分析,使其产生相关性、互联性、共享性,信息是数据的高级表现形式。知识是将信息从定性到定量的过程,使得信息得以实现抽象化和逻辑化,知识通过对信息的使用归纳、演绎的方法而得到知识,知识是人们利用信息来解决问题的一种表现和能力(或称力量)。智慧的产生需要基于知识的积累和应用,只有在掌握知识的前提下经过广泛深入的实践检验,被消化和吸收,才能成为了个人或集体对问题的一种判断、决策和处理事物更高层次智慧能力的体现。
新型智慧城市信息流视图,正是基于多级数据流视图,并通过多级信息平台,将数据流经过系统组织、整理加工转换成为具有关联性、互联性、共享性的信息流。信息流又通过各级信息平台提供业务处理、行业管理和决策指挥的知识和智慧。信息流视图是数据、信息、知识、智慧相互关联的、清晰的、详细的描述。
3)信息流视图组成元素
信息流视图组成元素包括信息收集、信息处理、信息传递三个组成元素。
信息收集
信息收集是信息流运行的起点,它是分散的信息向收集者集中的过程。信息的收集者成为信息的信宿,它是按照自己的目的和需要来集中有关信息。收集信息的质量,即信息的真实性、可靠性、准确性、及时性,决定着能否达到预定的目的和能否满足需要。收集信息必须遵循一定的原则进行。
- 具有明确的目的性。收集信息的目的决定着收集的范围、深度、方法和费用。只有与目的(目标)相联系的信息才是收集的对象。对于出于战略性的目的收集信息,所涉及的范围就很大,可以采用分级分类收集的方法,将收集信息分为战役性信息和战术性信息;
- 确定深度和精度。这是按照收集目的的要求来确定的。不同的目的对深度和精度的要求也不相同。深度和精度决定着收集的难易程度和内容;
- 选择信息源,建立信息渠道。信息源的选择取决于收集目的及信息内容。选择信息源先要利用现有信息和现有信息渠道,确定具有连续性相对稳定的信息源和信息渠道,是非常重要的。
信息处理
收集来的信息往往是碎片化的,有时甚至是片面的、重复的、虚假的,必须经过处理才能去伪存真,归纳出结果,提高信息的使用价值。信息处理主要包括以下内容:
- 分类及汇总,对碎片化的信息按照一定的标准进行分类整理,重新组合后,才能显示出信息之间的相互联系,为分析、比较、判断创造条件。分类采用统一的标准或者规范,要有较强的通用性。建立专门的信息标准。编码或目录是分类的方法之一,它是存储信息,利用信息系统进行处理的重要手段;
- 分析、判断、形成结果,大量的信息罗列在一起,有真有假、有主有次、相互孤立、形式各异,既不容易存储和检索,也难以观察到信息所反映的事物本质内容。特别是关系管理和决策的信息,如果只是大量的数据,应用起来将非常困难。因此,要对信息进行比较、分析、计算,使之有条理、有规范、有序列,进而作出判断,形成结果,信息才有较高的使用价值。所以可以说,信息处理是对信息进行再创造的过程,是信息流运行非常重要的环节;
- 存储和更新,经过处理的信息,有时不是立刻投入使用,有的虽然已经使用过,但仍然有再利用的价值,这就需要进行信息存储。现代信息存储方式,主要是利用电子计算机技术建立数据库进行海量存储。
信息传递
信息传递是信息从信息源发出,通过一定的媒介和信息渠道传输给接收者的过程。如果说,信息收集相当于生产所需原材料的供应过程,信息处理相当于生产过程。信息收集也是信息传递的内容。信息传递既有单向传递,也有双向和多向传递。其中,反馈传递是信息传递非常重要的内容和特点。信息传递有纵向传递和横向传递两种流向。纵向传递是同一组织内部上下级之间的传递,横向传递是不同组织之间的传递。纵向传递是组织传递,横向传递是协同传递。纵向传递是不同环节之间的传递,横向传递是相同环节之间的传递。纵向传递是有序的传递,横向传递是无序的传递。信息互联过程以横向传递为主,数据共享过程以纵向传递为主。
4)信息流视图功能
信息流互联功能
信息流的过程是作为一个整体的运动,即体系的运动来实现的。信息是由各种要素的集合,不同的信息要素之所以能形成集合,是靠信息流把它们联接在一起的。在信息流多级信息平台之间的关系,从本质上讲是信息互联和信息交换的关系。信息流将一个个孤立的环节,连结成为连续不断的有序活动。信息流产生于从数据到信息的转换过程,是活动的客观反映。
每一个主体都是依据它所接收到的信息从事活动,它所进行的活动又表现为一定的信息传递出去,被其他主体接收,成为其他主体活动的依据。如此循环往复,形成了信息流互联互通的有机联系和运动。
信息流不仅具有连结和贯通新型智慧城市总体功能体系、系统体系、技术体系、标准体系、信息基础设施体系的功能,而且具有沟通“三融五跨” (注 1)体系与外部系统和环境的功能。新型智慧城市信息流不是孤立的,它处在社会经济的大系统之中,是大系统的组成部分。其它系统构成信息流外部系统和外部环境,影响着信息流的运动。信息流反过来也影响其它系统的运动。不同系统之间的相互影响和联系,同样是靠信息流来联接的。
信息流调控功能
信息流的调控功能产生于互联互通的联接功能。信息是能够被人们理解、接收和利用的信息,是经过一定程度处理的信息。因此,信息在联接要素的时候,所反映的客观内容就是事物的状态和人们行为的结果。这样,在事物与人之间就产生了一个过程,每一个人都取得其他人的信息,这些信息会影响人们的行动和后果,而个人信息同时也影响相互联系的其他人的行为,信息的变化将会使人们的行为发生变化,这就是信息流的调控功能。
信息流决策功能
信息流是不断变化的动态过程,信息流所赖以存在的运动环境也是不断变化的动态环境。无论是运动着的过程,还是变化着动态环境,都存在大量的不确定因素。信息的重要功能,是使决策当事人了解动态变化的状况,以减少不可避免的不确定性,从而为处理事件和行动作出恰当的选择,并控制行为的后果。信息越完善、充分、及时,不确定性就越少,决策就可以越合理。
决策过程实际上就是信息的收集、传递、分析、处理、判断的过程。从决策的角度来看,有两类信息是必须的。一类是决策面临的可选择行动系列信息;另一类是影响这些行动后果的信息。显然,这些信息需要经过收集才能得到,而信息的质量对决策来讲至关重要。当决策者对收集到的信息进行处理,作出判断,确认了不同行动可能产生的后果时,决策实际上已经作出来了。
3.数据、信息、网络之间互联互通的关系
新型智慧城市大数据可视化平台建设的过程就是建立信息互联互通、数据共享交换、业务功能协同的过程。新型智慧城市大数据、大平台、大网络是智慧城市大数据“总和”体系建设的一个整体。
大数据是大平台的数据源和提供有价值知识信息的支撑;大平台提供大数据的挖掘分析、人工智能、可视化展现与信息互联互通的环境;大网络是数据与信息传输的通道和安全保障。新型智慧城市大数据结构体现了数据、信息、网络相互之间的物理与逻辑互联互通的关系和应用及功能协同的关系。新型智慧城市大数据分级分类结构由城市级大数据库、业务级主题数据库、应用级数据库分级和知识决策类、经验管理类、过程应用类分类数据构成。
1)分级分类大数据
分级分类大数据是构成新型智慧城市政务大数据和社会大数据采集、存储、应用的共享交换平台。运用“信息栅格”开放的体系架构,采用以“数据为中心”的分级分类的总体结构。以城市级大数据八大基础库为核心,形成与行业级二级主题数据库、业务级三级应用数据库的分级和政府政务、城市社会治理、社会民生、企业经济的分类的数据与信息紧密相连的一体化大数据共享交换体系。
2)分级分类大平台
分级分类大平台是构成新型智慧城市政务信息资源和社会信息资源互联互通的共享平台。运用“信息栅格”开放的体系架构,采用以“平台为中心”的分级分类的总体结构。以城市级共享信息一级平台为核心,形成与行业级二级平台、业务级三级平台的分级和政府政务、城市社会治理、社会民生、企业经济的分类的数据与信息紧密相连的智慧化信息资源共享体系。
3)分级分类大网络
分级分类大网络是构成新型智慧城市“天地一张栅格网”的网络融合与安全中心。运用“信息栅格”开放的体系架构,采用以“网络为中心”的分级分类的总体结构。以城市级互联网为基础,形成与各级政府电子政务内网和电子政务外网的分级和政府政务、城市社会治理、社会民生、企业经济的分类的数据与信息紧密相连的网络融合与安全一体化大网络体系。