要点速递 | 郑爱军:数据基因与政务大数据服务知识图谱

2017-11-23 17:56 来源:数邦客
浏览量: 收藏:0 分享

  11月23日,“2017互联网+智慧中国年会”在北京召开。本届年会以“智绘城市 数造未来”为主题,以数字政府、智慧城市、互联网+政务服务、数据治理、信息社会等为主要议题。会议由中国社会科学院信息化研究中心、北京国脉互联信息顾问有限公司联合主办,国脉海洋信息发展有限公司、浙江蟠桃会信息技术有限公司协办,共有来自全国部委、省、市、区县电子政务、智慧城市、大数据主管领导、行业专家、企业代表、主流媒体千余人参会。

  在上午举行的主论坛上,北京国脉互联信息顾问有限公司总经理郑爱军女士发表了《数据基因与政务大数据服务知识图谱》主题演讲。

blob.png

▲北京国脉互联信息顾问有限公司总经理郑爱军做主题演讲

  要点一:知识图谱重构思维方式、重塑联系力量

  知识图谱,是一张由知识点相互连接而成的语义网络,是基于图的数据结构,由节点(概念或实体)和边(关系)组成,是关系最有效的表达方式,是大数据智能的前沿研究问题。郑爱军总经理认为,大数据时代已经到来,数据正在重塑当今时代的资源观,大数据是基于链接和关系层面,更精准地反映、认识、掌握世界,而知识图谱是大数据语义链接的基石(语义:数据的含义,只有被赋予含义的数据才能够被使用),将重构我们的思维方式、是重塑联系的力量。

  期间,她以“政府”为例:由“政府”可以联想到“政务→电子政务→互联网+政务服务→浙江省‘最多跑一次’→数据基因”、“电子政务→国脉电子政务网→数据智能门户系统(DIPS)”,还能联想到“‘看得见的手’→亚当·斯密→《国富论》→经济→政治→政府”等等。通过知识图谱,对数据进行连接,有助于我们发现隐藏在数据连接背后的“故事”、甚至创造“故事”,进一步释放数据价值、提升数据资产管理能级。

  要点二:知识图谱的发展阶段与主要特征

  对于知识图谱的发展,郑爱军总经理基于其研究归结为三个阶段:①引文分析阶段,主要特征是连接、关系、评价,核心作用是关联性、前瞻性、客观性、准确性;②结构图视阶段,特征是结构、图表、标签、推理,核心作用是系统性、逻辑性、直观性、科学性;③智能决策阶段,发展特征是数据活化、智能化、自流程化、融合化,核心作用是全面性、融合性、抽象性、创造性。

  要点三:知识图谱促进了政府智能化服务应用

  近年来,知识图谱已在多个行业有所应用,包括政务领域:①政务信息服务方面,政府网站语义搜索、人机智能问答系统提供政策咨询、投诉建议等交互服务;②政务知识库构建,比如国家安监总局的“政府垂直行业知识库”、科技部知识库等;③AI(人工智能)+政务层面,知识图谱是AI核心基础能力;④公安部门案情调查、情报分析;⑤司法部门事理图谱、辅助判案;⑥政府部门专题分析和决策研究、舆情监控等。

  其中,郑爱军总经理也提到,浙江省“最多跑一次”数据串梳理项目就应用到了知识图谱,并简单介绍了浙江是如何利用知识图谱对事项串、数据项等进行关联,目前浙江省26家省级单位前100项高频事项关联的材料已有1451项,这些材料涉及很多的申报表、证照、证明、批文等,以及各种各样的自行填写、外部分享、内部分享、数源单位确认,而所有事项的确认、来源、关联都是通过国脉数据基因普查系统进行的。

  要点四:数据基因,基于知识图谱构建数据治理能力

  国脉数据基因,是基于知识图谱构建数据治理能力的一个重要平台、系统、工具,是数据管家、数据治理专家,已荣获多项软件着作权,是国脉十二年咨询的产品化,由国脉集团下属国脉海洋信息发展有限公司数据基因研发基地开发而成,具有多版本,包括政务类、通用类、教学类、平台工具类、行业应用类、标准化类等。

  其中政务类数据基因,是国脉目前拥有最多最广泛应用案例的产品系列,包括十大核心产品:①数据资产登记(普查)管理系统(管资产);②政务信息资源采集系统(管数量);③信息资源编目管理系统(管目录);④数据体系标准化管理系统(管标准);⑤公共数据元(主数据)池和标签管理系统(管基因);⑥数据分析加工管理系统(数据清洗比对入库)(管质量);⑦数据治理与评估系统(管治理);⑧政务信息系统整合决策支撑工具(管整合);⑨数据供需对接与认责管理平台(管共享);⑩政务服务事项(最多跑一次)支撑管理平台(管业务)。涵盖了从数据采集、加工、清洗比对、入库、应用等数据服务生命周期。

  数据基因知识图谱在政务方面的应用案例:第一个是海南省政务采集云项目,在基础目录分类过程中,对基础类、主题类、部门类等大类下属的各种类、项、目、细目组合用知识图谱的概念进行了关联,比如针对一个市民,通过数据基因能关联到20多个相关部门和200多个要素,又如一个部门(工信厅等)下面的系统、数据库、数据表、数据字段都要进行关联;第二个是数据智能门户系统(DIPS),其基于数据基因开发,是站群集约化管理平台,可直观展现DIPS系统知识图谱以及行业知识图谱。

  要点五:基于数据基因提供政务大数据服务

  以政务数据基因为核心,国脉提供数十项政务大数据服务,主要包括以下几部分:①数据大脑:提供基于数据的顶层设计,由大数据架构支撑;②“两手抓”:一手抓方案(数据咨询),包括数据体系设计、数据治理流程设计、大数据(产业、园区、企业等)规划、第三方数据评估;一手抓软件(数据产品),包括数据基因系列产品、数据智能门户系统(DIPS)、数据治系统/工具等;③两“脚”支撑:一个是平台支撑,基于大数据资产管理平台,提供基础、主题、部门、标签、综合库等核心数据池建设;一个是管理支撑,在大数据管理方面提供标准化建设、安全制度规范、政策/课题/研究等保障体系建设。

  国脉在政务服务领域积累了丰富经验,对数据本质的理解、对政府业务的把脉、对技术落地的执行,未来将继续在大数据全口径、全流程、全活化、全精准、全可视方面进行推进,在知识图谱、智能关联、数据理解等方面做进一步突破。

  最后,郑爱军总经理用国脉的一句文化标语结束了本次演讲:结构就是力量、数据就是观点、图表就是本质、文字就是思想。

  演讲实录即将推出,敬请关注!

标签:

责任编辑:xiaaimei2018
在线客服