2017年10月18日,中国共产党第十九次全国代表大会在北京隆重召开,习近平代表第十八届中央委员会向大会作报告。这份沉甸甸的报告总结了自十八大以来我国的发展进程,党的引领脚步,人民的生活改变……以及未来如何开启新时代、谱写新篇章。
如何精准解读这份报告,小编为你提供大数据挖掘的新方法。本文采用实验室研发的自然语言处理工具NLPIR-Parser(下载地址:https://github.com/NLPIR-team/NLPIR/tree/master/NLPIR-Parser)对十九大报告做大数据语义智能处理,带你深度感受十九大精神。
1、关键词提取
十九大报告全文3万余字,本文使用NLPIR对十九大报告进行关键词提取,以期揭示十九大报告的核心要点。关键词top100结果展示如下:
图1 关键词top100
由于篇幅所限,本文只展示了部分关键词提取的结果,关键词词云图分析结果比较充分地展示了十九大报告的核心概念。
2、词频统计
分析结果显示,词频统计top10的关键词分别为:“中国特色社会主义”、“中华民族伟大复兴”、“依法治国”、“全面建成小康社会”、“中国梦”、“人民当家作主”、“美好生活”、“现代化经济体系”、“人民军队”、“小康社会”。这些高频词汇基本概括了十九大报告中的基础概念。
图2、词频统计
图3、词频统计-top20
3、新词发现
“人类命运共同体”,“新征程”,“现代化经济体系”,“社会主要矛盾转化”,“历史性变革”……
十九大报告中出现的不少新的“关键词”,这些新词展示了新理念、新观点,给予了重大时代课题明确的回答,在实践上作出了新部署。
图4 十九大新词
十九大报告意涵丰富,限于篇幅,本文于分析结果中择一二阐述。从核心理念、基础概念到十九大新词,利用大数据思想,我们已基本了解十九大思想的轮廓:进入新时代,谱写新篇章!