增强改革创新本领,保持锐意进取的精神风貌,善于结合实际创造性推动工作,善于运用互联网技术和信息化手段开展工作。
在中国共产党第十九次全国代表大会开幕会上,习近平总书记代表十八届中央委员会向大会作报告。报告全文3万多字,讲话时长3个多小时。
各路媒体已经从多角度梳理、总结了报告的内容。
既然报告中提及到,善于运用互联网技术和信息化手段开展工作。那么我们就用 Python 来分析下报告里的高频关键词,看看什么才是我们需要关注的重点。
对于报告全文进行分词处理,再对词频进行统计,得到以下两张图:
从数据中不难看出:
-
发展 是第一要务
-
坚持 以 人民 为中心
-
全面 建设 社会主义 现代化 国家
其他重点内容,也均在关键词中有所体现。
这里我们使用了之前数次介绍过的 jieba 分词(【编程课堂】jieba-中文分词利器),再通过 collections 模块里的 Counter 类(【编程课堂】计数器 Counter)进行了排序。最后分别通过 wordcloud(【编程课堂】词云 wordcloud)和 ECharts(ECharts+Python 给你的数据做“美颜”)对结果进行了可视化展示。
很简单的几步操作,不超过 20 行代码,便可以对报告有更清晰的认识。只要懂一点编程,你也可以在工作中大大提升效率。节省了时间就是增加了生命,哪怕一秒也是好的。
人生苦短,我用 Python。
-
代码问题请在论坛 bbs.crossincode.com 上发帖提问
-
欢迎加入讨论交流群组共同学习进步
-
别忘了将我们的文章转发朋友圈或在知乎上为我们的专栏点赞,你们的支持将会让编程教室做得更好:)
近期文章推荐阅读:
Python有嘻哈:Crossin教你用代码写出押韵的verse
如何用100行Python代码做出魔性声控游戏“八分音符酱”
欢迎加入
Crossin的编程教室
crossincode.com
读者交流QQ群:657099683
微信请加 crossin123 留言入群(新手/进阶/爬虫)
请把我们分享给身边爱学习的小伙伴 :)
文章评论