作者:马明清,袁武,葛全胜,袁文,杨林生,李汉青,李萌
摘要:"一带一路"倡议已成为中国的基本国际政策,及时掌握沿线国家的社会发展态势,对确保该倡议的稳步推进与顺利实施至关重要。为此,论文将GDELT数据库作为数据来源,获取了"一带一路"沿线25个国家近5 a的英文新闻全文数据,引入主题模型,结合无监督方法(LDA)与监督方法(Labeled LDA)挖掘新闻数据中蕴含的主题,构建社会稳定度模型,分析各国社会发展态势。研究发现:①沿线国家社会发展态势不均衡,可划分为4类,即稳定型,如阿曼、越南等;较稳定型,如乌兹别克斯坦、伊朗等;较高风险型,如科威特、约旦、巴基斯坦、缅甸;高风险型,如叙利亚、阿富汗等。②通过新闻主题时空挖掘,可有效发现热点区域,例如论文发现安集延对中亚地区社会发展与稳定具有重要影响。③利用监督主题模型,能够发现乌兹别克斯坦经济产业结构,识别出重大社会事件,发现其社会安全风险及变化趋势。采用论文方法可有效挖掘新闻事件时空变化规律,发现各国潜在风险,支撑对沿线国家社会发展态势的实时动态监控,为"一带一路"倡议的实施提供辅助决策支持,具有重要的应用价值。
发文机构:中国科学院地理科学与资源研究所 中国科学院大学 北京理工大学计算机学院 中国公安部第一研究所
关键词:一带一路时空数据挖掘主题模型社会发展态势社会稳定度大数据the Belt and Road Initiativespatiotemporal data miningtheme modalsocial situationsocial stabilitybig data
分类号: TP311.13[自动化与计算机技术—计算机软件与理论][自动化与计算机技术—计算机科学与技术]