作者:齐少凡,于雷易,白明,梅丽斯,王延惠
摘要:分布式数据库系统和分布式并行计算是"地质云"2.0的关键技术。基于开源的分布式数据库系统HBase、并行计算框架Spark、空间信息服务器GeoServer等技术,完成了地质空间大数据系统设计与实现。本文论述了影响系统查询和计算性能的关键技术,并使用地质空间数据进行了系统实验和测试。实验结果表明,基于开源技术设计的地质空间大数据系统是可行的,比传统技术具有更加高效的性能。HBase分布式存储和空间索引技术显著提高了地质空间大数据的空间查询性能,Spark并行计算技术和多线程技术明显提升了地质空间大数据的计算性能。
发文机构:自然资源部地质信息工程技术创新中心 中国地质调查局发展研究中心 特力惠信息科技股份有限公司
关键词:地质空间大数据分布式数据库空间索引分布式并行计算空间信息服务spatial geological big datadistributed databasespatial indexdistributed parallel computationspatial information service
分类号: TP3[自动化与计算机技术—计算机科学与技术]