作者:何珍文,吴冲龙,刘刚,田宜平,张夏林,陈麒玉
摘要:地学时序大数据具有多传感器、多目标、多分辨率、多类型的多源异构特征,是地学领域机器学习与数据挖掘的重要数据来源,分为基于时点和基于时段的两大类时序数据。现有时序数据的相似性度量与索引研究主要聚焦在前者。时序数据表达方法的核心思想是降维处理,是相似性度量与索引方法的基础,主要包括基于域变换和模型的表达方法和基于极限分段思想的表达方法。相似性度量的核心是相似性距离计算,主要分为锁步度量和弹性度量。它为时序数据索引中索引项的聚合与划分提供了基本准则。多源异构地学时序大数据的高效相似性度量与分布式索引方法是地学大数据领域未来的重要研究方向。
发文机构:中国地质大学(武汉)计算机学院 中国地质大学(武汉)智能地学信息处理湖北省重点实验室 自然资源部基岩区矿产资源勘查工程技术创新中心
关键词:时序数据大数据表达索引相似性度量time series databig datarepresentationindexsimilarity measurement
分类号: TP31[自动化与计算机技术—计算机软件与理论]