作者:衡萍,李明星,董沛武,陈健
摘要:用户浏览模式识别是现阶段Web日志挖掘的主要目标之一,研究Web日志挖掘中的序列模式识别问题,针对传统关联规则算法中阈值固定不变、大序列的数目与序列长度成反向增长的问题,对传统的关联规则算法进行改进,提出IAx算法,使长序列只需较小的支持度计数就能达到阈值,从而发现更多有意义的序列模式,同时运用理论证明该方法的正确性.
发文机构:哈尔滨工业大学
关键词:WEB日志挖掘阈值序列模式识别IA^x算法Web log miningThresholdThe recognition of sequence patternsI A* algorithm
分类号: TP18[自动化与计算机技术—控制科学与工程][自动化与计算机技术—控制理论与控制工程]