作者:张文,唐锡晋
摘要:对于Internet所承载的海量信息,一般需要通过人们主观选择或机器帮助的情况下过滤出为人可利用的有效信息.为此在期望提高信息过滤、使用效率并对人们的各种分析与决策任务支持的驱动下.各种信息挖掘技术的相关研究受到重视。在简要介绍Web挖掘技术的基本内容后,本文叙述了中文Web内容挖掘的工作过程及技术实现。通过对一个著名的科学论坛“香山科学会议”网站的应用.具体说明AIS—GAE(Augmented Information Support for Group Argumentation Environment)如何为香山科学会议的各方用户提供有效的信息支持。文章最后指出了一些问题及值得改进和推广的工作。
发文机构:中国科学院数学与系统科学研究院
关键词:中文Web内容挖掘文本挖掘香山科学会议
分类号: TP393.092[自动化与计算机技术—计算机应用技术][自动化与计算机技术—计算机科学与技术]