作者:宋国民,张三强,贾奋励
摘要:针对中文文本中时间信息抽取的现实需求,在分析比较常用时间信息抽取方法优缺点的基础上,提出利用通用文本工程框架(GATE)进行中文时间信息抽取的方法。设计基于GATE进行中文文本时间信息抽取的处理流程,解决中文文本分词及词性标注、扩展时间领域词表、修编时间信息抽取规则等关键技术问题,实现中文文本中时间信息的识别和抽取。利用已标注时间信息的中文语料数据,对文中提出的中文时间信息抽取方法进行实验验证。实验结果表明,该方法具有较好的时间信息抽取效果。
发文机构:信息工程大学 69340部队
关键词:中文文本时间信息抽取GATEChinese texttemporalinformation extractionGATE
分类号: P208[天文地球—地图制图学与地理信息工程]