详细信息
基于“词——词性”匹配模式获取的古汉语树库快速构建方法
An Efficient Approach to Ancient Chinese Treebank Construction Based on “Word or POS” Match
文献类型:期刊文献
中文题名:基于“词——词性”匹配模式获取的古汉语树库快速构建方法
英文题名:An Efficient Approach to Ancient Chinese Treebank Construction Based on “Word or POS” Match
作者:何静[1];宋天宝[1];彭炜明[1];朱淑琴[1,2];宋继华[1]
第一作者:何静
机构:[1]北京师范大学信息科学与技术学院;[2]北京联合大学师范学院
第一机构:北京师范大学信息科学与技术学院,北京100875
年份:2017
卷号:31
期号:4
起止页码:114-121
中文期刊名:中文信息学报
外文期刊名:Journal of Chinese Information Processing
收录:CSTPCD;;北大核心:【北大核心2014】;CSCD:【CSCD2017_2018】;
基金:北京师范大学青年教师基金(2014NT39)
语种:中文
中文关键词:古代汉语;树库构建;模式获取
外文关键词:ancient Chinese; treebank construction; pattern acquisition
摘要:该文针对古汉语文本小、句简短、模式性强的结构特点,提出了一种基于"词-词性"匹配模式获取的快速树库构建方法,将句法标注过程规约为获取候选匹配模式、制定句法转换规则、自动生成句法树和最终人工校对四个步骤。该方法可大大缩减人工标注工作量,节省树库构建的工程成本,且所获取的匹配规则在古汉语教学研究中具有一定的实用价值。
An efficient approach for ancient Chinese treebank construction is proposed,which is based on "word or POS" match strategy.To deal with the ancient Chinese characterized by short-clauses and typical-patterns,it divides the Chinese treebank construction into four steps:1)candidate match pattern generation;2)syntactic transformation rule composition;3)syntactic parsing;4)manual verification.In addition to minimize the manual annotation cost in treebank construction,the match patterns obtained during this process can provide data support for the ancient Chinese teaching and research.
参考文献:
正在载入数据...