登录    注册    忘记密码

详细信息

基于“词——词性”匹配模式获取的古汉语树库快速构建方法    

An Efficient Approach to Ancient Chinese Treebank Construction Based on “Word or POS” Match

文献类型:期刊文献

中文题名:基于“词——词性”匹配模式获取的古汉语树库快速构建方法

英文题名:An Efficient Approach to Ancient Chinese Treebank Construction Based on “Word or POS” Match

作者:何静[1];宋天宝[1];彭炜明[1];朱淑琴[1,2];宋继华[1]

第一作者:何静

机构:[1]北京师范大学信息科学与技术学院;[2]北京联合大学师范学院

第一机构:北京师范大学信息科学与技术学院,北京100875

年份:2017

卷号:31

期号:4

起止页码:114-121

中文期刊名:中文信息学报

外文期刊名:Journal of Chinese Information Processing

收录:CSTPCD;;北大核心:【北大核心2014】;CSCD:【CSCD2017_2018】;

基金:北京师范大学青年教师基金(2014NT39)

语种:中文

中文关键词:古代汉语;树库构建;模式获取

外文关键词:ancient Chinese; treebank construction; pattern acquisition

摘要:该文针对古汉语文本小、句简短、模式性强的结构特点,提出了一种基于"词-词性"匹配模式获取的快速树库构建方法,将句法标注过程规约为获取候选匹配模式、制定句法转换规则、自动生成句法树和最终人工校对四个步骤。该方法可大大缩减人工标注工作量,节省树库构建的工程成本,且所获取的匹配规则在古汉语教学研究中具有一定的实用价值。
An efficient approach for ancient Chinese treebank construction is proposed,which is based on "word or POS" match strategy.To deal with the ancient Chinese characterized by short-clauses and typical-patterns,it divides the Chinese treebank construction into four steps:1)candidate match pattern generation;2)syntactic transformation rule composition;3)syntactic parsing;4)manual verification.In addition to minimize the manual annotation cost in treebank construction,the match patterns obtained during this process can provide data support for the ancient Chinese teaching and research.

参考文献:

正在载入数据...

版权所有©北京联合大学 重庆维普资讯有限公司 渝B2-20050021-8 
渝公网安备 50019002500408号 违法和不良信息举报中心