成果/Result
- 基于BI_LSTM_CRF神经网络的序列标注中文分词方法被引量:14收藏
- 作者:姚茂建 李晗静 吕会华 姚登峰
- 机构:北京联合大学北京市信息服务工程实验室;北京联合大学特殊教育学院
- 来源:《现代电子技术》 2019
- 关键词:自然语言处理 中文分词 神经网络 双向长短时记忆条件随机场 字嵌入 序列标注
- 摘要:当前主流的中文分词方法是基于有监督的学习算法,该方法需要大量的人工标注语料,并且提取的局部特征存在稀疏等问题。针对上述问题,提出一种双向长短时记忆条件随机场(BI_LSTM_CRF)模型,可以自动学习文本特征,能对文本上...
- 面向ELAN软件的手语汉语平行语料库构建被引量:10收藏
- 作者:吴蕊珠 李晗静 吕会华 姚登峰
- 机构:北京联合大学北京市信息服务工程重点实验室;北京联合大学特殊教育学院
- 来源:《中文信息学报》 2019
- 关键词:手语 平行语料库 转写
- 摘要:建立手语汉语平行语料库的目的是用于机器翻译和语言对比研究,并且能够系统地保存手语资源,保护手语和聋人文化。手语汉语平行语料库存储的内容主要包括手语视频、被采集者信息和标注者信息,以及通过多媒体标注软件ELAN转写的十四层...
- 中国手语的关系从句被引量:9收藏
- 作者:吕会华 高立群
- 机构:北京联合大学特殊教育学院;北京语言大学对外汉语研究中心
- 来源:《当代语言学》 2011
- 关键词:中国手语 关系从句 句法
- 摘要:本研究通过对实验所收集的语料的分析发现,在中国手语中存在关系从句结构。中国手语的关系从句表现为两种形式:一种是同时存在的形式,一种是序列存在的形式。中国手语关系从句中心名词的位置主要表现为内置,和其他内置中心语关系从句一...
- 聋人汉语书面语语料库建设研究被引量:7收藏
- 作者:吕会华 吴铃 张会文
- 机构:北京联合大学特殊教育学院基础部
- 来源:《中国特殊教育》 2010
- 关键词:聋人 汉语书面语 语料库
- 摘要:目前对聋人汉语书面语的研究尚停留在经验层面。基于聋人汉语书面语语料库的研究,可以解决语料少,作者信息不清以及和其他汉语作为第二语言习得者对比困难等问题。随着对聋人汉语书面语研究的深入,聋人的汉语水平也将得到提高。语料库建...