详细信息
文献类型:期刊文献
中文题名:汉语盲文语料库建设方案
英文题名:Construction of a Chinese Braille Corpus
作者:肖航[1];钟经华[2]
第一作者:肖航
机构:[1]教育部语言文字应用研究所;[2]北京联合大学特殊教育学院
第一机构:教育部语言文字应用研究所,北京100010
年份:2015
卷号:0
期号:3
起止页码:109-118
中文期刊名:语言文字应用
外文期刊名:Applied Linguistics
收录:CSTPCD;;国家哲学社会科学学术期刊数据库;北大核心:【北大核心2014】;CSSCI:【CSSCI2014_2016】;
基金:国家社科基金重大项目"汉语盲文语料库建设研究"(编号:13&ZD187);国家语委科研项目"基于云计算平台的语言资源整合应用方略研究"(编号:YB125-38)资助
语种:中文
中文关键词:汉语盲文;盲文语料库;语料选材;语料标注
外文关键词:Chinese braille; braille corpus; material selection; corpus annotation
摘要:本文提出了一个汉语盲文语料库的建设方案。由于现行盲文在分词连写和标调方面的特点,汉语盲文研究难以直接使用明眼文语料库,需要建设专门的语料库。论文拟建设的语料库是一个大规模的(约1000万方盲文)、经过语言信息和触觉信息多层级对照标注的语料库。该语料库的建设可促进对我国盲文发展全貌的把握和了解,促进盲文基础研究和信息化、规范化研究,助力盲人信息无障碍水平提升。论文从语料库选材原则和样本采集、语料标注规范和标注方案、辅助软件研发计划等几个方面详细说明了盲文语料库建设的主要内容和初步方案,并进一步指出其重点和难点问题。
The paper presents a design for the construction of a Chinese Braille corpus, which is needed because Chinese Braille has distinctive features in terms of the writing of particles and of intonations, different from normal Chinese characters. The corpus designed in this paper is of about 10 million characters, and it is tagged with linguistic and touching information. The corpus is of both theoretical and practical significance in deepening the understanding of Chinese Braille, promoting fundamentalresearch, information research and standardization research, and improving the accessibility of the Braille. The paper explains the construction of the corpus in terms of material selection and collection, corpus annotation and assistant software development, and points out important and difficult issues in the construction process.
参考文献:
正在载入数据...