详细信息
文献类型:期刊文献
中文题名:改进的知识迁移景点实体识别算法研究及应用
英文题名:Identifying Scenic Spot Entities Based on Improved Knowledge Transfer
作者:赵平[1];孙连英[2];涂帅[1];卞建玲[3];万莹[1]
第一作者:赵平
机构:[1]北京联合大学智慧城市学院,北京100101;[2]北京联合大学城市轨道交通与物流学院,北京100101;[3]北京中电普华信息技术有限公司,北京100192
第一机构:北京联合大学智慧城市学院
年份:2020
卷号:4
期号:5
起止页码:118-125
中文期刊名:数据分析与知识发现
外文期刊名:Data Analysis and Knowledge Discovery
收录:CSTPCD;;国家哲学社会科学学术期刊数据库;北大核心:【北大核心2017】;CSSCI:【CSSCI2019_2020】;CSCD:【CSCD_E2019_2020】;
基金:国家重点研发计划项目“多方法综合探测数据融合与智能识别技术研究”(项目编号:2018YFC0807806);教育部科研创新基金项目“大数据驱动下的都市轨道交通安全应急决策模式研究”(项目编号:2018A01003)的研究成果之一。
语种:中文
中文关键词:迁移学习;BERT;条件随机场;景点实体识别
外文关键词:Transfer Learning;BERT;Conditional Random Fields;Scenery Spot Recognition
摘要:【目的】解决景点实体识别中标注数据难以获取的问题。【方法】提出一种改进的知识迁移景点实体识别算法,通过对人民日报的数据集进行关键词、句子以及可扩展能力三种级别的实验评估扩展数据集。【结果】实验结果表明,本文方法在仅使用少量标注数据时,其准确率相比使用全部标注数据的模型提高1.62%。【局限】对样本扩展能力考虑的特征较少,可能影响模型效果。【结论】解决了景点实体识别中严重依赖标注数据质量的问题,为旅游自动化推荐提供技术支持。
[Objective] This paper addresses the issues facing labeled data in the recognition of scenic spots.[Methods] We proposed an improved knowledge transfer algorithm for entity recognition and used datasets from the People’s Daily to evaluate our new model. [Results] Our method’s accuracy was 1. 62% higher than the model using all labeled data. [Limitations] More research is needed to examine the expansion of samples.[Conclusions] The proposed method uses less labeled data in entity recognition and provides better technical support for tourism recommendation.
参考文献:
正在载入数据...