登录    注册    忘记密码

详细信息

面向行业电商知识图谱应用的实体对齐算法    

Research of entity alignment in the B2B e-commerce knowledge graph

文献类型:期刊文献

中文题名:面向行业电商知识图谱应用的实体对齐算法

英文题名:Research of entity alignment in the B2B e-commerce knowledge graph

作者:陈富强[1];肖明明[1];韩凯南[2];任毅[3];王文文[3];李克[1]

第一作者:陈富强

机构:[1]北京联合大学智慧城市学院,北京100101;[2]中铁物贸集团有限公司,北京102308;[3]鲁班(北京)电子商务科技有限公司,北京102308

第一机构:北京联合大学智慧城市学院

年份:2022

卷号:32

期号:12

起止页码:1302-1311

中文期刊名:高技术通讯

外文期刊名:Chinese High Technology Letters

收录:CSTPCD;;Scopus

基金:国家自然科学基金(61972040);中铁物贸集团鲁班公司科技研究开发计划课题,北京市教育委员会科研计划(KM201911417010);北京联合大学校内科研专项课题(ZB10202004)资助项目。

语种:中文

中文关键词:多源异构数据;知识图谱;实体对齐;集合相似度;电子商务

外文关键词:multi-source heterogeneous data;knowledge graph;entity alignment;set similarity;e-commerce

摘要:针对多源异构知识图谱数据融合中的实体对齐问题,本文面向行业电商领域电商平台真实数据,提出了一种基于领域知识的集合相似度实体对齐算法。首先,基于领域知识针对性设计数据预处理技术,如实体属性值原子化、统一术语和去除冗余等,以规范化电商底层多源异构数据、提升数据处理效率和准确性;然后,以行业电商知识图谱应用为导向,筛选实体对生成高质量候选集,优化集合相似度测量和实体对排序方法,实现实体对的高效匹配。实验结果表明,本文算法可有效提高多源异构数据融合的准确率,大幅减少人工干预,可为行业电商发展提供新思路。
Aiming at the entity alignment problem in the fusion of multi-source heterogeneous knowledge graph data,this paper is oriented to the real data of the e-commerce platform in the industry e-commerce field,and proposes an entity alignment algorithm based on domain knowledge of the set similarity.First,data pre-processing techniques,such as atomizing property value,unifying terminology,and removing redundancy,are specifically designed based on domain knowledge to normalize the multi-source heterogeneous data at the bottom of e-commerce,thus improving the accuracy of data application.Then,considering the application of B2C e-commerce knowledge graph,an effective and efficient entity matching method is proposed,which mainly consists of selecting high-quality pairs of entities and sorting them by optimizing set similarity evaluation function.The experimental results show that the proposed algorithm can effectively improve the accuracy of data fusion,reduce workload,and can provide new ideas for the development of the industry.

参考文献:

正在载入数据...

版权所有©北京联合大学 重庆维普资讯有限公司 渝B2-20050021-8 
渝公网安备 50019002500408号 违法和不良信息举报中心