详细信息
基于集合相似度的属性对齐算法
文献类型:会议论文
中文题名:基于集合相似度的属性对齐算法
作者:常思杰[1];林浩田[1];刘博存[1];江静[1];
第一作者:常思杰
机构:[1]北京联合大学智慧城市学院;
第一机构:北京联合大学智慧城市学院
会议论文集:中国计算机用户协会网络应用分会2021年第二十五届网络新技术与应用年会论文集
会议日期:20211127
会议地点:中国北京
语种:中文
中文关键词:属性对齐;知识图谱;集合相似度;异构数据
摘要:为解决中铁物贸电商平台上的钢产品信息与各采购钢厂提供的钢产品属性不匹配问题,本文提出了一种基于领域集合相似度的属性对齐算法。首先,分别对电商平台数据与各钢厂数据进行预处理,去除数据冗余,清除脏数据,并人为使用特定规则对数据进行统一处理。然后,计算领域集合相似度进行循环迭代,完成属性对齐。为了能够提高后续算法的效率和准确率,应用电商平台的真实数据验证可行性。最后,实验以知识图谱为导向,筛选出高质量且有效的属性实例,利用传统方法与本文提出的优化方法对数据进行匹配,数据分析的结果证明了所提算法的有效性,其能够显著提高属性对齐的准确性。
参考文献:
正在载入数据...