详细信息
文献类型:期刊文献
中文题名:一种针对类别数据分析的平行坐标改进方法
英文题名:Parallel Coordinate Improvement Method for Category Data Analysis
作者:陈红倩[1,2];程中娟[1,2];杨倩玉[1,2];李慧[3]
第一作者:陈红倩
机构:[1]北京工商大学计算机与信息工程学院,北京100048;[2]北京工商大学计算机与信息工程学院食品安全大数据技术北京市重点实验室,北京100048;[3]北京联合大学管理学院,北京100101
第一机构:北京工商大学计算机与信息工程学院,北京100048
年份:2019
卷号:55
期号:8
起止页码:175-181
中文期刊名:计算机工程与应用
外文期刊名:Computer Engineering and Applications
收录:CSTPCD;;北大核心:【北大核心2017】;CSCD:【CSCD_E2019_2020】;
基金:国家自然科学基金(No.31701517);北京市自然科学基金(No.9164028);北京市社会科学基金(No.17GLC060)";十三五"时期北京市属高校高水平教师队伍建设支持计划-青年拔尖人才培育计划项目(No.CIT&TCD201704039);北京工商大学国家两科基金培育项目(No.LKJJ2017-20);北京工商大学科研创新服务能力建设项目(No.PXM2018_014213_000033)
语种:中文
中文关键词:平行坐标;数据覆盖;数据筛选;可视化
外文关键词:parallel coordinates;data coverage;data filtering;visualization
摘要:针对类别数据在传统平行坐标系中的映射重叠问题,提出类别统计和数据累积式偏移映射的平行坐标改进方法。该方法首先统计多维数据中的各类别数据的频次,使用直方图表示其记录数,将直方图与平行坐标相结合提出改进平行坐标。然后提出一种类别数据的数据累积式偏移算法,将映射在一点的数据均匀分布在坐标轴上的一定区域中,区域的范围根据数据记录数确定。最后设计实现可视化分析系统,通过改进平行坐标实现对数据集的筛选、条件交叉分析、类别间数据分析和维度间数据分析;通过联动视图和弦图两种方式实现每两个维度间的对比分析;通过字云显示每一维度的频次分布。案例数据集实验结果表明,该方法能在平行坐标中实现各维度中类别间的对比、各维度中记录数排序,以及对筛选数据集的分析,展示类别型数据维度间的关联关系。
Aiming at the problem of the overlap between the category data and the traditional parallel coordinate system,a parallel coordinate method of category statistics and data accumulated offset mapping is proposed. The method first counts the frequency of each category data in the multidimensional data, uses the histogram to show the distribution of the detection results and the number of records, and combines the histogram with the parallel coordinates to propose improved parallel coordinates. And then it proposes a data accumulation formula offset algorithm, the data mapped at one point is evenly distributed in a certain area on the coordinate axis, and the range of the area is determined according to the number of data records. Finally, a visual analysis system is designed and implemented, filtering of the data set, cross analysis, analysis of inter-category data and analysis of inter-dimensional data can be accomplished by improving parallel coordinates.It comparatively analyzes every two dimensions by the linkage view and chord diagram, and shows the number of records of each dimension in the data set through the word cloud. The experimental results of case datasets show that the proposed method can simultaneously display the contrasts, sorts, and the analysis of the selected datasets in different dimensions in parallel coordinates, and can visually display the association between the categories of data types.
参考文献:
正在载入数据...