详细信息
基于ARM V8平台的向量算法库实现与优化
Vector Algorithm Library Implementation and Optimization Based on ARM V8 Platform
文献类型:期刊文献
中文题名:基于ARM V8平台的向量算法库实现与优化
英文题名:Vector Algorithm Library Implementation and Optimization Based on ARM V8 Platform
作者:王晶[1];张云泉[1];梁军[2]
机构:[1]北京联合大学北京市信息服务工程重点实验室,北京100101;[2]北京联合大学工科综合实验教学示范中心,北京100101
第一机构:北京联合大学北京市信息服务工程重点实验室
年份:2019
卷号:45
期号:6
起止页码:82-88
中文期刊名:计算机工程
外文期刊名:Computer Engineering
收录:CSTPCD;;Scopus;北大核心:【北大核心2017】;CSCD:【CSCD_E2019_2020】;
基金:国家重点研发计划(2017YFB0202105,2016YFB0200803,2017YFB0202302);国家自然科学基金重点项目(61272136);北京市教委科研计划(KM201811417006)
语种:中文
中文关键词:数学函数库;ARMV8架构;向量算法库;单指令流多数据;访存优化
外文关键词:mathematical function library;ARM V8 architecture;vector algorithm library;Single Instruction Multiple Data (SIMD);memory access optimization
摘要:基于ARMV8架构的VecOp向量算法库,提出一种基础向量算法在ARMV8平台上实现和优化的方案。从访存对界优化、指令集优化、基本块优化以及向量分支优化4个方面进行精细调优,提升向量算法函数在ARMV8平台上的性能,以实现VecOp算法库在ARMV8平台上的优化。实验结果表明,该方案在ARMV8计算平台上实现的向量算法库性能提升可达到10%~300%。
Based on the VecOp vector algorithm library of ARM V8 architecture,this paper proposes a scheme of implementing and optimizing the basic vector algorithm lobrary on ARM V8 platform.The optimization is implemented from four aspects: memory access optimization,instruction set optimization,basic block optimization,and vector branch optimization,to improve the performance of vector algorithm functions on ARM V8 platform to optimize VecOp algorithm library on ARM V8 platform.Experimental results show that the performance of the vector algorithm library on the ARM V8 computing platform can be improved by 10%~300%.
参考文献:
正在载入数据...