登录    注册    忘记密码

详细信息

NVIDIA Tegra K1异构计算平台访存优化研究    

Research on Memory Access Optimization of NVIDIA Tegra K1 Heterogeneous Computing Platform

文献类型:期刊文献

中文题名:NVIDIA Tegra K1异构计算平台访存优化研究

英文题名:Research on Memory Access Optimization of NVIDIA Tegra K1 Heterogeneous Computing Platform

作者:梁军[1];李威[2];肖琳[3];徐歆恺[1]

机构:[1]北京联合大学电子信息技术实验实训基地;[2]北京联合大学自动化学院;[3]北京联合大学应用科技学院

第一机构:北京联合大学工科综合实验教学示范中心

年份:2016

卷号:42

期号:12

起止页码:44-49

中文期刊名:计算机工程

外文期刊名:Computer Engineering

收录:CSTPCD;;Scopus;北大核心:【北大核心2014】;CSCD:【CSCD_E2015_2016】;

基金:国家自然科学基金重大研究计划项目(91420202);北京市教育委员会科技计划面上项目(SQKM201411417010;KM201511417003)

语种:中文

中文关键词:GPU优化;访存带宽;数据本地化;向量化;合并访问;拉普拉斯滤波算法

外文关键词:GPU optimization ; memory access bandwidth ; data localization ; vectorization ; coalesced access ; Laplace filtering algorithm

摘要:在异构计算平台的移植和优化过程中,数字图像处理算法的访存性能已成为制约系统性能的主要因素。为此,结合NVIDIA Tegra K1硬件架构特征和具体算法特性,从合并与向量化访存优化、全局访存bank和channel冲突消除等方面,对矩阵转置算法和拉普拉斯滤波算法在NVIDIA Tegra K1异构计算平台上的实现和访存性能优化进行研究。实验结果表明,采用优化方法后的矩阵转置算法和拉普拉斯滤波算法在NVIDIA Tegra K1异构计算平台上取得了较大的访存性能提升,并且具有较好的实时性。
During the transplantation and optimization of the heterogeneous computing platform, memory access performance of digital image data algorithm becomes the main factor. In order to solve the problem, this paper combines with the NVIDIA Tegra KI hardware architecture' s characteristics and the specific algorithm' s characteristics,reserches the implementation and memory access performance optimization of matrix transpose and Laplace filtering algorithms on the NVIDIA Tegra K1 heterogeneous computing platform from memory access optimization of consolidation and vectorization,eliminating global memory access' s bank and channel conflict etc. Experimental result shows that the performance of matrix transpose and Laplace filtering algorithms on the NVIDIA Tegra K1 heterogeneous computing platform has an obvious improvement, and has good real-time performance.

参考文献:

正在载入数据...

版权所有©北京联合大学 重庆维普资讯有限公司 渝B2-20050021-8 
渝公网安备 50019002500408号 违法和不良信息举报中心