登录    注册    忘记密码

详细信息

基于多重注意力和改进重叠补丁嵌入的语义分割网络    

Aerial images semantic segmentation network based on multi-head attention and enhanced overlapping patch embedding

文献类型:期刊文献

中文题名:基于多重注意力和改进重叠补丁嵌入的语义分割网络

英文题名:Aerial images semantic segmentation network based on multi-head attention and enhanced overlapping patch embedding

作者:沈扬[1];张明瑜[1];刘烜[1,2];龙浩[1,2]

第一作者:沈扬

机构:[1]北京联合大学机器人学院,北京100027;[2]北京联合大学北京市信息服务工程重点实验室,北京100101

第一机构:北京联合大学机器人学院

年份:2026

卷号:44

期号:2

起止页码:94-100

中文期刊名:飞行力学

外文期刊名:Flight Dynamics

收录:;北大核心:【北大核心2023】;

基金:国家重点研发计划资助(2022YFB4601104);北京联合大学校级科研项目资助(ZK20202304,ZKZD202302),北京联合大学“启明星”大学生科技创新创业项目(20242014)。

语种:中文

中文关键词:无人机遥感图像;小目标;多重注意力;语义分割;

外文关键词:UAV remote sensing images;small targets;multi-head attention;semantic segmentation

摘要:针对无人机遥感图像语义分割中面临的密集小目标、多尺度特征、复杂背景和难以获取准确局部信息等问题,提出了一种适用于无人机应用场景的多重注意力变换网络(LGFormer)。在特征图的重叠嵌入过程中,LGFormer利用通道注意力将一半的通道分配给全局注意力,同时从剩余部分中自适应地选择重要的语义信息进行局部注意力处理,,不仅提高了对无人机遥感图像处理能力,还降低了计算资源的消耗。所设计网络模型兼具强大的小目标分割能力和详细且丰富的语义信息,具有较为轻量化的设计。通过AeroScapes和ISPRS Vaihingen数据集验证了该模型在无人机遥感图像语义分割中的优越表现。
To address the challenges in semantic segmentation of UAV remote sensing images,such as dense small targets,multi-scale features,complex backgrounds,and difficulty in obtaining accurate local information,this paper proposes a multi-head attention transformer network(LGFormer)tailored for UAV application scenarios.During the overlapping embedding of feature maps,LGFormer uses channel attention to allocate half of the channels to global attention while adaptively selecting important semantic information from the remaining portion for local attention.This approach not only enhances the processing capability of UAV remote sensing images but also reduces computational resource consumption.This novel network model combines strong small-target segmentation capability,detailed and rich semantic information,and a relatively lightweight design.Experiments on AeroScapes and ISPRS Vaihingen datasets demonstrate that the superior performance of this model in UAV remote sensing image semantic segmentation.

参考文献:

正在载入数据...

版权所有©北京联合大学 重庆维普资讯有限公司 渝B2-20050021-8 
渝公网安备 50019002500408号 违法和不良信息举报中心