登录    注册    忘记密码

详细信息

一种图像形状的编码表达方法及其应用    

An image shape coding expression method and its application

文献类型:期刊文献

中文题名:一种图像形状的编码表达方法及其应用

英文题名:An image shape coding expression method and its application

作者:苗军[1];许少武[1];卿来云[2];乔元华[3];邹柏贤[4]

第一作者:苗军

机构:[1]北京信息科技大学计算机学院,网络文化与数字传播北京市重点实验室,北京100101;[2]中国科学院大学计算机科学与技术学院,北京100049;[3]北京工业大学数理学院,北京100124;[4]北京联合大学应用文理学院,北京100191

第一机构:北京信息科技大学计算机学院,网络文化与数字传播北京市重点实验室,北京100101

年份:2020

卷号:35

期号:6

起止页码:1-7

中文期刊名:北京信息科技大学学报:自然科学版

基金:国家自然科学基金项目(61872333);北京市自然科学基金项目(4202025);北京市教委科技计划项目(KM201911232003);北京市未来芯片技术高精尖创新中心科研基金(KYJJ2018004)。

语种:中文

中文关键词:形状编码;卷积神经网络;手写数字识别;图像识别

外文关键词:shape encoding;CNN;handwriting digital recognition;image recognition

摘要:针对一般卷积结构无法直接提取图像的高级语义特征的问题,提出了通过编码的方式获取形状这一图像全局结构特征的方法——形状编码。形状编码包含两个步骤:第一步是将原图像转换为由显著像素点和非显著像素点组成的二值特征图;第二步是基于二值特征图中显著点对的空间位置关系进行编码。编码的结果是表征原图像的形状特征的形状编码图,可用于替代原始图像送入卷积神经网络中作为学习对象。在形状编码方法的基础上提出了两种改进编码方法,分别是动态形状编码和分块形状编码。实验证明,同时将形状编码图和原始图像送入卷积神经网络进行学习,相比只使用原始图像时可以获得更高的识别准确率。
For the problem that the general convolutional structure cannot directly extract the high-level semantic features of the image,a method for obtaining the global structural features of the image by encoding is proposed.This method is called shape encoding,which consists of two steps.The first step is to convert the original image into the binary feature map composed of salient pixels and insignificant pixels,and the second step is to encode the map based on the spatial position relationship of salient point pairs in the map.The result of the encoding is the shape coding map that represents the shape feature of the original image,which can be used to replace the original image and be sent to the convolutional neural network as a learning object.Two improved coding methods based on the shape encoding,namely dynamic shape encoding and partitioning shape encoding are proposed.It is proved through experiments that sending the shape coding map and the original image into the convolutional neural network for learning at the same time can achieve higher recognition accuracy than that when only using the original image.

参考文献:

正在载入数据...

版权所有©北京联合大学 重庆维普资讯有限公司 渝B2-20050021-8 
渝公网安备 50019002500408号 违法和不良信息举报中心