|
|
PFAM—面向遥感图像分类的基于注意力机制的卷积神经网络剪枝算法研究 | MDPI Electronics |
|
论文标题:Pruning Convolutional Neural Networks with an Attention Mechanism for Remote Sensing Image Classification(基于注意机制的卷积神经网络剪枝方法在遥感图像分类中的应用)
期刊:Electronics
作者:Shuo Zhang, Gengshen Wu, Junhua Gu and Jungong Han
发表时间:27 July 2020
DOI:10.3390/electronics9081209
微信链接:
https://mp.weixin.qq.com/s?__biz=MzI1MzEzNjgxMQ==&mid=2649992621&idx=2&sn=f9a46b
810e1a9f4f5f25708ab5cd9b47&chksm=f1de1769c6a99e7fad327f87280a5ac958dde5906131e
7af42f28f351fa94a9f4bce1183de3e&token=176317181&lang=zh_CN#rd
期刊链接:
https://www.mdpi.com/journal/electronics
原文作者简介
韩军功
英国阿伯里斯特威斯大学
韩军功, 英国阿伯里斯特威斯大学计算机科学的正教授兼主席。曾担任Civolution Technology (飞利浦内容识别和Thomson STS的结合机构) 的高级科学家、高级数学和计算机科学中心 (CWI) 的工作人员、荷兰艾恩德霍芬技术大学 (TU / e) 研究员、以及中国微软亚洲研究院互联网媒体小组研究助理。韩军功教授在人工智能、机器学习领域具有很高的权威,并对此做出了卓越的贡献。
引言
卷积神经网络已经在诸多的计算机视觉任务中取得了巨大成功,但这些复杂深度网络模型获得的优异性能往往得益于高性能处理器强大的高维数据处理能力。此外,复杂的深度网络模型通常包含百万级网络参数,所以需要占用大量的内存空间。然而,以上两个能力是嵌入式遥感设备的硬件所不具备的,这也意味着如果不对复杂深度网络模型进行剪切和压缩,深度学习在遥感图像理解领域的应用就是水中望月。
研究介绍
英国兰卡斯特大学的博士生张硕、吴庚申,河北工业大学的顾军华教授以及英国阿伯里斯特威斯大学的韩军功教授提出了一种利用注意力机制指导深度网络滤波器剪枝的算法 (PFAM)(图1) 来压缩和加速深度卷积神经网络,从而为先进的深度学习在遥感图像的应用扫清障碍。相较于传统的基于滤波器系数范数值为剪枝准则的方法,此研究提出了依据滤波器之间相关性来设置滤波器剪枝准则。该准则通过注意力模块来探索滤波器之间的相关性联系,从而对相关性较小的滤波器进行剪枝来获得全局损失较小且更为精简的压缩模型。
图1. PFAM概述。(a) 基于相关标准的滤波器选择。注意,由于softmax的输出,相关值的总和为1。相关性值较小的滤波器将根据预设的修剪率进行修剪。(b) 卷积层中滤波器修剪的示例。为保持模型容量,允许在下一个修剪阶段之前的每个训练时期将修剪的滤波器更新为非零值。
此外,与一次性直接删减掉滤波器的硬剪枝方法不同,作者采用了不断更新和优化待剪枝的滤波器的策略,从而最大程度上避免了硬剪枝方法存在的误剪问题。算法的整体流程为:在当前训练阶段利用注意力模块计算滤波器之间的相关性,并对其进行排序,之后对相关性较小的滤波器进行软剪枝,然后在下一个训练阶段对其进行恢复和重新评估。在训练的过程中,训练数据始终是对原始模型框架而非次优子模型计算处理。这样的操作可以保证网络的预测能力不受较大影响,且不需要额外的微调处理就能得到具备较好预测能力的压缩模型。
结论
该算法在三个流行的公共遥感影像数据集上进行了实验验证,实验结果展示了算法的优越性能。值得一提的是,PFAM对VGG -16模型的压缩,在对比系列传统方法中,取得了最好的综合性能表现,即获得最大压缩比的同时获得更高的图像分类准确度。此外,对于ResNet-50模型,PFAM在航拍图像数据集 (AID) 上,和目前最好的算法使用相似的卷积运算量相比,获得了多达0.67%的精度提升。本文实验还发现,甚至在对模型压缩60%的情况下,剪切后的模型依然获得较好的图像分类性能。这一结论为深度学习模型在普通的遥感图像采集设备上直接运行提供了有力的实验依据。
期刊简介
Electronics (ISSN 2079-9292; IF:2.412) 是MDPI组织出版的国际性开放获取期刊之一,主题涵盖电子科学与应用领域,致力于发表电子器件、微电子与计算机技术、光电子工程、通信工程、信号与信息处理、微波理论与技术、生物电子工程、能源电子及系统等领域的各类文章。Electronics采取单盲同行评审,一审周期约为15.1天,文章从接收到发表仅需3.4天。
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。