LOADING

加载过慢请开启缓存 浏览器默认开启

Pyramidal Feature Shrinking for Salient Object Detection

2023/4/11 SOD SOD

Pyramidal Feature Shrinking for Salient Object Detection

摘要

提出了一种金字塔型特征收缩网络(PFSNet) ,其目的是将相邻的特征节点按照层层收缩的方式进行聚合,从而使聚合后的特征融合有效的细节和语义,丢弃干扰信息。特别地,提出了一种金字塔收缩译码器(PSD) ,以渐近的方式分层聚合相邻特征。此外,我们提出了一个相邻融合模块(AFM)来进行相邻特征之间的空间增强,以动态加权特征和自适应融合适当的信息。此外,利用基于主干提取特征的尺度感知富集模块(SEM)获取丰富的尺度信息,生成具有扩张卷积的不同初始特征。

在SOD任务中,高低级特征在功能之间有着很大的差距,SOD算法的关键在于如何充分利用语义和细节信息,在最后两个特征的合并中,具有丰富细节和噪声的低级特征和高级特征相融合,但是当两种特征完全不同时,差异较大的特征直接融合会产生噪声,导致性能的下降.

本文提出了一种金字塔收缩解码器,将相邻特征定义为相似特征,将不相邻的特征定义为孤立特征,PSD仅收缩每层中类似的特征,经过几层收缩后,最时候当前输入的特征得以保留,然后配合AFM融合模块实现增强当前样本的特征并抑制不适合的特征,最后为了充分利用好多尺度信息,配合使用SEM。其对应的架构图如下所示:

AFM模块

将待合并的特征视为父特征,合并后的特征视为子特征,AFM要实现的两个功能:

(1)子特征应该继承适当当前输入样本的特征,并丢弃不适合的特征

(2)子特征要和父特征保持相同的尺寸

首先通过逐元素乘法从父特征中提取共享特征,然后通过逐元素加法将共享特征加到父特征中从而增强它们,通过级联运算将两个处理后的特征合并,然后让它们依次通过全局平均化,$1\times1$卷积和softmax函数来生成权重向量,最后对权重向量和特征进行相应的乘法,得到加权后的特征,在特征加权后再使用$3\times3$卷积来压缩与副特征一致的子特征的通道,由于不同的特征具有不同的权重,因此在卷积计算受,具有较小权重的元素很少被子特征继承,通过这种方式,达到子特征继承重要的特征并丢弃更多的噪声的目的。

PSD模块

本文首次提出将相邻特征扩展到层次融合。这样,我们就可以利用相邻特征融合的优势,实现多层次的特征融合,避免跳跃式融合操作。此外,从最后一个特征融合的位置来看,它可以直接集成基于 FPN 的框架中包含噪声的低层特征,而 PFSNet 则消除了大量的噪声。
PSD的核心目的是为了实现多特征集成,同时尽可能避免跳跃式特征融合的操作,PSD是由AFM组成的结构。合并特征的过程在相邻节点对中进行,首先使用backone提出五层特征$f_1,f_2,f_3,f_4,f_5$,然后使用AFM模块将相邻的特征$f_i,f_{i+1}$得到$f^{‘}_i$依次类推得到最后的特征$f$

本文作者:GWB
当前时间:2023-11-09 11:11:12
版权声明:本文由gwb原创,本博客所有文章除特别声明外,均采用 CC BY-NC-ND 4.0 国际许可协议。
转载请注明出处!