論文鏈接
源代码Abstract
我们针对泛锐化问题提出了一种深度网络架构,称为PanNet。我们结合特定领域的知识来设计我们的PanNet架构,重点关注泛锐化问题的两个目标:光谱和空间保存
为了保持光谱,我们将上采样的多光谱图像加入到网络输出中,直接将光谱信息传播到重建图像中
为了保持空间结构,我们在高通滤波域而不是图像域训练网络参数
我们表明,训练后的网络可以很好地泛化来自不同卫星的图像,而无需再训练。实验表明,在视觉上和标准质量度量方面,比最先进的方法有了显著的改进
多光谱图像在农业、矿业和环境监测等领域有着广泛的应用。由于物理限制,卫星通常只能测量一张高分辨率全色(PAN)图像(即灰度)和几张低分辨率多光谱(LRMS)图像.泛锐化的目标是将这些光谱信息和空间信息融合在一起,得到与PAN相同尺寸的高分辨率多光谱(HRMS)图像
过去方法存在的问题随着近年来深度神经网络在图像处理应用中的进展,研究人员已经开始探索这种泛锐化的途径,例如,一个深度泛锐化模型假设关系HR/LR多光谱图像斑块之间的差值与对应的HR/LR全色图像斑块之间的差值相同,并利用这一假设通过神经网络学习映射,最先进的泛锐化模型,基于卷积神经网络,称为PNN[21],采用了先前提出的图像超分辨率架构
这两种方法都把泛锐化问题看作一个简单的图像回归问题。也就是说,尽管他们能够获得良好的结果,但他们没有利用泛锐化的特定目标——光谱和空间保存——而是将泛锐化视为一个黑盒深度学习问题。然而,对于泛锐化,很明显,保留空间和光谱信息是融合的主要目标,因此深度学习方法应该明确地关注这些方面
这激发了我们提出的称为“PanNet”的深度网络,它具有以下特征:
我们将泛锐化的问题特定知识纳入深度学习框架。具体来说,我们使用上采样的多光谱图像在网络中传播光谱信息,我们将此过程称为“光谱映射”。为了重点研究PAN图像中的主体结构,我们在高通域而不是图像域训练网络我们的方法是一个端到端系统,它完全从数据中自动学习映射。与之前的(非深度)方法不同,卷积允许我们捕获MS图像和PAN图像不同波段的内部相关性实验表明,PanNet与几种标准方法以及其他深度模型相比,实现了最先进的性能由于成像值的范围不一致,大多数传统方法需要针对不同的卫星进行参数调整。然而,在高通域的训练消除了这个因素,允许在一个卫星上的训练很好地推广到新的卫星,这不是在图像域上训练的其他深度方法的特征 Related work
简要介绍下过去的work
近几十年来出现了各种各样的pan锐化方法。其中,最流行的是基于分量替换,包括强度色调饱和度技术(IHS)[5],主成分分析(PCA)[20]和Brovey变换[14]。这些方法简单而快速,但它们往往以引入光谱失真为代价,成功地接近了PAN中包含的HRMS图像的空间分辨率
为了解决这个问题,已经提出了更复杂的技术,例如自适应方法(例如,PRACS[8])和频段相关方法(例如,BDSD[13])。在多分辨率方法[19,22]中,PAN图像和LRMS图像被分解,例如使用小波或拉普拉斯金字塔,然后融合
其他基于模型的方法将PAN、HRMS和LRMS图像之间关系的信念编码为正则化目标函数,然后将融合问题视为图像恢复优化问题[3,4,7,9,12,18]。其中许多算法都取得了很好的效果。我们在这些方法中选择最好的方法进行实验比较
图2显示了我们提出的泛锐化深度学习方法(称为PanNet)的高级概要。我们首先回顾了泛锐化问题的常见方法,然后在泛锐化的两个目标背景下讨论了我们的方法,即重建包含pan空间内容的高分辨率多光谱图像和低分辨率图像的光谱内容
我们将期望的HRMS图像集表示为X,并设Xb为第b个波段的图像。对于观测数据,P为PAN图像,M为LRMS图像,Mb为第b波段。大多数最先进的方法将融合视为最小化形式的目标
其中f1 (X,P)项强制结构一致性,f2 (X,M)强制光谱一致性,f3 (X)对X施加期望的图像约束。例如,第一个变分方法P+XS让
ω是一个b维概率权向量
其他方法使用空间差分算子G来关注高频内容
为了光谱的一致性,许多方法定义
↑M b表示上采样M b与X b大小相同,通过与平滑核k卷积进行平滑。f3 (X)通常是总变异惩罚
对于泛锐化问题,一个直接的深度学习方法可以利用一个简单的网络架构来学习输入(P,M)和输出X之间的非线性映射关系
其中,fw代表一个神经网络,W代表其参数
PNN[21]使用了这一思想,它直接将(P,M)输入到一个深度卷积神经网络中来近似x。尽管这种直接的架构给出了很好的结果,但它没有利用已知的图像特征来定义输入或网络结构
PanNet architecture与PNN一样,我们也使用卷积神经网络(CNN),但我们的具体结构与PNN不同,使用最近提出的ResNet结构作为我们的神经网络
卷积滤波器对于这个问题特别有用,因为它们可以利用多光谱图像不同波段之间的高相关性,这在SIRF算法[7]中被证明是有用的。与其他泛锐化方法一样,我们的深度网络旨在同时保留光谱和空间信息
High-level idea用图3所示的潜在网络结构序列表示
我们考虑的三种泛锐化模型结构的例子:(从左到右)ResNet [15],ResNet+光谱映射,以及最终提出的网络,称为PanNet。ResNet已被证明可以提高CNN在图像处理任务上的性能,但在泛锐化框架中存在缺点。第二种网络实现了光谱保存的目标,而最后一种网络同时捕获了空间和光谱信息。我们对这三种方法都进行了试验,但没有一种应用于泛锐化
Spectral preservation为了融合频谱信息,我们对M进行了上采样,并在该形式的深层网络中添加了一个跳跃连接
↑M表示上采样LRMS图像,f W表示ResNet,这一项的动机与式(3)中表示的目标相同
正如我们将看到的,它强制X共享m的频谱内容。与变分方法不同,我们不将X与平滑核进行卷积,而是允许深度网络纠正高分辨率的差异。在我们的实验中,我们将此模型称为“光谱映射”,并使用ResNet模型进行fw;对应图3中的中间网络
我们将PAN图像和上采样LRMS图像的高通内容输入到深度网络W中,修改后的模型为
为了获得由函数G表示的高通信息,我们从原始图像中减去使用平均滤波器找到的低通内容
对于LRMS图像,我们在获得高通含量后将样本提升到PAN的大小
我们观察到,由于↑M是低分辨率的,它可以被看作包含了X的低通光谱含量,这是↑M - X项模型。这使得网络f W可以学习映射,将PAN中包含的高通spa信息融合到x中。我们将↑G(M)输入到网络中,以了解PAN中的空间信息如何映射到x中的不同光谱波段。这个目标对应于图3中的PanNet
在图4中,我们展示了图3中左右网络的初步比较。HRMS和LRMS图像有8个光谱带,我们用灰度表示为平均年龄。图4©显示了(a)的ResNet重建的平均绝对误差(MAE)图像,而(d)显示了提出的PanNet的平均绝对误差(MAE)图像。很明显,光谱映射可以更好地模拟光谱内容(在较暗的光滑区域中很明显),而在高通域上训练网络可以保留边缘和细节,这些结论得到了我们大量定量实验的支持
正如引言中提到的,在高通域训练深度网络的另一个优点是消除PAN和HRMS图像在不同卫星上产生的不一致性
在保留光谱信息的同时恢复空间信息的目标激发了式(6)中提出的目标。此外,之前的变分方法试图通过使用先验图像假设[3,7]来提高性能,对应于式(1)中的f3。在这里,我们利用深度学习直接学习一个函数,该函数捕获了PAN和LRMS输入之间的关系,以及HRMS输出
我们采用带有卷积神经网络的ResNet结构作为方程(6)中的网络模型fw,卷积运算有助于多光谱图像不同波段间的耦合建模。因此,我们的网络结构通过以下操作表示
其中,W表示权重,b表示网络偏差,l = 1,…, L−2/2, Y l表示第l层的输出
因此,网络建模的是不包含在↑ M中的高频边缘信息。近似的惩罚是如式(6)所示的Frobenius范数
虽然我们架构的参数层遵循ResNet,但两者在光谱映射过程(底部方程)和网络的高通输入(顶部方程)方面是不同的。在我们的实验中,我们将这种PanNet框架与直接应用于图像域的ResNet进行了比较,以显示合并这种额外领域知识的明显优势。(我们再次回顾,这两种方法都没有应用于泛锐化问题。)我们还比较了最先进的PNN,它使用了与ResNet不同的深度CNN学习方法
Experiments我们利用Worldview3卫星的数据进行了几次实验。该卫星的PAN分辨率为0.41m ~ 1.5m。我们使用随机梯度下降(SGD)来最小化方程(6)中的目标函数。在我们的实验中,我们提取了18,000个大小为64 × 64的PAN/LRMS/HRMS补丁对。我们将其分成90/10%用于训练/验证。我们比较了六种广泛使用的泛锐化方法:PRACS[8]、In- dusion[19]、PHLP[18]、BDSD[13]、SIRF[6,7]和PNN[21]。每个参数都使用了几个参数设置,并选择了最佳性能
我们提出了PanNet,这是一个基于泛锐化的两个目标:光谱和空间保存的深度模型
对于光谱保存,我们引入了一种称为“光谱映射”的技术,将上采样的LRMS图像添加到目标函数中,允许网络只关注图像中的细节
为了空间保存,我们在PAN和上采样LRMS图像的高通分量上训练网络参数
我们使用ResNet作为一个非常适合这项任务的深度模型,与目前最先进的方法(包括PNN和vanilla ResNet)相比,Pan-Net实现了更好的图像重建,并更好地推广到新卫星