近日,中国科学院软件研究所天基综合信息系统重点实验室研究团队的论文“面向跨粒度小样本学习的元注意力生成网络”被计算机视觉领域顶级期刊《国际计算机视觉杂志》(IJCV)接收。论文首次提出一个新的学习问题:跨粒度的小样本学习(CG-FSL),并基于结构因果理论推导出适用于CG-FSL的因果学习模型,称为元注意力生成网络 (MAGN),有效突破细粒度小样本学习的瓶颈。
研究团队解释,细粒度分类旨在识别属于粗粒度类别的细粒度子类的图像,相比于粗粒度样本,其收集和标注难度大、成本高。现有的标准小样本学习(FSL)侧重于对已知和未知类进行泛化,所有的分类都处于相同的粒度级别。实践中使用FSL方法来解决分类问题时,需要为某些细粒度类提供大量标记样本。
如何才能实现基于少量标记样本的细粒度分类,是研究团队需要解决的问题。由于粗粒度类样本的易得性,他们希望从粗粒度类别中学习知识,并通过少量样本转移到细粒度类别中。
在该研究中,科研人员遵循认知神经学的规律,提出了基于大量粗粒度类标签样本进行训练,在测试阶段对细粒度子类标签样本进行划分的方法。同时,通过结构因果模型(SCM)对CG-FSL进行分析,发现在粗粒度级别学习的标准小样本学习模型实际上是一个混杂因素。研究团队采用后门调整以解耦干扰,推导并提出了一个称为元注意力生成网络 (MAGN) 的因果CG-FSL模型。该模型以双层优化方式进行训练,可以自适应地生成多注意图,以消除由粗粒度类别信息引起的混淆。
研究团队基于5个不同的细粒度图像数据集,通过构建多个基准和评估协议,来对比CG-FSL方法和几种广泛使用的FSL方法。经过大量实验,结果表明CG-FSL更具有挑战性,所构建的MAGN模型在细粒度分类任务精度上明显优于标准小样本学习模型,实现了在跨粒度小样本学习上的突破。
论文第一作者为助理研究员强文文、博士生李江梦。
相关论文信息:https://link.springer.com/article/10.1007/s11263-023-01760-7
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:shouquan@stimes.cn。