文章总览 - 164

IMDL-BenCo:A Comprehensive Benchmark and Codebase for Image Manipulation Detection & Localization
发表于NeurIPS 2024,因为图像篡改检测没有统一的标准,所以构建一个全面的基准,并且设计了一个框架将部分sota网络集成:Mantra-Net,MVSS-net,CAT-Net,ObjectFormer,PSCC-Net,NCL-IML,Trufor和IML-ViT。
61
Image as Set of Points
发表于ICLR2023,将图像视为一组无组织的点,并通过简化的聚类算法提取特征。具体地说,每个点都包括原始特征(如颜色)和位置信息(如坐标),并采用简化的聚类算法对深度特征进行分层分组和提取。
64
SparseViT:Nonsemantics-Centered, Parameter-Efficient Image Manipulation Localization through Spare-Coding Transformer
发表于AAAI2025,SparseViT认为图像篡改检测应该是非语义的,非语义特征与上下文无关,且对篡改敏感。也就是说,在图像中,除非发生篡改,否则它们在各个补丁之间是一致的,而图像块之间的稀疏和离散交互足以提取非语义特征,非语义特征由于其局部独立性,可以通过稀疏编码实现全局交互。
66
Contextrast:Contextual Contrastive Learning for Semantic Segmentation
发表于CVPR2024,该论文面向语义分割任务中不准确的分割边界,提出了Contextrast,即设计了一个基于INfoNCE损失的新损失函数,以保证在不同尺度下的特征(不同类别的平均特征)的空间关系保持一致,还提出了基于边界引导的负样本挖掘方法,旨在提高负样本的质量。(代码未公布)
68



