文章总览 - 191
Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks
Faster R-CNN:Towards Real-Time Object Detection with Region Proposal Networks

51
examine
examine

52
Mesoscopic Insights:Orchestrating Multi-Scale & Hybrid Architecture for Image Manipulation Localization
Mesoscopic Insights:Orchestrating Multi-Scale & Hybrid Architecture for Image Manipulation Localization

发表于AAAI2025,该论文Mesorch同时构建IML所需的微观与宏观信息介观表征,并提出Mesorch架构,一种融合卷积神经网络和Transformer模型优势的混合模型,通过动态调整尺度权重,能高效捕捉介观层面的伪影特征。

53
LSNet:See Large, Focus Small
LSNet:See Large, Focus Small

54
Exploring Multi-view Pixel Contrast for General and Robust Image Forgery Localization
Exploring Multi-view Pixel Contrast for General and Robust Image Forgery Localization

发表于TIFS 2025,,通过在特征提取网络阶段使用dropout层让同样的图像可以得到不同的输出特征,基于此,使用了两阶段训练,第一阶段在图像内部、跨尺度和跨模态三个维度使用对比损失进行训练,第二阶段使用交叉熵训练定位头,其代码思路和FOCAL非常相似。

55
GIM:A Million-scale Benchmark for Generative Image Manipulation Detection and Localization
GIM:A Million-scale Benchmark for Generative Image Manipulation Detection and Localization

发表于AAAI2025,提出了GIM数据集,提出了双流网络GIMFormer。

56
Loupe:A Generalizable and Adaptive Framework for Image Forgery Detection
Loupe:A Generalizable and Adaptive Framework for Image Forgery Detection

发表于IJCAI 2025,Loupe通过整合补丁感知分类器与带条件查询的分割模块,实现了全局真实性分类与细粒度掩码预测的同步处理。为增强对测试集分布偏移的鲁棒性,该模型创新性地采用伪标签引导的测试时自适应机制,利用补丁级预测结果对分割头进行监督学习。。

57
Neural Clustering based Visual Representation Learning
Neural Clustering based Visual Representation Learning

发表于CVPR2024,认为现有图像视觉提取器基于图片是平滑的这一假设设计了基于网格式的架构,因此提出了聚类特征提取FEC,在图像处理中,FEC算法通过两种交替操作实现:首先将像素分组为独立簇以提取抽象特征,随后利用当前特征向量更新像素的深度特征。这种迭代机制通过多层神经网络实现,最终生成的特征向量可直接应用于下游任务。各层间的聚类分配过程可供人工观察验证,使得FEC的前向计算过程完全透明化,并赋予其出色的自适应可解释性。

58
Mind marginal non-crack regions:Clustering-inspired representation learning for crack segmentation
Mind marginal non-crack regions:Clustering-inspired representation learning for crack segmentation

发表于CVPR2024,提出了一种基于聚类启发的表征学习框架,该框架包含自动裂缝分割的双阶段策略。第一阶段通过预处理步骤实现边缘非裂缝区域的精确定位。在第二阶段,为学习这些区域的判别性特征,我们设计了聚类启发式损失(CI Loss,*clustering-inspired loss*),将监督学习模式转变为无监督聚类方式。

59
CoCoOp:Conditional Prompt Learning for Vision-Language Models
CoCoOp:Conditional Prompt Learning for Vision-Language Models

60