发表于TIFS 2025,两阶段训练,第一阶段在图像内部、跨尺度和跨模态三个维度使用对比损失进行训练,第二阶段使用交叉熵训练定位头。
发表于AAAI2025,提出了GIM数据集,提出了双流网络GIMFormer。