文章总览 - 12
Qwen3-VL
Qwen3-VL

11
VLForgery Face Triad:Detection, Localization and Attribution via Multimodal Large Language Models
VLForgery Face Triad:Detection, Localization and Attribution via Multimodal Large Language Models

aixiv文章,基于大语言模型完成人脸篡改的检测、定位和溯源任务,其核心的创新点是构建了部分合成面部数据集,以及一个基于MLLM的LoRA微调模型和一个基于MLLM的篡改思维链EKCot。评价:其使用低级视觉模型对图片的多个方面打分作为视觉低级线索,然后和精心设计的prompt拼接来微调大语言模型MLLM。 - 人脸篡改检测 - MLLM

12