关于BAG问题 - Githubissues

你好，证件的这种情况比较特殊，因为它有复杂的底纹而不像文档场景那种背景都差不多，因此证件篡改容易产生底纹不连续导致的视觉痕迹，这种情况下用mmsegmentation训练纯视觉convnext分割模型都能得到较好的效果，还能抗resize，没必要用频域方法。这个论文的模型的重点优势在于对于背景单调的文档场景，篡改产生的视觉痕迹很少或没有，能取得比纯视觉模型好得多的检出效果和跨场景泛化性，这套方法在单调背景的文档场景下才是必须的。

对于第1点，如果必须大图resize那肯定会受影响，可以考虑使用纯视觉模型。但如果可以接受裁切身份证区域来减小尺寸但是不resize，那么这个方案仍然能work，并且需要使用这个模型的T-SROIE那套训练推理的pipeline来弄(我不知道你有没有)。对于第2点，尽管频域方法会受到resize影响，但这里主要针对篡改后的resize。篡改前裁切resize再压缩，作为素材再篡改得到训练样本是对训练没有影响的。

总结：证照因为有底纹而适合纯视觉模型做。推理resize会有影响，训练样本的源素材resize没有影响。

qcf-568 / DocTamper

关于BAG问题 #61