salesforce / BLIP

PyTorch code for BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation
BSD 3-Clause "New" or "Revised" License
4.85k stars 648 forks source link

相似图像生成的caption一样,该如何解决? #188

Open shams2023 opened 1 year ago

shams2023 commented 1 year ago

感谢你的工作,这是一个很棒的工作! 我的中文数据集中有很多相似的图像(即他们的穿着很相似),当我使用BLIP对其进行生成时,生成的caption一样,请问这个问题该如何解决?谢谢