OpenBMB / MiniCPM-V

MiniCPM-V 2.6: A GPT-4V Level MLLM for Single Image, Multi Image and Video on Your Phone
Apache License 2.0
12.75k stars 894 forks source link

求教:为什么Resampler后,还可以做OCR识别,感觉已经在压缩的过程中,丢失了信息,做OCR识别任务会降低精度 #684

Open alphanlp opened 1 day ago

alphanlp commented 1 day ago

为什么Resampler后,还可以做OCR识别,感觉已经在压缩的过程中,丢失了信息,做OCR识别任务会降低精度