【question】您好，如果将pdf转换成图片应该怎么让模型同时阅读多种图片并回答问题

whysirier commented 4 weeks ago

pdf结合langchain可能效果差点，但直接阅读图片，效果不错。demo中每次只能提交一张图片和一个question，请问怎么提交多张图片和一个question这种形式。

No response

V100 32GB * 2

期待回答

whysirier commented 4 weeks ago

是多张图片，说错了

whysirier commented 4 weeks ago

感觉这个单图识别很强啊，比Qwen强了不少，用得也很方便

zRzRzRzRzRzRzR commented 3 weeks ago

可以查看 #84 #83 ，不支持多个图片

THUDM / CogVLM2