Closed ArlanCooper closed 2 months ago
感谢您bad case的反馈,我想问一下,您这边都是对这一张图片进行的测试么?以上在其他图片上有相同问题出现么?
感谢您bad case的反馈,我想问一下,您这边都是对这一张图片进行的测试么?以上在其他图片上有相同问题出现么?
对的,只在官方提供的这一个图片上进行的测试,我再测试几张图片给您反馈
感谢您bad case的反馈,我想问一下,您这边都是对这一张图片进行的测试么?以上在其他图片上有相同问题出现么?
我这边看了一下代码,是我这边调用的问题,就是image我直接将base64的编码给到了llm进行识别,所以导致算法返回结果比较随机。我看是需要将图片直接输入给到LLM。
image = Image.open(io.BytesIO(base64.b64decode(inputs['image']))).convert('RGB')
是否已有关于该错误的issue或讨论? | Is there an existing issue / discussion for this?
该问题是否在FAQ中有解答? | Is there an existing answer for this in FAQ?
当前行为 | Current Behavior
我跑了官方的示例图片,一架飞机。
如果我不告诉MiniCPM-Llama3-V-2_5这个图片里面有一架飞机,只是问图片中有什么,他的回答就会非常的随意,比如:
输出:
但是,如果你提到了,需要"100%确认的内容",则无结果返回:
答案:
而且,换成英语,它竟然说自己只是语言模型,而不能识别图片!!!
结果:
只有告诉模型图片中有"飞机",它才能描述清楚:
结果:
期望行为 | Expected Behavior
可以正确识别图片中有什么,然后进行描述
复现方法 | Steps To Reproduce
运行环境 | Environment
备注 | Anything else?
No response