Open qingchen177 opened 2 days ago
顺便想问下,评测结果的含义,是如何评测?或者依据是什么?(不太懂)就比如下面这张图各个含义是如何? 这几个字段的意义:"prefetch","hit","prefetch_rate","acc"
我在.env文件中配置如下:
OPENAI_API_KEY=sk-123456
OPENAI_API_BASE=http://127.0.0.1:8000/v1/chat/completions
LOCAL_LLM=qwen2_5-7b-instruct
然后观察到表格中res的回复会出现如下的回复:
You are Qwen, created by Alibaba Cloud. You are a helpful assistant.
这是模型本身的原因还是要调整提示词
估计是因为你用的transformers版本太新了
尝试评测InternVL2-1B时报错
这是评测运行的命令
python run.py --data MathVision_MINI --model InternVL2-1B
换成 2B的its work,可能是因为1B的基座是qwen2导致的问题python run.py --data MathVision_MINI --model InternVL2-2B
这是报错信息:
可能与Qwen2ForCausalLM这个有关?
如何复现
新建一个demo.py ,运行如下代码即可复现