关于推理的问题 - Githubissues

Jiangchenglin521 commented 1 year ago

您好，我这边使用的模型是你们发布的open-llama-panda 7b的这个。问题1，请问hf下载下来的应该不是delta，是全量可用的参数对吧。问题2，做生成的时候有固定的instruction形式么比如说一定要（human: ，assistant：）这样。个人看你们介绍，貌似不会这么限制。问题3，（基于问题2了），我就用通用的generate代码问了两个简单问题，感觉有点不正常啊结果，请问你们评测的时候，官方的核心推理代码在哪里呢？case1：{"input": "世界上最高的山是？", "in_prompt": "世界上最高的山是？", "output": "世界上最高的山是? 马六甲山 1001公里"}case2：{"input": "世界上最美的人是？", "in_prompt": "世界上最美的人是？", "output": "世界上最美的人是? 小刚的妈"} code：model_path = os.path.expanduser(args.model_path) tokenizer = AutoTokenizer.from_pretrained(model_path, use_fast=False) if args.batch_size > 1: tokenizer.pad_token = tokenizer.eos_token model = AutoModelForCausalLM.from_pretrained( model_path, low_cpu_mem_usage=True, torch_dtype=torch.float16 ).cuda()input_ids = tokenizer(in_prompt, return_tensors='pt')["input_ids"].cuda() results = model.generate( input_ids, do_sample=True, temperature=0.8, max_new_tokens=512, )