Closed Zlzzzupup closed 3 weeks ago
您好,我在测试qwen-7b时通过转onnx会出错,直接中断。但是我测试了qwen-1.5b转onnx是正常的。因为我了解到onnx单个文件是有大小限制的,所以想问下这块有测试过更大的模型吗?
暂时没有测试过更大的,不过,之前试过chatglm3-6b,也超过2GB了,没有出错。 你说的出错是pytorch转onnx时,超过2GB会出错?
qwen2-1.5b已经是3GB左右的模型文件占用了,所以应该和2GB容量限制无关,超过2GB会拆分成一堆小文件,所以大概率和他无关,可能是你的内存不够用了哈。
您好,我在测试qwen-7b时通过转onnx会出错,直接中断。但是我测试了qwen-1.5b转onnx是正常的。因为我了解到onnx单个文件是有大小限制的,所以想问下这块有测试过更大的模型吗?