cd ./test_nlp_model
python -m pytest -m server -k trt --disable-warnings -sv ./test_AFQMC_PTQ_trt_int8.py
python -m pytest -m server -k trt --disable-warnings -sv ./test_AFQMC_base_trt_fp32.py
python -m pytest -m server -k trt --disable-warnings -sv ./test_AFQMC_base_trt_fp16.py
bug描述 Describe the Bug
错误信息
错误引入 PR:https://github.com/PaddlePaddle/Paddle/pull/50915
case 地址:https://github.com/PaddlePaddle/PaddleTest/tree/develop/inference/python_api_test/test_nlp_model
镜像(推荐): registry.baidubce.com/paddlepaddle/paddle_manylinux_devel:cuda10.2-cudnn7.6-trt7.0-gcc8.2
错误类型:AFQMC_base, AFQMC_PTQ_1 模型在 develop 分支多环境下执行 trt 推理精度下降
Bug 复现步骤
环境配置
执行步骤:
1、基于对应镜像构建容器并配置好环境 1.1 起容器后进入 1.2 配置依赖
1.3 下载 case 并安装 case 依赖以及推荐镜像对应的 paddle whl:
1.4 执行 case
其他补充信息 Additional Supplementary Information
@jinyouzhi @luotao1 @zhangting2020 辛苦处理一下。