Closed TylunasLi closed 3 months ago
fastllm在主分支中增加了fp16算子后,引发了一些编译问题。
__hmax
本次做了如下的修改:
CUDA_NO_TENSOR_CORE
用以下方式测试过:
CMAKE_CUDA_ARCHITECTURES
说明
fastllm在主分支中增加了fp16算子后,引发了一些编译问题。
__hmax
函数,本次做了如下的修改:
CUDA_NO_TENSOR_CORE
;测试
用以下方式测试过:
CMAKE_CUDA_ARCHITECTURES
选项,验证编译。