ztxz16 / fastllm

纯c++的全平台llm加速库,支持python调用,chatglm-6B级模型单卡可达10000+token / s,支持glm, llama, moss基座,手机端流畅运行
Apache License 2.0
3.23k stars 325 forks source link

batch padding mask 处理的相关代码 #427

Closed Liufeiran123 closed 4 months ago

Liufeiran123 commented 4 months ago

batch padding mask 处理的相关代码位置在哪。麻烦提供一下。需要了解下相关的逻辑。