70B训练脚本 - Githubissues

TigerResearch / TigerBot

TigerBot: A multi-language multi-task LLM

https://www.tigerbot.com

Apache License 2.0

2.24k stars 194 forks source link

Closed zachluo closed 1 year ago

zachluo commented 1 year ago

您好，我看readme写着训练采用了tensor/pipeline-partition技术，但是实际代码是通过ds的offload来实现降显存，请问这一块TP/PP的训练代码是没有公布吗？

chentigerye commented 1 year ago

多谢关注。tp/pp是我们内部代码，主要用于几百张卡，千亿量级模型训练的。我们觉得大部分用户可能不需要，在小数量为调中，公开的ds代码同样表现不错。如有大集群训练的需求，可以联系我们，我们愿意合作支持。

zachluo commented 1 year ago

好的，谢谢