Closed bao-xiaoyi closed 1 month ago
如题,目前存在依赖问题。 另外,支持starcoder2吗
依赖问题已解决
此外,deepseekcoder-v2转换成megatron格式后(能够转换成功),模型参数量和deepseek-v2不一样导致训练加载模型失败。目前原因未知
您好,有进一步的问题可以在群里发下deepseek-v2的错误提示哈
如题,目前存在依赖问题。 另外,支持starcoder2吗