Open Lzhang-hub opened 1 month ago
咨询一下,长文本训练支持样本间的相互隔离吗?
支持,internevo默认配置基本上都是 use_packed_data = True, pack_sample_into_one = False;不过loongtrain我们目前只支持unpack data,由于2d attn 依赖的zigzag attn那边暂时只适配了unpack的版本
描述问题
咨询一下,长文本训练支持样本间的相互隔离吗?