咨询下长文本处理方式

zjunlp / IEPile

[ACL 2024] IEPile: A Large-Scale Information Extraction Corpus

Other

157 stars 14 forks source link

有场景需要对长文本通常有几万字进行信息抽取，qwen2的最大长度是32K，可以通过修改代码src/finetune.py中的参数max_source_length, max_target_length, cutoff_len: 最大输入、输出长度、截断长度支持长文本的输入和输出吗？看到了 #7 的讨论由于训练模型的最大长度限制，因此可能无法很好处理，想请教下Qwen2的所有Instruct模型,均在32k上下文长度上进行训练，而IEPile训练模型能在32K的文本内进行训练吗？

zjunlp / IEPile

咨询下长文本处理方式 #21