Open Wilboludriver opened 5 months ago
感谢。
Wikipedia Dumps:
- 统一使用200301,Wikipedia Dumps页面:https://dumps.wikimedia.org/enwiki/20220301/
- 下载到本地后,使用wikiextractor:https://github.com/attardi/wikiextractor;
执行python -m wikiextractor.WikiExtractor <Wikipedia dump file>
- 下载Wikidata5M:https://deepgraphlearning.github.io/project/wikidata5m
InstructGraph的指令微调数据暂时受到保护,因此目前可能只能开源一部分数据,不过数据构建的脚本全部开源,全量数据建议暂时独立构造。 感谢您的支持
Hello, we release the sft data, and you can download from https://huggingface.co/datasets/wjn1996/InstructGraph.
Hello, we release the sft data, and you can download from https://huggingface.co/datasets/wjn1996/InstructGraph.
Thank you so much for your kind open-sourced datasets.
作者您好,
祝贺你们的工作被Findings of ACL 2024接受!
这篇工作的数据集准备部分给了我很大启发,我在自己合成instruction ft datasets的时候发现有部分步骤不太完整:
text = example["input"]
报错。非常感谢你们的贡献,祝学术工作顺利~
Wilbolu