AntNLP / gnn-dep-parsing

Apache License 2.0
32 stars 7 forks source link

关于数据集 #8

Open Rvlis opened 2 years ago

Rvlis commented 2 years ago

作者你好,请问可以提供源码中使用的数据集吗?

[Data]
DATA_DIR = ../data
TRAIN = %(DATA_DIR)s/train_v3.3.0.conllu
DEV = %(DATA_DIR)s/dev_v3.3.0.conllu
TEST = %(DATA_DIR)s/test_v3.3.0.conllu
GLOVE = %(DATA_DIR)s/glove.6B.100d.txt.gz
JT-Ushio commented 2 years ago

你好,原始数据集可以从 LDC 上获取。下载网址:https://catalog.ldc.upenn.edu/LDC99T42 原始数据集还需要额外使用 CoreNLP 工具转换格式+预测 POS tag,细节可以参照论文,如果遇到问题欢迎交流~