请问data/generated/vocab.mtl.txt数据是所有task，分词后的word列表么？

FrankWork / fudan_mtl_reviews

TensorFlow implementation of the paper `Adversarial Multi-task Learning for Text Classification`

178 stars 40 forks source link

请问data/generated/vocab.mtl.txt数据是所有task，分词后的word列表么？ #7

Open yuanyuansiyuan opened 6 years ago

isunym commented 6 years ago

你好，请问这个问题你是怎么解决的呢？还有那个ebemd.300.trim.npy目录?

isunym commented 6 years ago

您好！请问这个问题您怎么解决的呢？以及怎么用 google news word2vec. 得到embed300.trim.npy呢

yuanyuansiyuan commented 6 years ago

保证tensorflow的版本为1.4（或许别的也可以），命令行运行build_data命令来生成vocabulary的列表和embed300.trim.py。看通读取word2vec向量到为数据集的vocabulary列表查询到相应的embed300.trim.npy就行了，可能中间还有一些参数需要修改，我是为自己的数据集生成的50维的向量。

isunym commented 6 years ago

非常感谢您热心的解答，祝科研顺利！