FrankWork / fudan_mtl_reviews

TensorFlow implementation of the paper `Adversarial Multi-task Learning for Text Classification`
178 stars 40 forks source link

请问data/generated/vocab.mtl.txt数据是所有task,分词后的word列表么? #7

Open yuanyuansiyuan opened 6 years ago

isunym commented 6 years ago

你好,请问这个问题你是怎么解决的呢?还有那个ebemd.300.trim.npy目录?

isunym commented 6 years ago

您好!请问这个问题您怎么解决的呢?以及怎么用 google news word2vec. 得到embed300.trim.npy呢

yuanyuansiyuan commented 6 years ago

保证tensorflow的版本为1.4(或许别的也可以),命令行运行build_data命令来生成vocabulary的列表和embed300.trim.py。看通读取word2vec向量到为数据集的vocabulary列表查询到相应的embed300.trim.npy就行了,可能中间还有一些参数需要修改,我是为自己的数据集生成的50维的向量。

isunym commented 6 years ago

非常感谢您热心的解答,祝科研顺利!