shiyybua / NER

基于tensorflow深度学习的中文的命名实体识别
1.04k stars 400 forks source link

src_unknown_id = tgt_unknown_id = vocab_size #31

Open spikems opened 6 years ago

spikems commented 6 years ago

src_unknown_id = tgt_unknown_id = vocab_size 这两个size为什么一样呢,不应该一个是词的种类数 ,一个是目标的种类数么?

zhangmingnine commented 6 years ago

因为词的种类都是已知的,不会出现未知情况,不像一个词可能出现一个没训练词向量中没出现的词,所以就直接用vocab_size代替,不会产生影响,我是这样猜测的