Embedding / Chinese-Word-Vectors

100+ Chinese Word Vectors 上百种预训练中文词向量
Apache License 2.0
11.82k stars 2.32k forks source link

符号","似乎缺失 #129

Closed Zqjjjydl closed 3 years ago

Zqjjjydl commented 3 years ago

采用Word + Character + Ngram方法,以综合语料库作为语料训练出的词向量中,似乎缺少","这一字符。我逐行读入并检查了词向量文件,没有找到这一字符及其所对应的词向量,请问这是正常现象吗?

shenshen-hungry commented 3 years ago

第一个词不就是“,”吗?也就是文件的第二行。