想问一下为什么为什么没有中文的模型呢

liwb1219 / zhfeat

7 stars 0 forks source link

Open 3244we opened 1 year ago

liwb1219 commented 1 year ago

有中文模型，模型比较大不好直接上传，需要在Usage里面的链接进行下载，然后放入checkpoint文件夹中即可。

3244we commented 1 year ago

感谢

3244we commented 1 year ago

有中文模型，模型比较大不好直接上传，需要在Usage里面的链接进行下载，然后放入checkpoint文件夹中即可。但是不是只有主题模型吗，没有分类模型

liwb1219 commented 1 year ago

3244we commented 1 year ago

训练好的模型不放一下吗，主要是也没数据，想用一下您的模型也用不了啊

liwb1219 commented 1 year ago

数据人民教育出版社的合作项目（主要就是不同出版社的中小学的课文教材），暂时无法公开。您这把需要模型具体是做什么呢，如果只是简单的体验，可以去我们的demo网站（http://www.chinese-pku.com/）上尝试，左边的“文章分级”嵌入了一个我们之前设计的神经网络分类的模型（分类结果为1-5学段，对应12年级，34年级，56年级，初中，高中）

3244we commented 1 year ago

可能想作为一个模型评价指标吧，用不了就算了，感谢

3244we commented 1 year ago

老哥你们的模型是对长度比较敏感吗

liwb1219 commented 1 year ago

可以这么理解。因为可读性评估的数据分布一般会有这个问题：难度低的文章一般是比较短的，难度高的文章一般是比较长的，而模型是用数据训练出来的，所以会有这个问题