liwb1219 / zhfeat

7 stars 0 forks source link

想问一下为什么为什么没有中文的模型呢 #2

Open 3244we opened 1 year ago

liwb1219 commented 1 year ago

有中文模型,模型比较大不好直接上传,需要在Usage里面的链接进行下载,然后放入checkpoint文件夹中即可。

3244we commented 1 year ago

感谢

3244we commented 1 year ago

有中文模型,模型比较大不好直接上传,需要在Usage里面的链接进行下载,然后放入checkpoint文件夹中即可。 但是不是只有主题模型吗,没有分类模型

liwb1219 commented 1 year ago

中文模型可以参考英文的:https://github.com/liwb1219/zhfeat/tree/main/BERT-FP-LBL

3244we commented 1 year ago

训练好的模型不放一下吗,主要是也没数据,想用一下您的模型也用不了啊

liwb1219 commented 1 year ago

数据人民教育出版社的合作项目(主要就是不同出版社的中小学的课文教材),暂时无法公开。您这把需要模型具体是做什么呢,如果只是简单的体验,可以去我们的demo网站(http://www.chinese-pku.com/)上尝试,左边的“文章分级”嵌入了一个我们之前设计的神经网络分类的模型(分类结果为1-5学段,对应12年级,34年级,56年级,初中,高中

3244we commented 1 year ago

可能想作为一个模型评价指标吧,用不了就算了,感谢

3244we commented 1 year ago

老哥你们的模型是对长度比较敏感吗

liwb1219 commented 1 year ago

可以这么理解。因为可读性评估的数据分布一般会有这个问题:难度低的文章一般是比较短的,难度高的文章一般是比较长的,而模型是用数据训练出来的,所以会有这个问题