terrifyzhao / bert-utils

一行代码使用BERT生成句向量,BERT做文本分类、文本相似度计算
Apache License 2.0
1.65k stars 425 forks source link

你这个代码有个大坑! #75

Open dullblue opened 3 years ago

dullblue commented 3 years ago

就是最大序列长度设置得太小,# 序列的最大程度,单文本建议把该值调小 max_seq_len =

dullblue commented 3 years ago

max_seq_len = 至少要设置为80, 每个句子40个汉字,否则成功率提升不起来的。

myinvoke commented 2 years ago

设置为80之后,输入两个相同的句子,相似度也不高