flowers2023 / lm-ken

kenlm语言模型,并提供python的rest服务
29 stars 4 forks source link

数据格式问题 #2

Open brealisty opened 3 years ago

brealisty commented 3 years ago

你好,我看了一下你训练的样本中,数字部分,相连的数字不用空格隔开,这是kenlm对格式的要求吗?还是有其他考量?

MR-INSEC commented 1 year ago

目测,数字不分开的目的是将这些数字作为一个字符吧