wangbin / jiebago

Jieba 分词 Go 语言版
492 stars 114 forks source link

according to python jieba, "a b 4" is a valid dictionay record #2

Closed zzn01 closed 1 year ago

zzn01 commented 7 years ago

尽管 https://github.com/fxsjy/jieba 是这么说,但是它的实现处理了"a b" 这种情况,所以应该支持一下。

词典格式和 dict.txt 一样,一个词占一行;每一行分三部分:词语、词频(可省略)、词性(可省略),用空格隔开,顺序不可颠倒。file_name 若为路径或二进制方式打开的文件,则文件必须为 UTF-8 编码。