-
jieba貌似会写入`/tmp/jieba.cache`
```
Loading model from cache /tmp/jieba.cache
Dumping model to file cache /tmp/jieba.cache
```
但是一个server上有多个用户时,就会有写文件冲突。
-
如何在vue中使用结巴,这对我很有用处!
-
RT
-
我按照规范建立了自己的字典,因为业务需要,我创建了两个字典,分别名字为a.txt ,b.txt 这两个文件分表包括了两个数据表格里面的数据,自己测试了一下不能如果采用以下的方法加载两个文件,好像不能同时生效
> > import jieba
> > jieba.load_userdict('a.txt')
> > jieba.load_userdict('a.txt')
请问结巴能否同时加载两…
-
```python
In [94]: s = '乌鲁木齐爱家超市南门店'
In [95]: jieba.cut(s)
Out[95]:
In [96]: jieba.lcut(s)
Out[96]: ['乌鲁木齐', '爱家', '超市', '南', '门店']
In [97]: jieba.add_word('南门')
In [98]: jieba.lcut(s)…
-
```
put jieba-test
{
"settings": {
"analysis": {
"analyzer": {
"my_ana": {
"tokenizer": "jieba_index",
"filter": [
"lowercase"
]…
-
### Proposal:
it could be better to add support of the custom rules into ICU integration
- [Rule Based Number Format](https://unicode-org.github.io/icu/userguide/format_parse/numbers/rbnf.html#rules…
-
jieba.add_word("石墨烯",100,"nr")
jieba.add_word("凱特琳",100,"nr")
jieba.add_word("莫那娄氏",10,"n")
jieba.del_word("自定义词")
不添加词典,利用add_word和del_word仍然不起作用
先开启并行,不起作用。如果先添加词,再进行并行就可以。。。。还真是bug
jieba.…
-
对比了今天自己的作业和廖同学的作业,发现有一点不同的是,line128处我写的是
`text = [x for x in jieba.cut(text,cut_all=False) if len(x) >= 2]`
廖同学直接写的是
`text = [x for x in jieba.cut(text) if len(x) >= 2]`
请问jieba的默认模式是精确模式吗?
但输出的结…
-
jieba.cut和jieba.lcut均支持jieba.cut,
jieba.posseg中的pseg.cut支持use_paddle,
但是pseg.lcut不支持use_paddle,是否方便统一一下,谢谢。
虽然用list(pseg.cut(sentence, use_paddle=True))也能解决问题。