-
一个很奇怪的问题
我的代码如下:
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
sys.path.append("../")
import jieba
jieba.setLogLevel(60)
jieba.load_userdict("dict.txt")
import jieba.analyse
test_sent = sys…
-
day10安装jieba第三方库成功后,运行程序,可以正常运作。
在调用tang300.json时,不能读取文件位置,按照issues上的提示,用VS找到自己的用户名位置,再打开。此时再运行程序,程序报错:No module named 'jieba'。意思是:没有名为“jieba”的模块
这时退出VS,再进入VS,再运行程序,jieba运行正常,但是tang300.json的位置找不到。
-
如何在vue中使用结巴,这对我很有用处!
-
jieba貌似会写入`/tmp/jieba.cache`
```
Loading model from cache /tmp/jieba.cache
Dumping model to file cache /tmp/jieba.cache
```
但是一个server上有多个用户时,就会有写文件冲突。
-
我按照规范建立了自己的字典,因为业务需要,我创建了两个字典,分别名字为a.txt ,b.txt 这两个文件分表包括了两个数据表格里面的数据,自己测试了一下不能如果采用以下的方法加载两个文件,好像不能同时生效
> > import jieba
> > jieba.load_userdict('a.txt')
> > jieba.load_userdict('a.txt')
请问结巴能否同时加载两…
-
RT
-
在列表下面的代码无法格式化,在本地正常,github.io就出错比如:
1. 设置匹配任意字符
```python
jieba.re_han_default = re.compile("(.+)", re.U)
```
2. 修改jieba的字典格式,可以不设置词频
```python
class MyTokenizer(jieba.Tokeniz…
-
您好,每一次我用jieba进行分词的时候,都会有
```
Building prefix dict from the default dictionary ...
Loading model from cache /tmp/jieba.cache
Loading model cost 0.128 seconds.
Prefix dict has been built succesfull…
-
```
put jieba-test
{
"settings": {
"analysis": {
"analyzer": {
"my_ana": {
"tokenizer": "jieba_index",
"filter": [
"lowercase"
]…
-
```python
In [94]: s = '乌鲁木齐爱家超市南门店'
In [95]: jieba.cut(s)
Out[95]:
In [96]: jieba.lcut(s)
Out[96]: ['乌鲁木齐', '爱家', '超市', '南', '门店']
In [97]: jieba.add_word('南门')
In [98]: jieba.lcut(s)…