-
In Chinese text, there is no whitespace between words, so when I use TextVectorization.adapt(train_dataset), I can only get Sentence-level vocabulary. the code I used is [https://keras.io/examples/nl…
-
我已经仔细查看过本库的README和之前的Issues,没有发现解决方案。
**问题描述**
您好!请问为什么我用pip下载harvesttext的版本为0.4.1呢?使用pip install --upgrade harvesttext后也没用。谢谢!
**如何复现**
操作系统:
python版本:
3.9
HarvestText版本:
-
## 注意事项
请确认下列注意事项:
* 我已仔细阅读下列文档,都没有找到答案:
- [首页文档](https://github.com/hankcs/HanLP)
- [wiki](https://github.com/hankcs/HanLP/wiki)
- [常见问题](https://github.com/hankcs/HanLP/wiki/FAQ)
*…
-
具体操作和报错如下:
Last login: Mon Jul 15 20:16:21 on ttys001
MacBook-Pro-de-Chen:~ noah$ pip install pyhanlp
Collecting pyhanlp
Collecting jpype1>=0.7.0 (from pyhanlp)
Using cached https://files.pytho…
-
## 注意事项
请确认下列注意事项:
* 我已仔细阅读下列文档,都没有找到答案:
- [首页文档](https://github.com/hankcs/HanLP)
- [wiki](https://github.com/hankcs/HanLP/wiki)
- [常见问题](https://github.com/hankcs/HanLP/wiki/FAQ)
* 我已经…
-
**问题描述:**
crf模型在处理emoji时报错(wordbasedsegmenter不会报错), 样例代码如下:
**复现代码**
```
from jpype import java
from pyhanlp import *
text = '😱😱😱你好,欢迎在😱Pytho😱😱n中😱调用HanLP的API 😱😱😱😱😱😱😱😱😱😱'
Strin…
-
**Describe the bug**
pyhanlp多进程异常. 不能充分利用cpu,而且感觉 代码停止/"卡住"
**Code to reproduce the issue**
```
!pip3 install pyhanlp
from multiprocessing import Pool
from tqdm import tqdm
from pyhanlp impo…
-
**Describe the bug**
A clear and concise description of what the bug is.
from hanlp import CustomDictionary 后,调用CustomDictionary.reload()返回false,无法更新词典,通过打印部分日志后仍然没有解决问题
![image](https://user-i…
-
**Describe the bug**
使用pyhanlp在多线程下测试无问题,在多进程下会出现异常。
**Code to reproduce the issue**
Provide a reproducible test case that is the bare minimum necessary to generate the problem.
```from …
-
## 注意事项
请确认下列注意事项:
* 我已仔细阅读下列文档,都没有找到答案:
- [首页文档](https://github.com/hankcs/HanLP)
- [wiki](https://github.com/hankcs/HanLP/wiki)
- [常见问题](https://github.com/hankcs/HanLP/wiki/FAQ)
*…