-
这两天调研Pycorrector的GPT模式纠错,感觉结果相对理想,但是我们的目标行业是特定的行业,所以我就在想基于现有的模型shibing624/chatglm3-6b-csc-chinese-lora,THUDM/chatglm3-6b再次加强训练,提升错误检测的准确率,样例代码中也提供了训练方法,但是最终的训练模型在工程话的时候,Pycorrector如何加载使用,这一块有详细的说明吗?
-
```js
>>> from pycorrector import MacBertCorrector
>>> m = MacBertCorrector("shibing624/macbert4csc-base-chinese")
>>> print(m.correct_batch(['本项目基于Kenlm统计语言模型工具训连了中文NGram语言模型']))
[{'source': '本…
-
作者你好,请问一下,pycorrector库能否对OCR的误识别的字进行纠错呢,比如0和O,B和8这种,哪种模型效果会比较好呢?谢谢。
-
在基于语言模型进行错误检测过程中,使用平均绝对离差方式进行识别,y_score = ratio * margin_median / med_abs_deviation 这个的作用是什么?ration这个参数代表什么意思?谢谢!
-
在此之前是可以成功运行的
![截屏2023-05-09 09 39 14](https://user-images.githubusercontent.com/94101986/236972429-669a0653-1f4f-4ea4-bd94-953aaf6e09c0.png)
我重新下载了文件还是不行
请问有解决办法吗
-
我目前測試是針對特定句子做訓練
text:
....
讓座
今天
應該
...
訓練資訊
model = pycorrector.Corrector(language_model_path='corpus/lm.klm')
correct_sent, detailect_sent = model.correct("少先隊員因該為老人讓坐")
結果沒有找出任何錯字…
-
### Describe the Question
Please provide a clear and concise description of what the question is.
运行python training_chatglm_demo.py --do_train --do_predict
使用examples/data/garmmar中的train、test数据
…
-
检测文本:西安交通大学官网介绍。
[text.txt](https://github.com/shibing624/pycorrector/files/13593234/text.txt)
检测方式:采用中文长句(按照句号分割)和中文短句(按照中文标点分割)的方式分别检测。
检测结果:发现结果中有较多的误报,详情见如下附件。
[文章的检错结果(按照长句(句号分隔)).xlsx](https…
-
通过接口调用correct_batch 这个方法,遇到回答结果不对,并且每次请求的时候模型输入非常慢,请问这是什么原因导致的?
-
请问我在运行examples\macbert\train.py时,出现这个问题该怎么解决?
Traceback (most recent call last):
File "D:\bishe\code\pycorrector\examples\macbert\train.py", line 139, in
main()
File "D:\bishe\code\pycorr…