-
### Question
How can i use this Model? https://huggingface.co/shibing624/macbert4csc-base-chinese
-
```
def gpt_model(self, texts=None):
if texts is None:
texts = ['今天新情很好', '你找到你最喜欢的工作,我也很高心。']
m = GptCorrector("../model/chatglm3-6b-csc-chinese-lora")
re…
5zjk5 updated
7 months ago
-
### 本周完成工作:
**1、熟悉Wechaty,完成ding-dong最小demo实现**
**2、熟悉deepdialog/juzibot**
**3、根据qinghua老师的建议调研中文文本纠错的成果及可用资源**
### 下周工作计划
**1、讨论项目具体的内容,指定详细工作计划**
-
如题,原论文中report的sighan15的 sentence-wise的 detect和correct分别是 73.5和66.4,描述使用的训练集也是sighan13-15的三个training set以及他们自己构建多达5million的 news title数据。你这边sentence一口气提到了79.4,还是仅用sighan得数据finetune,这个差距也太大了吧
有没有可能你的…
-
数据是根据样例生成的,报错信息如下:
![image](https://github.com/user-attachments/assets/6a0cb6b9-c467-4877-9570-34e90261907c)
是由于这段代码造成吗:
![image](https://github.com/user-attachments/assets/11b7c7d1-3d77-4734-9255-…
-
![screenshot-1728760389319](https://github.com/user-attachments/assets/720ef884-eac2-4dc2-9e7c-c8f4a76ba49a)
-
你好,请问下,可以基于你发布的模型,只用自己的数据再训练吗?
![image](https://github.com/shibing624/pycorrector/assets/63828645/fd14e392-862b-419d-a91f-f71cf3e16ca3)
1w条样本领域内的样本句子,进行数据增强(替换谐音词,英文单词增删改字母),生成了11w增强样本你,
采用这种方式,训…
-
### Describe the Question
Please provide a clear and concise description of what the question is.
新版本macbert4csc中ConfusionCorrector实现逻辑问题,这里需要遍历疑似错误词典,然后每一个都需要re正则,当混淆词典比较大的时候,会特别慢。建议改为前缀树或者其他形式。
`…
-
请问可以指定纠错的target和source的基本发音不要改变吗?举例:干净的胡面,只能改为干净的湖面,不要改为干净的画面。
-
您好,在使用jcorrector的过程中我发现会把一些英文或者数字进行替换,导致一些异常,我想如果句子中包含英文或数字的情况,不将它们替换,而是保留原字符,我该怎么做?