-
我在使用自己的数据集进行训练时出现了如下问题“ValueError: Expected input batch_size (7008) to match target batch_size (6976).”。我所训练的数据集格式如下,自认为和readme中的示例并无差异,因此想要询问我应当从哪方面入手修正这个问题?非常感谢!
`
{
"id": "5985",
…
-
老师您好,我在使用自己的数据训练macbert模型的时候发现,有未出现在vocab.txt中的生僻字,比如“鄄”,我把生僻字添加到vocab.txt中然后上传到../pycorrector/macbert/output/macbert4csc/路径下,但是一旦开始训练模型的时候,就会自动下载原始的vocab.txt,把我上传的vocab.txt替换掉了,又还原成原始默认的vocab了,请问这是不是…
-
python3 preprocess.py
Traceback (most recent call last):
File "preprocess.py", line 201, in
main()
File "preprocess.py", line 188, in main
test_lst = proc_test_set(sighan15_dir)
File "preproce…
-
如题,我使用开源数据加自己标注的数据训练后得到的模型,仍然无法纠正出自定义训练集中的错误,seq2seq训练了200轮,T5训练了5000轮。请问我需要如何改进呢?
-
```
# 检错概率
prob = self.detection(bert_outputs.hidden_states[-1])
if text_labels is None:
# 检错输出,纠错输出
outputs = (prob, bert_outputs.logits)
else:
det_loss_fct = FocalLoss(num_label…
-
macbert微调,大概迭代到几轮达到了指标
-
-
拼写纠错模型是不是类似于pycorrector开源项目中macbert4csc?另外,拼写纠错中的解码trick是在预测时使用吗?在训练时要使用吗?
-
您好,在之前实验中发现,若bert先用目标域数据进行预训练再finetune,是能够提升一些下游任务效果的,所以想问下macbert4csc是否可以类似于bert,在目标域数据上进行Further Pre-training呢
-
### Describe the Question
Please provide a clear and concise description of what the question is.
### Describe your attempts
- [ ] I walked through the tutorials
- [ ] I checked the documentatio…