-
Hello all,
We are curious on what is the MLM accuracy of our eval-set run on the pre-trained model that google-research provided. Specifically, the bert-large-uncased model. However, when trying to…
-
提问时请尽可能提供如下信息:
### 基本信息
- 你使用的**ubuntu**:
- 你使用的**Python3.6**版本:
- 你使用的**Tensorflow-gpu-1.14.0**版本:
- 你使用的**Keras-2.3.1**版本:
- 你使用的**bert4keras**版本:
- 你使用纯**tf.keras**:
- 你加载的**预训练模型 通…
-
请问这里的pytorch_model.bin是指什么,从您那下载下来的pytorch_model.bin大小只有0b
-
-
**您好!请问以下几个问题,非常感谢:**
**(1)请问我以BERT为基础,进行MLM的预训练,同时采用静态Span masking,请问是正确的操作吗?不知道为何,我实际训练出的模型效果反倒不如原生BERT。**
预训练脚本如下:
python3 preprocess.py --corpus_path corpus/corpus.txt \
…
-
## Description
GPT2 tests in tests/test_models.py is mysteriously killed. The was found in the recent [nightly tests](https://github.com/dmlc/gluon-nlp/actions/runs/811741483)(cu102-2.0.0b20210502 an…
-
跑一下代码,发现无法达到0.78+ 的性能。请您指点一下。谢谢!
-
您好,我想问一下,能不能完全不需要微调,从头训练自己的数据集呢?要是可以的话我该如何设置训练脚本呢?
-
hugging face网站跑代码403,没有找到您的模型文件
-
### Error Message
INFO:root:converting to Gluon checkpoint ...
Traceback (most recent call last):
File "convert_tf_model.py", line 159, in
assert len(tf_config) == len(tf_config_names_to_gl…