-
我在使用bert4keras加载 bert-base-chinese,做分类任务时,会查出显存,但是使用bert4torch就可以正常训练,是torch显存优化的比tensorflow好?还是bert4torch会冻结某些参数嘛?我的显卡是1660 6g显存。
### 基本信息
- 你使用的**操作系统**: windows
- 你使用的**Python**版本: 3.8
- 你使用…
-
提问时请尽可能提供如下信息:
### 基本信息
- 你使用的**操作系统**:
- 你使用的**Python**版本:
- 你使用的**Pytorch**版本:
- 你使用的**bert4torch**版本:
- 你加载的**预训练模型**:
目前进度条只会显示预估剩余时间,但是不会显示已用时间。有时候想预估一下跑一个epoch的时间,但是又不想真的跑完,这个功能就很…
-
提问时请尽可能提供如下信息:
### 基本信息
- 你使用的**操作系统**:
- 你使用的**Python**版本:
- 你使用的**Pytorch**版本:
- 你使用的**bert4torch**版本: 0.3.4
- 你加载的**预训练模型**: bert4torch/examples/sequence_labeling/task_sequence_labeling_…
-
https://github.com/Tongjilibo/bert4torch
起源于苏神的bert4keras改torch版,目前在大模型上,已经包含了目前主要的开源大模型,llama系列,chatglm,bloom系列等等,代码简洁阅读性高,希望收纳
-
Hi everyone,
May I ask for the correct command running the example?
As I trying to running 7B on single 16G V100 or 13B on two 16G V100. it always raise error as follow:
```
Traceback (most rece…
-
苏神您好,之前参考bert4keras写了对应的pytorch版[bert4torch](https://github.com/Tongjilibo/bert4torch), 方不方便在bert4keras的readme中添加下该项目链接呢?按照您自己的意愿来就可以了:)
ps. 知道苏神之前不太喜欢使用pytorch
-
提问时请尽可能提供如下信息:
### 基本信息
- 你使用的**操作系统**: Linux
- 你使用的**Python**版本: python3.8
- 你使用的**Pytorch**版本: '1.10.0+cu102'
- 你使用的**bert4torch**版本: 0.2.9
- 你加载的**预训练模型**:bert_crf
### 核心代码
```python
#…
-
在bert4torch/models.py有
from bert4torch.snippets import print_trainable_parameters,
但是在 bert4torch.snippets 没有 print_trainable_parameters 这个函数的定义
-
提问时请尽可能提供如下信息:
### 基本信息
- 你使用的**操作系统**: Ubuntu
- 你使用的**Python**版本: 3.8
- 你使用的**Pytorch**版本: 2.0.1+cu117
- 你使用的**bert4torch**版本:
- 你加载的**预训练模型**: deberta
### 核心代码
```python
# 请在此处贴上你的核心代码…
-
I can running `llama` but this is `cuda is out of memory`,
who can run on 7B model on `windows11` with `RTX3080ti `?
other projects don't seem to have windows versions?