用原版的就可以，用这个版本就一直报错 IndexError: tuple index out of range

Link-Li / Balanced-DataParallel

这里是改进了pytorch的DataParallel, 用来平衡第一个GPU的显存使用量

231 stars 51 forks source link

说明你将输入送进模型时，可能按照字典的形式，常见于transformers中，如：

inputs = {
    "input_ids": ...,
    "attention_mask": ...,
    "token_type_ids": ...,
}
outputs = model(**inputs)

再看下源码的处理：

def scatter(self, inputs, kwargs, device_ids):
    # 从inputs第一个输入中获取bsz
    bsz = inputs[0].size(self.dim)
    num_dev = len(self.device_ids)

所以当你上面输入过来的时候，Inputs就是个空的元组，肯定不work，可以将scatter获取bsz的代码改成我这个：

def scatter(self, inputs, kwargs, device_ids):
    if len(inputs) > 0:
        bsz = inputs[0].size(self.dim)
    elif kwargs:
        bsz = list(kwargs.values())[0].size(self.dim)
    else:
        raise ValueError("You must pass inputs to the model!")
    num_dev = len(self.device_ids)
    ...

Link-Li / Balanced-DataParallel

用原版的就可以，用这个版本就一直报错 IndexError: tuple index out of range #15