代码是先经过两个tranformer 再各经过一个decoder，为啥流程图画的先经过一个，然后各经过两个decoder

JiaquanYe / TableMASTER-mmocr

2nd solution of ICDAR 2021 Competition on Scientific Literature Parsing, Task B.

Apache License 2.0

442 stars 104 forks source link

def decode(self, input, feature, src_mask, tgt_mask):
    # main process of transformer decoder.
    x = self.embedding(input)
    x = self.positional_encoding(x)

    # origin transformer layers
    for i, layer in enumerate(self.layers):
        x = layer(x, feature, src_mask, tgt_mask)

    # cls head
    for layer in self.cls_layer:
        cls_x = layer(x, feature, src_mask, tgt_mask)
    cls_x = self.norm(cls_x)

    # bbox head
    for layer in self.bbox_layer:
        bbox_x = layer(x, feature, src_mask, tgt_mask)
    bbox_x = self.norm(bbox_x)

    return self.cls_fc(cls_x), self.bbox_fc(bbox_x)

JiaquanYe / TableMASTER-mmocr

代码是先经过两个tranformer 再各经过一个decoder，为啥流程图画的先经过一个，然后各经过两个decoder #65