Attention weight in CrossAttnDownBlock3D is not trained?

same question. I add this code below accelerator.backward(loss)

                accelerator.backward(loss)
                for name, paras in unet.named_parameters():
                    if paras.requires_grad and paras.grad is None:
                        logger.error(name)

And this is the output of the program

module.down_blocks.0.attentions.0.transformer_blocks.0.attn1.to_q.weight
module.down_blocks.0.attentions.0.transformer_blocks.0.attn2.to_q.weight
module.down_blocks.0.attentions.0.transformer_blocks.0.attn_temp.to_q.weight
module.down_blocks.0.attentions.0.transformer_blocks.0.attn_temp.to_k.weight
module.down_blocks.0.attentions.0.transformer_blocks.0.attn_temp.to_v.weight
module.down_blocks.0.attentions.0.transformer_blocks.0.attn_temp.to_out.0.weight
module.down_blocks.0.attentions.0.transformer_blocks.0.attn_temp.to_out.0.bias
module.down_blocks.0.attentions.1.transformer_blocks.0.attn1.to_q.weight
module.down_blocks.0.attentions.1.transformer_blocks.0.attn2.to_q.weight
module.down_blocks.0.attentions.1.transformer_blocks.0.attn_temp.to_q.weight
module.down_blocks.0.attentions.1.transformer_blocks.0.attn_temp.to_k.weight
module.down_blocks.0.attentions.1.transformer_blocks.0.attn_temp.to_v.weight
module.down_blocks.0.attentions.1.transformer_blocks.0.attn_temp.to_out.0.weight
module.down_blocks.0.attentions.1.transformer_blocks.0.attn_temp.to_out.0.bias
module.down_blocks.1.attentions.0.transformer_blocks.0.attn1.to_q.weight
module.down_blocks.1.attentions.0.transformer_blocks.0.attn2.to_q.weight
module.down_blocks.1.attentions.0.transformer_blocks.0.attn_temp.to_q.weight
module.down_blocks.1.attentions.0.transformer_blocks.0.attn_temp.to_k.weight
module.down_blocks.1.attentions.0.transformer_blocks.0.attn_temp.to_v.weight
module.down_blocks.1.attentions.0.transformer_blocks.0.attn_temp.to_out.0.weight
module.down_blocks.1.attentions.0.transformer_blocks.0.attn_temp.to_out.0.bias
module.down_blocks.1.attentions.1.transformer_blocks.0.attn1.to_q.weight
module.down_blocks.1.attentions.1.transformer_blocks.0.attn2.to_q.weight
module.down_blocks.1.attentions.1.transformer_blocks.0.attn_temp.to_q.weight
module.down_blocks.1.attentions.1.transformer_blocks.0.attn_temp.to_k.weight
module.down_blocks.1.attentions.1.transformer_blocks.0.attn_temp.to_v.weight
module.down_blocks.1.attentions.1.transformer_blocks.0.attn_temp.to_out.0.weight
module.down_blocks.1.attentions.1.transformer_blocks.0.attn_temp.to_out.0.bias
module.down_blocks.2.attentions.0.transformer_blocks.0.attn1.to_q.weight
module.down_blocks.2.attentions.0.transformer_blocks.0.attn2.to_q.weight
module.down_blocks.2.attentions.0.transformer_blocks.0.attn_temp.to_q.weight
module.down_blocks.2.attentions.0.transformer_blocks.0.attn_temp.to_k.weight
module.down_blocks.2.attentions.0.transformer_blocks.0.attn_temp.to_v.weight
module.down_blocks.2.attentions.0.transformer_blocks.0.attn_temp.to_out.0.weight
module.down_blocks.2.attentions.0.transformer_blocks.0.attn_temp.to_out.0.bias
module.down_blocks.2.attentions.1.transformer_blocks.0.attn1.to_q.weight
module.down_blocks.2.attentions.1.transformer_blocks.0.attn2.to_q.weight
module.down_blocks.2.attentions.1.transformer_blocks.0.attn_temp.to_q.weight
module.down_blocks.2.attentions.1.transformer_blocks.0.attn_temp.to_k.weight
module.down_blocks.2.attentions.1.transformer_blocks.0.attn_temp.to_v.weight
module.down_blocks.2.attentions.1.transformer_blocks.0.attn_temp.to_out.0.weight
module.down_blocks.2.attentions.1.transformer_blocks.0.attn_temp.to_out.0.bias

It seems the gradient is not going through.

showlab / Tune-A-Video

Attention weight in CrossAttnDownBlock3D is not trained? #18