4

You can check the issue above, in addition, you can select the parameters you want to train to reduce memory usage. By default, the entire unet is trainable.

# for name, para in unet.named_parameters():
#     if 'temporal_transformer_block' in name and 'down_blocks' in name:
#         parameters_list.append(para)
#         para.requires_grad = True
#     else:
#         para.requires_grad = False
# optimizer = optimizer_cls(
#     parameters_list,
#     lr=args.learning_rate,
#     betas=(args.adam_beta1, args.adam_beta2),
#     weight_decay=args.adam_weight_decay,
#     eps=args.adam_epsilon,
# )

pixeli99 / SVD_Xtend

How much memory is needed when training SVD #9

4