Finetune stuck at vae encode

foreverpiano commented 1 week ago

System Info / 系統信息

11.8 pytorch 2.5.0

Information / 问题信息

[ ] The official example scripts / 官方的示例脚本
[ ] My own modified scripts / 我自己修改的脚本和任务

Reproduction / 复现过程

def encode_video(video):
    video = video.to(accelerator.device, dtype=vae.dtype).unsqueeze(0)
    video = video.permute(0, 2, 1, 3, 4)  # [B, C, F, H, W]
    latent_dist = vae.encode(video).latent_dist
    return latent_dist
train_dataset.instance_videos = [encode_video(video) for video in train_dataset.instance_videos]

this fuction stuck https://github.com/THUDM/CogVideo/blob/main/finetune/train_cogvideox_lora.py

Expected behavior / 期待表现

workr normal

foreverpiano commented 1 week ago

@zRzRzRzRzRzRzR

foreverpiano commented 1 week ago

不知道是不是数据格式的问题，请问可以提供下video.shape吗，我数据是从disney按照官方的要求下载的

THUDM / CogVideo

Finetune stuck at vae encode #413

System Info / 系統信息

Information / 问题信息

Reproduction / 复现过程

Expected behavior / 期待表现