Open henbucuoshanghai opened 3 months ago
压缩维度是288? 2是时间?88是hw?
loss包括reconstruction loss(L1/L2),perceptual loss,gan loss,kl loss。
目前的vae是488倍压缩,时间4,空间8。
训练的时候encoder和decoder同时训练。
可以当做最基本的那种vae原理? 但是输入是视频,thw可变化?fps同样是输入?
压缩维度是288? 2是时间?88是hw?