Open idekazuki opened 5 years ago
fine tuning のために最終層をepic-kitchenに合わせて127categoryに変更している。 最終層を出力すると以下のようになっていた。 Linear(in_features=2048, out_features=125, bias=True) in_featuresの2048は--cropCsize, --batch_sizeを変更しても前層の出力が2048なので常に同じになる。 なぜout_featuresを125に減らしているのか忘れた。(ただの間違い?) 125に変更すると、エラーが出て動かなくなった。 エラー内容を見てみると m1: [8 x 32768], m2: [2048 x 125]という記述がある。m2の部分がモデル構築時に設定したパラメータで、m1の部分が実際の入力時のshapeを表していると考えられる。
このm1に対応する変数を探して表示する必要がある。
前層の出力を確認した。 AvgPool3d(kernel_size=(1, 4, 4), stride=1, padding=0) https://pytorch.org/docs/stable/nn.html#torch.nn.AvgPool3d
動画の前処理方法を変更してモデルに入力したところ、エラーが発生した。最終的な入力サイズを調整するパラメータ--cropRsize を168に変更したところ正常に動作したが、既存研究とおり224で学習したいので原因を解明中。