Tramac / tiny-kinetics-400

Tiny Kinetics-400 for test
82 stars 10 forks source link

K400 預處理問題 #3

Open lamsongianm opened 1 year ago

lamsongianm commented 1 year ago

請問一下,因為k400有標注了 那一幀是動作的問始,因此你提供的功能,只最影片300幀 或 補充成有300幀,那有機會會包括不了動作嗎? 還是其他論文也是這樣做? 謝謝你

Tramac commented 1 year ago

你好,截取或补充至300帧是有可能造成动作丢失或者引入冗余信息的。300帧图像大概覆盖了300 / 25 = 12 秒的视频时长,我觉得可以统计一下K400数据集的平均时长,如果差别不是很大,这么做我认为是可行的。

该repo中所引用的一篇论文是这么处理的,可以作为参考。

lamsongianm commented 1 year ago

博主您好,謝謝你的分享。 但當進行testing 時,需要把影片切割成csv檔提供的時段嗎? 但我看很多paper,都只是說用數據增強,如 three crop 後,計算出結果再平均分數,但沒有一編說要跟k400 cvs 檔進行預處理。 但影片內包含了不關這個動作的一些雜訊,會影響訓練及推理結果。謝謝。

image
Tramac commented 1 year ago

在test阶段,如果将视频切割成csv中所提供的只包含动作的时段,是人为的去除了冗余信息,使测试变得更简单了;取three crop计算平均分理论上是更科学的评估方式,更能体现出模型的鲁棒性。个人建议使用第二种方式更好。

lamsongianm commented 1 year ago

博主您好,再次謝謝你的回覆。 如使用K400 進行模型訓練(train),而要依據csv檔進行影片剪裁嗎? 因為我在訓練時發現,影片包含了太多雜訊,因此訓練訓結果很差。而我也試過把影片剪裁,但K400很多csv提供的start_time, end_time都是錯的…

xqc-qc commented 10 months ago

你好 请问这个数据格式可以用来训练Mvitv2吗