Open ApaydinK opened 1 week ago
Henrik findet es nicht möglich als den Datensatz ohne professionelle Hilfe zu label
Die neutrale Pose ist einfach zu erkennen. Immer wenn die Hände runter gehen und auch außerhalb des Frames gehen können, dann können wir identifizieren wann aktiv und inaktiv gebärdet wird.
Er schlägt vor erst die aktiven Sequenzen mit Vision Models zu gruppieren und sich den Task danach noch einmal durchzuführen.
ToDo: Henrik: Aktivität und keine Aktivität identifizieren
Inakative und aktive Phasen des Gebärdens labeln und versuchen diese zu den Untertiteln zuzuordnen