opencampus-sh / sign-language-translator

German Sign Language Translator
GNU General Public License v3.0
1 stars 0 forks source link

Tagesschau Videos segmentieren in Sätzen/Paragraphen des Gebärdendolmetschers (händisch Ground Truth Datensatz) #13

Open ApaydinK opened 1 week ago

ApaydinK commented 1 week ago

Inakative und aktive Phasen des Gebärdens labeln und versuchen diese zu den Untertiteln zuzuordnen

ApaydinK commented 4 days ago

Henrik findet es nicht möglich als den Datensatz ohne professionelle Hilfe zu label

Die neutrale Pose ist einfach zu erkennen. Immer wenn die Hände runter gehen und auch außerhalb des Frames gehen können, dann können wir identifizieren wann aktiv und inaktiv gebärdet wird.

Er schlägt vor erst die aktiven Sequenzen mit Vision Models zu gruppieren und sich den Task danach noch einmal durchzuführen.

ApaydinK commented 4 days ago

ToDo: Henrik: Aktivität und keine Aktivität identifizieren