kaixxx / noScribe

Cutting edge AI technology for automated audio transcription. A nice GUI for OpenAIs Whisper and pyannote (speaker identification)
GNU General Public License v3.0
406 stars 71 forks source link

Transkription wiederholt sich/hängt an mehreren Stellen #13

Closed BabyFnord closed 1 year ago

BabyFnord commented 1 year ago

Während der Transkription scheint es einen Hänger gegeben zu haben – wie bei einer zerkratzten Schallplatte wiederholt sich die gleiche Stelle mehrmals, springt irgendwann weiter, hängt wieder ... 😲

noScribe Fehler

Könnte das durch eine Überlastung des Rechners kommen, wenn andere (Renderarbeit) Prozesse zu Engpässen führen? Zumindest scheint das Stoppen anderer Prozesse keine Abhilfe zu bringen, noScribe bzw. whisper.cc aus diesem Zustand zu führen. Folglich hilft nur Abbrechen und Neustarten der Transkription 😞 . Wenn bereits ein paar Stunden vergangen sind, ist das schade. Gibt es Erfahrungen bzw. Do's'n'Don'ts diesbezüglich?

kaixxx commented 1 year ago

Dieses "Hängenbleiben" bei langen Audiofiles ist ein bekanntes Problem dieser KI und leider noch nicht vollständig gelöst. Ein Workaround hier im letzten Punkt: https://github.com/kaixxx/noScribe#factors-influencing-the-quality-of-the-transcription

Übrigens: Wenn man die Transkription abbricht, ist der bis dahin erreichte Stand trotzdem im Zieldokument gespeichert. Erst ein erneuter Start der Transkription überschreibt diese Datei.

BabyFnord commented 1 year ago

Ah, RTFM – danke für die Erinnerung 😉. Gibt es einen Richtwert, wie lange die Segmente max. sein sollten?

kaixxx commented 1 year ago

Gibt es einen Richtwert, wie lange die Segmente max. sein sollten?

Nein, das habe ich bisher nicht genauer ausprobiert.

Ich habe den Hinweis auf dieses Problem jetzt etwas prominenter platziert, in einer neuen Sektion "Known Issues" im Readme.