Closed bugwelle closed 3 years ago
Beispiel fuer JoeyNMT kann hier entnommen werden, oder auf dem eigenen Colab: https://github.com/bugwelle/cl-neural-networks/blob/main/colab/joeynmt.ipynb
Ok. Also ich hab noch weiter mit JoeyNMT rumgespielt und es scheint, dass es wirklich nur Konfigurations-basiert ist. Ich kann keine eigenen Klassen hinzufügen, etc.
z.B. ist in training.py
die normalization
hard-gecoded auf entweder batch
, tokens
oder none
.
Mein Vorschlag deswegen: JoeyNMT nicht als sub-module, sondern kopieren und anpassen.
@RobinFleige , @stefanDeveloper Oder seht ihr einen anderen weg?
JoeyNMT schreibt z.B. hier https://joeynmt.readthedocs.io/en/latest/overview.html#data-loading , dass Torchtext verwendet wird. Da wir mit Audio arbeiten, müssen wir das auf jeden Fall anpassen.
@bugwelle Von meiner Seite aus sehe ich auch keinen anderen Weg JoeyNMT anzupassen. Daher passt der pull request #8 für mich.
JoeyNMT schreibt z.B. hier https://joeynmt.readthedocs.io/en/latest/overview.html#data-loading , dass Torchtext verwendet wird. Da wir mit Audio arbeiten, müssen wir das auf jeden Fall anpassen.
In joeynmt/data.py
werden die Daten geladen. Ich denke diese Datei muss angepasst werden, dass speech anstatt text Datei geladen werden. Wird korrekt #11 hinzugefuegt