Closed huichen5796 closed 2 years ago
densenet hat ein großes Sichtfeld, sodass Tabellen mit großen Leerzeichen erkannt werden können
Aber es kann nicht zwischen Tabellen und Text unterscheiden, die nahe beieinander liegen.
loss of unet: loss of densenet:
bei test6.png ist alle drei model leistungslos: model densenet(tablenet) trained by andere: model densenet(tablenet) trained by me: mdoel unet trained by me:
Ich werde ein spezielles Training versuchen: Trainieren das Modell auf der vorherigen Basis mit den Bildern in der SuccessControl weiter. So etwas wie Transfer Learning.
learn rate 1e-3, densenet 5 epochs: Text in der Nähe von Diagrammen wird jetzt korrekt erkannt
40 epochs: gut ist es verfügbar
habe vor, zu reduzieren die Lernrate und trainieren eine Weile weiter.
learn rate 1e-6, 40 epochs, densenet
5 epochs, learnrate 1e-4, unet
Manchmal wird ein Teil einer Tabelle wieder als Tabelle erkannt. Überlappende Tabellen werden zu einer zusammengeführt:
Unet hat ein kleines Sichtfeld und damit mehr Detailtreue
Es kann zwischen Tabellen und Text unterscheiden, die nahe beieinander liegen
Wenn es aber viele leere Bereiche in der Tabelle gibt, wird die Vollständigkeit nicht erkannt