huichen5796 / 2022-studienarbeit-hui-chen

a tool for detecting tables in image and analysing complex header
3 stars 0 forks source link

Vergleichung von Unet und Densenet #53

Closed huichen5796 closed 2 years ago

huichen5796 commented 2 years ago

Unet hat ein kleines Sichtfeld und damit mehr Detailtreue

Es kann zwischen Tabellen und Text unterscheiden, die nahe beieinander liegen image

Wenn es aber viele leere Bereiche in der Tabelle gibt, wird die Vollständigkeit nicht erkannt image

huichen5796 commented 2 years ago

densenet hat ein großes Sichtfeld, sodass Tabellen mit großen Leerzeichen erkannt werden können

image

Aber es kann nicht zwischen Tabellen und Text unterscheiden, die nahe beieinander liegen. image

huichen5796 commented 2 years ago

loss of unet: unet_loss loss of densenet: densenet_loss

huichen5796 commented 2 years ago

bei test6.png ist alle drei model leistungslos: model densenet(tablenet) trained by andere: image model densenet(tablenet) trained by me: image mdoel unet trained by me: image

huichen5796 commented 2 years ago

Ich werde ein spezielles Training versuchen: Trainieren das Modell auf der vorherigen Basis mit den Bildern in der SuccessControl weiter. So etwas wie Transfer Learning.

huichen5796 commented 2 years ago

learn rate 1e-3, densenet 5 epochs: Text in der Nähe von Diagrammen wird jetzt korrekt erkannt image

40 epochs: image gut ist es verfügbar

huichen5796 commented 2 years ago

habe vor, zu reduzieren die Lernrate und trainieren eine Weile weiter.

huichen5796 commented 2 years ago

learn rate 1e-6, 40 epochs, densenet image

huichen5796 commented 2 years ago

5 epochs, learnrate 1e-4, unet image

huichen5796 commented 2 years ago

Manchmal wird ein Teil einer Tabelle wieder als Tabelle erkannt. image Überlappende Tabellen werden zu einer zusammengeführt: image