huichen5796 / 2022-studienarbeit-hui-chen

a tool for detecting tables in image and analysing complex header
3 stars 0 forks source link

über was ich letzte Woche gemacht #48

Closed huichen5796 closed 2 years ago

huichen5796 commented 2 years ago
  1. Codes für Extraktieren Infos aus Tabellen ohne Linien oder mit nicht vollständigen Linien ---> seh the issue ,,Bei Tabelle ohne Vertikale oder mit wenigen vertikalen"
  2. Tabelleninhalte ohne verbundene Zellen können jetzt korrekt extrahiert und ausgegeben werden, unabhängig davon, ob die Tabelle Rahmen hat. Um alle Tabellen mit einem Programm zu bearbeiten, möchte ich am Anfang eine rahmenlose Tabelle in eine Vollrahmentabelle oder eine Vollrahmentabelle in eine rahmenlose Tabelle umwandeln. denke Entfernen Linien ist einfacher so möchte ich in der Zukunft alle Tabellen rahmenlos machen. Daher muss der Code geändert werden, der zuvor verwendet wurde, um die Tabellen mit vollständigen Linien zu verarbeiten.
  1. Ich habe ein einfaches DeepLearning Modell durch NanoNets erstellen, nun kann das Modell beurteilen, ob im Bild Tabelle oder Text ist. Aber für Bilder mit Tabelle und Text kann es die Position der Tabelle nicht beurteilen, also möchte ich ein komplettes Modell selbst mittels TensorFlow Objekt Detection API bauen, aber ich habe TFOD API noch nicht erfolgreich heruntergeladen. ---> seh the issue ,,Erkennung der Tabellezone ohne Linien" und ,,install TF API"

TODOs: