Codes für Extraktieren Infos aus Tabellen ohne Linien oder mit nicht vollständigen Linien
---> seh the issue ,,Bei Tabelle ohne Vertikale oder mit wenigen vertikalen"
Tabelleninhalte ohne verbundene Zellen können jetzt korrekt extrahiert und ausgegeben werden, unabhängig davon, ob die Tabelle Rahmen hat. Um alle Tabellen mit einem Programm zu bearbeiten, möchte ich am Anfang eine rahmenlose Tabelle in eine Vollrahmentabelle oder eine Vollrahmentabelle in eine rahmenlose Tabelle umwandeln. denke Entfernen Linien ist einfacher so möchte ich in der Zukunft alle Tabellen rahmenlos machen. Daher muss der Code geändert werden, der zuvor verwendet wurde, um die Tabellen mit vollständigen Linien zu verarbeiten.
Tabellen mit nicht vollständigen Linien oder mit vollständigen Linien ---> entfernen alle Linien
extraktieren Infos aus Tabellen ohnen Linien
Ich habe ein einfaches DeepLearning Modell durch NanoNets erstellen, nun kann das Modell beurteilen, ob im Bild Tabelle oder Text ist. Aber für Bilder mit Tabelle und Text kann es die Position der Tabelle nicht beurteilen, also möchte ich ein komplettes Modell selbst mittels TensorFlow Objekt Detection API bauen, aber ich habe TFOD API noch nicht erfolgreich heruntergeladen.
---> seh the issue ,,Erkennung der Tabellezone ohne Linien" und ,,install TF API"
TODOs:
Die entsprechende Codes werden noch nicht sortiert und verpackt.
Finden eine Möglichkeit, den Inhalt verbundener Zellen richtig zu lesen.
TODOs: