Es wäre nützlich, wenn der Benutzer gewisse Angaben aus dem PDF-Dokument selektieren kann, auch ohne vorher ein bestimmtes Formularfeld selektiert zu haben. Der extrahierte Text könnte dann irgendwo angezeigt werden und/oder in die Zwischenablage landen, und der Benutzer kann dann selber entscheiden, ob und wo er den extrahierten Text einfügen möchte. Die hierzu benötigte Funktionalität ist schön verfügbar in der API der Data Extraction Service (Datenextraktion mit Format «text»). Das könnte z.B. etwa so aussehen:
«AI-Stern» ist auch in der Dokument-Anzeige verfügbar, und triggert die Textextraktion nach Zwischenablage.
Benutzer selektiert den gewünschten Bereich (wie bei der Koordinatenextraktion)
Text wird extrahiert, angezeigt, und in die Zwischenablage kopiert. (Sorry for the messy image editing skills…)
Der grosse Vorteil wäre, dass die Textextraktion direkt für jedes Text-Input-Feld auf allen Seiten verfügbar wäre, ohne dass wir jedes einzelne Formular überarbeiten müssten, und ohne bei jedem Feld ein Stern-Ikon hinzufügen zu müssen.
Zudem denke ich, dass die Bedienung für den Benutzer so sogar etwas einfacher und intuitiver wäre, in Vergleich zur bereits umgesetzten Koordinatenextraktion. Bei der Koordinatenextraktion muss der Benutzer nämlich zuerst im Formular die Extraktion aktivieren, dann im Dokument die richtigen Angaben selektieren, und dann wieder im Formular verifizieren, dass alles richtig eingefügt wurde. Also zwei Mal einen «Kontext Switch» von einer Seite vom Browserfenster zur anderen. Mit Extraktion in die Zwischenablage kann der Benutzer direkt im Dokument die Extraktion aktivieren und ausführen, und dann im Formular die extrahierten Angaben einfügen. Hier geht sein Fokus also nur in eine Richtung (und zwar in die gleiche Richtung wie die extrahierten Daten) statt zuerst vom «Ziel» zurück zur «Quelle» und dann wieder zum «Ziel» zu gehen. Das tönt vielleicht wie ein kleines Detail, aber ich glaube, wenn viele unterschiedliche Informationen aus einem Bohrprofil extrahiert werden müssen, dass dies trotzdem einen spürbaren Unterschied macht für den Benutzer.
Die Extraktion für komplexere Datentypen können wir natürlich immer noch behalten, so wie sie für Koordinaten bereits implementiert ist.
Es wäre nützlich, wenn der Benutzer gewisse Angaben aus dem PDF-Dokument selektieren kann, auch ohne vorher ein bestimmtes Formularfeld selektiert zu haben. Der extrahierte Text könnte dann irgendwo angezeigt werden und/oder in die Zwischenablage landen, und der Benutzer kann dann selber entscheiden, ob und wo er den extrahierten Text einfügen möchte. Die hierzu benötigte Funktionalität ist schön verfügbar in der API der Data Extraction Service (Datenextraktion mit Format «text»). Das könnte z.B. etwa so aussehen:
«AI-Stern» ist auch in der Dokument-Anzeige verfügbar, und triggert die Textextraktion nach Zwischenablage.
Benutzer selektiert den gewünschten Bereich (wie bei der Koordinatenextraktion)
Text wird extrahiert, angezeigt, und in die Zwischenablage kopiert. (Sorry for the messy image editing skills…) Der grosse Vorteil wäre, dass die Textextraktion direkt für jedes Text-Input-Feld auf allen Seiten verfügbar wäre, ohne dass wir jedes einzelne Formular überarbeiten müssten, und ohne bei jedem Feld ein Stern-Ikon hinzufügen zu müssen.
Zudem denke ich, dass die Bedienung für den Benutzer so sogar etwas einfacher und intuitiver wäre, in Vergleich zur bereits umgesetzten Koordinatenextraktion. Bei der Koordinatenextraktion muss der Benutzer nämlich zuerst im Formular die Extraktion aktivieren, dann im Dokument die richtigen Angaben selektieren, und dann wieder im Formular verifizieren, dass alles richtig eingefügt wurde. Also zwei Mal einen «Kontext Switch» von einer Seite vom Browserfenster zur anderen. Mit Extraktion in die Zwischenablage kann der Benutzer direkt im Dokument die Extraktion aktivieren und ausführen, und dann im Formular die extrahierten Angaben einfügen. Hier geht sein Fokus also nur in eine Richtung (und zwar in die gleiche Richtung wie die extrahierten Daten) statt zuerst vom «Ziel» zurück zur «Quelle» und dann wieder zum «Ziel» zu gehen. Das tönt vielleicht wie ein kleines Detail, aber ich glaube, wenn viele unterschiedliche Informationen aus einem Bohrprofil extrahiert werden müssen, dass dies trotzdem einen spürbaren Unterschied macht für den Benutzer. Die Extraktion für komplexere Datentypen können wir natürlich immer noch behalten, so wie sie für Koordinaten bereits implementiert ist.