gtadigital / experimentaldesign-datacuration

Here we document what needs toi be done in datacuration
0 stars 0 forks source link

Isler Data: Migrate englisch appellations to archive data | Inconsistent source data #27

Open thomashaensli opened 1 year ago

thomashaensli commented 1 year ago

Die als Import file gelieferten des Isler Projekts sind nicht identisch bzw. nicht konsistent mit dem Inhalt des CMS.

Das Ticket dient der Klärung der Frage

thomashaensli commented 1 year ago

De-Brief @leomueller2161 // 24.5.2023, 18:11:

Lieber Alex, lieber Thomas,

Vor etwa einer Woche habe ich meine letzten Aufgaben abgeschlossen und habe nun meine Arbeit am Lehrstuhl nieder gelegt. Zuletzt habe ich noch Informationen aus den Legacy-Daten zu den Akteuren und Zeitspannen hinzugefügt. Auf Oeuvre-Ebene sind die Daten nun eingepflegt, doch es gibt noch ein paar ausstehende Punkte, die auf mein "Go" gewartet haben.

Alex:

Im Anhang dieser E-Mail findest du die Excel-Dateien mit den Namen, die importiert werden sollten. Es ist wichtig, dass keine Informationen, an denen ich gearbeitet habe, verloren gehen. Es gibt zwei Dateien: eine für die Oeuvre-Ebene und eine für die Projekt-/Gebautes Werk-Ebene. Aus der Oeuvre-Excel-Datei sollten die englischen Titel in das Feld "Englischer Titel" des Generic-Tabs übertragen werden. Anschließend sollten auf der Projekt-/Gebautes Werk-Ebene die englischen Titel im Isler-Tab durch die aus der Excel-Tabelle (oeu_isler_name#en-US) ersetzt und ebenfalls im Generic-Tab unter "Englischer Titel" eingetragen werden.

Thomas:

Die "Beton-Vorgespannt"-Tags sollten in "Stahlbeton" umbenannt werden. Mir ist aufgefallen, dass es für "beteiligt" bei den Akteuren drei unterschiedliche Tags gibt - hier sollten die Tags vermutlich zusammengeführt werden.

Zusätzlich möchte ich noch eine kurze Zusammenfassung mit euch teilen. In der beigefügten Aufstellung sind die von mir erledigten Aufgaben und meine während der Bearbeitung gemachten Feststellungen zusammengefasst, die zukünftig weiterverfolgt werden könnten. Bei Fragen oder Klärungsbedarf stehe ich natürlich jederzeit zur Verfügung. Das habe ich auch bereits mit Giulia abgesprochen.

Da wir uns nun vermutlich eine Weile nicht mehr sehen werden, möchte ich mich bei euch beiden für eure Unterstützung und Beistand bedanken. Ohne eure Hilfe wäre diese Arbeit nicht möglich gewesen und dafür bin ich euch sehr dankbar. Ich hoffe, dass meine Arbeit dazu beitragen wird, die Übersetzung ins Research Portal erfolgreich zu gestalten.

Mit Freude blicke ich auf ein hoffentlich baldiges Wiedersehen und verbleibe

mit lieben Grüßen, _

Leo Müller MSc. ETH Arch.

T: [+41 76 232 0 131](tel://+41 76 232 0 131) muller@arch.ethz.ch

Attached Files: CMS.pdf Import Titel - Oeuvre.xlsx Import Titel - PBW.xls

thomashaensli commented 1 year ago

Lieber Leo,

danke nochmal für den Bericht und die Listen!

wir hatten initial vereinbart, dass wir die Titel (Appellations) gemäss Isler Projekt (aus dem CMS) über die Appellations gemäss Archiv laden. Diese Daten habe ich analysiert und in https://github.com/gtadigital/experimentaldesign-datacuration/issues/16 zusammengefasst.

Du hast nun noch mal eine eigene »Import« Liste geschickt (für Œuvres und PBW, was vermutlich Project und Built Works bedeutet). Dazu folgende Fragen:

  1. sind diese Liste identisch?

    • wenn ja => gibt es ein paar Fragen bezüglich der Daten, siehe Analyse, die direkt aus dem CMS kommen: Issue #16
    • wenn nein => wieso nicht und wie gehen wir mit der Differenz um?
  2. Deine Listen enthalten nicht die englischen Titel des Archivs

    • wie gehen wir mit denen um? Unbesehen überschreiben?
  3. Neuere Titel (Zusatz im Titel der Form: »heute: Gebäude XYZ«) sind in Deinen Titeln konsequent (?) gelöscht.

    • wurden diese in Alternative Title übertragen?
    • oder ist es ok, wenn sie verloren gehen?

Dies eine erste schnelle Analyse, entscheiden muss schliesslich Alex und das Archiv

Herzliche Grüsse, Thomas

thomashaensli commented 1 year ago

Lieber @leomueller2161 , (cc: @vinegar-ethz)

noch eine weitere Nachfrage:

  1. das File Import Titel - Oeuvre.xlsx enthält nur die Titel des Archivs, aber nicht die Titel des Isler Projekts:
  1. das File Import Titel - PBW.xls enthält die Titel des Archivs und die Titel des Isler Projekts:

Danke für eine kurze Rückmeldung. Th.

thomashaensli commented 1 year ago

Beispiel inkonsistenter Daten:

(eine mögliche Erklärung ist, dass der Export aus dem CMS von 2023-04-27T15:06:06+02:00 stammt, der Datensatz im CMS aber nachträglich geändert wurde, nämlich 2023-04-27T15:56:04)

Dann stellt sich nach wie vor die Frage:

Import Titel - PBW_example_inconsistent_data

thomashaensli commented 1 year ago

Und hier noch ein wenig Statistik (für das File Import Titel - PBW.xls (verglichen gegenüber dem aktuellen Inhalt des CMS):

thomashaensli commented 1 year ago

Von: Müller Leo (mailto:muller@arch.ethz.ch) Datum: 7. Juni 2023 at 14:02:02 An: Thomas Hänsli (mailto:thomas.haensli@gta.arch.ethz.ch) CC: Winiger Alex (mailto:alex.winiger@gta.arch.ethz.ch), Boller Giulia (mailto:boller@arch.ethz.ch) Betreff: Re: De-Brief

Lieber Thomas,

ich möchte mich zunächst für die Verspätung bei der Übersendung der Excel-Datei entschuldigen. Aufgrund zahlreicher Verpflichtungen, darunter die Hilfe bei Diplomarbeiten und verschiedene Bewerbungen/Interviews in den letzten zwei Wochen, geriet die Bearbeitung der Excel-Datei leider in den Hintergrund.

Anbei findest du nun das Dokument, in dem ich die beiden vorigen Dokumente wie besprochen zusammengefügt habe. Zur besseren Unterscheidung habe ich sie durch eine Zeile (2663) voneinander getrennt. Darüber hinaus habe ich die Einträge, auf die du mich hingewiesen hast (Naturtheater Stetten, Kaufhaus, usw.), korrigiert und einige weitere Einträge angepasst, die mir aufgefallen sind.

Ich hoffe, dass das Dokument nun allen Anforderungen für den Import entspricht. Solltest du dennoch auf Probleme stoßen oder Fragen haben, zögere bitte nicht, dich bei mir zu melden.

Im Voraus vielen Dank für deine Hilfe beim Importieren.

Mit freundlichen Grüßen, _

Leo Müller MSc. ETH Arch.

230607_Excel Import_ÜberarbeitetZusammengefügt.xlsx

thomashaensli commented 1 year ago

Lieber @leomueller2161,

(lieber @vinegar-ethz )

Danke für die neue Liste: ich werde sie zeitnah aufbereiten und zusammen mit Alex importieren.

Herzl. Grüsse, Thomas