dini-ag-kim / hochschulfaechersystematik

https://w3id.org/kim/hochschulfaechersystematik/scheme SKOS-Version der Destatis-Systematik der Fächergruppen, Studienbereiche und Studienfächer
4 stars 4 forks source link

Update der Systematik auf den Stand von 2023 #28

Closed lummerland closed 8 months ago

lummerland commented 1 year ago

Hier sind die Änderungen integriert, die in der aktuellen Veröffentlichung vom Januar 2023 (https://www.destatis.de/DE/Methoden/Klassifikationen/Bildung/studenten-pruefungsstatistik.html) enthalten sind. Außerdem auch die (umfangreicheren) vorhergehenden Änderungen vom 17.11.2021. Dazu finde ich allerdings gerade kein verlinkbares Dokument, ich habe das PDF bei mir lokal gespeichert :| Vielleicht kann das ja jemand nachrecherchieren?

Zwei Fächer sind gestrichen worden, ich habe sie als deprecated markiert. Ansonsten nur neue Fächer, Umbenennungen und Verschiebungen.

Betrifft Issue https://github.com/dini-ag-kim/hochschulfaechersystematik/issues/14.

lummerland commented 1 year ago

FYI @TobiasNx @acka47

lummerland commented 1 year ago

@acka47 Ich hab Antwort von destatis bekommen. Die Fächersystematik für WS2020/2021 ist unter https://www.statistischebibliothek.de/mir/receive/DEHeft_mods_00135733 zu finden :)

acka47 commented 9 months ago

Ich habe mal draufgeschaut, allerdings ohne es 1-zu-1 mit der PDF-Version abzugleichen. Hier mein Bericht:

Allerdings meckert ein Build mit SkoHub Vocabs und, der Shacl-Check sagt viermal "Violation":

Note should be provided with a language tag.

(Siehe auch https://skohub.io/build/?id=fdfba9db-a905-4b46-a7a6-6a7c89af95cd)

Es gibt aber nur zwei skos:notes, bei denen tatsächlich das language tag fehlt (@sroertgen, du weißt bestimmt eher, warum er aber vier Violations nennt):

Wenn du das noch korrigierst, sollte es passen, @lummerland .

sroertgen commented 9 months ago

Es gibt aber nur zwei skos:notes, bei denen tatsächlich das language tag fehlt (@sroertgen, du weißt bestimmt eher, warum er aber vier Violations nennt):

Interessant. Schaue ich mir mal an!

acka47 commented 9 months ago

Im heutigen Treffen kam noch die Frage auf, was wir mit gelöschten/deprecated skos:Conceptss machen bzw. wie verarbeitende Systeme damit umgehen sollen. @mic-men, wir haben da ein bisschen aneinander vorbei geredet, weil es zwei verschiedene Fälle gibt.

1. deprecated: true

Es gibt zwei Fälle, in denen ein Konzept als deprecated markiert ist, siehe https://github.com/dini-ag-kim/hochschulfaechersystematik/pull/28/commits/7af142f0e4caf81e3c8979c65702269c0cdadfbd

Michaels Frage ging in die Richtung, wie Software-Implementierungen (u.U auch SkoHub) damit umgehen sollen. Z.B. sollen diese Werte ja nicht in Formularen zur Auswahl gestellt werden.

2. Löschung/Ersetzung einer Konzept-URI

Wenn ich das richtig sehe, gibt es dann noch einen einen Fall, wo eine Konzept-URI verschwindet, weil sie durch eine neue ersetzt wird:

https://github.com/dini-ag-kim/hochschulfaechersystematik/pull/28/files#diff-7faa76cd7d77a0b2a88e90859a93a364d0eaad01aa2f7e4250690de7be1b5f55L595-R603

Den zweiten Fall können wir vermeiden, indem wir weiter die alte URI verwenden, die dann halt nicht mit der Notation übereinstimmt. (Entstanden ist das Problem glaube ich, als in diesem Commit nicht die URI mit aktualisiert wurde, sondern nur die Notation.) Ich verstehe, dass das gegen das ästhetische Empfinden verstößt, prinzipiell sollten wir aber dafür sorgen, dass URIs stabil bleiben.

acka47 commented 9 months ago

Einen anderen Punkt habe ich im heutigen Treffen auch angesprochen: Wir müssten uns bei den stattgefundenen Anpassungen und Ergänzungen von Labels auch um deren Übersetzungen kümmern (en, nl, uk) bzw. überlegen, wie wir damit umgehen.

mic-men commented 8 months ago

Im heutigen Treffen kam noch die Frage auf, was wir mit gelöschten/deprecated skos:Conceptss machen bzw. wie verarbeitende Systeme damit umgehen sollen. @mic-men, wir haben da ein bisschen aneinander vorbei geredet, weil es zwei verschiedene Fälle gibt.

1. deprecated: true

Es gibt zwei Fälle, in denen ein Konzept als deprecated markiert ist, siehe 7af142f

Michaels Frage ging in die Richtung, wie Software-Implementierungen (u.U auch SkoHub) damit umgehen sollen. Z.B. sollen diese Werte ja nicht in Formularen zur Auswahl gestellt werden.

Genau, diesen Punkt würde ich gern besprechen. Sie dürfen nicht mehr auswählbar sein. Aber was ist mit vergebenen Werten? Sollen diese so bleiben oder auf andere abgebildet werden? Wenn letzteres, wie?

lummerland commented 8 months ago

Ich habe mal draufgeschaut, allerdings ohne es 1-zu-1 mit der PDF-Version abzugleichen. Hier mein Bericht:

* Das turtle ist valide.

* Es sind nun 345 statt bisher 340 `ConceptScheme`s.

Allerdings meckert ein Build mit SkoHub Vocabs und, der Shacl-Check sagt viermal "Violation":

Note should be provided with a language tag.

(Siehe auch https://skohub.io/build/?id=fdfba9db-a905-4b46-a7a6-6a7c89af95cd)

Es gibt aber nur zwei skos:notes, bei denen tatsächlich das language tag fehlt (@sroertgen, du weißt bestimmt eher, warum er aber vier Violations nennt):

* https://github.com/dini-ag-kim/hochschulfaechersystematik/blob/7af142f0e4caf81e3c8979c65702269c0cdadfbd/hochschulfaechersystematik.ttl#L1103

* https://github.com/dini-ag-kim/hochschulfaechersystematik/blob/7af142f0e4caf81e3c8979c65702269c0cdadfbd/hochschulfaechersystematik.ttl#L1635

Wenn du das noch korrigierst, sollte es passen, @lummerland .

Die beiden Sprach-Tags sind integriert.

lummerland commented 8 months ago

2. Löschung/Ersetzung einer Konzept-URI

Wenn ich das richtig sehe, gibt es dann noch einen einen Fall, wo eine Konzept-URI verschwindet, weil sie durch eine neue ersetzt wird:

https://github.com/dini-ag-kim/hochschulfaechersystematik/pull/28/files#diff-7faa76cd7d77a0b2a88e90859a93a364d0eaad01aa2f7e4250690de7be1b5f55L595-R603

Den zweiten Fall können wir vermeiden, indem wir weiter die alte URI verwenden, die dann halt nicht mit der Notation übereinstimmt. (Entstanden ist das Problem glaube ich, als in diesem Commit nicht die URI mit aktualisiert wurde, sondern nur die Notation.) Ich verstehe, dass das gegen das ästhetische Empfinden verstößt, prinzipiell sollten wir aber dafür sorgen, dass URIs stabil bleiben.

Ich habe die Änderung der URI bzw. des Concept-Namens wieder rückgängig gemacht. Ich hatte nicht darüber nachgedacht was diese Änderung bedeutet. Ist aber auch gar nicht so einfach, wenn man einerseits die Concept-Namen sinnvoll vergeben will (statt z.B. unlesbare UUIDs oder dergleichen zu verwenden) aber andererseits damit auch für lange Zeit feste URIs definiert :)

acka47 commented 8 months ago

Ist aber auch gar nicht so einfach, wenn man einerseits die Concept-Namen sinnvoll vergeben will (statt z.B. unlesbare UUIDs oder dergleichen zu verwenden) aber andererseits damit auch für lange Zeit feste URIs definiert :)

Ja, da hast du Recht. Das kann schnell zu Konflikten kommen. Passenderweise werden die Notationen der Destatis-Systematik offensichtlich auch nie geändert, auch wenn eine Systemstelle komplett umgehängt wird. Deshalb fehlt da mittlerweile jede Konsistenz, z.B.:

image

lummerland commented 8 months ago

@acka47 Ergänzungen sind drin, danke dir! Ja, ich weiß auch nicht, warum ich den Weg über den Fork gegangen bin. Werde ich aber nicht mehr tun, sorry :)