robert-koch-institut / SARS-CoV-2-Sequenzdaten_aus_Deutschland

Ein zentraler Bestandteil einer erfolgreichen Erregersurveillance ist das Verständnis der Verbreitung eines Erregers sowie seiner pathogenen Eigenschaften. Hierbei stellt das Wissen über das Erregergenom eine wichtige Informationsquelle dar. So erlaubt der Nachweis von Mutationen im Genom eines Erregers, Verwandtschaftsbeziehungen zu rekonstruie...
https://robert-koch-institut.github.io/SARS-CoV-2-Sequenzdaten_aus_Deutschland/
Creative Commons Attribution 4.0 International
67 stars 7 forks source link

Zuordnung zwischen IMS_ID und GISAID Accession #21

Closed lenaschimmel closed 2 years ago

lenaschimmel commented 2 years ago

Sequenzen bei GISAID werden über ihren "Virus name" (z.B. Germany/NW-RKI-I-592489/2022) und ihre Accession (z.B. EPI_ISL_10910370) identifiziert, während sie in diesem Datensatz eine IMS_ID wie z.B. IMS-10294-CVDP-48D4B4C1-58D3-4C97-A368-7EBB8E5D1989 haben.

Ich sehe derzeit keinen Weg, wie die verschiedenen IDs derselben Sequenz einander zugeordnet werden können, was die Kommunikation zwischen Wissenschafter_innen, die primär auf den RKI-Daten arbeiten, und denen, die auf den globalen GISAID-Daten arbeiten, erschwert.

Da es für mich nicht so aussieht, als würden die IDs nach einem einfachen (mathematischen) Prinzip auseinander abgeleitet werden, müsste vermutlich in der SARS-CoV-2-Sequenzdaten_Deutschland.csv(.xz) eine bzw. zwei weitere Spalte(n) eingeführt werden, in der die GISAID ID(s) nachgetragen werden, sobald die Sequenzen auch dort verfügbar sind?

cuehs commented 2 years ago

@lenaschimmel Genau das haben wir bereits auf der Roadmap.

Als workaround ist auch möglich bei GISAID nach der IMS_ID zu filtern: “Select” image Activate “sample ID given by the originating lab” image

lenaschimmel commented 2 years ago

@lenaschimmel Genau das haben wir bereits auf der Roadmap.

Das ist super!

Als workaround ist auch möglich bei GISAID nach der IMS_ID zu filtern:

Das heißt, für Personen mit GISAID-Zugang funktioniert dieser Workaround auch umgekehrt? Also, bei bekannter Accession kann in GISAID die IMS_ID angezeigt werden?

(Kann es derzeit nicht selbst prüfen, da ich noch auf Freischaltung meines GISAID-Accounts warte.)

cuehs commented 2 years ago

Das heißt, für Personen mit GISAID-Zugang funktioniert dieser Workaround auch umgekehrt? Also, bei bekannter Accession kann in GISAID die IMS_ID angezeigt werden?

Genau. Eine Person kann bei in GISAID bei einer Sequenz aus dem RKI prüfen welche IMS_ID dafür vorhanden ist.

cuehs commented 2 years ago

Die Spalte GISAID_ACCESSION wurde hinzugefügt