robert-koch-institut / SARS-CoV-2-Sequenzdaten_aus_Deutschland

Ein zentraler Bestandteil einer erfolgreichen Erregersurveillance ist das Verständnis der Verbreitung eines Erregers sowie seiner pathogenen Eigenschaften. Hierbei stellt das Wissen über das Erregergenom eine wichtige Informationsquelle dar. So erlaubt der Nachweis von Mutationen im Genom eines Erregers, Verwandtschaftsbeziehungen zu rekonstruie...
https://robert-koch-institut.github.io/SARS-CoV-2-Sequenzdaten_aus_Deutschland/
Creative Commons Attribution 4.0 International
67 stars 7 forks source link

Ein paar Labore geben das Probendatum fälschlicherweise gleich dem Submissiondatum an #10

Closed corneliusroemer closed 2 years ago

corneliusroemer commented 2 years ago

Mir ist aufgefallen, dass es ein paar Submissions gibt mit draw_date == processing_date, siehe die Delay-Verteilung hier: image https://github.com/corneliusroemer/desh-data/blob/main/plots/sequencing_delay.png

Weniger als 5 Tage Delay ist schon bemerkenswert. 0 ist praktisch unmöglich. Die Probe muss ja erst vom Patienten zum Labor für PCR, PCR muss gemacht werden, dann Sequenzierung, das dauert Stunden bis Tage, dann Bioinformatik, dann Submission.

Viel plausibler: hier werden Daten falsch eingegeben. Interessant ist, dass vor allem ein Labor betroffen ist mit PLZ 44879, vermutlich Eurofins MVZ Labor Gelsenkirchen.

Das hier sind sending_pc der Labore mit Delay = 0:

44879    2331
76131     190
13353      77
69126      18
32545      12
97422      10
48143       5
21502       3
13347       3
20095       1

Und das die sequencing_pc mit Delay = 0:

44879    2331
76131     200
13353      77
69126      18
32545      12
48143       5
21502       3
13347       3
23845       1

Das ist die Verteilung für das Labor mit PLZ 44879, hier scheint das also systematisch zu sein: sequencing_delay

Beim Sequencing Labor mit PLZ 76131 sind 0/1 Tage die Ausnahme, ziemlich sicher also Fehler, denn warum sollte es bei den paar Proben nur 0-1 Tage sein, wenn die meisten Proben 10 Tage brauchen: sequencing_delay

cuehs commented 2 years ago

@corneliusroemer Vielen Dank für deinen Hinweis. Wir haben die Anmerkungen an die entsprechenden Stellen am RKI weitergeleitet die sich dann mit den Laboren in Verbindung setzen.

corneliusroemer commented 2 years ago

@HannesWuensche Hier das gleiche, mich würde interessieren, ob es Rückmeldungen/Korrekturen von den Laboren gab zur Randomisierung, jetzt wo das Issue geschlossen wurde. Danke!